что такое процентиль в психодиагностике
Что такое процентиль?
Что такое процентиль?
Термин ″процентиль″ (percentile) часто встречается в зарубежной литературе про инвестиции и вообще в статистических исследованиях – одно из таких исследований я упоминал в этой статье. Другими вариантами русских названий являются ″персентиль″ и ″перцентиль″. Думаю, что небольшая известность термина в России не вполне заслужена, поскольку нередко именно в процентилях удобно выразить полученные результаты.
Процентиль это определенная часть выборки данных
Возьмем простой пример. Группа студентов из 200 человек пишет тест, состоящий из 100 вопросов. Проходной порог, когда тест считается сданным, составляет 2/3 правильных ответов, т.е. не менее 66. Что получается с точки зрения отдельного студента?
Допустим, Иван правильно ответил на 70 вопросов. Задачу он выполнил — тест засчитан. Результат каждого участника теста также сравнивается с числом 66: если правильных ответов больше, тест сдан. В результате формируется список сдавших и не сдавших: каждый студент проходил через это. Пока ничего нового.
Но задачу можно поставить и по-другому: нужно сравнить результаты студентов не с проходным баллом в 66 пунктов, а между собой. Зачем это нужно? В данном случае, например, для объективной оценки сложность теста, что достигается группировкой результатов.
Вернемся к Ивану, который получил 70 правильных ответов. Много это или мало по сравнению с остальными? Это и покажет процентиль.
Процентили делят всю выборку на определенные части. Например, пятый процентиль охватывает 5% объема выборки. Предположим, показатель Ивана равен пятому процентилю. Это означает, что Иван написал тест лучше, чем 5% студентов (10 человек из 200 получили от нуля до 70 баллов). Не густо, поскольку в этом случае остальные 190 человек набрали больше, чем 70. Значит, тест был очень легкий и порог в 66 баллов можно и повысить.
Но в том же самом тесте может быть и обратная ситуация: результат Ивана равен 90-ому процентилю. Это значит, что Иван написал тест лучше, чем 90% студентов. Или по другому: только 10% (20 человек) набрали более 70 правильных ответов. Следовательно, тест был весьма трудным. Преимущество метода еще и в том, что разбивкой на процентили можно сравнивать тесты с разным числом участников.
Функция Гаусса
Чем более высок процентиль, тем больше данных он включает
Расчет процентиля в Excel
Процентиль несложно вычислить по формуле:
но проще обрабатывать массив данных одноименной функцией Excel. Для примера возьмем произвольную выборку полученных баллов и рассчитаем в ней процентили:
Функция PERCENTILE (ПЕРСЕНТИЛЬ) включает в себя ввод диапазона ячеек данных (А1:А10) и значения процентиля К, деленного на 100%. Т.е. в данном случае ввод 0.3 означает нахождение тридцатого процентиля. Смысл расчета: к 30-му процентилю будут относиться все результаты, меньше или равные 7.9.
Если мы хотим узнать процентиль участника, получившего 10 баллов, то это несложно сделать, варьируя значение К до тех пор, пока значение в ячейке С12 не станет близким 10. Получится примерно 34-ый процентиль. При увеличении процентиля в выборку попадает больше табличных значений:
Итого, в 80-ый процентиль попадает уже 8 табличных значений из 10, которые меньше или равны 47.2. При этом подчеркнуть результат можно диапазоном процентилей — например, между восьмидесятым и сотым. В этом случае значения будут лежать между 47.2 и 67 (максимальным числом выборки).
Процентиль
Пример 3. Если, к примеру, 28% людей правильно решат 15 задач в арифметическом тесте, то первичному показателю 15 соответствует 28-й процентиль (Р28).
Процентили указывают на относительное положение индивида в выборке стандартизации.
Процентили не следует смешивать с обычными процентными показателями.
Процентильные показатели обладают рядом достоинств. Их легко рассчитать и понять даже сравнительно неподготовленному человеку.
В психодиагностике существует и другой подход к оценке результатов диагностических испытаний. Под руководством К. М. Гуревича разрабатываются тесты, в которых в качестве точки отсчета выступает не статистическая норма, а независимый от результатов испытания, объективно заданный социально-психологический норматив. Социально-психологический норматив реализуется в совокупности заданий, составляющих тест. Следовательно, сам тест в полном его объеме и является таким нормативом. Все сопоставления индивидуальных или групповых результатов тестирования проводятся с тем максимумом, который представляется в тесте (а это полный набор знаний). В качестве критерия оценки выступает показатель, отражающий степень близости результатов к нормативу. Имеется разработанная схема представления групповых количественных данных.
Для анализа данных относительно их близости к социально-психологическому нормативу, условно рассматриваемому как 100%-ное выполнение всего теста, все испытуемые подразделяются по результатам тестирования на 5 подгрупп (%):
ЛЕКЦИЯ № 18. Психологический диагноз
2. Шкальные оценки
Шкальные оценки способ оценки результата теста путем установления его места на специальной шкале. Шкала содержит данные о внутригрупповых нормах выполнения данной методики в выборке стандартизации. Так, индивидуальные результаты выполнения заданий (первичные оценки испытуемых) сравниваются с данными в сопоставимой нормативной группе (например, результат, достигнутый учеником, сравнивается с показателями детей того же возраста или года обучения; результат исследования общих способностей взрослого сопоставляется со статистически обработанными показателями репрезентативной выборки лиц в заданных возрастных пределах).
Шкальные оценки в этом смысле имеют четко определенное количественное содержание и могут быть использованы при статистическом анализе. Одной из распространенных в психологической диагностике форм оценки результата теста путем соотнесения с групповыми данными является расчет процентилей.
Процентиль процентная доля индивидов из выборки стандартизации, результат которых ниже данного первичного показателя. Шкалу процентилей можно рассматривать как совокупность ранговых градаций (см. ранговая корреляция) при числе рангов 100 и отсчете от 1-го ранга, соответствующего самому низкому результату; 50-й процентиль (PSQ) соответствует медиане (см. меры центральной тенденции) распределения результатов, Р›50 и Р‹50 соответственно представляют ранги результатов выше и ниже среднего уровня результата.
Процентили не следует смешивать с обычными процентными показателями. Последние представляют собой долю правильных решений из общего количества заданий теста в индивидуальном результате (см. первичные оценки). Ранги Р, и Р100 получают соответственно самый низкий и самый высокий результаты из наблюдавшихся в выборке, однако этим рангам могут соответствовать и далеко не нулевой (ни одного правильного решения) или абсолютный (все решения правильны) показатели (например, при общем количестве 120 заданий минимальный результат, соответствующий первому рангу, может составить 6 правильных решений, в то время как максимальный результат, соответствующий рангу Р100, будет составлять 95 правильно решенных заданий). Такая ситуация наблюдается, например, при оценке тестов скорости.
Основной недостаток процентильных шкал состоит в неравномерности единиц измерения. При нормальном распределении отдельные переменные тесно группируются в центре распределения и по мере удаления к краям рассеиваются. Поэтому равным частотам случаев вблизи центра соответствуют более короткие интервалы по оси абсцисс, расположенные по краям распределения оценок. Процентили показывают относительное положение каждого испытуемого в нормальной выборке, но не величину различий между результатами. Это создает некоторые неудобства в интерпретации индивидуальных результатов. Так, разница в первичных показателях, соответствующая интервалу Р70-Р80, может составить 10 баллов, а различие в количестве правильных решений в интервале рангов Р50-Р60 лишь 1–3 балла.
Вместе с тем процентильные оценки обладают и рядом достоинств. Они легкодоступны пониманию пользователей психодиагностической информацией, универсальны по отношению к различным типам методик и легко рассчитываются.
Процентильные оценки не относятся к типичным шкальным показателям. Более широкое распространение в психодиагностике получили стандартные показатели, рассчитываемые на основе линейного и нелинейного преобразования первичных показателей, распределенных по нормальному или близкому к нормальному закону. При таком расчете проводится г-преобразование оценок (см. стандартизация, нормальное распределение). Чтобы определить 2-стандартный показатель, определяют разность между индивидуальным первичным результатом и средним значением для нормальной группы, а затем делят эту разность на а нормативной выборки. Полученная таким образом шкала z имеет среднюю точку М = 0, отрицательные значения обозначают результаты ниже среднего и убывают по мере удаления от нулевой точки; положительные значения обозначают, соответственно, результаты выше среднего. Единица измерения (масштаб) в шкале z равна 1а стандартного (единичного) нормального распределения.
Для преобразования полученного при стандартизации распределения первичных нормативных результатов в стандартную z-шкалу необходимо исследовать вопрос о характере эмпирического распределения и степени его согласованности с нормальным. Поскольку для большинства случаев значения показателей в распределении умещаются в пределах М ± 3σ, единицы измерения простой z-шкалы слишком велики. Для удобства оценивания применяется еще одно преобразование типа z = (x ‹x›) / σ. Примером такой шкалы могут быть оценки тестовой батареи SAT(СЕЕВ) методики для оценки способности к обучению (см. тесты достижений). Эта r-шкала пересчитана таким образом, что средней точке соответствует значение 500, а σ = 100. Другим аналогичным примером является шкала Векслера для отдельных субтестов (см. шкала измерения интеллекта Векслера, где М = 10, σ = 3).
Наряду с определением места индивидуального результата в стандартном распределении групповых данных введение ШО направлено и на достижение другой важнейшей цели обеспечение сопоставимости количественных результатов различных тестов, выраженных в стандартных шкалах, возможности их совместных интерпретаций, сведение оценок к единой системе.
В случае, если оба распределения оценок в сравниваемых методиках близки к нормальному, вопрос о сопоставимости оценок решается довольно просто (в любом нормальном распределении интервалам М ± nσ соответствует одинаковая частота случаев). Для обеспечения сопоставимости результатов, принадлежащих к рас-пределениям другой формы, применяются нелинейные преобразования, позволяющие придать распределению форму заданной теоретической кривой. В качестве такой кривой обычно используется нормальное распределение. Как и 160–150 в простом г-преобразовании, нормализованным стандартным показателям можно придать любую желаемую форму. К примеру, умножив такой нормализованный стандартный показатель на 10 и прибавив константу 50, получаем Т-показатель (см. стандартизация, миннесотский многоаспектный личностный опросник).
Примером нелинейно преобразованной в стандартную шкалу является и шкала станайнов (от англ. standart nine «стандартная девятка»), где оценки принимают значения от 1 до 9, М = 5, σ=2.
Шкала станайнов получает все большее распространение, сочетая в себе достоинства стандартных шкальных показателей и простоту процентилей. Первичные показатели легко преобразуются в станайны. Для этого испытуемых ранжируют по возрастанию результатов и из них образуют группы с числом лиц, пропорциональным определенным частотам оценок в нормальном распределении тестовых результатов (табл. 14).
Что такое процентиль в психодиагностике
1) Стандартизация – обработка и регламентация процедуры проведения, унификация инструкции, бланков обследования, способов регистрации результатов, условий проведения обследования, характеристика контингентов испытуемых. Строгая периодичность процедуры обследования – обязательное условие обеспечения надежности теста и определения тестовых норм для оценивания результатов в обследования.
2) Стандартизация – преобразование нормальной шкалы оценок в новую шкалу, основанную не на количественных значениях изучаемого показателя, а на его относительном месте в распределении результатов в выборке испытуемых.
1 этап. Создание единообразной процедуры тестирования.
Она состоит из определения моментов диагностической ситуации.
· Условия тестирования (помещение, освещение и др. внешние факторы).
· Содержание инструкции и особенности ее предъявления (тон голоса, паузы, скорость речи и т.д.).
· Наличие стандартного стимульного материала (например, карты Роршаха).
· Временные ограничения выполнения данного теста.
· Стандартный бланк для выполнения данного теста.
· Учет влияния ситуационных факторов на процесс и результат тестирования.
· Учет влияния поведения диагноста на процесс и результат тестирования
· Учет влияния опыта испытуемого в тестировании.
2 этап. Создание единообразной оценки выполнения теста. С тандартной интерпретации полученных результатов и предварительной стандартной обработки. На этом этапе сравнивается полученный показатель с нормой выполнения этого теста для данного возраста.
3 этап. Определение норм выполнения теста. Нормы разрабатываются для различных возрастов, профессий, полов и т.д.
Наиболее распространенным преобразование первичных оценок являются центрирование и нормирование посредством среднеквадратических отклонений. Процедура нормирования заключается в переходе к другим единицам измерения. В качестве функции нормирования обычно выступает Z-показатель (стандартный показатель), который выражает отклонение индивидуального результата Х в единицах, пропрорциональных стандартному отклонению.
Более широкое распространение в психодиагностике получили стандартные показатели, рассчитываемые на основе линейного и нелинейного преобразования первичных показателей, распределенных по нормальному или близкому к нормальному закону. При таком расчете проводится z-преобразование оценок. Чтобы определить z-стандартный показатель, определяют разность между индивидуальным первичным результатом средним значением для нормальной группы, а затем делят эту разность на δ нормативной выборки.
Х – сырой балл (количество выполненных заданий)
Мх – средняя величина выполненных заданий по всей выборке
δ – среднеквадратичное отклонение (в зарубежной психологии SD)
Математик Карл Гаусс предложил функцию, описывающию нормальное распределение. График уравнения нормального распределения – симметричная унимодальная колоколообразная кривая (или кривая нормального распределения ).
Назовем среднее арифметическое Мх, а стандартное отклонение δ (сигма малая). При нормальном распределении все изучаемые величины находятся в пределах Мх ± 5 δ.
Это позволяет заранее рассчитать сколько случаев будет расположено в определенном удалении от средеарифметического (и в зависимости от стандартного отклонения).
В пределах Мх ± δ находится 68,26 %, остальные 31,74 % расположены симметрично по 15,87
В пределах Мх ± 2 δ находится 95,44 %
А в пределах Мх ± 3 δ находится 99,72 %
Процентиль – процентная доля индивидов из выборки стандартизации, результат которых ниже данного первичного показателя. Шкалу процентилей можно рассматривать как совокупность ранговых градаций при числе рангов 100 и отсчете от 1-го ранга, соответствующего самому низкому результату;
50-й процентиль ( Р 50 )соответствует медиане распределения результатов
Вместе с тем процентильные оценки обладают и рядом достоинств. Они легко доступны пониманию пользователей психодиагностической информацией, универсальны по отношению к различным типам методик и легко рассчитываются.
А. Статистические нормы. Граничные значения на шкале тестовых баллов, образованные на основе частотного распределения тестовых баллов в выборке стандартизации. Как правило, эти граничные значения отделяют от выборки фиксированный процент испытуемых: (дециль), 25 (квартиль), 50 (медиана). При нормальном распределении статистическая норма описывается с помощью параметров (среднее плюс/минус сигма, или стандартное отклонение). Статистические нормы служат принятию «сравнительный решения» и не дают информации для принятии «нормативных решений»
Б. Возрастные нормы – частные варианты психодиагностических норм, собранные для детей разного возраста.
Г. Школьные нормы разрабатываются на основе тесов школьных достижений или тестов школьных способностей.
Д. Профессиональный нормы. Устанавливаются на основе тестов для различных профессиональных групп.
Ж. Национальные нормы. Разрабатываются для представителей данной нации или страны в целом.
Примером нелинейного преобразованной в стандартную шкалу является и шкала станайнов (англ. standart nine – стандартная девятка), где оценки принимают значения от 1 до 9, М = 5, δ = 2
Шкала станайнов получает все большее распространение, сочетая в себе достоинства стандартных шкальных показателей и простоту процентилей. Первичные показатели легко преобразуются в станайны. Для этого испытуемых ранжируют по возрастанию результатов и из них образуют группы с числом лиц, пропорциональным определенным частотам оценок в нормальном распределении тестовых результатов.
Ваш психолог. Работа психолога в школе.
Самое популярное
Занятие. Стандартизация результата и нормы теста
Вводные замечания
Психодиагностические методики являются измерительными инструментами. Для того чтобы измерить какой-либо мерой величину измеряемого, необходимо, чтобы были соблюдены определенные условия (К.М. Гуревич [24]).
Первое условие касается самого измерительного инструмента: он должен иметь на протяжении всего измерения одну и ту же тождественную самой себе меру. Нельзя измерять инструментом, у которого нет такой тождественной самой себе меры (например, если бы на линейке расстояния от одного деления до другого были неодинаковы на разных участках).
Второе условие – необходимо, чтобы то, что измеряется, во всех случаях оставалось одним и тем же, т.е. также было тождественно самому себе.
Как показывает далее К.М. Гуревич, соблюсти эти два условия в психодиагностических исследованиях крайне затруднительно. Вопрос стабильности измеряемых психических характеристик находится в компетенции соответствующих предметных областей психологической науки. В настоящем параграфе будут рассмотрены требования к психодиагностическим методикам, как профессиональным инструментам измерения индивидуально-психологических характеристик. К числу этих требований относятся стандартизация, надёжность и валидность.
Стандартизация – это единообразие процедуры проведения и оценки выполнения теста. Она рассматривается в двух планах: как выработка единых требований к процедуре эксперимента и как определение единого критерия оценки результатов (рис. 9.1.1).
Стандартизация процедуры проведения обследования подразумевает единообразие инструкций, бланков и других материалов обследования, способов регистрации результатов, условий проведения обследования.
Стандартизация психодиагностической методики
Стандартизация процедуры проведения Едиообразие инструкций, бланков, тестовых материалов, способов регистрации результатов, условий проведения обследования | Стандартизация оценки выполнения Формирование выборки стандартизации, проведение обследования, проверка нормальности распределения признака, определение шкалы стандартных показателей, разработка методики перевода сырых показателей в стандартную шкалу |
Рис. 9.1.1 Составляющие процесса стандартизации психодиагностической методики
При проведении психодиагностического обследования надо соблюдать следующие требования:
– инструкции следует сообщать испытуемым одинаковым образом, лучше письменно; в случае устных указаний они даются в разных группах одними и теми же словами, понятными для всех, в одинаковой манере;
– ни одному испытуемому не следует давать никаких преимуществ перед другими;
– в процессе эксперимента не следует давать отдельным испытуемым дополнительные пояснения;
– эксперимент с разными группами следует проводить по возможности в одно и то же время дня в сходных условиях;
– временные ограничения в выполнении заданий для всех испытуемых должны быть одинаковыми.
Стандартизация критериев выполнения теста осуществляется путём её проведения на большой представительной выборке испытуемых, которая ничем не отличатся от той, для которых данная методика предназначена. Такая выборка называется выборкой стандартизации. Она представляет собой меньшую по размеру точную модель генеральной совокупности. Правила формирования выборки стандартизации подробно изложены в учебном пособии «Методы психолого-педагогической оценки» [38].
Стандартизация оценки выполнения применяется в основном для тестов и опросников и включает определение нормативных данных и построение шкалы стандартных показателей.
Нормы – это статистические показатели выборки стандартизации (среднее значение и стандартное отклонение), позволяющие охарактеризовать положение обследованного индивидуума относительно выборки стандартизации. Рассчитанные на основе обследования выборки стандартизации среднее значение (обозначается латинской буквой М или греческой буквой µ – мю) и стандартное отклонение (обозначается греческой буквой σ – сигма) являются основой для разработки шкалы оценок в стандартных показателях, к которым относятся Z-показатели, Т-показатели, стены, станайны.
Z-показатели
Z-показатель – выражение шкальных показателей в единицах стандартного отклонения:
Таблица 9.1.1 Нормы теста Равена в процентилях