Стандартная шкала
Станда́ртная шкала́, шкала, используемая для перехода от сырых тестовых показателей к нормативным на основе эмпирически полученного распределения в выборке стандартизации.
Если полученное на репрезентативной выборке стандартизации эмпирическое распределение близко к нормальному, то используются нормированные шкалы, прежде всего Z-шкала Р. Фишера и её производные. Однако абсолютно нормальное распределение является скорее теоретическим идеалом, и реальные эмпирические распределения обычно несколько отличаются от него (бывают асимметричными, уплощёнными, бимодальными и т. п.). Поэтому разработан ряд способов преобразования сырых показателей в стандартную шкалу при «неидеальных» (отличающихся от нормального) эмпирических распределениях.
Наиболее простым способом преобразования сырых показателей в стандартную шкалу в случаях, когда тестируемый показатель не соответствует в полной мере гауссову распределению, являются процентили. Шкала процентилей впервые была применена Ф. Гальтоном (Galton. 1885). Процентиль отражает значение индивидуального показателя через процент протестированных из нормативной группы, получивших сырой балл такой же или ниже по сравнению с данным испытуемым. Процентильные границы часто используются для определения крайних групп – «низкой» и «высокой» – на шкале тестовых баллов (по 25 или 33 % от нормативной выборки). 50-й процентиль соответствует медиане – показателю центральной тенденции.
Несмотря на простоту определения и наглядность представления, процентили имеют ряд существенных недостатков и ограничений:
1) поскольку представляют собой значения порядковой шкалы, процентили непригодны для многих процедур статистического анализа (например, для вычисления среднего арифметического по нескольким шкалам); 2) поскольку распределение процентилей по своей природе равномерное (прямоугольное), при наложении его на данные, близкие к нормальному распределению, могут быть сильные искажения результатов: в середине распределения небольшие отклонения от среднего будут процентилями увеличиваться, а значительные отклонения на краях кривой – неадекватно сжиматься. По сути, процентили отражают ранговую позицию каждого испытуемого в выборке и неспособны выразить величину различий между тестовыми баллами. Поэтому в большинстве случаев шкала процентилей имеет вспомогательное значение и служит промежуточным звеном для перевода сырых баллов в стандартизированные.
Более совершенные способы преобразования сырых показателей в стандартную шкалу выражают тестовый балл в единицах среднего значения и стандартного отклонения («расстояния от среднего»), что позволяет соотносить не только результаты отдельных испытуемых, но и показатели конкретного испытуемого по разным тестам.
Стандартные показатели могут быть получены с помощью линейных и нелинейных способов преобразования. Специфика стандартных показателей, полученных путём линейного преобразования, заключается в том, что они воспроизводят все особенности распределения сырых баллов. Нелинейный способ преобразования призван подогнать отличающееся от нормального эмпирическое распределение к типу нормальной кривой.
Классическим вариантом линейного преобразования является Z-показатель, отражающий расположение тестового балла конкретного испытуемого в единицах стандартного отклонения относительно среднего значения (выше или ниже). Однако для практического применения Z-шкала не совсем удобна, т. к. имеет малое количество градаций (от –4 до +4), использует отрицательные значения, оперирует дробными (конкретный результат редко бывает целым числом) либо округлёнными значениями Z-оценок, что снижает дифференцирующие возможности теста. Поэтому на практике обычно применяются вторичные линейные преобразования Z-показателя, при которых сохраняются все особенности исходного эмпирического распределения, но уже без перечисленных недостатков.
Часто используемой в психологической практике и более понятной для обычного пользователя производной от Z-шкалы является Т-шкала. Т-шкала (T scale) получила своё название в честь Э. Торндайка и Л. Термена и впервые была применена У. Макколлом (McCall. 1922). Т-баллы имеют среднее значение 50 и стандартное отклонение 10, что позволяет увеличить разброс шкалы и избавиться от дробных и отрицательных величин. Вместе с тем Т-шкала не вполне удобна в тех случаях, когда необходимо на основе результатов тестирования разделить испытуемых на подгруппы.
Аналогично по 1000-балльной CEEB-шкале (от англ. College Entrance Examination Board – Комиссия по вступительным экзаменам в колледж) со средним значением 500 и стандартным отклонением 100 осуществляется оценка результатов по тестам знаний.
Небольшие отклонения эмпирического распределения от нормального можно скорректировать путём нелинейного преобразования: сначала сырые баллы преобразуют в процентильные эквиваленты, а затем с помощью таблиц значений функции плотности нормального распределения переводят в стандартные баллы. Такой способ преобразования называется нормализацией, а полученные единицы – нормализованными. Примерами нормализованных показателей, удобных для решения прикладных задач, являются С-шкала, шкала стэнов Канфилда («стандартная десятка») и шкала станайнов («стандартная девятка»).
Шкала стэнов (от англ. sten как сокращение фразы standard scale of ten units – стандартная шкала из 10 единиц) представляет собой модификацию С-шкалы Гилфорда (принимает значения от 1 до 10 баллов). Шкала стэнов была предложена А. Канфилдом (Canfield. 1951) для тех случаев, когда необходимо разделить группу на равные половины («верхняя/нижняя» подгруппы или «прошёл/не прошёл»).
Шкала станайнов (от англ. stanine – standard nine), также являющаяся незначительной модификацией С-шкалы Гилфорда (принимает значения от 1 до 9 баллов), впервые была использована психологами ВВС США во время 2-й мировой войны в целях определённой группировки испытуемых.
В тестах интеллекта обычно применяют IQ-шкалу, существующую в нескольких вариантах (с интервалами в 10, 15 и 16 баллов). Впервые 100-балльную шкалу измерения IQ использовал Л. Термен (1916).
В первых версиях шкалы умственного развития Стэнфорд – Бине 1916 и 1937 гг. применялся относительный (или классический) IQ-показатель. IQ-балл, равный 100, интерпретировался как 100-процентное соответствие умственного возраста тестируемого хронологическому. Однако такой способ расчёта, несмотря на его простоту и понятность, оказался неэффективным при оценке IQ у взрослых, когда показатели умственного возраста стабилизируются, а хронологический возраст постоянно увеличивается. Относительный IQ был заменён на стандартизированный, основанный на законе нормального распределения и являющийся разновидностью Z-показателя.
Стандартизированный IQ-показатель демонстрирует, как результат обследуемого относится к средней величине сырых баллов по тесту для людей его возраста. Впервые IQ в стандартных единицах стал рассчитывать в своих тестах Д. Векслер (1939). По мере развития методов психометрической проверки тестов интеллекта начинает использоваться именно стандартизированный IQ-показатель (в частности, в 3-й версии шкалы Стэнфорд – Бине 1960). В настоящее время стандартизированный IQ является эталоном при анализе и интерпретации результатов измерения интеллектуальных способностей.