Тестология
Тестоло́гия (англ. testology), теория и технологическая практика создания и применения тестов в областях науки и практики, связанных с деятельностью и поведением людей. Тестология зародилась в рамках английской измерительной школы экспериментальной психологии в конце 19 в. (работы Ф. Гальтона, Дж. Кеттелла). В начале 21 в. область тестологии расширилась: она развивается как прикладная междисциплинарная методическая теория на стыке психологии, педагогики, медицины, когитологии, социологии, маркетинга, компьютерных наук и технической метрологии. Эти сферы науки и практики обогащают концептуально-методический аппарат современной тестологии и при этом обогащают методический арсенал каждой из указанных наук.
Понятие «тестология» следует отличать от более узкого понятия «психометрика», теории и практики психологических измерений. В контексте тестологии ключевой термин «тест» обозначает измерительную стандартизованную методику, направленную либо на количественную диагностику психических свойств человека (включая способности, черты личности, мотивационные черты, социально-психологические свойства – ценности, моральные качества, социальные установки и предпочтения), либо на измерение уровня его знаний, умений, навыков, компетенций, физиологических свойств организма (что особенно важно для спортивной деятельности и профессиональной деятельности в экстремальных условиях), а также параметров, характеризующих физическое здоровье. Кроме термина «психометрика» в качестве возможных нестрогих синонимов для понятия «тестология» в разных областях служат следующие термины: измерительная психодиагностика, теория педагогических измерений, теория тестов, квалиметрия. Возможный синоним – гуманитарное тестирование.
Тестология является теорией особого типа. Эта математизированная теория конструирования и применения тестов и тестовых шкал позволяет:
индивидуализировать траектории обучения (что характерно для сферы образования и развивающей педагогической психологии);
принимать кадровые решения (что характерно для сферы управления персоналом);
делать диагностические заключения (что характерно для сферы медицины);
строить прогнозы (что характерно для прогнозирования экономического или политического поведения).
Исторический и методологический контекст
Метод тестов был предложен учёными как особый метод познания сравнительно недавно – на рубеже 19 и 20 вв., но имеет длительную предысторию. Система спортивных турниров во времена Античности (в Древней Греции это олимпийские игры) представляла собой фактически систему своеобразных тестовых испытаний, в которых участники в попарных поединках и в одиночных попытках (в беге, метаниях, скачках и т. п.) выясняли, кто из спортсменов-воинов сильней: кто выше поднялся на «невидимой шкале» силы, ловкости, скорости, выносливости и др. Соревновательные тесты отличались от реальных боевых действий тем, что имели сознательной целью исключить или минимизировать риск летального исхода для участников, т. е. создать относительно безопасную модель военных сражений, выявить сильнейших, но оставить их в живых и в максимально боеспособном состоянии (здоровыми) для участия в реальных сражениях. Отсюда вытекает главный смысл тестовых испытаний: они не дублируют, но моделируют реальные испытания с приближённой точностью. Таким образом, практическая тестология зародилась как система физических испытаний, но со временем логика «тестовых испытаний» распространилась не только на физическую, но и на умственную деятельность человека.
Во многих работах по истории метода тестов (в том числе в работах В. С. Аванесова, К. М. Гуревича, С. А. Семеновской, И. А. Цатуровой) в числе основоположников научного подхода к тестированию называют авторов психологических тестов на способности и умственный возраст (коэффициент интеллекта), а также первых педагогических тестов – Дж. Кеттелла, А. Бине, Л. Термена, Э. Торндайка (Анастази. 2009; Тесты. 1928–1930). Хотя сами эти учёные фактически не использовали в своих трудах термин «тестология», их можно считать основателями тестологии. Одним из первых изданий на русском языке, в котором используются термины «тестология» и «тестолог», является сборник 1928 г., подготовленный коллективом авторов под руководством П. П. Блонского (Тесты. 1928–1930). Российский психолог Анна Шуберт, подготовившая для этого сборника главу «Книжная полка тестолога», является автором выполненного в 1909 г. первого русского перевода теста Бине – Симона. Развитие российской тестологической науки было прервано в 1936 г. с выходом постановления ЦК ВКП(б) «О педологических извращениях в системе Наркомпросов». Частичная реабилитация метода тестов состоялась в 1970-е гг.: метод тестов рассматривался в эти годы как частный случай психологической диагностики. Возвращение термина «тестология» оказалось возможным только поле распада СССР, в том числе потому, что постановление 1936 г. не было отменено.
Научный подход к тестированию тесно связан со статистическими методами. Развитие методов обработки результатов тестирования в 20 в. стало важным источником для развития методов математической статистики и многомерного анализа данных. В 1923 г., за два года до выхода работы Р. Фишера, автора дисперсионного анализа и математической теории планирования эксперимента, Э. Макколл, предложивший стандартизированную шкалу Т-баллов, отмечал: «Существуют прекрасные учебники и руководства по статистической обработке экспериментальных данных, но мало что можно найти по методам получения адекватных относящихся к делу данных, к которым применимы статистические процедуры» (цит. по: Кэмпбелл. 1980. С. 35). Такие данные для статистиков стали вскоре предоставлять именно специалисты по тестированию. Более того, многие специалисты совмещали обе роли – и специалиста по тестированию, и специалиста по статистике. К их числу принадлежат Ф. Гальтон (основоположник корреляционного метода исследования), Ч. Спирмен (создатель ранговой корреляции), Л. Тёрстоун (создатель центроидного метода мультифакторного анализа), Дж. Гилфорд (создатель фи-коэффициента), Р. Кеттелл (создатель регрессионных уравнений эффективности), А. Лазарсфельд (создатель латентно-структурного анализа).
Новый импульс к развитию анализа данных и теории математического шкалирования (калибровки шкал тестовых баллов) принесли в начале 1960-х гг. работы Г. Раша (Раш. 1973). Появилась шкала логитов. Модель Раша стала основой современной теории тестовых заданий и обязательным элементом университетских курсов по психометрии и теории тестов. Однопараметрический анализ результатов тестирования по модели Раша или двухпараметрический по модели Бирнбаума работают идентичным образом с любыми данными тестирования, собранными психологами, педагогами, социологами, маркетологами или медиками (Батурин. 2001; Российский стандарт тестирования персонала. 2015; Ежегодник профессиональных рецензий и обзоров. 2010–2013).
Таким образом, ко 2-й половине 20 в. специалисты, разрабатывавшие тесты в совершенно разных областях, описали общие принципы конструирования тестов, проведения и обработки их результатов (Крокер. 2010).
На Западе и в России термин «теория тестов» существует и без привязки к термину «тестология». Психологи чаще трактуют «теорию тестов» как раздел в рамках психометрии (психометрики). Аргументы против такого сужения понятия «тестология» приводит А. Г. Шмелев (Шмелев. 2013; Шмелев. 2019). Замена термина «тестология» на термин «психометрия» приводит к тому, что значительная часть гуманитарных специалистов в области педагогики, медицины, социологии, оценки персонала фактически не признаёт таких научных требований к качеству тестов как функциональные параметры надёжности, валидности, репрезентативности тестовых норм (психометрических свойств теста). Эти свойства явно и неявно начинают рассматриваться как свойства, важные только для психологических измерений и психологической диагностики – измерения способностей и диагностики личностных качеств (черт характера, мотивации, социальных установок и др.), в то время как не только психологические, но и педагогические, и социологические тесты должны обладать этими свойствами (Аванесов. 2003; Девятко. 2010; Шмелев. 2004; Шмелев. 2013).
Многие российские специалисты в области измерительных методов контроля качества образования (в области экзаменационных технологий) предпочитают использовать не термин «психометрия» (или «психометрика») (Фер. 2010), а термин «педагогическая тестология» (Аванесов. 2003; Балыхина. 2000; Майоров. 2001; Болотов. 2005; Ефремова. 2007; Мальцев. 2008; Михайлычев. 2001; Рудинский. 2010 и др.). Это сознательное терминологическое предпочтение, которое побуждает педагогов-учёных и педагогов-практиков с бо́льшим вниманием отнестись к тому, чтобы разрабатывать и внедрять тесты на основе научного подхода, научных процедур и критериев. Именно термин «тестология» вводит практику стихийного применения метода тестов в научно-методический контекст.
Ключевые принципы и методы тестологии
А. Г. Шмелев предлагает схему для становления представлений о том, какое место метод тестов занимает по отношению к другим методам оценки и диагностики психических свойств и знаний человека (Шмелев. 2019).
Методы | Предмет диагностики и оценки | |
Общеобразовательные | Психические свойства | |
Тестовые | Тестовые экзамены | Психометрическое тестирование |
Нетестовые | Экспертные экзамены | Экспертная психодиагностика |
Метод тестов – измерительный метод, который является стандартизированным по проведению и формализованным по обработке. Испытуемые (тестируемые, респонденты) получают один и тот же набор заданий (вопросов) или сходный набор, полученный на компьютере с помощью алгоритма рандомизированной (случайной) селекции из большого банка заданий. Результаты тестирования – баллы на количественной шкале. Методика тестирования может быть полностью компьютеризирована, т. е. не требует ни на одном этапе проведения и обработки вмешательства человека – эксперта. Смешение двух независимых оснований классификации – предмета оценки (диагностики) и метода оценки (тестовый или экспертный) приводит к концептуально-методическим разногласиям между сторонниками и противниками метода тестов. Распространение научного подхода к тестам, разработка понятия «тестология» и его популяризация должны способствовать смягчению этих противоречий, распространению научных знаний в этой области, что должно привести к отказу от некорректного массового применения, умозрительных и «самодельных» квазитестов, не соответствующих научным требованиям. Понятие «квазитесты» обосновано в рамках Российского стандарта тестирования персонала, разработанного в 2015 г. коллективом авторов и прошедшего экспертизу в рамках «Федерации тестирования персонала» и Экспертного совета Российского психологического общества (Российский стандарт тестирования ... 2015).
Отдельное ИТ-направление в области гуманитарной тестологии – разработка инструментов автоматизированной подготовки (тестовых редакторов) и автоматизированного проведения тестов. Последние инструменты часто интегрированы с более мощными и универсальными системами СДО (LMS, Learning Management Systems; русский аналог этой аббревиатуры – СДО, т. е. системы дистанционного обучения). История создания СДО восходит корнями к сформулированной Б. Ф. Скиннером в 1950-е гг. концепции программированного обучения. В 20 – начале 21 вв. сформулированы критерии, разграничивающие измерительные и обучающие тесты. Обучающие тесты – предмет дидактики, но не предмет тестологии (Шмелев. 2013).
В области технической тестологии и технической диагностики дискуссия о научных основах тестологии в начале 21 в. по существу только начинается. Простые методы однопараметрической метрологии (измерение веса, скорости, мощности, точности технических средств и т. п.) перестают оставаться единственными инструментами. Это связано с тем, что появились массовые сложные технические системы с элементами искусственного интеллекта, так что поведение таких систем изучить и измерить (протестировать) не намного проще, чем поведение человека (Brzezinski. 2010).
Современное состояние тестологической практики в России
В начале 21 в. в России появились центры подготовки тестологов и соответствующие программы подготовки на уровне магистратуры ведущих вузов (Высшей школы экономики, Санкт-Петербургского государственного университета, Российского университета дружбы народов). В некоторых таких программах в явном виде присутствует в самом названии термин «тестология», в других употребляется термин «измерения в психологии и педагогике», в третьих присутствует термин «лингвотестология» (методическое обеспечение центров языкового тестирования).
Теория тестов лежит в основе подготовки заданий и алгоритмов обработки результатов Единого государственного экзамена в России. Главным оператором по проведению ЕГЭ является созданный в системе Министерства образования и науки Федеральный центр тестирования, а центром разработки заданий ЕГЭ является ФИПИ – «Федеральный институт педагогических измерений». На метод тестов опираются массовые программы по профориентации. Центр профориентационного тестирования при МГУ имени М. В. Ломоносова с 2016 г. проводит бесплатную массовую акцию «Всероссийская профдиагностика». Например, в такую акцию в 2018 г. были вовлечены более 400 тыс. школьников России, прошедших профориентационное компьютерное тестирование на едином сервере на платформе HT-LINE (центр «Гуманитарные технологии»). В 2020–2022 гг. этот же центр внедрил методы онлайн-тестирования в такие всероссийские проекты для школьников, как «Билет в будущее» и «Большая перемена», в которых принимали участие до 1 млн школьников в год.
Среди общегосударственных проектов Российской Федерации, в которых метод тестов нашёл массовое применение, – конкурс «Лидеры России». На дистанционном этапе этого конкурса стоит задача отбора относительного узкого круга в 2,5 тыс. полуфиналистов (участников очных региональных полуфиналов конкурса) из широкого числа претендентов (около 200 тыс. человек в 2017 и свыше 200 тыс. в 2018). Метод тестов применялся в ходе дистанционных туров в первых сезонах этого конкурса; при этом использованы: а) тесты на измерение вербальных и числовых способностей, б) тест общих знаний о России, в) тест управленческого потенциала. В 2020-е гг. оператором этого конкурса стала специализированная организация АНО РСВ «Россия – страна возможностей». В 4-ом и 5-ом сезонах конкурса в 2020–2023 гг. на дистанционном этапе внедрены кейс-тесты, тест на практическое знание русского языка (диктант), методика «Эхо» (с элементами искусственного интеллекта при распознавании речи и мимики участника по его видео-презентации) и другие инновационные методики.
Определённые квалификационные (сертификационные) тестовые экзамены включены в программу квалификационных испытаний, которые проводят в ряде отраслей советы по профессиональным квалификациям и созданные при этих советах центры оценки и развития квалификации.