Факторный анализ
Фа́кторный ана́лиз, раздел многомерного статистического анализа, объединяющий методы оценки размерности множества наблюдаемых переменных посредством исследования структуры ковариационных или корреляционных матриц. Основное предположение факторного анализа заключается в том, что корреляционные связи между большим числом наблюдаемых переменных определяются существованием меньшего числа гипотетически ненаблюдаемых переменных, или факторов. В терминах случайных величин – результатов наблюдений – общей моделью факторного анализа служит линейная модель где случайные величины – общие факторы, случайные величины – факторы, специфические для величин и не коррелированные с , а – случайные ошибки. Предполагается, что задано, случайные величины независимы между собой и с величинами и , , . Постоянные коэффициенты называются факторными нагрузками (нагрузка -й переменной на -й фактор). Значения , считаются неизвестными параметрами, подлежащими оценке. В указанной форме модель факторного анализа отличается некоторой неопределённостью, т. к. переменных выражаются здесь через других переменных. Однако уравнения (*) заключают в себе гипотезу о ковариационной матрице, которую можно проверить. Например, если факторы некоррелированы и – элементы матрицы ковариаций между величинами , то из уравнений (*) следует выражение для через факторные нагрузки и дисперсии ошибок: Таким образом, общая модель факторного анализа равносильна гипотезе о том, что ковариационная матрица представляется в виде суммы матрицы и диагональной матрицы с элементами .
Процедура оценивания в факторном анализе состоит из двух этапов: оценки факторной структуры – числа факторов, необходимого для объяснения корреляционной связи между величинами и факторной нагрузки, а затем оценивания самих факторов по результатам наблюдений. Принципиальные трудности при интерпретации набора факторов состоят в том, что при ни факторные нагрузки, ни сами факторы не определяются однозначно, т. к. в уравнениях (*) факторы могут быть заменены с помощью любого ортогонального преобразования (вращения). Это свойство модели используется для преобразования факторов, которое выбирается так, чтобы наблюдаемые величины имели максимально возможные нагрузки на один фактор и минимальные нагрузки на другие факторы. Существуют различные практические способы оценки факторных нагрузок в предположении, что имеют многомерное нормальное распределение с ковариационной матрицей . В частности, метод максимального правдоподобия приводит к единственным оценкам для , но для оценок даёт уравнения, которым удовлетворяет бесконечное число решений, одинаково хороших по статистическим свойствам.