Гетероскедастичность
Гетероскедасти́чность (англ. heteroscedasticity), нарушение условий теоремы Гаусса – Маркова, проявляющееся в непостоянстве дисперсии ошибок эконометрической модели.
Гетероскедастичность обычно проявляется в пространственных (кросс-секционных) выборках (Айвазян. 2001), когда одномоментно собирается большое число наблюдений, касающихся различных объектов. В этом случае гетероскедастичность может быть связана, например, с неодинаковыми внешними условиями для различных объектов наблюдения.
Однако гетероскедастичность может наблюдаться и в моделях временных рядов (Engle. 1982; Bollerslev. 1986), особенно в случае финансовых временных рядов, когда может возникать зависимость дисперсии текущего наблюдения от дисперсии предыдущих наблюдений; в этом случае возникает авторегрессионная условная гетероскедастичность.
Последствия гетероскедастичности
Согласно теореме Гаусса – Маркова, оценки коэффициентов линейной эконометрической модели , полученные методом наименьших квадратов (МНК-оценки), являются несмещёнными, состоятельными и эффективными (также такие оценки называют наилучшими линейными несмещёнными), если (Носко. 2011):
значения объясняющих переменных являются фиксированными;
объясняющие переменные являются линейно независимыми, т. е. матрица имеет полный столбцовый ранг и ;
случайные ошибки имеют нулевое математическое ожидание (одинаковую дисперсию) и попарно не коррелированы, т. е. .
Следует отметить, что теорема Гаусса – Маркова не требует нормального распределения ошибок модели. Если хотя бы одно из перечисленных выше условий не выполняется, то полученные МНК-оценки не будут наилучшими линейными оценками. В частности, нарушение постоянства дисперсии приводит к тому, что (Носко. 2011м):
оценки дисперсий оценок оказываются смещёнными;
построенные на их базе доверительные интервалы не соответствуют заявленным уровням значимости;
оценённые значения и статистик нельзя рассматривать как наблюдаемые значения случайных величин с и распределениями, т. е. их использование может привести к ошибочным выводам при проверке статистических гипотез.
Выявление гетероскедастичности
Одним из способов выявления гетероскедастичности в данных является построение графика стандартизованных остатков относительно подобранных значений :
В формуле (1) – сумма квадратов остатков, – число объясняющих переменных. Построенный график позволяет предположить форму функциональной зависимости дисперсии остатков от величины подобранного значения .
Признаки наличия условной гетероскедастичности во временных рядах можно выявить напрямую, анализируя график временного ряда. Как отмечает Эндерс (Enders. 2015), существует ряд признаков, позволяющих заподозрить гетероскедастичность во временном ряду. Например, на графиках временного ряда могут быть видны периоды большего или меньшего колебания ряда, частые изменения траектории движения с восходящей на нисходящую и наоборот, тенденции к сонаправленному движению нескольких временных рядов.
Разумеется, визуальный анализ не может быть использован для принятия обоснованного решения о наличии гетероскедастичности. Для более строгих выводов следует применять формальные критерии. Одним из простейших критериев является критерий Уайта (Greene. 2003). В рамках этого критерия тестируемой нулевой гипотезой является отсутствие гетероскедастичности. Для проведения теста необходимо оценить регрессию квадратов остатков эконометрической модели на константу, все объясняющие переменные, их квадраты и попарные произведения. В качестве тестовой статистики используется , где – число наблюдений, – коэффициент детерминации оценённой модели. Данная статистика имеет асимптотическое распределение с степенями свободы, где – число объясняющих переменных в оценённой регрессии без учёта свободного члена.
К числу формальных тестов можно также отнести критерий Глейзера (Айвазян. 2001), критерии Голдфелда – Квандта и Бройша – Пагана (Greene. 2003).
Условную гетероскедастичность в модели временных рядов можно протестировать при помощи теста Маклеода – Ли (Enders. 2015). Тестируемой нулевой гипотезой также является предположение об отсутствии гетероскедастичности. Для проведения теста в первую очередь нужно получить оценки остатков наиболее подходящей ARMA-модели для временного ряда. Затем необходимо оценить регрессию квадратов этих остатков на константу и необходимое количество их запаздывающих значений. В качестве тестовой статистики используется , где – число наблюдений, – коэффициент детерминации оценённой модели. Данная статистика имеет асимптотическое распределение с степенями свободы, где – число запаздывающих значений в оценённой регрессии без учёта константы. Для малых выборок более предпочтительным будет F-критерий для нулевой гипотезы . Искомая тестовая статистика будет иметь и степеней свободы в числителе и знаменателе соответственно.
Устранение гетероскедастичности
Для преодоления проблем, связанных с гетероскедастичностью, применяется модифицированный метод наименьших квадратов – взвешенный МНК (Носко. 2011; Айвазян. 2001), суть которого можно пояснить на следующем примере. Рассмотрим простейшую модель:
Представим дисперсию ошибок модели как
где одинаковая для всех , а может быть, например, функцией от значений объясняющих переменных.
Если переписать уравнение (2) в виде
где , то МНК-оценки коэффициентов уравнения (3) будут давать гомоскедастичные остатки, т. к. дисперсии ошибок будут одинаковыми и равными . Для последующего построения доверительных интервалов и тестирования гипотез следует использовать оценки дисперсий, полученных при оценивании модели (3).
В случае наличия авторегрессионной условной гетероскедастичности применяются модели ARCH (Engle. 1982), GARCH (Bollerslev. 1986) и их модификации. Основной идеей этих моделей является представление временного ряда в виде:
где – рассматриваемый временной ряд, – подобранное значение по наилучшей ARMA-модели, – условная дисперсия ошибки в момент времени . Данные модели оцениваются методом максимального правдоподобия.