Модель байесовской векторной авторегрессии
Моде́ль ба́йесовской ве́кторной авторегре́ссии (англ. bayesian vector autoregression model, BVAR model), вариант модели векторной авторегрессии (VAR), оцениваемый с помощью байесовских методов. За счёт наложения априорной структуры на параметры модели позволяет избежать «проклятия размерности» (излишней параметризации), чему подвержены VAR-модели, оценка которых базируется на классическом (частотном) эконометрическом подходе. В литературе, на основе эмпирических данных, было продемонстрировано, что BVAR-модели дают более точные прогнозы в отличие от VAR-моделей, FAVAR-моделей (Bańbura. 2010), а также могут снижать неопределённость в распределении параметров модели (Демешев. 2016).
Описание модели
В общем виде VARX()-модель записывается следующим образом:
где – число лагов, – вектор эндогенных переменных в период времени , содержащий эндогенных переменных, – матрица коэффициентов при -м лаге эндогенных переменных, – вектор, включающий экзогенных переменных, включая константу, – матрица коэффициентов экзогенных переменных, – вектор ошибок в период времени , имеющий многомерное нормальное распределение .
Основной проблемой, присущей большинству средне- и большеразмерных VAR-моделей, является излишняя параметризация. При оценке VAR-модели необходимо оценить параметров, где и – количество эндогенных и экзогенных переменных соответственно. Так, при использовании 6 эндогенных переменных с 4 лагами и 5 экзогенными переменными надо будет оценить 174 коэффициента, что достаточно проблематично реализовать в отсутствии продолжительных временных рядов.
В то же время при формировании прогноза и реализации денежно-кредитной политики центральные банки зачастую ориентируются на широкий спектр экономических показателей (Bernanke. 2003). Проблема может усугубляться неоднородными периодами, которые ещё сильнее ухудшают качество оценки моделей стандартными методами. Например, ряд авторов ставят под сомнение целесообразность использования статистических данных для получения устойчивых оценок по российской экономике до начала 2009 – конца 2014 г. вследствие смены режима монетарной политики (Пестова. 2017; Пестова. 2018) для получения устойчивых оценок. В результате классические (частотные) эконометрические методы оценивания не позволяют получать состоятельные оценки.
Для решения проблемы «проклятия размерности» можно использовать байесовский подход, в частности байесовскую векторную авторегрессию. Концепция оценки VAR-моделей с помощью байесовской методологии следующая. В теории вероятности существует теорема Байеса, которая имеет следующий вид:
где – вероятность события , при условии, что наступило событие , – полная вероятность события , – совместная вероятность события и . Данное правило можно обобщить и на распределения.
Модель векторной авторегрессии в более компактной форме представляется в виде:
где . Матрица объясняющих переменных задаётся как , где . Положим, что и , где означает процесс векторизации. Тогда условное распределение оценок коэффициентов () и ковариационной матрицы ошибок () при условии имеющих место значений эндогенных переменных () можно записать в виде:
где – априорное распределение коэффициентов и ковариационной матрицы, – функция правдоподобия, – функция плотности распределения используемых данных, π(α,Σ│y) – апостериорное распределение коэффициентов и ковариационной матрицы. является просто нормализующей константой, поскольку не зависит от и , поэтому можно переписать уравнение для как:
Именно из этого распределения извлекаются оценки параметров модели (сэмплы), которые будут совмещать в себе, с одной стороны, заданную априорную информацию о коэффициентах и ковариационной матрице (именно эта часть позволяет избежать излишней параметризации), с другой, – фактическую информацию об исследуемых макроэкономических переменных в компоненте .
Формирование компоненты (априорного распределения, прайора) производится исходя из тех нужд и предпосылок, которые первоначально накладываются на модель. Ниже представлен перечень наиболее распространённых априорных распределений.
Распределение Миннесоты (прайор Литтермана). Наиболее часто используемое распределение, преимуществом которого является аналитическое сведение к многомерному нормальному распределению (позволяет обойтись без алгоритмов сэмплирования). Недостатком является использование предпосылки об известной ковариационной матрицы остатков.
Нормальное распределение Уишарта (нормальное обратное распределение Уишарта, англ. normal-Wishart prior, normal-inverse-Wishart prior). Смягчает предпосылку об известной ковариационной матрице ошибок. В данном прайоре предполагается, что ковариационная матрица ошибок неизвестна и задаётся обратным распределением Уишарта. К недостаткам данного распределения можно отнести менее гибкое формирование априорной матрицы ковариации коэффициентов.
Нормальное-диффузное (неинформативное) распределение (англ. normal-diffuse prior, noninformative prior). Используется при отсутствии каких-либо ожиданий или информации относительно взаимосвязи остатков.
Независимое нормальное распределение Уишарта (независимое нормальное обратное распределение Уишарта, англ. independent normal-Wishart prior, independent normal-inverse-Wishart prior). В этом нормальном распределении присутствует возможность надстройки гиперпараметра переменной дисперсии, а также смягчается установка априорной зависимости между дисперсией коэффициентов и дисперсией остатков.
Прайор дамми наблюдений (англ. dummy observations prior). Одним из основных преимуществ является снижение размерности обращаемых матриц, что позволяет производить вычисления с моделями большей размерности и ускорять расчёты. Данный прайор также обладает альтернативными способами построения: априорное распределение суммы коэффициентов (англ. sums-of-coefficients prior) и распределение фиктивного начального наблюдения (англ. dummy initial observation prior). Априорное распределение суммы коэффициентов используется, когда предполагается наличие единичного корня во временных рядах. Распределение фиктивного начального наблюдения применяется, когда предполагается наличие единого стохастического тренда у переменных.
Особенность расчёта импульсных откликов
В отличие от классических (частотных) VAR-моделей, BVAR-модели предполагают, что анализ проводится на основе распределения моделей. Таким образом, для построения отклика с установленным доверительным интервалом (доверительной областью) реализуется следующий алгоритм. Для каждого сэмпла рассчитываются точечные импульсные отклики. Их множество образует распределение откликов. Для расчёта точечной оценки реакции берётся медиана на каждом периоде и соответствующие квантили распределения по всем сэмплам (для 68 % доверительного интервала это 16 % и 84 % квантили соответственно). Предпочтение медиане вместо среднего значения отдаётся вследствие её устойчивости к возможным экстремальным значениям на краях распределения откликов.
Особенности построения исторической декомпозиции
Для построения исторической декомпозиции на основе BVAR-модели используется несколько подходов. Наиболее распространённым является выбор единственной модели из набора их распределений. Это может быть модель, которая наиболее близко воспроизводит медианные импульсные отклики на установленном горизонте.
Другой подход предполагает работу с множеством моделей или с распределением. Для каждого сэмпла рассчитывается вклад каждого структурного шока и экзогенных переменных на каждом периоде исторической динамики эндогенных переменных. Во всех полученных множествах вкладов фундаментальных шоков и экзогенных факторов берётся медиана за каждый период. Полученные значения будут оценками вкладов шоков и экзогенных переменных. При данном способе сумма вкладов может не совпадать с фактическим значением рядов эндогенных переменных, даже если начальные условия равны нулю, что является следствием использования не точечных оценок, а их распределения.
Особенности построения декомпозиции дисперсии ошибки прогноза
Аналогично исторической декомпозиции, при построении декомпозиции дисперсии ошибки прогноза можно использовать подход с выбором единственной модели или подход с распределениями. Соответственно, при выборе последнего сумма вкладов структурных шоков в дисперсию ошибки прогноза может не равняться единице. В качестве альтернативы можно нормировать полученную сумму к единице и пересчитать вес шоков в соответствии с их весами в этой сумме.