Страница 9 из 9

Как предсказать курс доллара. Эффективные методы прогнозирования с использованием Excel и EViews

Брюков Владимир Георгиевич

LnY = -3,1154 + 1,28073 × 5,370638 = 3,762939,

где 5,370638 = ln (215) — натуральный логарифм от порядкового номера апреля 2010 г. — 215.

Отсюда находим (в Excel потенцирование натуральных логарифмов производится с помощью функции ЕХР), что прогноз курса доллара на апрель 2010 г. равен

Y = ЕХР (3,762939) = 43,07482.

После проведения соответствующих преобразований уравнение регрессии приобретет следующий вид:

Y = ЕХР (-3,1154 + 1,28073 lnХ) = 0,044361 × X^1,28073.

С помощью последнего уравнения регрессии можно делать расчет прогнозов непосредственно от исходных данных, а не от их натуральных логарифмов. В результате можно получить следующий прогноз курса доллара на апрель 2010 г.:

Y =0,044361 × 215^1,28073,

где 215 — порядковый номер апреля 2010 г. (июнь 1992 г. — 1).

Несмотря на то что коэффициент детерминации у степенного уравнения регрессии выше, чем у линейного, однако, например, относительно апреля 2010 г. прогноз по этому уравнению регрессии весьма сильно отклоняется от фактического курса доллара, как впрочем, и во многих других случаях. Судя по табл. 2.9, с января 2009 г. по апрель 2010 г. отклонения от прогноза (остатки), сделанного по уравнению регрессии Yрасч = 0,044361 — X^1,28073, колебались в диапазоне от -3,7954 руб. до -13,7862 руб., что свидетельствует о невысокой точности этой прогностической модели.

При этом средняя абсолютная ошибка прогноза по модулю для степенной статистической модели (см. формулу (2.20)) оказалась равна 5 руб. 92,4 коп. Следовательно, этот показатель для анализируемой модели оказался на 30 коп. больше, чем у линейной модели. В свою очередь средняя относительная ошибка по модулю в процентах (см. формулу (2.20)) для степенной модели оказалась равна 31,10 %, т. е. на 7,78 процентных пункта ниже, чем у линейной модели. Более того, если построить график остатков по степенной прогностической модели (рис. 2.6), то легко обнаружить, что на нем наблюдается несколько локальных трендов. А это — как мы говорили ранее — наглядно свидетельствует о нестационарности остатков.

Отсюда можно сделать вывод, что не только линейная модель, но и степенная модель, в которой в качестве независимой переменной использовался фактор времени (порядковый номер месяца), оказались непригодны для прогнозирования курса доллара. Все это заставляет нас продолжить поиск адекватной прогностической модели.

1. В чем суть метода наименьших квадратов, как этот метод можно представить графически?

2. Перечислите все пункты алгоритма действий, которые необходимо выполнить при решении уравнения регрессии в Microsoft Excel.

3. Какое уравнение регрессии (при прочих равных условиях) точнее: то, которое имеет коэффициент детерминации (R-квадрат) = 0,757, либо то, у которого R-квадрат равен 0,978? Объясните почему?

4. Можно ли признать статистически значимым уравнение регрессии в том случае, если значимость его F-критерия = 0,049? И если можно, то с каким уровнем надежности?

5. В каком случае делается вывод о статистической значимости коэффициентов уравнения регрессии? При каком Р-значении коэффициенты уравнения регрессии являются статистически значимыми с 95 %-ным и 99 %-ным уровнем надежности?

6. Перечислите форматы трендов, используемых в Excel при решении уравнений регрессии графическим способом. Чем эти форматы трендов отличаются друг от друга?

Глава 3

Уравнения авторегрессии и авторегрессии со скользящим средним

3.1. Специфика уравнений авторегрессии (AR)

Во главе 2 мы убедились, что использование фактора времени для прогноза курса доллара не дает достаточно точного результата, поэтому необходимо найти более подходящую независимую переменную (или переменные). Как известно, согласно теории эффективного рынка, наиболее полную информацию для прогноза будущей стоимости какого-либо финансового актива в момент времени t можно извлечь из его цены в момент времени t-1. Причем точность прогноза уменьшается по мере того, как прогноз делается в моменты времени t-2, t-3 и т. д. Исходя из этого вполне очевидного постулата можно прийти к выводу, что наиболее полную информацию о курсе доллара на момент времени t содержит его курс на момент времени t-1. Следовательно, наиболее точный прогноз курса американской валюты можно рассчитать на основе уравнения регрессии, включив в него в качестве независимой переменной курс доллара с лагом t-1. Такого рода уравнения регрессии, в которых значения результативного признака прогнозируются на основе его предыдущих значений, в статистической литературе называют уравнениями авторегрессии.

Правда, в отличие от прогностической модели, в которой в качестве независимой переменной используется фактор времени, а потому горизонт для прогноза практически безграничен, прогноз по авторегрессионной модели имеет небольшой временной горизонт для прогноза, равный длине лага. В частности, модель авторегрессии с лагом в один месяц способна давать прогноз с упреждением в один месяц.

Помимо относительно небольшого временного горизонта для прогноза в процессе построения моделей авторегрессии возникает еще одна серьезная проблема. Дело в том, что наличие лаговых значений зависимой переменной в правой части уравнения приводит к нарушению одной из важнейших предпосылок метода наименьших квадратов (МНК) — об отсутствии связи между зависимой (результативной) и независимой (факторной) переменными. Если перейти к языку формул, то теоретически эта проблема может быть изложена следующим образом:

Yt= c + bYt-1 + e, (3.1)

где с — свободный член (константа) уравнения;

Yt — зависимая (результативная) переменная;

Yt-1 — независимая (факторная) переменная с лагом в один месяц;

b — соответствующий коэффициент при Yt-1,

еt — отклонение прогноза от фактического курса доллара (остаток) в текущем месяце t.

Таким образом, из формулы (3.1) следует, что в уравнении авторегрессии может иметь место, во-первых, зависимость между et и еt-1, т. е. может быть нарушена предпосылка МНК об отсутствии автокорреляция в остатках; во-вторых, может появиться зависимость между факторной переменной Y, и остатками et, т. е. будет нарушена предпосылка МНК о гомоскедастичности[9] остатков.

Наличие автокорреляции в остатках означает определенную связь (корреляцию) между остатками текущих и предыдущих наблюдений. При наличии такой зависимости остатки могут содержать определенную тенденцию либо какие-то циклические колебания. В этом случае делается вывод, что отклонения от прогноза не могут иметь случайный характер. При наличии автокорреляции в остатках оценки коэффициентов уравнения регрессии нельзя назвать состоятельными и эффективными.

Гомоскедастичность остатков означает, что дисперсия остатков Et не изменяется в зависимости от величины факторной переменной Yt_. Если это не так, то возникает гетероскедастичностъ остатков, что так же, как и в случае автокорреляции в остатках, влияет на состоятельность оценки коэффициентов уравнения регрессии.

Для справки заметим, что состоятельными называются такие оценки, чья точность повышается по мере роста объема выборки, объема данных, на основе которых строится уравнение регрессии. В свою очередь эффективными называются такие оценки, которые имеют наименьшую дисперсию.

Гомоскедастичность, или гомогенность, дисперсии — состояние, при котором измерения вариативности колеблются внутри диапазона, ожидаемого при случайной вариативности; гетероскедастичностъ — состояние, при котором измерения вариативности являются большими, чем ожидаемые случайно.

Конец ознакомительного фрагмента. Полная версия книги есть на сайте ЛитРес.