Ссылка на источник:
Горева Т. С., Дуплина С. В. Анализ методов прогнозирования доходности валютных рынков // Теоретические и методологические проблемы современных наук: Материалы XXI Международной научно-практической конференции (Новосибирск, 18 декабря 2017 г.). – Новосибирск: ООО «ЦСРНИ», 2017. – 96 с. - C. 75-87.


АНАЛИЗ МЕТОДОВ ПРОГНОЗИРОВАНИЯ ДОХОДНОСТИ ВАЛЮТНЫХ РЫНКОВ

Татьяна Сергеевна Горева

кандидат технических наук,
Московский государственный университет имени М.В. Ломоносова (филиал г. Севастополь),
доцент,
г. Севастополь,
Российская Федерация


Светлана Витальевна Дуплина

Московский государственный университет имени М.В. Ломоносова (филиал г. Севастополь),
Бакалавр,
г. Севастополь,
Российская Федерация


В статье рассмотрены методы прогнозирования доходности валютных рынков. Представлен алгоритм решения задачи прогноза с применением нейронных сетей. Произведен анализ математических методов прогнозирования временных рядов, таких как простейший метод экспоненциального сглаживания, метод Брауна, метод Хольта, метод Тейла\\-Вейджа и модель авторегрессионного интегрированного скользящего среднего. В работе реализован прогноз валютного курса доллара к рублю с применением полносвязной нейронной сети.

Ключевые слова: прогнозирование доходности, методы прогнозирования, нейронные сети, авторегрессия проинтегрированного скользящего среднего.


ANALYSIS OF METHODS OF FORECASTING THE YIELD OF FOREIGN EXCHANGE MARKETS

Tatyana Goreva

candidate of engineering,
Lomonosov Moscow State University (branch Sevastopol),
associate Professor,
Sevastopol city,
Russian Federation


Lomonosov Moscow State University (branch Sevastopol),
bachelor of arts,
Sevastopol city,
Russian Federation


The article considers methods of predicting the yield of foreign exchange markets. The algorithm of solving the problem of prediction with neural networks. The analysis of mathematical methods of forecasting time series, such as the simplest method of exponential smoothing, browns method, Holts method, the method Teyla\\-vejjdzh and model autoregressive integrated moving average. In this paper, implemented the forecast of the exchange rate of the dollar against the ruble with the use of fully connected neural network.

Keywords: yield forecasting, forecasting methods, neural networks, autoregressive integrated moving average.


Работа посвящена анализу математических моделей как инструментов для прогнозирования на валютных рынках, которые являются неотъемлемой частью любой экономической системы. Биржа обладает высокой чувствительностью и быстрой реакцией на различные события, происходящие в мире. Валюта может меняться с поразительной скоростью, реагируя на малейшие изменения в политической, экономической и общественной жизни. Именно поэтому биржевый рынок еще иногда называют «барометром экономики».

Для того чтобы построить адекватный прогноз, стоит определиться с переменными, которые анализируются. На выбор таких переменных влияет множество факторов: требуемый уровень детализации, доступность данных, предпочтение результатов прогноза.

Цель прогноза экономического процесса заключается в поиске наиболее вероятного пути развития его показателей при известных «прошлых» данных и с учетом закладываемых предпосылок. Еще в начале 20 века считалось, что колебания финансовых рынков носят хаотичный характер, но современные математические модели и технологии позволяют строить эффективные краткосрочные прогнозы. Основная проблема, с которой сталкивается исследователь в таких задачах, это нестационарность процесса (т.е. непостоянность некоторых характеристик, таких как, например, уровень временного ряда, скорость линейного роста и др.). Причем с увеличением периода прогноза увеличивается возможность различных отклонений экономических показателей. Также в реальных задачах случаются вообще непредвиденные события, которые невозможно предсказать заранее по причине недостатка исходной информации или природа которых неопределенна. Все это существенно затрудняет анализ экономических процессов. Самые простые предсказания основываются на принципе экстраполяции показателей на основании предыдущих значений, то есть выдвигается гипотеза о сохранении в будущем прошлых и настоящих тенденций развития объекта прогноза. Однако такие методы не обладают высокой точностью и гибкостью. Ниже представлен обзор и сравнение некоторых наиболее эффективных методов прогнозирования временных рядов.

Рассмотрим так называемые адаптивные модели. Основным преимуществом адаптивных моделей является способность моделей к самообучению (самонастраиванию, приспособлению) исходя из эволюции динамических внешних факторов, новых условий внешней среды, а также способность корректировать свое поведение, учитывая допущенные ошибки. Адаптивные модели дают довольно точные оценки для краткосрочного прогнозирования. Следует уточнить, однако, что в экономике под термином «краткосрочный» понимается временной отрезок длиной до года. В статистике же краткосрочный прогноз подразумевает собой прогноз на один (в крайнем случае несколько) интервал времени, и этот интервал не имеет временных ограничений.

Простейшей адаптивной моделью считается метод экспоненциального сглаживания.

Пусть временной ряд задан формулой: X = {x1,…,xT}.

Экспоненциальное сглаживание представляет собой метод, при котором более поздним наблюдениям соответствуют большие веса в сопоставлении с более ранними наблюдениями, при этом веса убывают с экспоненциальной скоростью. Формула, описывающая экспоненциальное сглаживание ряда задана уравнением:

St = αxt + (1 - α) St-1, α ϵ (0,1), (1)

где St – экспоненциальная средняя;

α – параметр сглаживания, α = const.

Выразим экспоненциальную среднюю St через значения временного ряда X, пользуясь рекуррентной формулой (1):

St = αxt + (1-α) (αxt-1 + (1-α)St-2 ) = ⋯ = α ∑i=1t-1(1-α)i xt-i + (1-α)t S0.

Выбор оптимального значения постоянной сглаживания представляет собой ключевой момент метода, так как именно от этого параметра зависит результат прогноза. Чем быстрее α стремится к единице, тем больше вес последних точек, что можно интерпретировать как тривиальный прогноз по последнему наблюдению. При сильном стремлении α к нулю имеем сильное сглаживание, то есть усреднение колебаний и шумов, что приводит к тривиальному прогнозу примерно с одинаковыми весами и полному отсутствию адаптации.

Основное соотношение, позволяющее подобрать приближенную оценку альфа предложил Р. Браун:

α = 2 / (N+1),

где N – число точек ряда, для которых динамика ряда считается однородной и устойчивой.

После появления работ Р. Брауна экспоненциальное сглаживание часто используется для решения задачи краткосрочного прогнозирования временных рядов.

Метод экспоненциального сглаживания широко применяется в прогнозировании временных рядов. Его преимущество состоит в том, что он учитывает веса исходной информации, мало зависим от случайных колебаний и прост в вычислениях.

С течением времени метод претерпевал важные усовершенствования, суть которых коротко будет изложена ниже.

Р. Браун предложил решение задачи прогнозирования с использованием метода экспоненциального сглаживания.

Пусть задан временной ряд {y_i },y_i ϵR. Для решения задачи прогнозирования

ŷt+d = ft,d (y1,…,yt), d ϵ {1,2,…,D},

где D – горизонт прогнозирования, необходимо, чтобы выполнялось условие:

QT = ∑i=1TWT-i (yi - ŷi) → min,

где {wi}, i=0,…,T, – неотрицательная невозрастающая последовательность весов.

Модель Брауна, которую справедливо использовать для решения данной задачи, имеет вид:

ŷt+d = αyt + (1 - α)ŷt0 = y0, α ϵ (0,1).

Главный недостаток модели является заключается в том, что она не учитывает тренд и сезонность.

Рассмотрим метод Хольта.

Пусть задан временной ряд {yi},yi ϵ R. В своей модели Хольт вводит два параметра at,bt– оценки адаптивных коэффициентов линейного тренда:

ŷt+d = at + dbt

Проделав несложные математические преобразования, можем получить рекуррентное соотношение для вычисления этих оценок:

at = α1yt + (1 - α1)(at-1 - bt-1);

bt = α2(at - at-1) + (1 + α2) bt-1.

Как и в методе экспоненциального сглаживания, главным этапом является выбор адаптивных коэффициентов экспоненциального сглаживания α1,2 ϵ (0,1).

Также эти уравнения можно переписать в виде:

at = at-1 + bt-1 + α1et;

bt = bt-1 + α1α2et,

где et – ошибка прогноза.

Преимущество метода в сравнении с предыдущим в том, что он учитывает линейные тренды, однако этого все же недостаточно для эффективного прогноза.

Рассмотрим метод Тейла-Вейджа.

Пусть задан временной ряд {yi,} yi ϵ R. Модель Тейла-Вейджа – это трендсезонная модель с тремя параметрами, которая учитывает аддитивный линейный тренд и сезонность.

yτ = aτ + gτ + δτ,

aτ = aτ-1 + bτ,

где aτ- уровень ряда, очищенный от сезонных колебаний;

bτ – аддитивный коэффициент роста;

gτ – аддитивный коэффициент сезонности;

δτ – белый шум.

Прогноз по данной модели, сделанный в момент времени t на l временных фаз в полном сезонном цикле, вычисляется следующим образом:

ŷt+d = at + btd + gt-l+d,

at = α1(yt - gt-l) + (1 - α1)(at-1 + bt-1)

gt = α2 (yt - at) + (1 - α2) gt-l

b = α3(at - at-1) + (1 - α3)bt-1

0 < α1,2,3 < 1

Перейдем к модели авторегрессиионного интегрированного скользящего среднего (ARIMA).

ARIMA-модель описывает нестационарные временные ряды, является обобщением авторегрессионной модели скользящего среднего (ARMA). Достоинство этой модели в том, что она позволяет преобразовать нестационарный ряд в стационарный путем взятия разностей некоторого порядка от исходного временного ряда. ARIMA-модель включает в себя 3 параметра (целые неотрицательные числа): p – порядок регрессионной части, d – порядок временного ряда, q – порядок скользящего среднего.

Пусть задан временной ряд {yi,} yi ϵ R. Модель ARMA(p,q) описывается формулой:

(1 - ∑i=1pφiLi)yt = (1 + ∑i=1qθiLi) ϵt,

где L – оператор сдвига, φi – параметры авторегрессионной части модели, θi – параметры скользящего среднего, ϵt – ошибка (чаще всего представляют собой независимые одинаково распределенные величины с нулевым средним).

ARIMA(p, d, q) модель является расширением ARMA (p, q) и имеет вид:

(1 - ∑i=1pφiLi)(1 - L)dyt = (1 + ∑i=1qθiLi) ϵt,

где порядок d задает уровень дифференцирования (при d = 0 модель сводится к ARMA).

Одним из частных случаев ARIMA-модели является процесс случайного блуждания – ARIMA(1, 0 1), определяемый формулой:

εt = ε(t-1) + δt.

Идентификация представляет собой задачу выбора подходящего подкласса ARIMA-моделей для конкретного временного ряда. Этот этап состоит из пунктов:

– определение порядка d, который обеспечит стационарность процесса;

– идентификация результирующего процесса ARIMA.

Нейронные сети находят широкое распространение в задачах принятия решений, в частности в финансовых сферах. Популярность применения нейросетевых технологий обусловлена рядом достоинств:

не предполагается никаких ограничений на характер входных данных;

информация, которая подается на вход нейронной сети, разными способами итеративно обрабатывается внутри ее конструкции. Благодаря этому с высокой вероятностью может быть достигнут желаемый оптимум (к примеру, минимизация ошибки).

нейронные сети способны определять оптимальные индикаторы для конкретной задачи и разрабатывать по ним наиболее оптимальную стратегию решения. Причем эта стратегия может быть адаптивной.

Существуют так называемые обучающиеся с учителем (supervised learning) и самообучающиеся (unsupervised learning) нейронные сети. Суть обучения с учителем заключается в том, что нейронной сети дается выборка обучающих примеров, которые она использует для тренировки. Таким образом на выходе получаются значения максимально близкие к эталонным.

Для реализации прогнозирования доходности на валютных рынках используются нейронные сети с учителем.

Проведем практический эксперимент краткосрочного прогнозирования доходности валютного рынка с применением нейронной сети.

Предлагается построить 3-х месячный прогноз доходности валютного рынка. Пусть имеются данные максимального изменения курса доллара к рублю за 1 год: с 01.11.2016 по 31.10.2017 (рис.1.)

Рисунок
Рисунок 1 – Изменение курса доллара к рублю за период 01.11.2016- 31.10.2017.

В качестве обучающей выборки будут использоваться данные за период 9 месяцев: с 01.11.2016 по 31.07.2017. Соответственно, тестовая выборка будет состоять из данных за 3 месяца: с 01.08.2017 по 30.10.2017, и на эти три месяца будет строиться прогноз.

Алгоритм реализации прогноза (рис.3.) разработан с применением полносвязной нейронной сети. Принцип такой топологии заключается в том, что каждый нейрон подает выходной сигнал на вход другим нейронам, включая самого себя. Схематичное описание работы алгоритма прогноза представлено на рис.3.

Этапы построения модели представлены на рис.2.

Рисунок
Рисунок 2 – Этапы построения модели.

Нейронная сеть включает в себя 120 нейронов, 1 входной и 1 выходной слой. Для реализации алгоритма используется среда разработки Python с импортированной библиотекой глубокого обучения Keras. Библиотека содержит внутри себя обучающие паттерны, которые непосредственно сразу можно использовать для работы.

Рисунок
Рисунок 3 – Алгоритм работы системы прогнозирования доходности валютных рынков с применением нейронных сетей.

Функция активации нейронной сети представляет собой гиперболический тангенс:

f(x) = e2x-1/e2x+1,f(x) ϵ [-1, 1]

Также Keras содержит множество функций ошибки. В данном алгоритме используется средняя абсолютная ошибка, которая вычисляется по формуле:

MAE = (1/N) ∑t=1N|Z(t) - Ž(t)|,

где Z(t) – фактическое значение, Ž (t) – прогнозное.

После подготовительной обработки данных (преобразования обучаемой и тестовой выборки в матрицы), производится, соответственно, обучение и тестирование. В обучении применяется алгоритм обратного распространения ошибки.

Метод fit принимает на вход обучающую выборку с некоторыми случайными весами (равномерно распределенными случайными величинами), параметр batch_size и количество эпох (epochs). Размер батча определяет количество данных, подаваемых за раз, и долю обучающей выборки, отдаваемой под валидацию (вычисление ошибки).

За одну эпоху модель проходит всю обучающую выборку. Ошибка вычисляется на каждом батче, после чего усредняется, и это значение после каждой эпохи возвращается обратно, чтобы в следующей эпохе усредненное значение ошибки уменьшилось. Наконец, происходит этап тестирования. Первый эксперимент (рис.4.) проводился для количества эпох, равного 200. В результате средняя абсолютная ошибка равна 0,186 и прогноз получился недостаточно точным. Второй эксперимент (рис.5.) был проведен для количества эпох, равного 500. Значение средней абсолютной ошибки получилось равным 0,141 и, соответственно, был получен более точный прогноз.

Третий прогноз проведен для 800 эпох. Точность прогноза значительно снизилась, средняя абсолютная ошибка равна 1,132. Таким образом, дальше обучать нейросеть дальше нет смысла, т. к. при epochs>500 модель хорошо приближает обучающую выборку, а на тестовой выборке получает плохое приближение. Отсюда следует вывод, что оптимальный прогноз был достигнут на данных второго эксперимента.

Рисунок
Рисунок 4 – Прогноз для 200 эпох

Рисунок
Рисунок 5 – Прогноз для 500 эпох

На основании вышеизложенного, можно сделать вывод о том, что решение задачи прогнозирования доходности валютных рынков является актуальным процессом. В результате прогнозирования уменьшается риск принятия неверных решений при работе с финансами.

Произведен анализ математических методов прогнозирования временных рядов, таких как простейший метод экспоненциального сглаживания, метод Брауна, метод Хольта, метод Тейла-Вейджа и модель авторегрессионного интегрированного скользящего среднего.

Современной технологией прогнозирования являются нейронные сети, получившие широкое применение для решения разного рода задач.

В работе реализован прогноз валютного курса доллара к рублю с применением полносвязной нейронной сети. Наилучший результат достигнут на испытании для 500 эпох.


Cписок литературы:
1. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования временных рядов: Учеб. пособие. – М.: Финансы и статистика, 2003. – 416 с.
2. Тихонов Э.Е. Методы прогнозирования в условиях рынка: учебное пособие. - Невинномысск, 2006. – 221 с.
3. Бэстенс Д.-Э., ван ден Берг В.-М., Вуд Д. Нейронные сети и финансовые рынки: принятие решений в торговых операциях. – Москва: ТВП, 1997. – 236 с.
4. (Электронный ресурс) URL: http://www.machinelearning.ru
5. Хайкин, Саймон. Нейронные сети: полный курс, 2-е издание.: Пер. с анг. – М.: Издательский дом «Вильямс» 2006. – 1104 с.