A SHORT-TERM ELECTRICITY PRICE FORECASTING ON THE RUSSIAN MAR-KET USING THE SCARX MODELS CLASS
Table of contents
Share
Metrics
A SHORT-TERM ELECTRICITY PRICE FORECASTING ON THE RUSSIAN MAR-KET USING THE SCARX MODELS CLASS
Annotation
PII
S042473880003318-8-1
DOI
10.31857/S042473880003318-8
Publication type
Article
Status
Published
Authors
Dmitry Afanasyev 
Affiliation: Financial University under the Government of the Russian Federation
Address: ,
Elena Fedorova
Occupation: Professor to the Department of financial management
Affiliation: Financial University under the Government of the Russian Federation
Address: Russian Federation
Pages
68-84
Abstract

 

  Diebold—Mariano test (DM-test). The historical data of price and planed consumption in the Europe–Ural and Siberia price areas of the Russian electricity exchange were used for the numerical experiment, while testing period is 104 week or 728 days long. The study shows that in the Russian markets SCARX-W model exhibits more accurate forecast compare to SCARX-HP and ARX. The minimal weekly error achieved on Europe–Ural price area is 4,932%, daily error — 4,997%. The same indicators for Siberia price area are 9,144% and 10,051%, correspondingly. The same results are proved by the formal DM-test carried for each hour in trading day. In order to overcome the problem of a priori selection of smoothing parameters, it is proposed to use various methods of forecast combinations.

 

Keywords
electricity price forecasting, seasonal component autoregressive, wavelet-smoothng, Hodrick—Prescott filter, Diebold—Mariano test
Received
14.03.2019
Date of publication
21.03.2019
Number of purchasers
34
Views
708
Readers community rating
0.0 (0 votes)
Cite Download pdf 100 RUB / 1.0 SU

To download PDF you should sign in

Full text is available to subscribers only
Subscribe right now
Only article
100 RUB / 1.0 SU
Whole issue
720 RUB / 15.0 SU
All issues for 2019
2534 RUB / 30.0 SU
1

1. Введение

2 В последние 25—30 лет прогнозирование цены электроэнергии, которая формируется на оптовом рынке, стало одной из наиболее актуальных и вместе с тем достаточно сложных задач, решаемых в рамках операционной деятельности генерирующих компаний и крупных потребителей (Eydeland, Wolyniec, 2012; Weron, 2014). Причиной этому послужил глобальный мировой тренд дерегулирования сектора электроэнергетики, который в первом десятилетии XX в. затронул и Россию. Планирование деятельности энергокомпаний в рыночных условиях ценообразования существенно усложнилось, а принимаемые финансовыми службами решения привели к более существенным последствиям (Carmon, Coulon, 2014).
3 В чем сложность прогнозирования цены электроэнергии? Прежде всего в особенностях свойств этого продукта, которые приводят к существенным отличиям динамики рынка электроэнергии от других товарных рынков. Для нее характерны (Casazza, Delea, 2003; Janczura et al.,2013; Carmon, Coulon, 2014): невозможность формирования запасов, совпадение моментов производства и потребления, высокая волатильность цены, наличие выбросов в ценах, краткосрочная неэластичность спроса по цене, тенденция возврата цены к среднему значению, использование поставщиками различных технологий генерирования электроэнергии с существенно отличающимися размерами предельных издержек.
4 Учитывая актуальность обсуждаемой проблемы, неудивительно, что за последние 15—20 лет было предложено много различных математических инструментов и моделей для формирования прогноза. Одной из наиболее динамически развивающихся здесь областей является краткосрочное прогнозирование, которое ставит задачу сформировать понимание динамики цены на ближайшие 24 часа для так называемого рынка «на сутки вперед» (РСВ). Комплексный обзор последних достижений в этом направлении можно найти в работе (Weron, 2014). В ней же автор отмечает один из существенных пробелов в имеющейся на текущий момент литературе: мало внимания уделяется вопросам моделирования и прогнозирования долгосрочной тренд-сезонной компоненты в динамике цены на электроэнергию, особенно в контексте построения краткосрочного прогноза.
5 Действительно, с одной стороны, интуитивно понятно, что при работе с горизонтом в 24 часа важнее всего учитывать краткосрочную дневную и недельную сезонные компоненты, в то время как трендовой составляющей можно пренебречь, заменив ее на простое среднее за период от одного года и более в прошлом. С другой стороны — есть ли формальные или эмпирические данные для подтверждения такой рассуждений. В работе (Nowotarski, Weron, 2016) задаются этим вопросом и сравнивают предложенную ими модель SCARX (Seasonal Component AutoRegressive — авторегрессия с сезонной компонентой и экзогенными факторами) — комбинацию экстраполяции оценочной тренд-сезонной составляющей на базе модели случайного блуждания и прогноза остатка, полученного с помощью авторегрессии, — с традиционной моделью ARX. Авторы приходят к выводу, что учет долгосрочной компоненты, а также правильный выбор метода и параметров для ее оценки ведут к существенному повышению точности получаемых прогнозов. Особенностью прогнозирования цены электроэнергии на РСВ России является относительная скромность числа академических исследований на данную тематику. В то же время на рынке существует ряд компаний, которые готовы оказывать информационно-консультационных услуги по формированию прогнозов цены, но при этом ожидаемо не раскрывают детали используемых алгоритмов и моделей. Среди них можно упомянуть компанию «StatSoft Russia» (система «Energy–Forecast: Цены»)1, ООО «Форексис» (система «Energy4Cast»)2, ООО «ЭНКОСТ»3 и пр. Исключение здесь составляет прогнозирование Математического бюро4. Его информация на официальном сайте этой компании основывается на публично доступной диссертационной работе одного из ее организаторов (Чучуева, 2012). Учитывая вышесказанное, целью данного исследования является апробация и проверка оправданности применения предложенного (Nowotarski, Weron, 2016) класса моделей SCARX на российском рынке на сутки вперед. Его результаты не только расширят число общедоступных подходов к прогнозированию цены электроэнергии на рынке России, так и позволит более детально верифицировать результаты, полученные ранее упомянутыми исследователями. Для достижения указанной цели в работе решается ряд задач. Во-первых, выбираются бенчмарк-модели, с которыми будет выполняться сравнение точности прогноза SCARX («наивная» модель (Nogales et al., 2002) и экономичная ARX-спецификация (Misiorek et al., 2006)). Во-вторых, кратко рассматривается математический формализм класса моделей SCARX и методов оценки долгосрочной тренд-циклической компоненты, применяемой в рамках SCARX. В-третьих, обосновывается выбор базовых мер ошибки, с помощью которых сравнивается качество полученных прогнозов, а также предлагается использовать формальную процедуру сравнения прогностических способностей — тест (Diebold, Mariano, 1995). В-четвертых, формируются наборы данных о цене электроэнергии на РСВ и прогнозе потребления. Наконец, в-пятых, выполняется эмпирическое сравнение точности SCARX с более простыми — «наивной» и моделями ARX, а также сопоставляется аккуратность прогнозов, получаемых на базе SCARX с различными методами сглаживания временных рядов.
1. >>>>

2. >>>>

3. >>>>

4. >>>>
6 Отметим так же еще два важных, на наш взгляд, момента. Во-первых, существует неоднозначное мнение, что модели прогнозирования, разработанные для европейских бирж (в частности Nord Pool), не применимы для российского рынка (Валь, Клепче, 2011). Поэтому апробация SCARX для рынка России позволит верифицировать и это утверждение, которое кажется спорным, как минимум, из-за статистической природы авторегрессионных моделей, которая не зависит от конкретных особенностей рынка. Во-вторых, в отличие от (Nowotarski, Weron 2016), впервые предложивших модель SCARX, мы рассматриваем более широкий набор производных показателей. В частности, кроме средневзвешенной недельной, была рассчитана средневзвешенная дневная ошибка; рассчитывалось число недель (дней), для которых модель SCARX оказалась точнее всех других моделей; число недель (дней), для которых SCARX оказалась точнее «наивной»; число недель (дней), для которых SCRAX оказалась точнее ARX; среднее отклонение от лучшей для каждой недели (дня) модели. Анализ всех этих показателей позволил более детально сравнить рассматриваемые модели и сделать ряд новых выводов, которые не были обозначены ранее в (Nowotarski, Weron 2016).
7

2. Методология исследования

8 2.1. Модели прогнозирования. Построение модели и прогнозирование цены электроэнергии выполнялось для каждого часа суток отдельно. Такой подход широко распространен в литературе (Weron, 2014) и позволяет упростить модель, исключив слагаемые, характеризующие обычные внутридневные сезонные колебания. Кроме того, в контексте задачи прогнозирования на сутки вперед такой подход позволяет вычислять прогноз не на 24 шага, а только на один, который имеет наиболее узкий доверительный интервал. Наконец, каждая модель позволяет учитывать существенно различную динамику цены в рамках каждого часа суток, что объясняется периодическими дневными колебаниями спроса, различными затратами генерирующих станций и операционными ограничениями. В качестве бенчмарк-модели мы рассмотрели подход, предложенный в (Nogales et al., 2002; Conejo et al., 2005) и основанный на идентичности внутрисуточных профилей цены электроэнергии для соответствующих дней недели: где — цена электроэнергии в момент времени ; — номер дня недели. Таким образом, если прогноз рассчитывается на понедельник, субботу или воскресенье, то цена полагается равной цене неделю назад. В остальных случаях используется цена вчерашнего дня. Данную модель будем называть «наивная». В (Nogales et al., 2002) авторы отмечают, что зачастую плохо специфицированная и откалиброванная альтернативная модель оказывается хуже по параметру средней ошибки прогноза, чем «наивная» модель. Поэтому последняя может быть использована как эталонная модель для сравнения аккуратности прогнозирования, т.е. бенчмарка. В качестве основной модели для построения прогноза цены электроэнергии на сутки вперед мы выбрали авторегрессионную спецификацию, предложенную ранее в (Misiorek et al., 2006) и применявшуюся в ряде недавних работ (см., например, (Maciejowska et al., 2016)): где — авторегрессионные составляющие, учитывающие влияние цен 1, 2 и 7 дней назад; — ценовой сигнал для участников рынка, который рассчитывается как минимальная цена за предыдущие сутки, т.е. , — прогноз потребления электроэнергии; — фиктивные бинарные переменные для понедельника, субботы и воскресенья (), учитывающие недельную сезонность цены (уменьшение цены в выходные дни из-за снижения спроса и рост цены в понедельник по сравнению с воскресеньем); — независимая и идентично распределенная ошибка модели с нулевым средним и конечной дисперсией , где — коэффициенты модели при соответствующих переменных.
9 Для стабилизации волатильности временных рядов цен и спроса при оценке параметров модели выполнялось логарифмическое преобразование. Кроме того, из временных рядов цен (для каждого часа суток) и ценовых сигналов предварительно удалялись средние значения. Оценка параметров модели выполнялась с помощью метода наименьших квадратов. Результирующий прогноз вычислялся в виде экспоненты от суммы среднего значения цены данного часа и прогноза, полученного из приведенной выше модели. Для ее обозначения будем далее использовать аббревиатуру ARX (AR — авторегрессия, X — учет (путем включения в модель переменной экзогенного фактора; Zt – прогноз потребления; в литературе по моделированию добавление в аббревиатуру класса моделей буквы X традиционно обозначает дополнительное включение в спецификацию одного и более экзогенных факторов) влияния экзогенного фактора прогноза потребления).
10 В (Nowotarski, Weron, 2016) показано, что анализ долгосрочной сезонной компоненты при построении прогноза цены на электроэнергию может существенно улучшать качество получаемых результатов. Предлагаемая этими авторами схема далее будет обозначена как SCARX (SC — сезонная компонента) и состоит из следующих шагов.
11
  1. Из временного ряда логарифмированных часовых цен электроэнергии выделяется в аддитивной форме долгосрочная сезонная и краткосрочная сезонная стохастическая компоненты:
  2. Для краткосрочной сезонной стохастической компоненты для каждого часа суток строится прогноз на одно наблюдение вперед.
  3. Для долгосрочной сезонной составляющей строится прогноз на 24 часа вперед.
  4. Полученные на шаге 2 и 3 прогнозы складываются для соответствующих часов суток и выполняется обратное логарифмическое преобразование (суть — экспонента), которое и дает финальный прогноз .
12 Для формирования прогноза предлагается использовать рассмотренную выше ARX-модель. Что касается , то, принимая во внимание, что решается задача краткосрочного прогнозирования на сутки вперед, на таком временном интервале предлагается считать долгосрочную динамику неизменной, а прогнозные значения на 24 точки вперед равными ценам за последние сутки для соответствующих часов. Аналогичный подход был использован ранее в (Lisi, Nan, 2014). Формально используется модель случайного блуждания вида
13 Основной вопрос, который широко обсуждается в литературе (Hyndman, Athanasopoulos, 2013; Lisi, Nan, 2014; Weron, Zator, 2015), связан с первым шагом данного подхода; он состоит в выборе метода выделения из исходного временного ряда цен. В следующем разделе будут рассмотрены некоторые процедуры, которые были использованы для решения данной задачи.
14 2.2. Долгосрочная сезонная компонента. Напомним некоторые из наиболее распространенных подходов, которые используются в работах, посвященных исследованию рынков электроэнергии к оценке трендовой составляющей :
15
  • регрессия на полиномы различной степени (De Jong, 2006);
  • скользящее среднее (в том числе экспоненциально-взвешенное), или медиана (Nowotarski et al., 2013);
  • регрессия на фиктивные переменные для каждого месяца в году (Haldrup et al., 2010);
  • разложение Фурье, т.е. декомпозиция на сумму синусоидальных функций различной частоты (De Jong, 2006; Janczura et al., 2013);
  • вейвлет-разложение, где в качестве базиса используются различные семейства вейвлетов — локализованных во времени, автомодальных (самоподобных) функций с нулевым средним (Nowotarski et al., 2013, Федорова, Афанасьев, 2015; Weron, Zator, 2015, Afanasyev, Fedorova, 2016);
  • фильтр Ходрика—Прескотта (HP) (Hodrick, Prescott, 1997), основанный на решении оптимизационной задачи для заданного параметра сглаживания (Weron, Zator, 2015).
16 Последние два подхода получили широкое распространение в недавних исследованиях по экономике электроэнергетики благодаря их эффективности, продемонстрированной ранее, а также наличию готовой реализации во многих прикладных программных продуктах. Остановимся на них немного более подробно.
17 Вейвлет-декомпозиция заключается в разложение исходного временного ряда по ортогональному базису — смещенной и масштабированной версии некоторого вейвлета . Для дискретного диадного вейвлет-преобразования (ДВП) декомпозиция может быть записана в виде где — материнский вейвлет; — постоянный нормирующий множитель; — параметр смещения; — параметр масштаба, увеличение которого на единицу приводит к растяжению вейвлета в два раза.
18 Исходный временной ряд представляется в виде совокупности последовательных приближений грубой (аппроксимирующей или сглаженной) и уточненной (детализирующей) составляющих с их последующим уточнением методом итерации
19 При этом базисный вейвлет для аппроксимирующей составляющей называют отцовским, а для детализирующей — материнским. Итерационная процедура быстрого вейвлет-преобразования получила название анализа от тонкого к грубому. На первом шаге для разложение совпадает с самим сигналом. На втором шаге сигнал преобразуется к виду , где — сглаженная версия . На третьем шаге — к виду , где — сглаженная версия , которая имеет больший характерный период изменения, чем . Подобным образом процедура повторяется и далее. Варьируя значения , можно получать различную степень сглаженности исходного сигнала, которая определяется как .
20 Руководствуясь результатами (Nowotarski et al., 2013; Nowotarski, Weron, 2016), в качестве базисного мы использовали вейвлет Добеши с порядком 24. Так как нет однозначного ответа на вопрос, какой уровень сглаживания необходимо использовать для того или иного временного ряда, то мы рассмотрели достаточно широкий диапазон значений , что примерно соответствует сглаживанию на масштабах от трех дней (26 = 64 часа ≈ 3 дня) до одного года (213 = 8192 часа ≈ 341 день ≈ 1 год). Модель прогнозирования, использующую вейвлет-декомпозицию, будем далее обозначать SCARX-Wm.
21 HP-фильтр был предложен в работе (Hodrick, Prescott, 1997) для решения задачи разделения долгосрочного роста и бизнес-циклов в макроэкономическом контексте, а именно при исследовании динамики показателя ВВП. Данный фильтр не содержит никакой специфики, что позволяет его применять для задач в экономике электроэнергетики (Lisi, Nan, 2014; Weron, Zator, 2015). Оценка для заданного временного ряда цен электроэнергии , с помощью HP-фильтра получается решением следующей оптимизационной задачи:
22

23 где — параметр, определяющий степень сглаживания временного ряда: чем больше значение , тем более сглаженный ряд получается на выходе HP-фильтра. Следуя (Nowotarski, Weron, 2016), в данной работе мы рассмотрели значения . Модель прогнозирования, использующую HP-фильтр, будем далее обозначать SCARX-HPλ.
24 2.3. Сравнение моделей прогнозирования. Для получения большого числа прогнозных значений , на базе которых можно было бы выполнить сравнение моделей, мы применили вневыборочную кросс-валидацию с фиксированным скользящим окном длиной 360 дней, или 8640 часов. На первом шаге модель оценивалась внутри окна, которое берет начало в первом наблюдении, и прогноз рассчитывался на каждый час следующих за последним наблюдением суток. Далее калибровочное окно смещалось на один день вперед (т.е. 24 точки), и процедура повторялась на новом диапазоне точек временного ряда. Тестовый период, на котором прогнозы рассчитывались указанным способом, был выбран достаточно продолжительным и составил 104 × 7 = 728 дней, т.е. почти два года.
25 Оценка прогнозной способности каждой модели может быть выполнена путем расчета различных показателей ошибки прогнозирования. Наиболее широко распространенными являются такие меры, как средняя абсолютная ошибка (MAE)5, средняя относительная ошибка (MAPE) и среднеквадратичная ошибка (MSE) (Weron, 2014). Однако в литературе о рынках электроэнергии зачастую применяются средневзвешенные дневные (DMAE) и средневзвешенные недельные (WMAE) абсолютные ошибки:
5. Стоит отметить, что читателя не должно смущать определение «абсолютная ошибка». Данные показатели представляют собой долю средней абсолютной ошибки в средней цене за соответствующий период, ввиду чего также могут быть интерпретированы как относительные меры и измерены в процентах. В этом смысле они аналогичны средней относительной ошибке.
26

27

28 где и , а в качестве цен используются данные в исходной, нелогарифмированной шкале. Основное преимущество этих мер заключается в том, что они хорошо интерпретируются и по сути аналогичны средней относительной ошибке, но одновременно — существенно более устойчивы к близким к нулю ценам, которые нередко встречаются на рынках электроэнергии. Кроме того, так как речь идет о краткосрочном прогнозировании, то основной интерес представляет величина ошибки прогноза за относительно короткие промежутки времени — сутки и неделю. Принимая во внимание это обстоятельство, мы в данной работе выполнили сравнение прогностических способностей моделей на базе показателей DMAE и WMAE.
29 Использование различных метрик ошибок прогноза, наподобие рассмотренных выше, является на текущий момент наиболее распространенным подходом при сравнении качества моделей прогнозирования. Однако в общем случае при тестировании на различных подвыборках данных получаемые значения для одной и той же модели могут варьировать достаточно сильно. Если же меры ошибки двух моделей отличаются незначительно, то это может быть следствием не реального различия качества, а всего лишь статистической погрешностью. Для формального сравнения (Diebold, Mariano, 1995) предложили процедуру тестирования, которая получила название DM-теста. Рассмотрим ее немного подробнее.
30 Пусть — прогноз цены по модели для момента времени ; — фактическая цена в этот же момент; — некоторая мера отличия прогнозного значения от реального. Введем зависящую от функцию потерь каждой модели и дифференциал потерь . Как показали (Diebold, Mariano, 1995), если выполнена гипотеза (качество прогноза двух моделей одинаковое), то при условии слабой стационарности временного ряда тестовая DM-статистика будет иметь стандартное нормальное распределение: где — выборочное среднее дифференциала потерь; — оценка его дисперсии. Вычисление последней отличается для двух ситуаций: прогноз на один шаг вперед и прогноз на два и более шагов. Во втором случае необходимо учитывать тот факт, что ошибки различных моделей коррелированы между собой (как одновременно, так и серийно), а это, в свою очередь, требует корректировать оценки. Однако так как в нашем случае прогнозы рассчитывались для каждого часа отдельно и на один шаг вперед, то в качестве оценки дисперсии дифференциала потерь допустимо использовать обычную выборочную дисперсию (несмещенную версию). При этом важно отметить, что сравнение выполнялось не для прогнозов в целом на сутки вперед, а для каждого часа. Следуя (Nowotarski et al., 2014), была выбрана как функция потерь, т.е. функция вида .
31 Используя DM-тест, мы проверили две односторонние гипотезы с уровнем значимости или . Первая утверждает, что потери при прогнозе средствами модели 1 меньше, чем модели 2, т.е. , что эквивалентно выполнению условия , где — перцентиль стандартного нормального распределения. Смысл второй гипотезы противоположен. Так, вторая гипотеза утверждает, что модель 2 приводит к более качественным прогнозам и меньшим потерям по сравнению с моделью 1, что соответствует ситуации или .
32 2.4. Данные. В исследовании мы протестировали рассмотренные выше модели прогнозирования на трех электроэнергетических рынках на сутки вперед: ценовые зоны Европа–Урал (EU) и Сибирь (SI) российской биржи АТС, а также крупнейшей европейской биржи Nord Pool (NP), объединяющей электроэнергетические рынки Норвегии, Швеции, Финляндии, Дании, Эстонии, Латвии и Литвы.
33 Для российских рынков использовались данные за период с 01.01.2014 по 23.12.2016. Цена электроэнергии была получена на официальном сайте «Системного оператора Единой энергетической системы» (СО ЕЭС), где она публикуется в открытом доступе (показатель «Цена РСВ»)6. В данных для зоны EU присутствовало 28 пропусков, которые были заменены на цену соответствующего часа предыдущих суток. Аналогично были обработаны 24 пропуска для региона SI. Учитывая, что доля таких замен от общего числа наблюдений (всего 26112 точек) несущественная, подобная предобработка данных, по нашему мнению, не могла существенно повлиять на результаты сравнения. Что касается спроса, то для него мы использовали часовые прогнозные значения потребления, также доступные на сайте СО ЕЭС (показатель «Планируемое потребление»)7.
6. См. отчет «Ценовые показатели» (http://br.so-ups.ru/Public/MainPageData/BR/IndicatorBR.aspx).

7. См. отчет «Генерация и потребление» (http://br.so-ups.ru/Public/MainPageData/BR/GenConsum.aspx).
34 На рис. 1 и 2 показана динамика показателей для обеих ценовых зон в указанный период. Вертикальная линия разделяет первый калибровочный период (который смещался в процессе кросс-валидации на 24 точки вперед на каждом шаге) и период, на котором осуществлялось тестирование прогностических способностей рассматриваемых моделей.
35 Для европейского рынка Nord Pool были использованы данные за период с 01.01.2013 по 24.12.2015. Данные по часовым системным ценам (показатель «SYS») и прогнозу потребления (сумма показателей «Consumption prognosis» для Норвегии, Швеции, Финляндии и Дании) были получены с официального сайта биржи8. На рис. 3 приведены временные ряды показателей в указанный период.
8. См. отчет «Historical Market Data» (http://nordpoolspot.com/historical-market-data/).
36 Отметим, что для данного рынка мы протестировали модели на том же периоде, что и (Nowotarski, Weron, 2016). Это дало возможность сопоставить и верифицировать результаты, полученные ранее этими исследователями. В то же время апробация на российских рынках описанного в предыдущем разделе подхода к прогнозированию цены электроэнергии выполняется впервые.
37 2.5. Результаты. Рассмотрим полученные в рамках эмпирического эксперимента результаты сравнения качества прогнозов, формируемых посредством «наивной», ARX, SCARX-W и SCARX-HP моделей.
38 Учитывая, что тестовый период был выбран равным 104 неделям (или 728 дням), для каждой модели мы получили соответствующее число значений WMAE и DMAE. Для дальнейшего анализа на их основе были рассчитаны следующие показатели.
  1. () — арифметическое среднее всех значений WMAE (DMAE), выраженное в процентах (так как отдельное значение представляет собой долю MAE в средней цене за период).
  2. NBest — число недель (дней), для которых модель оказалась лучшей, т.е. показала минимальное значение WMAE (DMAE).
  3. N
39 где i — номер недели (дня), а k — модель прогнозирования.
40 Полученные результаты сравнения по недельным и дневным метрикам ошибки в целом оказались идентичными, поэтому далее мы подробно рассмотрим только табл. 1, которая содержит показатели на базе WMAE (см. таблицу в Приложении). Ее анализ позволяет сделать следующие выводы.
41 1. Модель ARX и все варианты SCARX на рынках EU и NP (за исключением SCARX-W6) оказались лучше «наивной» модели в смысле минимизации ошибки прогноза ). Этот же вывод подтверждается и при сравнении среднего отклонения от лучшей модели в рамках каждой недели . Также видно, что данные модели демонстрируют более высокую точность, чем «наивный» подход, для более чем половины недель тестового периода: наименьшее значение N
42 Таблица 1. Недельные показатели прогностических способностей «наивной», ARX, SCARX-W и SCARX-HP моделей для трех рынков электроэнергии: ценовые зоны Европа–Урал и Сибирь российской биржи АТС, а также европейская биржа Nord Pool
43
Модель АТС Европа—Урал (EU) АТС Сибирь (SI) Nord Pool (NP)
NBest N N NBest N N NBest N<Naive N<ARX
«Наивная» 5,796 13 28 1,164 9,606 33 47 1,751 9,661 24 43 2,462
ARX  5,099 13 76 0,467 9,394 9 57 1,539 8,499 10 61 1,300
SCARX-W6 5,475 10 62 40 0,843 9,993 2 47 36 2,137 9,988 8 39 28 2,789
SCARX-W7 5,262 7 76 43 0,630 9,464 5 52 51 1,608 8,598 16 60 53 1,399
SCARX-W8 5,104 3 78 54 0,472 9,144 4 57 55 1,288 8,389 5 70 62 1,190
SCARX-W9 5,042 0 79 51 0,410 9,267 3 57 58 1,411 8,309 5 66 67 1,110
SCARX-W10 4,975 2 79 58 0,343 9,219 1 61 56 1,363 8,332 1 63 66 1,133
SCARX-W11 4,973 2 79 57 0,341 9,225 3 56 54 1,370 8,417 3 62 58 1,218
SCARX-W12 4,963 7 80 62 0,331 9,410 11 52 47 1,555 8,452 2 61 52 1,253
SCARX-W13 4,932 22 81 62 0,300 9,280 12 56 57 1,425 8,462 1 61 48 1,263
SCARX-HP1∙108 5,228 4 72 42 0,596 9,769 3 50 45 1,913 8,664 6 65 55 1,465
SCARX-HP5×108 5,205 1 75 43 0,574 9,780 2 52 49 1,925 8,696 2 66 54 1,497
SCARX-HP1×109 5,195 1 76 42 0,563 9,735 1 55 48 1,879 8,717 4 64 54 1,518
SCARX-HP5×109 5,168 2 77 48 0,536 9,685 4 56 53 1,830 8,758 3 65 52 1,559
SCARX-HP1×1010 5,158 4 78 48 0,527 9,706 2 57 48 1,850 8,765 2 65 53 1,566
SCARX-HP5×1010 5,139 2 75 48 0,507 9,774 3 54 50 1,918 8,764 0 60 50 1,565
SCARX-HP1×1011 5,131 4 72 47 0,500 9,809 1 53 50 1,953 8,756 4 59 49 1,557
SCARX-HP5×1011 5,116 7 73 48 0,484 9,930 5 45 45 2,074 8,727 8 61 49 1,528
Примечание. усредненная по 104 неделям WMAE; приведена в процентах (доля MAE в средней цене за неделю). NBest — число недель, для которых модель оказалась лучшей. N — число недель, для которых модель лучше «наивной». N<ARX — число недель, для которых модель лучше, чем ARX. — среднее отклонение от лучшей для каждой недели модели. Полужирным выделены и для SCARX-моделей, которые оказались меньше, чем для ARX-модели. Подчеркиванием отмечены минимальные и ; курсивом выделены и , значения которых превышают соответствующие показатели для «наивной» модели.
44 Для рынка SI ситуация несколько иная. Здесь модели ARX и все SCARX-W (за исключением SCARX-W6) оказались также точнее «наивной» (), в то время как ни одна SCARX-HP модель не продемонстрировала более высокого качества. При этом число недель N
45 Интересно отметить, что аналогичный по сути вывод можно сделать и для «наивной» модели на рынках SI и NP, если сравнивать ее с результатами, полученными средствами модели ARX. Видно, что число недель N
46 2. SCARX-W-модели оказываются в среднем точнее, чем ARX-модели для большинства значений параметра масштаба : на рынках EU и SI в 5 из 8 случаев, для биржи NP — в шесть из восьми. Оптимальные значения находятся преимущественно в диапазоне от 8 до 13, в то время как 6 из 7 на всех биржах показывают результаты хуже, чем ARX-модель. В целом это ожидаемо, так как последние соответствуют сглаживанию на периодах примерно три и шесть дней, что приводит к достаточно волатильной оценке долгосрочной тренд-сезонной составляющей. Кроме того, при таком уровне сглаживания в нее включается краткосрочная сезонная недельная компонента (с характерным периодом в семь дней), которая тем не менее не учитывается при формировании прогноза тренда на базе модели случайного блуждания.
47 Что касается моделей SCARX-HP, то, как видно из данных, представленных в табл. 1, на всех рынках они оказываются хуже, чем ARX, не зависимо от выбранного значения параметра сглаживания временного ряда. Более того, как было отмечено выше, на рынке SI данный класс моделей не выигрывает даже у простой «наивной» модели. Это позволяет утверждать, что применение HP-фильтра для выделения тренда в контексте краткосрочного прогнозирования цены электроэнергии неоправданно, в то время как вейвлет-декомпозиция зачастую приводит к повышению средней точности прогнозов.
48 3. Для ценовой зоны Европа–Урал российской биржи АТС лучшие результаты (в смысле минимизации средней ошибки) показала модель SCARX-W13, для которой . Данная модель оказалась точнее «наивной» на 0,864% и в течение 81 недели была лучше нее. По сравнению с ARX аккуратность повысилась на 0,167%, а на 62 неделях ARX проигрывала SCARX-W13.
49 В свою очередь, для зоны «Сибирь» наиболее точной оказалась модель SCARX-W8 с ошибкой . Уменьшение ошибки прогноза относительно «наивной» и ARX моделей составило 0,462 и 0,250% соответственно. В течение 57 недель SCARX-W8 была точнее «наивной» модели, и 55 недель — чем ARX.
50 Наконец, на европейском рынке Nord Pool минимальную ошибку показывает SCARX-W9. Здесь точность удалось повысить на 1,352% относительно «наивной» модели и на 0,190% — по сравнению с ARX. В течение 66 недель SCARX-W9 опережала первую и в течение 67 недель — последнюю.
51 Стоит отметить, что не всегда наиболее точная в среднем модель оказывалась такой же точной чаще других в рамках отдельных недель тестового периода. Так, на рынке EU, где NBest = 22 для самой аккуратной в среднем модели, это наблюдение справедливо, в то время как на SI и NP чаще всего наиболее точной оказывалась «наивная» модель (33 и 24 недели соответственно), а лучшие в среднем модели на отдельных неделях оказывались таковыми только в четырех для SI и пяти для NP случаях. Хотя это выглядит странно, но свидетельствует лишь о том, что другие модели, демонстрируя лучший результат на конкретных неделях, оказываются существенно менее точными на оставшихся периодах.
52 4. Эмпирические результаты показывают, что наибольшее повышение точности за счет использования моделей типа SCARX удается получить на тех рынках, где тренд выражен более отчетливо. Действительно, визуальный анализ рис. 1—3 показывает, что на бирже EU тренд практически отсутствует, в то время как для SI и NP он прослеживается гораздо более явно. В свою очередь, уменьшение ошибки (для лучшей SCARX-модели) на первой бирже EU оказалось наименьшим (0,167%), в то время как на двух других показало более высокие значения (0,250 и 0,190% соответственно).
53 По нашему мнению, наиболее существенное повышение точности прогнозов для модели SCARX достигается за счет компромисса между уровнем сглаживания для оценки тренда и волатильностью остатка: с одной стороны, сильное сглаживание приводит к менее вариативному и более прогнозируемому остатку, но с другой — тренд становится недостаточно персистентным, чтобы можно было применять модель случайного блуждания, и включает нерелевантные краткосрочные изменения.
54 Для формальной проверки результатов сравнения на базе средневзвешенных ошибок мы также выполнили DM-тест на статистически значимое различие качества прогнозов между моделью ARX и лучшей в каждом классе методов сглаживания модели SCARX. Для вейвлет-декомпозиции это — W13 на рынке EU, W8 — на SI и W9 — на NP. Для HP-фильтра — HP5×1011, HP5×109 и HP1×108 соответственно. Как упоминалось ранее, тестирование производилось для каждого часа суток.
55 На рисунке показаны результаты DM-теста для каждого часа суток. Здесь, если статистика теста (вертикальная непрерывная линия) превышает верхнее критическое значение (пунктирная линия в положительной области), то качество прогноза SCARX признается статистически лучше на уровне 5%, чем качество прогноза ARX. Если же статистика отрицательная и меньше нижнего критического значения (пунктирная линия в отрицательной области), то точность прогноза SCARX классифицируется как значимо более низкая на уровне 5%.
56 Таблица 2. Агрегированные результаты DM-тестов наиболее точных моделей SCARX-W и SCARX-HP (на каждом из рынков) против спецификации ARX
57
Парамент  АТС Европа—Урал (EU) АТС Сибирь (SI) Nord Pool (NP)
SCARX-W13 SCARX-HP5×011 SCARX-W8 SCARX-HP109 SCARX-W9 SCARX-HP1×108
Nbetter 10 (42) 4 (17) 9 (38) 7 (29) 7 (29) 3 (13)
Nworse 1 (4) 7 (29) 3 (13) 14 (58) 4 (17) 8 (33)
Примечание. Nbetter — число часов, для которых модель SCARX прогнозирует значимо точнее, чем ARX; Nworse — число часов, для которых модель SCARX прогнозирует значимо хуже, чем ARX. В скобках приведены значения доли (в процентах от числа) торговых периодов в сутках (для исследуемых рынков — 24 часа).
58 Табл. 2 содержит агрегированные показатели тестирования — число часов, для которых SCARX оказалась лучше и хуже ARX, а также их процент от общего числа торговых периодов в сутках. Анализ ее данных позволяет сделать вывод, что DM-тест в целом подтверждает полученные выше результаты сравнения моделей на базе . Во-первых, модель SCARX-W на каждом из рынков достаточно редко оказывается хуже ARX: максимальный процент часов (когда одна модель лучше другой) здесь оказался 17% (4 часа) для рынка NP, в то время как минимальный составляет 4% (1 час) для биржи EU. Во-вторых, SCARX-W опережает ARX по качеству прогноза минимально в 29% случаев (7 часов) на рынке NP, в то время как максимальное значение показателя составляет 42% (10 часов) на бирже EU. В-третьих, SCARX-HP демонстрирует результаты хуже SCARX-W на всех рассмотренных рынках, так как число часов NBetter для модели на базе HP-фильтра в среднем меньше в 1,6 раза, чем для модели с вейвлет-сглаживанием, в то время как число часов NWorse больше в 4,5 раза.
59 Возвращаясь к вопросу о применении моделей, разработанных для европейских бирж, на российском рынке электроэнергии (Валь, Клепче, 2011), можно сделать вывод, что, как и ожидалось, для рассмотренных в исследовании спецификаций их использование вполне оправдано. Очевидно, что причиной этого является как статистическая природа авторегрессионных моделей, так и принципиальная идентичность стилизованных свойств временных рядов цен в зонах рынка России и биржи Nord Pool.
60 Наконец, хотелось бы отметить, что период и данные для рынка Nord Pool в нашем исследовании были выбраны такими же, как в работе (Nowotarski, Weron, 2016), где была впервые предложена и апробирована модель SCARX. В целом наши результаты в части WMAE совпали с результатами указанных авторов. Однако мы обнаружили одно интересное отличие. Так, если по нашим расчетам усредненная величина WMAE для «наивной» модели составила 9,661%, то в первоисточнике она равняется 12,663%. Ввиду этого рост точности моделей ARX и SCARX в соответствии с нашими результатами оказывается меньше на 3%, что в контексте получаемых оценок ошибок является достаточно существенным значением. Однако в любом случае более сложные спецификации моделей оказались точнее, чем «наивная» модель для биржи Nord Pool, как и для российских рынков.
61

3. Заключение

62 В данной работе в контексте задачи краткосрочного прогнозирования цены выполнена апробация для российского оптового рынка электроэнергии (ценовые зоны Европа—Урал и Сибирь) класса моделей SCARX (Seasonal Component AutoRegressive), предложенного (Nowotarski, Weron, 2016). В отличие от более традиционной авторегрессионной спецификации ARX, не учитывающей долгосрочные изменения цены, модель SCARX представляет собой комбинацию экстраполяции тренд-сезонной компоненты (с использованием модели случайного блуждания) и прогноза остатка временного ряда (на базе авторегрессионной спецификации (Misiorek et al., 2006)). Для выделения трендовой составляющей использованы вейвлет-сглаживание и HP-фильтр. Проведено сравнение аккуратности прогнозов SCARX с ARX и «наивная» модель. Для этих целей использованы показатели средневзвешенной недельной и дневной ошибок, а также DM-тест.
63 Показано, что вариант модели SCARX с HP-фильтром приводит к менее точным результатам, чем ARX, в то время как использование вейвлет-сглаживания с корректно подобранным параметром масштаба позволяет повысить аккуратность прогнозов. Наиболее точной моделью для ценовой зоны Европа–Урал оказалась SCARX-W13, показав среднюю недельную ошибку в 4,932% и дневную — в 4,997%. Для зоны Сибирь — модель SCARX-W8 со средними ошибками 9,144 и 10,051% соответственно. С точки зрения результатов DM-теста, выполненного для каждого часа суток, в первой зоне лучшая модель оказалась статистически значимо более точной, чем ARX для 10 из 24 часов, а хуже — только для одного часа. Во второй зоне эти значения составили девять и три соответственно.
64 Несмотря на положительные результаты тестирования модели SCARX на российском рынке электроэнергии, можно обозначить определенные проблемы с необходимостью априорного выбора того метода и уровня сглаживания, который приведет к наилучшим результатам. И даже более того — хотя модели SCARX-W и показали себя в среднем более точными, чем ARX, но в принципе не существует возможности по формальным признакам заранее определить объективную потребность в использовании SCARX (для повышения точности прогнозов относительно ARX) в зависимости от выраженности тренда.
65 Учитывая это, в будущих исследованиях авторы планируют рассмотреть некоторые распространенные методы комбинирования прогнозов, полученных с помощью различных вариантов SCARX (с различными типами и параметрами сглаживания). Среди них можно выделить простое усреднение, усреднение на базе метода наименьших квадратов (МНК), метод наименьшего абсолютного отклонения, метод МНК с положительными коэффициентами, метод ограниченного МНК (с условием на сумму коэффициентов), байесовское усреднение моделей и усреднение с обратно пропорциональными среднеквадратичной ошибке весами. Как показано в ряде предыдущих работ (см., например, (Nowotarski и др., 2014)), применение подобной техники приводит к уменьшению средней ошибки прогноза. В случае моделей SCARX это также потенциально позволит нивелировать риск априорного выбора параметров сглаживания при оценке тренд-сезонной составляющей цены.
66 Приложение Таблица. Дневные показатели прогностических способностей «наивной», ARX-, SCARX-W- и SCARX-HP-моделей для трех рынков электроэнергии
67
Модель АТС Европа—Урал (EU) АТС Сибирь (SI) Nord Pool (NP)
NBest N<Naive N<ARX NBest N<Naive N<ARX NBest N N<ARX
«Наивная» 5,860 170 - 312 1,983 11,401 210 - 383 4,567 9,944 184 - 356 4,210
ARX  5,153 77 416 - 1,276 10,370 72 345 - 3,536 8,653 50 372 - 2,920
SCARX-W6 5,551 79 373 306 1,674 10,821 45 289 320 3,987 10,154 83 285 278 4,421
SCARX-W7 5,326 58 383 344 1,449 10,377 47 327 357 3,543 8,729 75 373 378 2,996
SCARX-W8 5,166 20 390 356 1,289 10,051 11 356 377 3,217 8,519 33 381 379 2,785
SCARX-W9 5,102 19 419 375 1,225 10,121 19 353 386 3,287 8,436 22 378 395 2,703
SCARX-W10 5,034 18 418 381 1,157 10,086 14 364 388 3,251 8,459 10 387 390 2,726
SCARX-W11 5,029 23 428 390 1,152 10,093 14 350 381 3,259 8,547 22 395 391 2,814
SCARX-W12 5,018 29 434 393 1,141 10,275 49 340 350 3,441 8,592 31 379 365 2,859
SCARX-W13 4,997 73 445 418 1,120 10,236 62 358 416 3,402 8,642 41 377 371 2,908
SCARX-HP1×108 5,286 39 408 363 1,409 10,612 30 347 354 3,778 8,776 47 374 368 3,043
SCARX-HP5×108 5,261 14 412 365 1,384 10,636 18 340 367 3,801 8,811 14 374 352 3,077
SCARX-HP1×109 5,250 17 403 356 1,373 10,597 11 340 376 3,763 8,834 29 369 338 3,101
SCARX-HP5×109 5,222 15 409 342 1,344 10,557 13 341 371 3,723 8,879 17 369 342 3,146
SCARX-HP1×1010 5,212 18 408 349 1,334 10,579 22 345 367 3,745 8,885 12 368 347 3,152
SCARX-HP5×1010 5,192 7 409 333 1,315 10,649 21 347 354 3,815 8,878 14 366 349 3,145
SCARX-HP1×1011 5,184 13 410 335 1,307 10,683 15 337 349 3,849 8,869 20 367 355 3,136
SCARX-HP5×1011 5,168 39 402 348 1,291 10,797 55 323 336 3,963 8,848 24 369 354 3,114
Примечание. Ценовые зоны: Европа—Урал и Сибирь российской биржи АТС, а также европейская биржа Nord Pool. усредненная по 728 дням DMAE; приведена в процентах (доля MAE в средней цене за день); NBest — число дней, для которых модель оказалась лучшей; N — число дней, для которых модель лучше, чем «наивная»; N<ARX — число дней, для которых модель лучше, чем ARX; — среднее отклонение от лучшей для каждого дня модели. Полужирным шрифтом выделены и для SCARX-моделей, которые оказались меньше, чем для ARX-модели; подчеркиванием — минимальные и ; курсивом — и , значения которых превышают соответствующие показатели для «наивной» модели.
68

Рис. 1. Цена и плановое потребление электроэнергии для зоны Европа—Урал Российской биржи АТС

69

Рис. 2. Цена и плановое потребление электроэнергии для зоны «Сибирь» российской биржи АТС

70

Рис. 3. Цена и плановое потребление электроэнергии Европейской биржи Nord Pool

71

Рис. 4. Результаты DM-теста наиболее точных моделей SCARX-W и SCARX-HP (на каждом из рынков) в сравнении со спецификацией ARX для каждого часа суток

References

1. Afanasyev D., Fedorova E. (2016). The Long-Term Trends on the Electricity Markets: Comparison of Empirical Mode and Wavelet Decompositions. Energy Economics, 56, 432—442.

2. Carmon R., Coulon M. (2014). A Survey of Commodity Markets and Structural Models for Electricity Prices. In: “Modeling, Pricing, and Hedging in Energy and Commodity Markets”. New York: Springer.

3. Casazza J., Delea F. (2003). Understanding Electric Power Systems: An Overview of the Technology and the Marketplace. Hoboken: Wiley.

4. Chuchueva I.A. (2012). The Time Series Forecasting Model with Maximum Likeness Sample. Postgraduate thesis. Moscow: BMSTU.

5. Conejo A.J., Contreras J., Espinola R., Plazas M.A. (2005). Forecasting Electricity Prices for a Day-Ahead Pool-Based Electric Energy Market. International Journal of Forecast-ing, 21, 3, 435—462.

6. De Jong C. (2006). The Nature of Power Spikes: A Regime-Switch Approach. Studies in Nonlinear Dynamics and Econometrics, 10, 3, 35—47.

7. Diebold F.X., Mariano R.S. (1995). Comparing Predictive Accuracy. Journal of Busi-ness and Economic Statistics, 13, 253—263.

8. Eydeland A., Wolyniec K. (2012). Energy and Power Risk Management. New Jersey: Wiley.

9. Fedorova E., Afanasyev D. (2015). Study of the Dynamic Price-Demand Relationship for Russian Electricity Market. Proceedings of the Russian Academy of Sciences. Power Engi-neering, 3, 3—17 (in Russian).

10. Haldrup N., Nielsen F., Nielsen M. (2010). A Vector Autoregressive Model for Elec-tricity Prices Subject to Long Memory and Regime Switching. Energy Economics, 32, 1044—1058.

11. Hodrick R., Prescott E. (1997). Postwar U.S. Business Cycles: An Empirical Investiga-tion. Journal of Money, Credit and Banking, 29, 1, 1—16.

12. Hyndman R., Athanasopoulos G. (2013). Forecasting: Principles and Practice. Available at: http://otexts.org/fpp (accessed: September 2017).

13. Janczura J., Truck S., Weron R., Wolff R. (2013). Identifying Spikes and Seasonal Components in Electricity Spot Price Data: A Guide to Robust Modeling. Energy Economics, 38, 96—110.

14. Lisi F., Nan F. (2014). Component Estimation for Electricity Prices: Procedures and Comparisons, Energy Economics, 44, 143—159.

15. Maciejowska K., Nowotarski J., Weron R. (2016). Probabilistic Forecasting of Elec-tricity Spot Prices Using Factor Quantile Regression Averaging. International Journal of Fore-casting, 32, 3, 957—965.

16. Maciejowska K., Weron R. (2016). Short- and Mid-Term Forecasting of Baseload Elec-tricity Prices in the UK: The Impact of Intra-Day Price Relationships and Market Fundamentals. IEEE Transactions on Power Systems, 31, 2, 994—1005.

17. Misiorek A., Truck S., Weron R. (2006). Point and Interval Forecasting of Spot Elec-tricity Prices: Linear vs. Non-Linear Time Series Models. Studies in Nonlinear Dynamics and Econometrics, 10, 3, 57—66.

18. Nogales F.J., Contreras J., Conejo A.J., Espinola R. (2002). Forecasting Next-Day Electricity Prices by Time Series Models. IEEE Transactions on Power Systems, 17, 342—348.

19. Nowotarski J., Raviv E., Truck S., Weron R. (2014). An Empirical Comparison of Al-ternative Schemes for Combining Electricity Spot Price Forecasts. Energy Economics, 46, 342—348.

20. Nowotarski J., Tomczyk J., Weron R. (2013). Robust Estimation and Forecasting of the Long-Term Seasonal Component of Electricity Spot Prices. Energy Economics, 39, 13—27.

21. Nowotarski J., Weron R. (2016). On the Importance of the Long-Term Seasonal Com-ponent in Day-Ahead Electricity Price Forecasting. Energy Economics, 57, 228—235.

22. Val’ P.V., Klepche N.S. (2011). Short-Term Electricity Prices Forecasting under Condi-tions of the Wholesale Electricity and Capacity Market. Available at: http://conf.sfu-kras.ru/sites/mn2011/thesis/s9/s9_30.pdf (accessed: September 2017, in Russian).

23. Weron R. (2014). Electricity Price Forecasting: A Review of the State-of-the-Art with a Look into the Future. International Journal of Forecasting, 30, 1030—1081.

24. Weron R., Zator M. (2015). A Note on Using the Hodrick—Prescott Filter in Electricity Markets. Energy Economics, 48, 1—6.