On the influence of foreign media on the Russian stock market: Text analysis
Table of contents
Share
Metrics
On the influence of foreign media on the Russian stock market: Text analysis
Annotation
PII
S042473880008527-8-1
DOI
10.31857/S042473880008527-8
Publication type
Article
Status
Published
Authors
Elena Fedorova 
Occupation: Professor to the Department of financial management
Affiliation:
Financial University under the Government of the Russian Federation
the National Research University Higher School of Economics
Address: Moscow, Russian Federation
Igor Demin
Occupation: Professor
Affiliation: The Financial University under the Government of the Russian Federation
Address: Russian Federation
Dmitry Afanasyev
Occupation: Postgraduate student
Affiliation: Financial University under the Government of the Russian Federation
Address: Russian Federation
Oleg Rogov
Occupation: junior researcher
Affiliation: Skolkovo Institute of Science and Technology
Address: Russian Federation
Pages
77-89
Abstract

This study assesses the foreign media Russia-related news tonality impact on the domestic stock market considering the periods before and after the imposition of the sanctions. Empirical basis of the research comprises 2,4 mln news texts from the Thomson Reuters. To estimate the news sentiment tonality we use the bag-of-words approach and three specific dictionaries (AFINN, NRC, Loughran and McDonald Word List). The time series analysis is implemented using the Toda–Yamamoto procedure for the Granger causality test, VAR-model, impulse response function, dispersion decomposition. We analyze the text data from 2012 to 2018 divided into half-periods: before and after the introduction of sanctions. We show that the sentiment tonality of the news media flow is significant and explains certain dynamics patterns of the Russian stock market. We also show that the increase in the sentiment polarity impact on the market participants is strongly related to the compound market index dynamics for the period after the introduction of sanctions. We conclude that there is asymmetry in the market reaction to shocks of positive and negative rhetoric in the foreign media

Keywords
text analysis, bag-of-words, stock market index, news sentiments, sanctions
Received
12.04.2020
Date of publication
11.06.2020
Number of purchasers
19
Views
255
Readers community rating
0.0 (0 votes)
Cite Download pdf 100 RUB / 1.0 SU

To download PDF you should sign in

Full text is available to subscribers only
Subscribe right now
Only article
100 RUB / 1.0 SU
Whole issue
792 RUB / 15.0 SU
All issues for 2020
2534 RUB / 50.0 SU
1

1. Введение и обзор литературы

2

Финансовый рынок является структурой, крайне восприимчивой к возникающим внутренним и внешним шокам. Изучение влияния различных факторов на отдельные сегменты и показатели фондового рынка является распространенной темой в исследованиях отечественных и зарубежных ученых. При этом список факторов, потенциально влияющих на движение фондового рынка, является практически безграничным, а его реакция на воздействие отдельных конкретных факторов может существенно отличаться в зависимости от стадии развития самого рынка, уровня финансовой интеграции и т.д. Перспективным является направление, связанное с оценкой влияния тональности новостей на динамику фондового рынка. В связи с глобализацией современной мировой экономики, взаимной интеграцией отдельных национальных экономик в единую систему нередкими являются ситуации, при которых кажущиеся на первый взгляд незначительными события, происходящие в отдельной стране, влекут за собой весомые последствия для всего мирового сообщества в целом. Поскольку инвесторам все труднее следовать и учитывать всю имеющуюся информацию, автоматическая обработка текстовой информации становится все более популярной, а число исследований в данной области растет. При этом для российской науки данная тема не стала пока широко распространенной, поэтому мы, заполняя данный пробел, предлагаем исследовать влияние тональности зарубежных новостей (т.е. эмоциональной окрашенности текстов в разрезе отдельных эмоций, или сентимент-признаков) на российский фондовый рынок.

3 В работе (Wu, Hou, Lin, 2018) авторы рассматривают вопрос улучшения точности прогноза доходности акций фондового рынка Тайваня с учетом экономических новостей и показывают как оправданность включения в модель текстовых переменных, так и наличие асимметричного влияния данных переменных на прогноз. В (Feuerriegel, Gordon, 2018) авторы проверили гипотезу эффективности фондового рынка с применением методов текстового анализа, для чего рассмотрели 75 927 объявлений с официальным раскрытием информации для инвесторов, опубликованных в период 1996–2016 гг. Было выявлено, что в долгосрочной перспективе модели с учетом переменных, базирующихся на текстовом анализе, позволяют улучшить точность прогноза фондовых индексов. В исследовании (Gupta, Banerjee, 2018) проанализировано влияние сентимент-показателей зарубежных новостей (т.е. отдельных эмоций в тексте сообщения) о нефти по странам ОПЕК в период 2003–2014 гг. на доходность акций энергетических компаний США. В исследовании (Walker, 2016) было рассмотрено влияние тональности новостей о недвижимости из газеты «Financial Times» на доходности акций компаний на рынке недвижимости. Авторы обнаружили, что эмоциональная окраска новостей связана с доходностью акций, а число тематических новостей – с числом сделок. Авторы (Wei et al., 2017) построили агрегатный новостной индекс сентиментов на рынке (ANSI), основанный на китайских финансовых новостях по всем листингованным компаниям Китая. Была проанализирована взаимосвязь между ANSI и доходностью, объемом торгов и волатильностью тайваньского фондового индекса. Тесты причинности по Грэнджеру показали, что как недельные, так и месячные агрегированные значения ANSI влияют на доходность индекса.
4 В работе (Ho, Shi, Zhang, 2018) было оценено влияние тональности новостей о банках (по данным RavenPack Dow Jones News Analytics) на доходность и волатильность акций компаний банковского сектора Китая. Показано, что вопреки гипотезе последовательного поступления информации большинство акций китайских банков не характеризуются значительной связью между тональностью новостей и волатильностью их котировок. Тем не менее также было выявлено, что тональность новостей сильно коррелирует с волатильностью доходности всех акций фондового рынка. В (Nam, Seong, 2018) авторы оценивают тональность экономических и финансовых сообщений в микроблоге Twitter и социальной сети Facebook, а также рассматривают ее влияние на доходность акций пищевой промышленности и фармацевтических компаний. Авторы выявили: на доходность отдельного сектора влияют не только новости этого сектора, но и общий новостной фон. В статье (Ruan, Durresi, Alfantoukh, 2018) был проанализирован вклад в доходность восьми компаний из списка S&P 500 тональностей коротких сообщений в микроблоге Twitter с учетом рейтинга доверия к авторам публикаций. Было показано, что сентиментальная окраска сообщений от авторов с высоким рейтингом доверия вносит более значимый вклад в колебания доходности акций, чем от авторов с низким рейтингом.
5 Что касается отечественных исследований в обсуждаемой области, то их число относительно невелико. Мы полагаем, что это связано с молодостью тематики для российского рынка, а также с определенными техническими трудностями, вызванными как необходимостью получения существенного объема новостных данных, так и сложностью их автоматизированной обработки. Однако можно отметить ряд подобных работ. Так, в статье (Эдулбаев, 2016) исследуется вопрос применимости поведенческих аспектов на основе сентиментов в качестве поправок к модели ценообразования капитальных активов (САРМ). Автор предложил подход на базе премии за субъективный риск и риск сентимента новостей для российских компаний. Установлена статистическая значимость указанных премий за риск в модели CAPM. В исследовании (Федорова и др., 2017) рассматривается содержание обращений генеральных директоров компаний как инструмент воздействия на ожидания акционеров и потенциальных инвесторов. Посредством панельной регрессии была подтверждена гипотеза о связи текстовых характеристик обращений (тональность, длина и сложность восприятия) со среднегодовой стоимостью акций компании. В работе (Федорова и др., 2018) изучается реакция фондового индекса нефтегазовой отрасли Российской Федерации на тональность отраслевых новостей. Было выявлено, что новости об отдельных компаниях влияют именно на значение индекса, в то время как новости по отрасли в целом отражаются на объеме торгов.
6 На текущий момент можно выделить отдельные направления, которые слабо проработаны в немногочисленных отечественных исследованиях. В частности, поскольку введение экономических и политических санкций существенно влияет на формирование имиджа государства, представляется достаточно актуальным исследовать влияние тональности новостей о Российской Федерации в зарубежных СМИ на внутриэкономическую ситуацию России в периоды до и после возникновения международной напряженности. В нашем исследовании мы полагаем, что введение санкций ухудшило имидж России, а влияние новостной составляющей возросло, в том числе и на фондовый рынок.
7

2. Методология исследования

8 Для исследования влияния тональности информационно-новостного фона в зарубежных СМИ на отечественный фондовый рынок применялся подход, состоящий из следующих этапов:
9
  1. оценка тональности новостей о России в зарубежных СМИ с использованием метода мешка слов;
  2. выявление наличия или отсутствия влияния отдельных признаков тональности новостей на российский фондовый рынок на базе процедуры Тода–Ямамото тестирования причинности по Грэнджеру;
  3. определение направления и степени влияния признаков тональности новостей на фондовый рынок России на базе векторной авторегрессии, функций импульсного отклика и декомпозиции дисперсии прогнозов.
10 Рассмотрим каждый этап более подробно.
11

2.1. Оценка тональности текста

12 «Мешок слов» — один из распространенных методов работы с текстами на естественном языке, сущность которого состоит в представлении каждого текста как набора входящих в него слов. В данной работе он используется для оценки тональности текста, т.е. сентимент-анализа, который основан на подсчете оценок тональности слов, входящих в мешок слов для конкретного текста. Тональностью текста называется эмоциональная оценка высказывания автора к некоторому объекту, описываемому в тексте. Иными словам, каждому слову отдельного текста можно поставить в соответствие числовое значение по заданной шкале. Для удобства расчетов пары «слово–число» записываются в специальные словари (лексиконы), состав которых и соответствующие шкалы различается в зависимости от контекста применения и способа определения эмоциональной окраски. Словари тональности, как правило, составлены экспертными методами.
13 В таких словарях содержатся списки слов в разрезе нескольких показателей тональности; в наиболее простом случае – «позитивный» и «отрицательный». Например, такие слова, как «превосходный», «отличный», «рост», «прибыль», обычно оцениваются как позитивные, а «неудача», «угроза», «убыток» — как отрицательные. Иногда в словарях могут быть отмечены термины других показателей тональности – таких как «страх» или «неожиданность». В отдельных словарях также указывается степень «позитивности» или «негативности» в баллах. Слова, не вошедшие в словарь, оцениваются как нейтральные.
14 Таким образом, оценка тональности документа выполняется по следующим формулам:
15
Sid=Nid/N — для словаря без баллов; Sid=Wid/Wd — для словаря c баллами, (1)
16 где i — сентимент-признак из словаря d; Nid — число слов, отнесенных к признаку i; N — общее число слов (за исключением «стоп-слов», т.е. предлогов, местоимений, цифр, дат и т.п.); W – аналогично N, но для баллов из словаря d. Нормировка на общее число слов или баллов в документе выполняется для обеспечения сопоставимости оценок между текстами разной длины. Интегральное значение для множества документов (например, опубликованных в один день новостей) вычисляется как средневзвешенное по длине всех текстов.
17 В работе были применены три словаря, получившие наибольшее распространение в практике текстового анализа. Краткая характеристика указанных словарей приведена в табл. 1. Их подробный сравнительный анализ можно найти в работе (Демин и др., 2019).
18 Таблица 1. Краткое описание словарей тональности, использованных в исследовании
19
Наименование словаря Объем и содержание словаря Признаки тональности
AFINN (Nielsen, 2011) 2477 униграмм, для каждой из которых указана степень «позитивности»: от −5 (наиболее отрицательные) до 5 (наиболее положительные) Степень позитивности в баллах
NRC Word-Emotion Association Lexicon (NRC) (Mohammad, Turney, 2010) 6468 терминов, каждому из которых присвоено от одного до десяти признаков тональности «Trust», «fear», «negative», «sadness», «anger», «surprise», «positive», «disgust», «joy», «anticipation» («доверие», «страх», «негативный», «печаль», «гнев», «удивление», «позитивный», «отвращение», «радость», «ожидание»)
Loughran and McDonald Word List (LM) (McDonald, Loughran, 2016) 3916 финансовых и экономических терминов, каждому из которых присвоено от одного до трех признаков тональности «Negative», «positive», «uncertainty», «litigious», «constraining», «superfluous» («негативный», «позитивный», «неопределенность», «спорный», «ограничивающий», «избыточный»)
20 С учетом выбранных нами словарей отметим, что если в случае NRC и LM показатели «positive» и «negative», определенные по формуле (1), отражают отдельно уровень положительных и отрицательных эмоций в тексте, то для словаря AFINN показатель «positivity» рассчитывался в форме чистой сентиментной окраски, равной разнице между числом или суммой баллов позитивных и негативных слов, нормированной на количество слов или баллов в тексте, или разнице позитивных и негативных сентиментов, оцененных по формуле (1).
21

2.2. Тестирование причинности по Грэнджеру: процедура Тода–Ямамото

22 В целях выявления наличия или отсутствия причинно-следственных связей между отдельными признаками тональности новостей и динамикой российского фондового рынка мы применили процедуру тестирования причинности по Грэнджеру, предложенную в работе (Toda, Yamamoto, 1995):
23
  1. для каждого из временных рядов xt (признак тональности) и yt (фондовый индекс) по отдельности находим порядки интегрированности Ix и Iy, используя KPSS-тест (Kwiatkowski et al., 1992) на стационарность, и определяем максимальный порядок Imax=max(Ix,Iy) ;
  2. оцениваем двумерную VAR-модель для xt и yt в уровнях (не зависимо от полученных ранее значений Ix и Iy) для лагов P от 1 до 30 и с помощью информационных критериев Акаике (AIC), Шварца (SC) и Ханнана–Куинна (HC) выбираем оптимальную величину лага PIC (максимальное значение для трех критериев);
  3. убеждаемся, что модель VAR(PIC) корректно специфицирована, выполняя для остатков тест Бройша–Годфри на отсутствие автокорреляции. Если нулевая гипотеза отклоняется на выбранном уровне значимости, то увеличиваем число лагов на 1, переоцениваем VAR-модель и повторяем тестирование до тех пор, пока для PBG PIC не перестанет обнаруживаться сериальная корреляция;
  4. оцениваем вспомогательную модель VAR(PBG + Imax). Для выявления причинности по Грэнджеру выполняем тест Вальда на совместное равенство нулю первых PBG коэффициентов (bi — коэффициенты при лагах xt-i, di — коэффициенты при лагах yt-i):
24
H0: bi=0,    i=1,,PBG;H0: di= 0,    i =1,,PBG. (2)
25 Оставшиеся Imax коэффициентов не включаются в процедуру тестирования, но учитываются при оценке параметров модели, выступая в некотором смысле экзогенными переменными. При выполнении нулевой гипотезы статистика теста Вальда асимптотически распределена как χ2 с PBG степенями свободы;
26
  1. отклонение первой нулевой гипотезы на выбранном уровне значимости позволяет сделать вывод о том, что xt является причиной по Грэнджеру для yt. Аналогично и для второй гипотезы, но вывод уже заключается в том, что yt является причиной по Гренджеру для xt.
27

2.3. Методология определения направления и степени влияния тональности новостей на фондовый рынок

28 Для учета более сложной природы протекающих процессов, а также одновременного комплексного влияния различных факторов на фондовый рынок Российской Федерации мы применяем методологию анализа на базе многомерной модели VAR(P), функций импульсного отклика и декомпозиции дисперсии. Спецификация нашей модели имеет вид:
29
Yt=A0+ΣiPAiYt-i+Ut, (3)
30 где Yt=xt,Zt,St, xt — вектор основного экономического показателя исследуемого рынка; Zt — набор факторов, имеющих экономическую природу; St — набор сентиментных переменных; A0 — матрица констант; Ai — матрица коэффициентов; i — номер лага; P — порядок авторегрессии; Ui — матрица независимых и идентично распределенных ошибок модели. При этом состав St выбирался с учетом полученных ранее результатов проверки причинно-следственных связей: в него включались только переменные, являющиеся причинной по Грэнджеру для целевого показателя xt (за одним исключением — позитивная и негативная тональности новостей, как наиболее широкие по своему смыслу, всегда включались в St)1.
1. Такой подход позволил обеспечить разумную экономичность оцениваемых спецификаций VAR-моделей, а также не уменьшал без лишней необходимости числа ее степеней свободы.
31 Оптимальное значение порядка авторегрессии PBG выбиралось нами аналогично подходу из п. 2.2, после чего проводилась проверка на наличие коинтеграции с помощью теста Йохансена. Функции импульсного отклика оцененной модели VAR(PBG) использовались для анализа наличия статистически значимой реакции переменной xt на единичный шок оставшихся показателей, а также определения направления влияния (доверительный интервал определялся посредством бутстрапа). В свою очередь, декомпозиция дисперсии ошибки прогноза xt позволила сделать выводы о степени влияния (вкладе) переменных из Zt и St на вариативность xt.
32

3. Информационная база исследования

33

В качестве исходной выборки новостей были использованы новости из источников, аккредитованных агентством Thomson Reuters. Новости, опубликованные в период с 2012 по 2018 г., составили эмпирическую базу исследования в объеме 2,4 млн текстов. Источники новостей формировались на основе публикаций ежедневных газет и медиа-ресурсов (периодичность выпуска – 1 сутки). По ключевым словам-фильтрам Sanctions, Russian, Moscow, Kremlin была сформирована подвыборка из 130 тыс. новостных текстов в контексте секторальных международных санкций в отношении российской экономики.

34

Рис. 1. Оценка тональности новостей о России в 2014 г. по словарю NRC (взвешенные данные относительно уровня декабря 2013 г.)

см.
35

На рис. 1 показана динамика тональности новостей в санкционном 2014 г. для основных шести показателей тональности словаря NRC (интегральные месячные значения)2. Видно, как после существенного скачка показателей «радости» («joy») и «ожидания» («anticipation») в феврале (что, несомненно, связано с проведением Олимпиады в Сочи) уже в марте, месяце введения санкций, уровень этих величин резко падает, одновременно сильно вырастает показатель «негативность» («negative»). Еще один пик «негативности» наблюдается в июле, когда произошла катастрофа самолета авиакомпании Malaysia Airline. Одновременно максимального значения достигает показатель «страх» («fear»). В течение года «позитивность» («positivity») новостей устойчиво падает, а «негативность» имеет тенденцию расти. Этот богатый событиями год демонстрирует, как тональность новостей о России зависит от важнейших международных событий.

2. Следует заметить, что число слов разной тональности, а следовательно, и величины соответствующих показателей, существенно отличаются (иногда во много раз). Для того чтобы представить наглядное сравнение их колебаний на одном графике, все показатели приведены в индексную форму относительно декабря 2013 г., для которого их уровни приняты за единицу.
36 Для анализа влияния освещения в иностранных СМИ событий в Российской Федерации на отечественный фондовый рынок в роли целевой переменной нами был выбран индекс Московской биржи (MICEX, цена закрытия торгового дня). В качестве экономических переменных, на изменение которых потенциально реагирует российский фондовый рынок (матрица Zt в уравнении (3)), мы рассмотрели американский индекс NASDAQ и цену на нефть марки Brent. В исследовании были изучены два временных периода: до введения зарубежными государствами санкционного режима в отношении России — с 01.01.2012 по 28.02.2014 г. и после — с 01.03. 2014 по 30.05.2018 г. Пропуски во временных рядах экономических показателей были заполнены значением предшествующего пропуску торгового дня.
37

4. Результаты исследования

 

4.1. Причинно-следственная связь динамики фондового рынка и отдельных признаков тональности новостей

38

Табл. 2 содержит результаты тестирования причинности по Грэнджеру (на базе подхода Тода–Ямамото) между индексом MICEX и сентиментной окраской новостей в зарубежных СМИ в периоды до и после введения санкций. Поясним на примере показателя «afinn.positivity» в досанкционный период, как интерпретировать данные табл. 2 (см. также п. 2.2). Оптимальный порядок VAR-модели (включающей переменные MICEX и «afinn.positivity»), выбранный на основании трех информационных критериев и скорректированный для устранения автокорреляции в остатках, составил PBG = 7. Для всех пар индекса и сентимент-признаков максимальный общий порядок интегрированности составил Imax= 1. Поэтому тестирование причинности выполнялось с помощью теста Вальда на одновременное равенство нулю набора соответствующих направлению влияния коэффициентов до седьмого лага вспомогательной модели VAR(P = PBG+ Imax= 8) в уровнях. Тестирование показало, что степень «позитивность» новостей не является причиной по Грэнджеру для цены закрытия индекса МосБиржи в период до введения санкций (см. статистику в колонке WaldS).

39 Таблица 2. Результаты тестирования причинности по Грэнджеру (процедура Тода–Ямомото) для индекса Мосбиржи (MICEX, в логарифмах) и показателей тональности новостей о РФ в зарубежных СМИ (до и после введения санкций)
40
До введения санкций (с 01.01.2012 г. по 28.02.2014 г.) После введения санкций (с 01.03.2014 г. по 30.05.2018 г.)
PBG WaldM WaldS Направление причинности PBG WaldM WaldS Направление причинности
7 2,5314 1,3446 MICEX × afinn.positivity 6 8,2559 11,2189* MICEX < afinn.positivity
3 2,5487 0,7305 MICEX × lm.positive 7 7,7804 17,0532** MICEX < lm.positive
2 0,8162 1,1272 MICEX × lm.negative 4 6,2065 15,6511** MICEX < lm.negative
4 1,6323 3,7398 MICEX × lm.constraining 7 9,0019 25,6517*** MICEX < lm.constraining
1 0,6519 0,1945 MICEX × lm.litigious 4 5,9386 3,2416 MICEX × lm.litigious
1 0,3194 2,6591 MICEX × lm.superfluous 1 1,3802 4,0563 MICEX × lm.superfluous
2 0,1209 0,5715 MICEX × lm.uncertainty 7 18,1879*** 3,909 MICEX > lm.uncertainty
7 7,5146 9,6973 MICEX × nrc.positive 7 7,5506 5,1252 MICEX × nrc.positive
9 13,606 5,0825 MICEX × nrc.negative 7 4,9836 14,841* MICEX < nrc.negative
9 9,0737 4,3825 MICEX × nrc.anger 17 19,3862 32,2436*** MICEX < nrc.anger
3 4,103 0,7256 MICEX × nrc.anticipation 7 5,6671 10,3168 MICEX × nrc.anticipation
1 1,359 0,0729 MICEX × nrc.disgust 7 7,8149 3,0172 MICEX × nrc.disgust
3 3,4898 0,2689 MICEX × nrc.fear 7 7,4151 6,6637 MICEX × nrc.fear
7 6,8898 2,5262 MICEX × nrc.joy 7 19,3313*** 10,4269 MICEX > nrc.joy
3 6,0581 4,0566 MICEX × nrc.sadness 5 1,5576 7,1827 MICEX × nrc.sadness
11 19,1818* 16,033 MICEX > nrc.surprise 7 15,7485** 11,0532 MICEX > nrc.surprise
7 19,5292*** 14,6852** MICEX <> nrc.trust 7 7,0727 5,8954 MICEX × nrc.trust
41 Примечание. PBG — оптимальный порядок VAR-модели, определенный по информационным критериям и скорректированный для устранения автокорреляции в остатках (в соответствии с тестом Бройша–Годфри); WaldM и WaldS — статистика теста Вальда на одновременное равенство нулю PBG авторегрессионных коэффициентов при MICEX и при сентимент-признаке для вспомогательной модели VAR(PBG + 1); «Направление причинности» – для обозначения показателей тональности используется маска «словарь.сентимент» (см. табл. 1 для перевода). В таблице символами «***», «**», «*» отмечены уровни значимости 1, 5 и 10% соответственно.
42 Из анализа левой части табл. 2 можно сделать вывод, что до марта 2014 г. влияние отдельных показателей тональности новостей на фондовый рынок России отсутствовало: подавляющее большинство сентимент-признаков, включая наиболее широкие по смыслу «позитив» и «негатив» (словари LM и NRC), не являются причиной по Грэнджеру для индекса MICEX.
43 Результаты для периода после введения санкций представляются существенно более интересными (см. правую часть табл. 2). Так, видно, что степень «позитивности» новостей, оцененная по словарю AFINN, является причиной по Грэнджеру для цены закрытия индекса Мосбиржи на 5%-ном уровне. Это позволяет утверждать, что указанный показатель может быть полезен при прогнозировании поведения фондового рынка, а влияние рассчитанной по словарю AFINN окраски освещения Российской Федерации в международных средствах массовой информации значимо для отечественного финансового рынка. В то же время обратная связь не была выявлена. Это говорит о том, что зарубежные СМИ не склонны реагировать соответствующими изменениями тональности публикуемых новостей на события, происходящие на фондовом рынке России.
44 Проводя аналогичный анализ для всех сентимент-признаков, рассчитанных по библиотеке LM, можно заключить, что отдельно позитивная и негативная тональности новостей также являются причиной по Грэнджеру для индекса МосБиржи. Кроме того, статистическое влияние обнаруживается для сентимент-признака «constraining» («ограничивающий»). Обратная зависимость была выявлена для сентимент-признака «uncertainty» («неопределенность»). Следовательно, существенная волатильность фондового индекса МосБиржи может провоцировать появление в зарубежных СМИ настроений неопределенности при освещении событий в России. Наконец, для словаря NRC причинность со стороны сентиментных переменных удалось обнаружить для таких показателей тональности, как «negative» («негатив») и «anger» («ярость»).
45 В целом, резюмируя полученные результаты, можно сделать два обобщающих вывода. Во-первых, до 2014 г. тональность освящения Российской Федерации в международных СМИ не играла существенной роли для участников фондового рынка России. Во-вторых, после массового введения санкций со стороны ряда зарубежных государств в отношении России фактор эмоциональной окраски новостей о России в международных СМИ приобрел особое значение для поведения участников отечественного рынка акций. При этом среди рассмотренных нами показателей тональности наиболее широкие по смыслу признаки «позитив» и «негатив» почти систематически являются причиной по Грэнджеру динамики российского фондового рынка.
46

4.2. Направление и степень влияния тональности новостей на фондовый рынок

47 Перейдем теперь к анализу результатов определения направления и степени комплексного влияния тональности новостей на фондовый индекс Мосбиржи. Так как при исследовании причинности по Грэнджеру в период до введения санкций мы не обнаружили наличия статистически значимого влияния, то дальнейший анализ был проведен для периода с 01.03.2014 по 30.05.2018 г.
48 Для начала рассмотрим результаты для тональности новостей, оцененной по библиотеке AFINN. Соответствующая VAR-модель включала, помимо индекса NASDAQ и цены нефти Brent, также сентимент-признак «positivity». Тест Йохансена для исследуемых переменных показал наличие, как минимум, одного коинтеграционного вектора (статистика теста 37,88, критическое значение 34,91 для 5%-ного уровня), поэтому оценка VAR-модели выполнялась в уровнях. Число учитываемых лагов составило семь.
49 Рис. 2 демонстрирует функции импульсного отклика, показывающие динамику фондового индекса MICEX в течение 28 дней, возникающую под воздействием единичного положительного шока непосредственно самого индекса, цены на нефть, американского фондового индекса и сентимент-признак «positivity».
50 Анализ графика на рис. 3 позволяет сформулировать следующие утверждения о значимости на 5%-ном уровне и направление влияния рассматриваемых показателей на индекс Мосбиржи:
51
  • рост американского индекса NASDAQ приводит также к росту российского фондового индекса, что, вероятно, объясняется финансовой интеграцией рынков (через поведенческий канал трансмиссии);
  • цена на нефть не влияет значимо на фондовый рынок Российской Федерации в период после введения санкций;
  • показатель тональности «positivity» (словарь AFINN) значимо и положительно воздействует на динамику отечественного рынка, т.е. рост позитивной окраски освещения России в зарубежных СМИ приводит к росту фондового индекса MICEX.
52

Рис. 2. Функции импульсного отклика фондового индекса Мосбиржи (MICEX) для VAR-модели, включающей сентименты из словаря AFINN (затемненная область — 95%-ный доверительный интервал)

53 Таблица 3. Декомпозиция дисперсии индекса MICEX на месяц вперед (%) для VAR-модели, включающей сентименты по словарю AFINN
54
Дни MICEX NASDAQ Brent Positivity
2 98,9 0,9 0,0 0,2
7 97,3 2,2 0,1 0,4
14 95,9 2,7 0,2 1,3
21 94,6 3,3 0,1 2,0
28 93,6 3,8 0,1 2,6
55 Данные в табл. 3 показывает полученную на основании построенной VAR-модели декомпозицию дисперсии, т.е. вклад каждой переменной в волатильность прогнозных значений фондового индекса Мосбиржи для отдельных контрольных периодов (прогнозных горизонтов). Ее анализ позволяет сделать следующие выводы. Во-первых, основной вклад в колебания фондового индекса (после непосредственно самого MICEX) вносит изменение индекса NASDAQ, но с определенной задержкой: в течение месяца вклад достигает 3,8%. Во-вторых, доля эмоциональной окраски новостей хотя и возрастает несколько медленнее, чем для NASDAQ, однако является вполне сопоставимой по значению. В-третьих, вклад, приходящийся на шок цены нефти, несущественный, что согласуется с полученными выше результатами о незначимости соответствующей функции отклика.
56 Перейдем к рассмотрению результатов, полученных для сентимент-признаков, рассчитанных по словарю NRC. В спецификацию VAR-модели были включены показатели «positive», «negative» и «anger». Тест Йохансена подтвердил возможность выполнять моделирование в уровнях (минимум один коинтеграционный вектор; статистика теста 189,29; критическое значение 76,07 для 5%-ного уровня).
57

Рис. 3. Функции импульсного отклика фондового индекса МосБиржи (MICEX) для VAR-модели, включающей сентименты из словаря NRC (затемненная область – 95%-ный доверительный интервал)

58 Анализ импульсных функций отклика (см. рис. 3) показывает, что, во-первых, выводы для экономических переменных устойчивы (так как аналогичны полученным выше), а, во-вторых, из признаков тональности только «negative» («негативная») оказывает статистически значимое влияние на индекс MICEX (для 5 из 28 дней это же касается и сентимента «anger» («гнев»), но в целом говорить о значимости здесь не приходится). При этом наклон функции отклика для шока показателя «negative» («негативный») является в среднем отрицательным, т.е. его рост приводит к падению российского фондового рынка.
59 Табл. 4 содержит декомпозицию дисперсии индекса MICEX для VAR-модели с показателями по словарю NRC. В подтверждение вывода о значимости функции отклика для сентимента «negative» («негативный») можно отметить, что его вклад в дисперсию фондового индекса выше, чем для «positive» («позитивный»), т.е. отрицательные эмоции в новостях сильнее влияют на поведение участников рынка, чем положительные.
60 Таблица 4. Декомпозиция дисперсии индекса MICEX на месяц вперед (%) для VAR-модели, включающей сентименты по словарю NRC
61
Дни MICEX NASDAQ Brent Positive (Позитивный) Negative (Неагтивный) Anger (Гнев)
2 98,9 1,0 0,0 0,0 0,1 0,1
7 97,1 2,4 0,1 0,1 0,1 0,1
14 96,1 3,0 0,1 0,1 0,4 0,3
21 95,3 3,5 0,1 0,1 0,6 0,4
28 94,6 3,9 0,1 0,1 0,8 0,5
62 Наконец, рассмотрим результаты для оценок тональности по библиотеке LM. В спецификацию VAR-модели были включены сентимент-признаки «positive» «позитивной», «negative» («негативной») и «constraining» («ограничивающий»). Тест Йохансена, как и ранее, подтвердил правомерность моделирования в уровнях (минимум один коинтеграционный вектор; статистика теста 327,56; критическое значение 76,07 для 5%-ного уровня).
63 Анализ соответствующих функций импульсного отклика (рис. 4) показывает, что статистически значимая реакция отечественного фондового рынка наблюдается как для шоков «позитивной» («positive»), так и «негативной» («negative») тональностей новостей о России. При этом в первом случае наблюдается рост индекса Мосбиржи, в то время как во втором — его падение. Сентимент-признак «constraining» («ограничивающий») хотя и показал ранее наличие причинность по Грэнджеру, однако в комплексе с другими показателями оказался статистически незначимым.
64 В табл. 5 представлена декомпозиция дисперсии фондового индекса MICEX для VAR-модели, включающей признаки тональности из словаря LM. Если сравнивать наши результаты с полученными ранее, то можно сделать ряд интересных выводов. Во-первых, так как в случае словаря LM нам удалось обнаружить две статистически значимые сентиментные переменные, то их суммарный вклад в дисперсию MICEX оказывается выше, чем для словарей AFINN или NRC, и составляет 4,6% на 28-й день. Вероятно, это объясняется тем, что словарь LM, в отличие от двух других, является тематическим и включает оценку тональности именно финансовых терминов, т.е. способен более качественно работать с экономическими текстами. Во-вторых, по этой же причине удалось обнаружить влияние не только чистых сентиментов (словарь AFINN) или сентиментов негативной окраски (словарь NRC), но и позитивной тональности новостей. Хотя вклад последней меньше вклада сентимент-признака «negative» («негативный»). Отметим важное соображение: суммарный вклад значимых признаков тональности превышает вклад от шока индекса NASDAQ уже на 14-й день (2,5% против 2,4%) и далее только возрастает.
65

Рис. 4. Функции импульсного отклика фондового индекса Мосбиржи (MICEX) для VAR-модели, включающей сентименты из словаря LM (затемненная область — 95%-ный доверительный интервал)

66 Таблица 5. Декомпозиция дисперсии индекса MICEX на месяц вперед (%) для VAR-модели, включающей сентименты по словарю LM
67
Дни MICEX NASDAQ Brent Positive («Позитивный») Negative («Негативный») Constraining (Ограничивающий)
2 98,8 0,9 0,0 0,1 0,2 0,0
7 96,5 2,0 0,1 0,3 0,4 0,6
14 94,1 2,4 0,2 0,7 1,8 1,0
21 92,3 2,8 0,1 0,9 2,8 1,1
28 91,0 3,2 0,1 1,1 3,5 1,1
68

5. Заключение

69 В данной работе выполнено исследование влияния тональности новостей, освещающих события в Российской Федерации и публикуемых в зарубежных средствах массовой информации, на динамику отечественного фондового рынка. По результатам проведенного анализа можно сделать следующие ключевые выводы.
70

Во-первых, для отечественного фондового рынка выявлено наличие воздействия тональности новостей на поведение экономических агентов и динамику индекса Мосбиржи. При этом рост позитивных настроений в зарубежных СМИ ведет к росту российского рынка ценных бумаг. Это хорошо согласуется с результатами многочисленных исследований, выполненных ранее для других стран (см, например, (Nam, Seong, 2019)).

71 Во-вторых, вклад негативной эмоциональной окраски новостей в дисперсию индекса МосБиржи оказывается выше, чем для позитивной тональности. Иными словами, участники рынка более склонны реагировать на отрицательные новости, чем на положительные. При этом суммарный вклад переменных тональности новостей (для словаря Loughran and McDonald Word List) в течение двух недель становится сопоставимым с долей дисперсии, которая приходится на американский индекс NASDAQ. Это говорит об актуальности информационной оставляющей, которую необходимо учитывать как в академических исследованиях, так и в практике формирования торговых стратегий.
72 Наконец, в-третьих, до введения санкций фондовый рынок почти не реагировал на эмоциональную составляющую освещения России в зарубежных СМИ, в то время как после начала санкционного бума в 2014 г. существенно чаще стала прослеживаться причинно-следственная связь между тональностью новостного фона и динамикой отечественного рынка. Таким образом, события на мировой арене и реакция зарубежных СМИ на них приобрели особую важность для фондового рынка Российской Федерации после введения антироссийских санкций.

References

1. Demin I.S., Fedorova E.A., Rogov O.Y., Applications of the sentiment tonality lexicons for textual analysis // Applied Informatics, 2019, Vol. 14, No.1 (79), pp. 5-16

2. Fedorova E.A., Demin I.S. Khrustova L.E., Osterov R.A., Fedorov F.Y., Impact of the CEO letters on corporate financial ratios // Russian Management Journal, 2017, Vol. 15, No.4, pp. 441-462

3. Fedorova E.A., Rogov O.Y., Kluchnikov V.A. // The impact of news on the MICEX Oil & Gas index: textual analysis // The Moscow University Economics Bulletin, 2018, Vol. 4, pp. 79-99

4. Edilbaev A.A., CAPM model with behavioral aspects // Economics and business, 2016, Vol. 12, No.4 (77), pp. 493-496

5. Araujo, T., Eleuterio, S., & Louca, F. (2018). Do sentiments influence market dynamics? A reconstruction of the Brazilian stock market and its mood. Physica A, 505, 1139–1149. https://doi.org/10.1016/j.physa.2018.04.045

6. Fang, L., Qian, Y., Chen, Y., & Yu, H. (2018). How does stock market volatility react to NVIX? Evidence from developed countries. Physica A, 505, 490–499. https://doi.org/10.1016/j.physa.2018.03.039

7. Feuerriegel, S., & Gordon, J. (2018). Long-term stock index forecasting based on text mining of regulatory disclosures. Decision Support Systems, 112(June), 88–97. https://doi.org/10.1016/j.dss.2018.06.008

8. Gupta, K., & Banerjee, R. (2018). Does OPEC news sentiment influence stock returns of energy fi rms in the United States? Energy Economics. https://doi.org/10.1016/j.eneco.2018.03.017

9. Ho, K., Shi, Y., & Zhang, Z. (2018). News and return volatility of Chinese bank stocks. International Review of Economics and Finance, (xxxx), 1–11. https://doi.org/10.1016/j.iref.2018.12.003

10. Nam, K., & Seong, N. (2018). Financial news-based stock movement prediction using causality analysis of influence in the Korean stock market. Decision Support Systems, (November), 1–13. https://doi.org/10.1016/j.dss.2018.11.004

11. Ruan, Y., Durresi, A., & Alfantoukh, L. (2018). Knowle dge-Base d Systems Using Twitter trust network for stock market analysis. Knowledge-Based Systems, 145, 207–218. https://doi.org/10.1016/j.knosys.2018.01.016

12. Walker, C. B. (2016). Journal of Behavioral and Experimental Finance The direction of media influence: Real-estate news and the. Journal of Behavioral and Experimental Finance, 10, 20–31. https://doi.org/10.1016/j.jbef.2016.02.001

13. Wei, Y., Lu, Y., Chen, J., & Hsu, Y. (2017). North American Journal of Economics and Finance Informativeness of the market news sentiment in the Taiwan stock market q. North American Journal of Economics and Finance, 39(1), 158–181. https://doi.org/10.1016/j.najef.2016.10.004

14. Wu, G. G., Hou, T. C., & Lin, J. (2018). Asia Paci fi c Management Review Can economic news predict Taiwan stock market returns? Asia Pacific Management Review. https://doi.org/10.1016/j.apmrv.2018.01.003

15. Nielsen F.A.. A new ANEW: Evaluation of a word list for sentiment analysis in microblogs, Proceedings of the ESWC2011 Workshop on 'Making Sense of Microposts': Big things come in small packages, 2011, 93-98.

16. Mohammad S., Turney P. Emotions Evoked by Common Words and Phrases: Using Mechanical Turk to Create an Emotion Lexicon. Proceedings of the NAACL-HLT 2010 Workshop on Computational Approaches to Analysis and Generation of Emotion in Text, 2010, 26-34

17. McDonald Â., Loughran T. Textual Analysis in Accounting and Finance: A Survey. SSRN, Journal of Accounting Research, 2016, 54:4, 1187-1230.

18. Toda H.Y. and Yamamoto T., 1995. Statistical inference in vector autoregressions with possibly integrated processes. Journal of Econometrics, 66, 225–250.

19. Kwiatkowski, D., Phillips, P.C.B., Schmidt, P., Shin, Y., 1992. Testing the null hypothesis of stationarity against the alternative of a unit root. Journal of Econometrics, 54, 159–178.