Новости
12.04.2024
Поздравляем с Днём космонавтики!
08.03.2024
Поздравляем с Международным Женским Днем!
23.02.2024
Поздравляем с Днем Защитника Отечества!
Оплата онлайн
При оплате онлайн будет
удержана комиссия 3,5-5,5%








Способ оплаты:

С банковской карты (3,5%)
Сбербанк онлайн (3,5%)
Со счета в Яндекс.Деньгах (5,5%)
Наличными через терминал (3,5%)

ТЕСТИРОВАНИЕ ГИПОТЕЗЫ О РАВЕНСТВЕ НУЛЮ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ ДНЕВНЫХ ЛОГАРИФМИЧЕСКИХ ДОХОДНОСТЕЙ АКЦИЙ И РОССИЙСКОГО ОТРАСЛЕВОГО ИНДЕКСА

Авторы:
Город:
Москва
ВУЗ:
Дата:
08 января 2016г.

Целью данной работы является проверка гипотезы о равенстве нулю коэффициента корреляции дневных логарифмических доходностей акций и российского отраслевого индекса.

Обозначим X – значения дневных логарифмических доходностей акций, а Y – значения дневных логарифмических доходностей российского отраслевого индекса. Если нулевая гипотеза отвергается, то это означает, что выборочный коэффициент корреляции значим, а X и Y коррелированы. Если нулевая гипотеза будет принята, то выборочный коэффициент корреляции незначим, а X и Y – некоррелированы.

Используются данные 15 компаний входящих в индекс ММВБ Металлургия (MICEX M&M) с 2008 по 2013 год включительно. Тикеры этих компаний:

GMKN, POLY, АЛРОСА, ALRS, CHMF, НЛМК, NLMK, VSMO, ТМК TRMK, RUALR, ММК, MAGN, MTLR,CHZN,RASP, MTLRP, LNZL, BLNG.

Проверка гипотезы будет осуществляться 15*5=75 раз. Главный критерий: критерий Стьюдента.

Помимо нулевой гипотезы будут рассмотрены три альтернативных гипотезы( о том что коэффициент корреляции равен 0.2, 0.3.

Предварительный анализ данных

      Для анализа используются данные о ценах акций компаний отрасли Металлургия, входящих в индекс ММВБ. Источником списка компаний, входящих в индекс ММВБ Металлургия (Табл.1), послужил сайт http://quote.rbc.ru/, а источником данных - http://www.finam.ru/ . Приведем список всех компаний и их тиккеров, входящих в данный российский отраслевой индекс (с тикером MICEX M&M) в Табл.1.


  

Таблица 1 Список компаний


 

Компания

Тикер

НорНикель ГМК

GMKN

Polymetal International plc

POLY

АЛРОСА

ALRS

Северсталь

CHMF

НЛМК

NLMK

ВСМПО-АВИСМА

VSMO

РУСАЛ РДР

RUALR

ТМК

TRMK

ММК

MAGN

МЕЧЕЛ

MTLR

ЧЦЗ

CHZN

Распадская

RASP

МЕЧЕЛ пр.

MTLRP

Лензолото

LNZL

Белон

BLNG

ММВБ Металлургия6

^MICEX M&M

 Рассмотрим таблицу числа торговых дней в году (Табл.2), использовав исходные данные из файлов с котировками компаний по полю , которое означает цену закрытия в рублях. Определяем число торговых дней, удаляя все нулевых значения; учитываем, что данные по компаниям должны быть доступны за одинаковый период времени. Для данной работы возьмем период с 1 января 2009 года по 31декабря 2013 года, данные за 2014 и 2015 года исключим из рассмотрения , в связи с с нестабильным состоянием на фондовом рынке в этот период.

    

Таблица 2 Число торговых дней



Компания\годы

2009

2010

2011

2012

2013

ALRS

0

0

24

255

250

BLNG

240

248

248

255

250

CHMF

249

248

248

255

250

CHZN

249

248

248

255

246

GMKN

249

248

248

255

250

LNZL

225

230

248

255

250

MAGN

249

248

248

255

250

MTLR

249

248

248

255

250

MTLRP

0

0

178

255

250

NLMK

249

248

248

255

250

POLY

0

0

0

0

137

RASP

249

248

248

255

250

RUALR

0

5

248

255

250

TRMK

249

248

248

255

250

VSMO

249

248

248

255

250

^MICEXM&M7

249

248

248

255

250

6 Индекс

 

 Из данной таблицы видно, что по акциям компаний с тикерами: ALRS , MTLRP, POLY, RUALR начались вестись торги позднее 2009 года, поэтому исключаем их из рассмотрения.

Для того, чтобы построить таблицы с максимальными (вверх и вниз) дневными относительными скачками цен (по годам и акциям), также используем поле из исходных данных, выделив при этом максимальные скачки вверх и вниз за весь исследуемый период для каждой компании, результатом являются Табл.3 и Табл.4.

 

Таблица 2 Максимальные дневные относительные скачки цен вверх


  

Компания\годы

2009

2010

2011

2012

2013

Максимальный скачок вверх

BLNG

26,679%

16,058%

8,814%

6,157%

14,089%

26,679%

CHMF

20,224%

9,099%

8,821%

7,756%

6,363%

20,224%

CHZN

26,296%

6,357%

5,120%

10,536%

9,634%

26,296%

GMKN

13,870%

5,646%

7,496%

6,125%

4,569%

13,870%

LNZL

33,647%

22,950%

33,648%

8,474%

10,821%

33,648%

MAGN

11,912%

7,545%

9,490%

7,582%

3,833%

11,912%

MTLR

17,481%

14,775%

9,896%

10,409%

11,403%

17,481%

NLMK

19,507%

10,775%

10,507%

8,823%

7,942%

19,507%

RASP

15,074%

15,951%

10,430%

9,305%

8,828%

15,951%

TRMK

16,788%

8,519%

9,550%

5,914%

5,838%

16,788%

VSMO

14,000%

16,104%

14,601%

8,127%

7,490%

16,104%

MICEXM&M

11,371%

6,030%

4,871%

7,207%

3,543%

11,371%

  

Таблица 4 Максимальные дневные относительные скачки цен вниз



Компания\годы

2009

2010

2011

2012

2013

Максимальный скачок вниз

BLNG

-35,667%

-7,174%

-8,608%

-7,424%

-16,917%

-35,667%

CHMF

-10,339%

-9,149%

-11,493%

-6,387%

-6,710%

-11,493%

CHZN

-13,840%

-7,130%

-7,583%

-6,355%

-6,894%

-13,840%

GMKN

-17,570%

-7,877%

-7,554%

-4,676%

-8,490%

-17,570%

LNZL

-14,792%

-23,874%

-23,762%

-19,213%

-24,480%

-24,480%

MAGN

-9,764%

-9,539%

-12,853%

-6,565%

-6,331%

-12,853%

MTLR

-12,743%

-9,644%

-11,421%

-11,470%

-53,365%

-53,365%

NLMK

-10,829%

-10,033%

-13,319%

-7,120%

-5,799%

-13,319%

RASP

-12,393%

-26,754%

-14,182%

-7,817%

-9,260%

-26,754%

TRMK

-11,167%

-9,076%

-12,364%

-6,360%

-5,705%

-12,364%

VSMO

-14,098%

-11,246%

-11,734%

-8,405%

-9,564%

-14,098%

MICEXM&M

-8,140%

-6,649%

-8,297%

-5,288%

-5,005%

-8,297%

 

7 Индекс ММВБ Металлургия

8 Браилов А.В. Лекции по математической статистике. М.: Финакадемия, 2007. стр 78, стр 79   


 Максимальные относительные скачки цен в основном небольшие, без сплитов за исключением 2013 года для компании MTLR, данные которой могут повлиять на проверку гипотезы.

     Теоретическая справка по проверке гипотез

Пусть H0, H1, H2 - статистические гипотезы. Гипотезу H0 назовем основной, а гипотезы H1и H2 альтернативными. Далее везде в качестве базисного предположения принимается утверждение о справедливости одной из этих гипотез.8  Для проверки нулевой гипотезы используется специально подобранная случайная величина,  точное  или  приближенное  распределение  которой  известно.  Эта  величина  носит  название статистического критерия (статистика критерия). 9


3.1 Критерий Стьюдента.

Итак, пусть имеется двумерная генеральная совокупность (𝑋,𝑌), которая распределена нормально. Из этой совокупности извлечена выборка объѐма 𝑛 и по ней найден выборочный коэффициент корреляции 𝜌в, который оказался отличным от нуля. Так как выборка отобрана случайно, то ещѐ нельзя заключить, что коэффициент корреляции генеральной совокупности 𝜌г также отличен от нуля. А так как нас интересует именно этот коэффициент, то возникает необходимость при заданном уровне значимости a проверить нулевую гипотезу (H0: 𝜌г = 0) о равенстве нулю генерального коэффициента корреляции при конкурирующих гипотезах H1: 𝜌г = 0.2; H2: 𝜌г = 0.3 .

Если нулевая гипотеза отвергается, то это означает, что выборочный коэффициент корреляции отличен от нуля, а 𝑋 и 𝑌 коррелированны (связаны линейной зависимостью). Если нулевая гипотеза будет принята, то выборочный коэффициент корреляции незначим, а 𝑋 и 𝑌 – некоррелированы. В качестве критерия нулевой гипотезы принимается следующая случайная величина:

где n –объем бесповторной выборки.

Величина 𝑇 при справедливости нулевой гипотезы имеет распределение Стьюдента с 𝑘=𝑛−2 степенями свободы.
Конкурирующие гипотезы имеют вид H1: 𝜌г = 0.2; H2: 𝜌г = 0.3;
Пусть 𝑇набл – вычисленное по данным наблюдений значение критерия, тогда можно сформулировать правило проверки нулевой гипотезы:
Правило. Для того чтобы при заданном уровне значимости 𝑎 проверить нулевую гипотезу (H0: 𝜌г = 0) о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующих гипотезах, надо вычислить наблюдаемое значение критерия:

и по таблице критических точек распределения Стьюдента по заданному уровню значимости и числу степеней свободы 𝑘=𝑛−2 найти критическую точку 𝑡𝛼(𝑘) для критической области.
Если 𝑇набл < 𝑡𝛼(𝑘) , то нет оснований отвергнуть нулевую гипотезу.
Если 𝑇набл > 𝑡𝛼(𝑘) , то нулевую гипотезу отвергают. 3.2 Критерий Колмогорова Критерий Колмогорова, как вспомогательный критерий для проверки статистической гипотезы, используется по следующему алгоритму:
1. Строятся эмпирическая функция распределения 𝐹 𝑛(x) и предполагаемая
теоретическая функция распределения 𝐹(x).
2. Определяется мера расхождения между теоретическим и эмпирическим
распределением 𝑑 по формуле 𝑑=𝑚𝑎𝑥|𝐹 𝑛(x) − 𝐹(x)| и вычисляется величина 𝑢= √𝑛𝑑.
3. Если вычисленное значение 𝑢 окажется больше критического 𝑢𝑎, определенного на уровне значимости 𝑎, то нулевая гипотеза H0 отвергается. Если 𝑢 ≤ 𝑢𝑎, то считают, что гипотеза H0 не противоречит опытным данным.
Проверка гипотез для модельных данных.
Сгенерируем модельные данные – коэффициент корреляции между X и Y , где X – значения дневных логарифмических доходностей акций, а Y – значения дневных логарифмических доходностей российского отраслевого индекса. Методом Монте-Карло вычислим таблицу квантилей распределения статистики критерия Стьюдента при верной нулевой. Результаты представлены ниже для квантилей уровней 0.01, 0.02, …, 0.5. Результаты представлены ниже.

9 Кобзарь А. И. Прикладная математическая статистикаДля инженеров и научных работников. – М.:ФИЗМАТЛИТ, 2006. стр. 202-203

Таблица 3 Квантили уровней 0.01, 0.02, …, 0.5, при различных объемах выборки


Квантили

Год (n=250)

Полугодие (n=120)

Квартал (n=60)

0,01

-2,294

-2,291

-2,355

0,02

-2,026

-2,044

-2,122

0,03

-1,878

-1,879

-1,913

0,04

-1,767

-1,754

-1,792

0,05

-1,657

-1,642

-1,686

0,06

-1,559

-1,545

-1,6

0,07

-1,484

-1,468

-1,507

0,08

-1,402

-1,4

-1,445

0,09

-1,33

-1,337

-1,377

0,1

-1,276

-1,278

-1,309

0,11

-1,231

-1,228

-1,251

0,12

-1,176

-1,177

-1,204

0,13

-1,132

-1,127

-1,15

0,14

-1,088

-1,075

-1,102

0,15

-1,042

-1,035

-1,059

0,16

-0,998

-0,998

-1,016

0,17

-0,954

-0,958

-0,98

0,18

-0,915

-0,918

-0,942

0,19

-0,876

-0,882

-0,901

0,2

-0,837

-0,846

-0,865

0,21

-0,797

-0,813

-0,829

0,22

-0,765

-0,767

-0,793

0,23

-0,725

-0,738

-0,761

0,24

-0,69

-0,703

-0,718

0,25

-0,659

-0,67

-0,689

0,26

-0,629

-0,639

-0,653

0,27

-0,603

-0,611

-0,623

0,28

-0,572

-0,585

-0,595

0,29

-0,539

-0,558

-0,561

0,3

-0,514

-0,526

-0,53

0,31

-0,484

-0,496

-0,503

0,32

-0,457

-0,469

-0,469

0,33

-0,432

-0,441

-0,44

0,34

-0,399

-0,41

-0,41

0,35

-0,371

-0,384

-0,385

0,36

-0,341

-0,354

-0,351

0,37

-0,317

-0,329

-0,322

0,38

-0,288

-0,303

-0,295

0,39

-0,259

-0,278

-0,268

0,4

-0,237

-0,253

-0,241

0,41

-0,213

-0,223

-0,217

0,42

-0,185

-0,198

-0,191

0,43

-0,161

-0,17

-0,167

0,44

-0,134

-0,146

-0,144

0,45

-0,106

-0,121

-0,12

0,46

-0,083

-0,094

-0,093

0,47

-0,052

-0,071

-0,064

0,48

-0,028

-0,042

-0,039

0,49

-0,003

-0,018

-0,013

0,5

0,02

0,005

0,013

 

Построим гистограмму частот Р-значений, используя данные из таблицы квантилей, и проверим их на равномерность на отрезке [0,1] по критерию Колмогорова:

Рис.3. Модельные данные. Гистограмма P-значений

 

Из гистограммы видно, что Р-значения критерия Стьюдента распределены практически равномерно на отрезке [0,1], что подтверждается при проверке равномерности распределения Р-значения по критерию Колмогорова.



 

Проверка на равномерность по критерию Колмогорова


Таблица 6



 

проверка равномерности распределения Р-значения на отрезке [0,1] по критерию Колмогорова

Гипотеза о равномерном распределении

принимается

 

Выбор альтернативной гипотезы и оценка мощности критерия.

В качестве двух  альтернативных  гипотез выберем гипотезы о том, что в первом случае коэффициент

корреляции 𝜌г = 0.2, во втором − 𝜌г = 0.3 . Выбор именно этих  гипотез мотивирован тем, что эти коэффициенты не слишком сильно отличаются от нулевой гипотезы.

Альтернативная гипотеза H1.

Оценим на основе 1000-кратной проверки нулевой гипотезы при верной альтернативной мощность критерия Стьюдента для выбранного распределения. Создадим программу, в которой моделируются данные при верной гипотезе H1 , загружаются квантили распределения нулевой гипотезы, при помощи которых происходит оценка мощности критерия.

Таблица 7 Мощность критерия Стьюдента при гипотезе H1 для различных объемов выборки


Уровень значимости

Год (n=250)

Полугодие (n=120)

Квартал (n=60)

0,05

0,891

0,576

0,327


Аналогично для гипотезы H2

 

Таблица 8 Мощность критерия Стьюдента при гипотезе H2 для различных объемов выборки


Уровень значимости

Год (n=250)

Полугодие (n=120)

Квартал (n=60)

0,05

0,996

0,934

0,63

 

Из выданного программой результата видим, что мощность при разных объемах выборки достаточно высокая и уменьшается при сокращении объемов выборки, увеличивается при большем отклонении альтернативной гипотезы (увеличении отклонения коэффициента корреляции) от нулевой гипотезы.

Можно сделать заключение о том, что вероятность ошибки второго рода мала и мощность критерия Стьюдента достаточно высокая.

Проверка гипотез для реальных данных

Проверим гипотезу о равенстве нулю коэффициента корреляции дневных логарифмических доходностей акций и российского отраслевого индекса на реальных данных (для индекса ММВБ Металлургия). Для этого создадим программу, с помощью которой найдем Р-значения по всем годам для всех компаний, загружая исходные данные из таблицы «Сокращенные данные» (из полей с названиями тикеров). Результат работы программы представлен ниже.

Таблица 4 P-значения по годам и компаниям

 

Компания/год

2009

2010

2011

2012

2013

BLNG

0

0

0

0

0

CHMF

0

0

0

0

0

CHZN

0

0

0

0

0,568

GMKN

0

0

0

0

0

LNZL

0,274

0,031

0,003

0

0,106

MAGN

0

0

0

0

0

NLMK

0

0

0

0

0

RASP

0

0

0

0

0

TRMK

0

0

0

0

0

VSMO

0

0

0

0

0

 

Построим общую гистограмму для всех лет и тикеров по найденным P-значениям. Результат представлен ниже.

 

Рис.4. Гистограмма P- значений для реальных данных


Для того чтобы вычислить долю проверок, в которых гипотеза принималась при 5% и 1% уровнях значимости, создадим программу, в которой загружаются исходные данные из таблицы «Сокращенные данные», вычисляются уровни значимости; результатом работы является таблица:


Таблица 10 Доля проверок с принимаемой основной гипотезой (для года)

 

1% уровень значимости

5% уровень значимости

0,08

0,06

 

Основная гипотеза систематически отвергается даже при 1% уровне значимости, поэтому необходимо заменить анализ полного календарного года исследованием данных за второе полугодие (для каждого года из того же самого диапазона лет).

Проводим исследование данных за вторые полугодия каждого года из того же диапазона лет. Результаты приведены в Табл.11, Табл.12 и на Рисунке 5.


Таблица 11 P-значения из второго полугодия

 

Компания/год

2009

2010

2011

2012

2013

BLNG

0

0

0

0

0,002

CHMF

0

0

0

0

0

CHZN

0

0

0

0,167

0,991

GMKN

0

0

0

0

0

LNZL

0,199

0,326

0,073

0,006

0,508

MAGN

0

0

0

0

0

NLMK

0

0

0

0

0

RASP

0

0

0

0

0

TRMK

0

0

0

0

0

VSMO

0

0

0

0

0,008



Рис.5. Гистограмма P- значений для реальных данных за второе полугодие

 

Таблица 5 Доля проверок с принимаемой основной гипотезой (за второе полугодие)

 

1% уровень значимости

5% уровень значимости

0,12

0,12

 

Основная гипотеза систематически отвергается даже при 1% уровне значимости, поэтому необходимо заменить анализ второго полугодия исследованием данных за четвертый квартал (для каждого года из того же самого диапазона лет).

Проводим исследование данных за четвертые кварталы каждого года из того же диапазона лет. Результаты приведены в Табл.13, Табл.14 и на Рисунке 6.

Таблица13 P-значения за четвертый квартал

 

Компания/год

2009

2010

2011

2012

2013

BLNG

0

0,018

0

0

0,018

CHMF

0

0

0

0

0

CHZN

0

0

0

0,12

0,399

GMKN

0

0

0

0

0

LNZL

0,001

0,191

0,552

0,164

0,25

MAGN

0

0

0

0

0

NLMK

0

0

0

0

0

RASP

0

0,006

0

0

0

TRMK

0

0,003

0

0

0,316

VSMO

0

0,135

0

0

0,217

 


Рис.6. Гистограмма P- значений для реальных данных за четвертый квартал)

 


Таблица 14 Доля проверок с принимаемой основной гипотезой (четвертый квартал)

 

1% уровень значимости

5% уровень значимости

0,22

0,18

 

Основная гипотеза отвергается даже при 1% уровне значимости.

Затем вычисляем медианные P- значения по годам и компаниям (для четвертого квартала), используя уже подсчитанные данные из Табл.13, результаты представлены ниже:


Таблица 15  Медианные P - значения по компаниям

 

Года

Р-значения

2009

0

2010

0,0015

2011

0

2012

0

2013

0,009


 

Таблица 16 Медианные P - значения по годам

 

Компания

Р-значения

BLNG

0

CHMF

0

CHZN

0

GMKN

0

LNZL

0,191

MAGN

0

NLMK

0

RASP

0

TRMK

0

VSMO

0

 

   Наиболее высокое медианное P-значение по годам в 2013 году может быть обеспечено ослаблением влияния политического фактора (смягчение политической напряженности), стабилизацией российской экономики (сведение к нулю отрицательных эффектов кризиса 2008). Также немаловажную роль сыграло вступление России в ВТО в 2012 г., заметные последствия начинаю появляться спустя год после вступления: увеличение открытости рынка для иностранцев, возрастание конкуренции.

    Наиболее низкое медианное P-значение в 2009, 2011, 2013 году обусловлены ростом интереса к использованию альтернативных источников энергии, сберегающих технологий, снижением темпов роста ВВП в Китае (в частности производственной сфере), который является основным потребителем металлургической и горно-добывающей продукции российских компаний, что в свою очередь влияет на всю отрасль в целом.

    Наиболее высокое медианное P-значение у компании с тикером LNZL может быть вызвано тем, что основным рынком сбыта является Российская федерация (в частности основные потребители: государство, граждане РФ и частные компания), поэтому возникает меньшая степень зависимости между логарифмической доходностью акций этой компании и российского отраслевого индекса, на который сильно оказывает влияние мировой экономики (т.к. потребителями продукции отрасли в целом являются в основном иностранные компании и компании работающие с зарубежными предпринимателями).

    Наиболее низкие медианные P-значение у оставшихся компаний. Такие значения могут быть обусловлены высокой степенью зависимости между компаниями и отраслью в целом, так как экономическая политика РФ по отношению к отрасли оказывает существенное влияние на компании в этой отрасли. Также немаловажную роль играет специфичность продукции (в основном это низкокачественное сырье или товары, которое продаются зарубежным странам и в меньшей мере потребляются в самой стране).

Заключение.

    Стоит отметить, что гипотеза о равенстве нулю коэффициента корреляции дневных логарифмических доходностей акций и российского отраслевого индекса подтверждается на модельных данных, говорит о том, что алгоритм вычислений и сами вычисления правильны. Днако для реальных данных нулевая гипотеза отвергается даже при 1% уровне значимости при различных объемах выборки: год, второе полугодие, четвертый квартал.

 

Список литературы

1.     Браилов А. В. Лекции по математической статистике. М.: Финансовая академия, 2007. 78-79, 172 с.

2.     Бабайцев В.А., Браилов А.В., Солодовников А.С. Математика в экономике. Теория вероятностей. Курс лекций. М.: Финансовая академия, 2002; 72 с.

3.     www.finam.ru

4.     http://quote.rbc.ru/