10 января 2016г.
Моделирование социально-экономических процессов по своей сути является воспроизведением данных процессов в малых экспериментальных формах, в искусственно созданных условиях. Чаще всего для этих целей используется математическое моделирование, описывающее социально-экономические процессы при помощи математических зависимостей.
Созданная математическая модель обычно подкрепляется реальными статистическими данными, а результаты расчетов, выполненные в рамках построенной модели, позволяют строить прогнозы и проводить объективные оценки.
По фактору времени принято выделять статические и динамические модели. Статические модели описывают поведение объекта в какой-либо конкретный момент времени. Данные модели применяют для описания статических систем, путем характеристики их состояния в заданный момент времени. При этом полученные, при помощи статического моделирования данные, не дают достоверного представления о динамической системе, можно судить лишь о ее поведении в строго определенный момент времени.
Динамические модели – модели, учитывающие взаимосвязи переменных во времени. Такие модели не сводятся к простой сумме ряда статических моделей, а описывают силы и взаимодействия, определяющие ход процессов в экономических системах. Модель является динамической, если в данный момент времени она учитывает значения входящих в нее переменных, относящихся как к текущему, так и к предыдущим моментам времени.
В экономических исследованиях очень часто для изучения факторов, определяющих уровень и динамику экономических процессов, используются модели корреляционно-регрессионного типа. При этом задачи корреляционного анализа сводятся к измерению тесноты известной связи между изменяющимися признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак. Задачи регрессионного анализа заключаются в выборе типа модели, установлении степени влияния независимых переменных на зависимую переменную и определении расчетных значений зависимой переменной.
Модели корреляционно-регрессионного типа в зависимости от количества факторов, включенных в уравнение регрессии, бывают простого (парного) и множественного вида. В свою очередь, парная регрессия и корреляция может определяться как наличием линейных связей между переменными, так и наличием нелинейных связей.
Простая регрессия представляет собой модель, где среднее значение зависимой (объясняемой) переменной y рассматривается как функция одной независимой (объясняющей) переменной x, то есть данная модель имеет вид:Моделирование социально-экономических процессов по своей сути является воспроизведением данных процессов в малых экспериментальных формах, в искусственно созданных условиях. Чаще всего для этих целей используется математическое моделирование, описывающее социально-экономические процессы при помощи математических зависимостей.
Созданная математическая модель обычно подкрепляется реальными статистическими данными, а результаты расчетов, выполненные в рамках построенной модели, позволяют строить прогнозы и проводить объективные оценки.
По фактору времени принято выделять статические и динамические модели. Статические модели описывают поведение объекта в какой-либо конкретный момент времени. Данные модели применяют для описания статических систем, путем характеристики их состояния в заданный момент времени. При этом полученные, при помощи статического моделирования данные, не дают достоверного представления о динамической системе, можно судить лишь о ее поведении в строго определенный момент времени.
Динамические модели – модели, учитывающие взаимосвязи переменных во времени. Такие модели не сводятся к простой сумме ряда статических моделей, а описывают силы и взаимодействия, определяющие ход процессов в экономических системах. Модель является динамической, если в данный момент времени она учитывает значения входящих в нее переменных, относящихся как к текущему, так и к предыдущим моментам времени.
В экономических исследованиях очень часто для изучения факторов, определяющих уровень и динамику экономических процессов, используются модели корреляционно-регрессионного типа. При этом задачи корреляционного анализа сводятся к измерению тесноты известной связи между изменяющимися признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак. Задачи регрессионного анализа заключаются в выборе типа модели, установлении степени влияния независимых переменных на зависимую переменную и определении расчетных значений зависимой переменной.
Модели корреляционно-регрессионного типа в зависимости от количества факторов, включенных в уравнение регрессии, бывают простого (парного) и множественного вида. В свою очередь, парная регрессия и корреляция может определяться как наличием линейных связей между переменными, так и наличием нелинейных связей.
Простая регрессия представляет собой модель, где среднее значение зависимой (объясняемой) переменной y рассматривается как функция одной независимой (объясняющей) переменной x, то есть данная модель имеет вид:
𝒚=𝒇 (𝒙) . (1)
Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной. В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. Практически в каждом отдельном случае величина y, складывается из двух слагаемых:
где 𝑦𝑗 – фактическое значение результативного признака; 𝑦 𝑥𝑗 – теоретическое значение результативного признака, найденное по соответствующему уравнению регрессии; 𝜀𝑗 – случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.
Случайная величина 𝜀 включает влияние неучтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели обусловлено тремя источниками: спецификацией модели, выборочным характером исходных данных и особенностями измерения переменных.
При построении регрессионных моделей могут использоваться как линейные, так и нелинейные функции.
Множественная регрессия – уравнение связи с несколькими объясняющими (независимыми) переменными:
𝑌=𝑓 (𝑥1,𝑥2,… 𝑥𝑚 ). (3)
Множественная регрессия широко используется при решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целого ряда других вопросов эконометрики. Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а так же совокупное воздействие их на моделируемый показатель.
Основной недостаток использования регрессионных моделей в экономике – не всегда достоверные результаты прогнозов, рассчитанных по данным моделям. Несмотря на то, что данные модели при проверке и обладают высоким качеством, но они не учитывают влияние, оказываемое предыдущими результатами на результат текущий. Это может в определенных случаях искажать прогнозные значения, полученные при помощи данных моделей.
Для большей достоверности полученных прогнозов в экономической и управленческой деятельности стоит учитывать динамические особенности прогнозируемых явлений.
Одним из типов динамических моделей, применяемых для исследования социально-экономических процессов, являются модели с распределенным лагом, в которых значения переменных за прошлые периоды непосредственно включены в модель.
В общем виде рассмотрим алгоритм построения модели социально-экономических процессов при помощи построения динамической модели с распределенным лагом – моделью с лагами Алмон:
𝑦𝑡=𝑏0+𝑏1∗𝑥𝑡+𝑏2∗𝑥𝑡−1+𝑏3∗𝑥𝑡−2+⋯+𝑏𝐿+1∗𝑥𝑡−𝐿+𝜀𝑡, (4)
где 𝐿 - максимальная величина лага; 𝑏0, 𝑏1, 𝑏2, 𝑏3, 𝑏𝐿+1– параметры оценок;
𝑡 – текущий момент времени; 𝜀 - случайная величина, характеризующая отклонения реального значения результативного признака от теоретического.
Данный метод хорошо описан в труде Елисеевой И.И. [1] и реализован на примере моделирования зависимости ВВП от инвестиций в экономику США. Исходная статистическая информация представлена в Табл.1.
Таблица 1 Динамика объема ВВП США (у) и валовых внутренних инвестиций в экономику США (х) в ценах 1987 г., млрд долл. США
Год
|
ВВП (y)
|
Инвестиции (x)
|
1981
|
1931,3
|
296,4
|
1982
|
1973,2
|
290,8
|
1983
|
2025,6
|
289,4
|
1984
|
2129,8
|
321,2
|
1985
|
2218
|
343,3
|
1986
|
2343,3
|
371,8
|
1987
|
2473,5
|
413
|
1988
|
2622,3
|
438
|
1989
|
2690,3
|
418,6
|
1990
|
2801
|
440,1
|
1991
|
2877,1
|
461,3
|
1992
|
2875,8
|
429,7
|
1993
|
2965,1
|
481,5
|
1994
|
3107,1
|
532,2
|
1995
|
3268,5
|
591,7
|
1996
|
3248,1
|
543
|
1997
|
3221,7
|
437,6
|
1998
|
3380,8
|
520,6
|
1999
|
3533,2
|
600,4
|
2000
|
3703,5
|
664,6
|
2001
|
3796,8
|
669,7
|
2002
|
3776,3
|
594,4
|
2003
|
3843,1
|
631,1
|
2004
|
3760,3
|
540,5
|
2005
|
3906,6
|
599,5
|
2006
|
4148,5
|
757,5
|
2007
|
4279,8
|
745,9
|
2008
|
4404,5
|
735,1
|
2009
|
4540
|
749,3
|
2010
|
4781,6
|
773,4
|
2011
|
4836,9
|
789,2
|
2012
|
4884,9
|
749,5
|
2013
|
4848,4
|
672,6
|
Пусть максимальная длина лага равна четырем, тогда вид лаговой модели будет следующим:
𝒚𝒕=𝒃𝟎+𝒃𝟏∙𝒙𝒕+𝒃𝟐∙𝒙
𝒕−𝟏+𝒃𝟑∙𝒙
𝒕−𝟐+𝒃𝟒∙𝒙𝒕−𝟑+𝒃𝟓∙𝒙
𝒕−𝟒+𝒆𝒕. (5)
Для определения коэффициентов модели воспользуемся обычным МНК, с помощью стандартной функции
Excel Линейн. Результаты моделирования представлены на Рисунке 1.
Рис.1.
Конкретный вид модели:
Из рисунка видно, что совпадение экспериментальных данных и результатов моделирования достаточно
неплохое. Подтверждением тому является высокий коэффициент детерминации X2 = 0,9914.
Однако коэффициенты
при
лаговых
переменных Xt −1 и Xt −3 являются
статистически
незначимыми. Кроме
того применение метода МНК к таким моделям в общем случае некорректно по ряду причин:
1.
Высокий уровень мультиколлинеарности факторов модели;
2.
При большой величине лага снижается число наблюдений, используемых при моделировании, что естественным образом ведет к снижению числа степеней свободы;
3.
Неизбежным также является наличие автокорреляции остатков.
Вышеперечисленные факторы свидетельствуют о значительных нарушениях предпосылок МНК, что приводит к неэффективным, а зачастую и к смещенным оценкам.
Следует отметить,
что несостоятельность
модели
становится более
выраженной
при
увеличении количества коэффициентов, когда по смыслу задачи ожидается влияние с большим запаздыванием.
Для преодоления этих трудностей обычно предлагается та или иная форма «гладкости» распределения лагов. Это приводит к уменьшению числа оцениваемых параметров.
Пусть модель с распределенным лагом порядка 𝐿имеет вид:
𝑦𝑡=𝑏0+𝑏1∙𝑥𝑡+𝑏2∙𝑥𝑡−1+𝑏3∙𝑥𝑡−2+⋯+𝑏𝐿+1∙𝑥𝑡−𝐿+𝑒𝑡. (7)
В преобразовании Алмон коэффициенты
модели
представлены степенными
полиномами,
факторами которых является величина лага. Для полинома k – ой степени эта зависимость имеет вид:
Если подставить значения (8) в исходную модель (7), то получим модель вида:
Для нашего примера, с максимальным лагом 𝐿=4, модель преобразуется к виду:
𝒚 𝒕=𝒃𝟎+𝒄𝟎∙𝒛𝟎+𝒄𝟏∙𝒛𝟏+𝒄𝟐∙𝒛𝟐, (10)
где 𝑧0=𝑥𝑡+𝑥𝑡−1+𝑥𝑡−2+𝑥𝑡−3+𝑥𝑡−4;
𝒛𝟏=𝒙𝒕−𝟏+𝟐∙𝒙𝒕−𝟐+𝟑∙𝒙𝒕−𝟑+𝟒∙𝒙𝒕−𝟒;
𝑧2=𝑥𝑡−1+4∙𝑥𝑡−2+9∙𝑥𝑡−3+16∙𝑥𝑡−4.
Оценим (10) с помощью МНК. Результаты моделирования представлены на Рисунке 2.
Рис.2.
Коэффициенты модели Алмон:
𝒃𝟎=𝟐𝟗𝟎,𝟎𝟕𝟏𝟒, 𝒄𝟎=𝟏,𝟗𝟒𝟐𝟔𝟎𝟕, 𝒄𝟏=−𝟎,𝟗𝟓𝟔𝟗𝟐, 𝒄𝟐=𝟎,𝟏𝟗𝟐𝟖𝟓𝟐.
Подставив эти значения в (4) получим модель с распределенным лагом
𝒚 𝒕=𝟐𝟗𝟎,𝟎𝟕+𝟏,𝟗𝟒𝟑∙𝒙𝒕+𝟏,𝟏𝟕𝟗∙𝒙𝒕−𝟏+𝟎,𝟖∙𝒙𝒕−𝟐+𝟎,𝟖𝟎𝟖∙𝒙𝒕−𝟑+ 𝟏,𝟐𝟎𝟏∙𝒙𝒕−𝟒 (11)
В этом случае коэффициент детерминации даже несколько ниже, чем в предыдущем случае R2 = 0,99, однако все коэффициенты являются статистически значимыми. Данный метод имеет два неоспоримых преимущества. Во-первых, он достаточно универсален и может быть применен для моделирования процессов, которые характеризуются разнообразными структурами лагов. Во-вторых, при относительно небольшом количестве переменных, которое не приводит к потере значительного числа степеней свободы, с помощью метода Алмон можно построить модели с распределенным лагом любой длины.
Результаты исследований с использованием этих преобразований показали, что, несмотря, на некоторое снижение коэффициента детерминации, эффективность оценок повышается, они становятся статистически более значимыми. Однако не снимается главная проблема – наличие мультиколлинеарности. Кроме того величина лага должна быть известна заранее.
Выбор длины лага меньше реального приведет к искажению динамики процесса: не будут учтены факторы, оказывающие значительное влияние на результат. В этом случае остатки будут неслучайными и оценки по МНК окажутся неэффективными и смещенными. Проявление этих проблем будет заметным особенно при определении прогнозных значений зависимой переменной с использованием других статистических данных.
Выбор большей величины лага по сравнению с ее реальным значением приведет к включению в модель слабо значимых факторов, а, следовательно, к снижению эффективности оценок. Кроме того при этом происходит уменьшение объема выборки, используемой для моделирования, что ведет также к снижениюэффективности и состоятельности оценок.
Для моделирования динамики можно использовать непрерывную модель, представленную дифференциальнымуравнением. Наиболее предпочтительным является использование линейных уравнений первого и второго порядков:
𝑇 ∙ 𝑦′ 𝑡 + 𝑦 𝑡 = 𝑦уст 𝑡 , (12)
𝑇2 ∙ 𝑦′′ 𝑡 + 2𝑇𝜁 ∙ 𝑦′ 𝑡 + 𝑦 𝑡 , (13)
где 𝑇 – постоянная времени; ζ- коэффициент затухания; - установившееся значение.
В (12) и (13) под установившимся значением понимается тренд между переменными 𝑦(𝑡) и 𝑢(𝑡) в установившемся режиме, когда u = const и отклики на «предысторию» значений объясняющей переменной завершены.
Трендовая составляющая моделей (12) и (13) может быть как линейной, так и нелинейной, например:
𝑦уст 𝑡 = 𝑏0 + 𝑏1 ∙ 𝑢 𝑡 , (14)
𝑦уст 𝑡 = 𝑏0 + 𝑏1 ∙ 𝑢 𝑡 + 𝑏2 ∙ 𝑢2(𝑡) (15)
Для оценки параметров модели Т, ζ, 𝑏0, 𝑏1, 𝑏2, можно использовать дискретно-непрерывный метод идентификации, основанный на соотношениях дискретного линейного фильтра Калмана [4], [6].
Используя статистику (табл. 1), построим математическую модель зависимости ВВП от инвестиций в форме (12), (14)
где параметры модели Т, 𝑏0, 𝑏1 подлежат оцениванию.
Для идентификации параметров Т, 𝑏0, 𝑏1 составим расширенную модель вида:
Обозначим 𝑥 𝑡 = (𝑦 𝑡 𝑇 𝑏0 𝑏1)𝑇 . Тогда исходную систему для идентификации можно представить в виде:
𝑥′ 𝑡 = 𝜑 𝑥, 𝑢, 𝑡 + 𝜉 𝑡 , (18)
где
𝜉 𝑡 = (𝜔 𝑡 0 0 0)𝑇 вектор шумов с дисперсионной матрицей
Модель измерения координат состояния имеет вид:
𝑧𝑘 = 𝐻 ∙ 𝑥𝑘 + 𝑣𝑘 , 𝑘 = 1,2, …, (19)
где 𝐻 = 1 0 0 0 .
Модель измерения управления
𝑢𝑘 ∗ = 𝑢𝑘 + 𝜂𝑘 , 𝑘 = 1,2, …, (20)
где 𝑢𝑘 ∗ - измеренные значения, 𝑢𝑘 - истинные значения управления.
В (19) и в (20) 𝑣𝑘 , 𝜂𝑘 - центрированные случайные шумы с известными дисперсиями: 𝑉𝑧 = 𝜎𝑦2, 𝑉𝑢 = 𝜎𝑢2.
Для оценки вектора x(t) модели (18) воспользуемся алгоритмом дискретно-непрерывного метода.
Оценка параметров модели и численное моделирование динамики инвестиций были реализованы с помощью ППП Mathcad.
Результаты идентификации представлены на Рисунке 3.
Исследования показали,
что эффективность
оценки
коэффициента
b0 достаточно низкая, так
как
в эксперименте нет установившегося значения x(t). Поэтому пришлось варьировать начальное значение этого коэффициента: если тенденция его оценки была возрастающая и не была установившейся, то начальное значение еще увеличивали, до тех пор, пока тенденция не сменила знак, т.е. стала убывающей. Затем начальное значение принималось в районе смены тенденции, «зажималась» его начальная дисперсия (дисперсия принималась небольшой, чтобы этот коэффициент не
«раскачивался») и осуществлялось окончательное оценивание, результаты которого представлены на рисунке. Итоговые оценки были выбраны следующими: b0=509; b1 =5,9; Т= 3,92.
Результаты проверки соответствия модели экспериментальным данным представлены на Рисунок 4.Рис.4. Z(1) – модельные данные, zY1 – экспериментальные данные.
Рис.4. Z(1) – модельные данные, zY1 – экспериментальные данные.
Из Рисунка 4 видно, что совпадение модельных и экспериментальных данных достаточно высокое. Свидетельством тому является значение коэффициента детерминации R2 = 0,992.
Следующим этапом проверки адекватности модели экспериментальным данным была проверка полноты моделирования динамических свойств модели с лаговыми переменными (5) и непрерывной модели вида (16). Как уже отмечалось выше, неполное отражение динамических свойств в первую очередь скажется на точности прогноза при других значениях фактора (не используемых при идентификации).
С этой целью для оценки параметров моделей (5) и (16) была использована статистика без последних четырех измерений. Результаты эксперимента показали, что оценки модели (16) практически не изменились, а оценки же лаговой модели изменились существенно:
𝑦 𝑡 = 387,62 + 2,46 ∙ 𝑥𝑡 + 0,56 ∙ 𝑥𝑡−1 + 1,18 ∙ 𝑥𝑡−2 + 0,45 ∙ 𝑥𝑡−3 + 1,03 ∙ 𝑥𝑡−4 (21)
Осуществим прогноз по последним четырем наблюдениям объясняющего фактора, т.е. объема ВВП на
1988 – 1991г.г.
На Рисунке 5 показаны ошибки прогноза, полученного с помощью этих моделей.
Рис.5. Ошибки прогноза непрерывной и лаговой моделей
Из Рисунка 5 видно, что адекватность динамических свойств непрерывной модели гораздо выше, чем модели с распределенными лагами. При этом для непрерывной модели на период прогноза
суммарные ошибки составили
= 50077, а для лаговой модели
= 176547,52.
Оценка параметров динамической модели показала следующее:
1)
соответствие модельных и экспериментальных данных является достаточно высоким;
2)
моделирование динамических свойств модели является полным. При использовании других значений факторов оценки модели практически не изменились;
3)
адекватность динамических свойств модели достаточно высока.
Таким образом, применение динамического моделирования с использованием дифференциальных уравнений помогает избежать проблем, возникающих при использовании лаговой модели, а также дает наиболее точные и достоверные результаты с возможностью прогнозирования. Результаты численного моделирования показали, что предложенный алгоритм идентификации параметров модели достаточно эффективен и может использоваться для оценки динамических свойств экономических процессов.
Список литературы
1. Елисеева И.И., Курышева
С.В., Костеева Т.В. и др. Эконометрика / Под ред. И.И. Елисеевой.
– М.: Финансы и статистика, 2007.
2. Колпаков В.Ф.
Компьютерные
технологии решения
экономических задач. Учебное пособие, 2008 (электронный вариант).
3. Колпаков В.Ф. Моделирование динамических процессов в экономике // Финансовая аналитика: проблемы и решения. – 2014. – № 3. – С. 31–36.
4. Колпаков В.Ф. Параметрическая идентификация модели лесных пожаров // Безопасность жизнедеятельности – 2012. - № 5. – С. 39-44.
5.
Кремер Н.Ш.,
Путко Б.А. Эконометрика. – М.: ЮНИТИ, 2002.
6.
Синицын И.И. Фильтры Калмана и Пугачева:
Учебное пособие. – М.: Университетская книга, Логос, 2006.