Моделирование социально-экономических процессов по своей сути является воспроизведением данных процессов в малых экспериментальных формах, в искусственно созданных условиях. Чаще всего для этих целей используется математическое моделирование, описывающее социально-экономические процессы при помощи математических зависимостей.
Созданная математическая модель обычно подкрепляется реальными статистическими данными, а результаты расчетов, выполненные в рамках построенной модели, позволяют строить прогнозы и проводить объективные оценки.
По фактору времени принято выделять статические и динамические модели. Статические модели описывают поведение объекта в какой-либо конкретный момент времени. Данные модели применяют для описания статических систем, путем характеристики их состояния в заданный момент времени. При этом полученные, при помощи статического моделирования данные, не дают достоверного представления о динамической системе, можно судить лишь о ее поведении в строго определенный момент времени.
Динамические модели – модели, учитывающие взаимосвязи переменных во времени. Такие модели не сводятся к простой сумме ряда статических моделей, а описывают силы и взаимодействия, определяющие ход процессов в экономических системах. Модель является динамической, если в данный момент времени она учитывает значения входящих в нее переменных, относящихся как к текущему, так и к предыдущим моментам времени.
В экономических исследованиях очень часто для изучения факторов, определяющих уровень и динамику экономических процессов, используются модели корреляционно-регрессионного типа. При этом задачи корреляционного анализа сводятся к измерению тесноты известной связи между изменяющимися признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак. Задачи регрессионного анализа заключаются в выборе типа модели, установлении степени влияния независимых переменных на зависимую переменную и определении расчетных значений зависимой переменной.
Модели корреляционно-регрессионного типа в зависимости от количества факторов, включенных в уравнение регрессии, бывают простого (парного) и множественного вида. В свою очередь, парная регрессия и корреляция может определяться как наличием линейных связей между переменными, так и наличием нелинейных связей.
Простая регрессия представляет собой модель, где среднее значение зависимой (объясняемой) переменной y рассматривается как функция одной независимой (объясняющей) переменной x, то есть данная модель имеет вид:Моделирование социально-экономических процессов по своей сути является воспроизведением данных процессов в малых экспериментальных формах, в искусственно созданных условиях. Чаще всего для этих целей используется математическое моделирование, описывающее социально-экономические процессы при помощи математических зависимостей.
Созданная математическая модель обычно подкрепляется реальными статистическими данными, а результаты расчетов, выполненные в рамках построенной модели, позволяют строить прогнозы и проводить объективные оценки.
По фактору времени принято выделять статические и динамические модели. Статические модели описывают поведение объекта в какой-либо конкретный момент времени. Данные модели применяют для описания статических систем, путем характеристики их состояния в заданный момент времени. При этом полученные, при помощи статического моделирования данные, не дают достоверного представления о динамической системе, можно судить лишь о ее поведении в строго определенный момент времени.
Динамические модели – модели, учитывающие взаимосвязи переменных во времени. Такие модели не сводятся к простой сумме ряда статических моделей, а описывают силы и взаимодействия, определяющие ход процессов в экономических системах. Модель является динамической, если в данный момент времени она учитывает значения входящих в нее переменных, относящихся как к текущему, так и к предыдущим моментам времени.
В экономических исследованиях очень часто для изучения факторов, определяющих уровень и динамику экономических процессов, используются модели корреляционно-регрессионного типа. При этом задачи корреляционного анализа сводятся к измерению тесноты известной связи между изменяющимися признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак. Задачи регрессионного анализа заключаются в выборе типа модели, установлении степени влияния независимых переменных на зависимую переменную и определении расчетных значений зависимой переменной.
Модели корреляционно-регрессионного типа в зависимости от количества факторов, включенных в уравнение регрессии, бывают простого (парного) и множественного вида. В свою очередь, парная регрессия и корреляция может определяться как наличием линейных связей между переменными, так и наличием нелинейных связей.
Простая регрессия представляет собой модель, где среднее значение зависимой (объясняемой) переменной y рассматривается как функция одной независимой (объясняющей) переменной x, то есть данная модель имеет вид:
𝒚=𝒇 (𝒙) . (1)
Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной. В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. Практически в каждом отдельном случае величина y, складывается из двух слагаемых:
где 𝑦𝑗 – фактическое значение результативного признака; 𝑦 𝑥𝑗 – теоретическое значение результативного признака, найденное по соответствующему уравнению регрессии; 𝜀𝑗 – случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.
Случайная величина 𝜀 включает влияние неучтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели обусловлено тремя источниками: спецификацией модели, выборочным характером исходных данных и особенностями измерения переменных.
При построении регрессионных моделей могут использоваться как линейные, так и нелинейные функции.
Множественная регрессия – уравнение связи с несколькими объясняющими (независимыми) переменными:
𝑌=𝑓 (𝑥1,𝑥2,… 𝑥𝑚 ). (3)
Множественная регрессия широко используется при решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целого ряда других вопросов эконометрики. Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а так же совокупное воздействие их на моделируемый показатель.
Основной недостаток использования регрессионных моделей в экономике – не всегда достоверные результаты прогнозов, рассчитанных по данным моделям. Несмотря на то, что данные модели при проверке и обладают высоким качеством, но они не учитывают влияние, оказываемое предыдущими результатами на результат текущий. Это может в определенных случаях искажать прогнозные значения, полученные при помощи данных моделей.
Для большей достоверности полученных прогнозов в экономической и управленческой деятельности стоит учитывать динамические особенности прогнозируемых явлений.
Одним из типов динамических моделей, применяемых для исследования социально-экономических процессов, являются модели с распределенным лагом, в которых значения переменных за прошлые периоды непосредственно включены в модель.
В общем виде рассмотрим алгоритм построения модели социально-экономических процессов при помощи построения динамической модели с распределенным лагом – моделью с лагами Алмон:
𝑦𝑡=𝑏0+𝑏1∗𝑥𝑡+𝑏2∗𝑥𝑡−1+𝑏3∗𝑥𝑡−2+⋯+𝑏𝐿+1∗𝑥𝑡−𝐿+𝜀𝑡, (4)
где 𝐿 - максимальная величина лага; 𝑏0, 𝑏1, 𝑏2, 𝑏3, 𝑏𝐿+1– параметры оценок;
𝑡 – текущий момент времени; 𝜀 - случайная величина, характеризующая отклонения реального значения результативного признака от теоретического.
Данный метод хорошо описан в труде Елисеевой И.И. [1] и реализован на примере моделирования зависимости ВВП от инвестиций в экономику США. Исходная статистическая информация представлена в Табл.1.
Таблица 1 Динамика объема ВВП США (у) и валовых внутренних инвестиций в экономику США (х) в ценах 1987 г., млрд долл. США
|
Год |
ВВП (y) |
Инвестиции (x) |
|
1981 |
1931,3 |
296,4 |
|
1982 |
1973,2 |
290,8 |
|
1983 |
2025,6 |
289,4 |
|
1984 |
2129,8 |
321,2 |
|
1985 |
2218 |
343,3 |
|
1986 |
2343,3 |
371,8 |
|
1987 |
2473,5 |
413 |
|
1988 |
2622,3 |
438 |
|
1989 |
2690,3 |
418,6 |
|
1990 |
2801 |
440,1 |
|
1991 |
2877,1 |
461,3 |
|
1992 |
2875,8 |
429,7 |
|
1993 |
2965,1 |
481,5 |
|
1994 |
3107,1 |
532,2 |
|
1995 |
3268,5 |
591,7 |
|
1996 |
3248,1 |
543 |
|
1997 |
3221,7 |
437,6 |
|
1998 |
3380,8 |
520,6 |
|
1999 |
3533,2 |
600,4 |
|
2000 |
3703,5 |
664,6 |
|
2001 |
3796,8 |
669,7 |
|
2002 |
3776,3 |
594,4 |
|
2003 |
3843,1 |
631,1 |
|
2004 |
3760,3 |
540,5 |
|
2005 |
3906,6 |
599,5 |
|
2006 |
4148,5 |
757,5 |
|
2007 |
4279,8 |
745,9 |
|
2008 |
4404,5 |
735,1 |
|
2009 |
4540 |
749,3 |
|
2010 |
4781,6 |
773,4 |
|
2011 |
4836,9 |
789,2 |
|
2012 |
4884,9 |
749,5 |
|
2013 |
4848,4 |
672,6 |
Excel Линейн. Результаты моделирования представлены на Рисунке 1.
Конкретный вид модели:
Из рисунка видно, что совпадение экспериментальных данных и результатов моделирования достаточно
неплохое. Подтверждением тому является высокий коэффициент детерминации X2 = 0,9914. Однако коэффициенты при лаговых переменных Xt −1 и Xt −3 являются статистически незначимыми. Кроме того применение метода МНК к таким моделям в общем случае некорректно по ряду причин:
1. Высокий уровень мультиколлинеарности факторов модели;
2. При большой величине лага снижается число наблюдений, используемых при моделировании, что естественным образом ведет к снижению числа степеней свободы;
3. Неизбежным также является наличие автокорреляции остатков.
Вышеперечисленные факторы свидетельствуют о значительных нарушениях предпосылок МНК, что приводит к неэффективным, а зачастую и к смещенным оценкам.
Следует отметить, что несостоятельность модели становится более выраженной при увеличении количества коэффициентов, когда по смыслу задачи ожидается влияние с большим запаздыванием.
Для преодоления этих трудностей обычно предлагается та или иная форма «гладкости» распределения лагов. Это приводит к уменьшению числа оцениваемых параметров.
Пусть модель с распределенным лагом порядка 𝐿имеет вид:
𝑦𝑡=𝑏0+𝑏1∙𝑥𝑡+𝑏2∙𝑥𝑡−1+𝑏3∙𝑥𝑡−2+⋯+𝑏𝐿+1∙𝑥𝑡−𝐿+𝑒𝑡. (7)
В преобразовании Алмон коэффициенты модели представлены степенными полиномами, факторами которых является величина лага. Для полинома k – ой степени эта зависимость имеет вид:
Если подставить значения (8) в исходную модель (7), то получим модель вида:
Для нашего примера, с максимальным лагом 𝐿=4, модель преобразуется к виду:
𝒚 𝒕=𝒃𝟎+𝒄𝟎∙𝒛𝟎+𝒄𝟏∙𝒛𝟏+𝒄𝟐∙𝒛𝟐, (10)
где 𝑧0=𝑥𝑡+𝑥𝑡−1+𝑥𝑡−2+𝑥𝑡−3+𝑥𝑡−4;
𝒛𝟏=𝒙𝒕−𝟏+𝟐∙𝒙𝒕−𝟐+𝟑∙𝒙𝒕−𝟑+𝟒∙𝒙𝒕−𝟒;
𝑧2=𝑥𝑡−1+4∙𝑥𝑡−2+9∙𝑥𝑡−3+16∙𝑥𝑡−4.
Оценим (10) с помощью МНК. Результаты моделирования представлены на Рисунке 2.
Рис.2.
Коэффициенты модели Алмон:
𝒃𝟎=𝟐𝟗𝟎,𝟎𝟕𝟏𝟒, 𝒄𝟎=𝟏,𝟗𝟒𝟐𝟔𝟎𝟕, 𝒄𝟏=−𝟎,𝟗𝟓𝟔𝟗𝟐, 𝒄𝟐=𝟎,𝟏𝟗𝟐𝟖𝟓𝟐.
Подставив эти значения в (4) получим модель с распределенным лагом
𝒚 𝒕=𝟐𝟗𝟎,𝟎𝟕+𝟏,𝟗𝟒𝟑∙𝒙𝒕+𝟏,𝟏𝟕𝟗∙𝒙𝒕−𝟏+𝟎,𝟖∙𝒙𝒕−𝟐+𝟎,𝟖𝟎𝟖∙𝒙𝒕−𝟑+ 𝟏,𝟐𝟎𝟏∙𝒙𝒕−𝟒 (11)
В этом случае коэффициент детерминации даже несколько ниже, чем в предыдущем случае R2 = 0,99, однако все коэффициенты являются статистически значимыми. Данный метод имеет два неоспоримых преимущества. Во-первых, он достаточно универсален и может быть применен для моделирования процессов, которые характеризуются разнообразными структурами лагов. Во-вторых, при относительно небольшом количестве переменных, которое не приводит к потере значительного числа степеней свободы, с помощью метода Алмон можно построить модели с распределенным лагом любой длины.
Результаты исследований с использованием этих преобразований показали, что, несмотря, на некоторое снижение коэффициента детерминации, эффективность оценок повышается, они становятся статистически более значимыми. Однако не снимается главная проблема – наличие мультиколлинеарности. Кроме того величина лага должна быть известна заранее.
Выбор длины лага меньше реального приведет к искажению динамики процесса: не будут учтены факторы, оказывающие значительное влияние на результат. В этом случае остатки будут неслучайными и оценки по МНК окажутся неэффективными и смещенными. Проявление этих проблем будет заметным особенно при определении прогнозных значений зависимой переменной с использованием других статистических данных.
Выбор большей величины лага по сравнению с ее реальным значением приведет к включению в модель слабо значимых факторов, а, следовательно, к снижению эффективности оценок. Кроме того при этом происходит уменьшение объема выборки, используемой для моделирования, что ведет также к снижениюэффективности и состоятельности оценок.
Для моделирования динамики можно использовать непрерывную модель, представленную дифференциальнымуравнением. Наиболее предпочтительным является использование линейных уравнений первого и второго порядков:
𝑇 ∙ 𝑦′ 𝑡 + 𝑦 𝑡 = 𝑦уст 𝑡 , (12)
𝑇2 ∙ 𝑦′′ 𝑡 + 2𝑇𝜁 ∙ 𝑦′ 𝑡 + 𝑦 𝑡 , (13)
где 𝑇 – постоянная времени; ζ- коэффициент затухания; - установившееся значение.
В (12) и (13) под установившимся значением понимается тренд между переменными 𝑦(𝑡) и 𝑢(𝑡) в установившемся режиме, когда u = const и отклики на «предысторию» значений объясняющей переменной завершены.
Трендовая составляющая моделей (12) и (13) может быть как линейной, так и нелинейной, например:
𝑦уст 𝑡 = 𝑏0 + 𝑏1 ∙ 𝑢 𝑡 , (14)
𝑦уст 𝑡 = 𝑏0 + 𝑏1 ∙ 𝑢 𝑡 + 𝑏2 ∙ 𝑢2(𝑡) (15)
Для оценки параметров модели Т, ζ, 𝑏0, 𝑏1, 𝑏2, можно использовать дискретно-непрерывный метод идентификации, основанный на соотношениях дискретного линейного фильтра Калмана [4], [6].
Используя статистику (табл. 1), построим математическую модель зависимости ВВП от инвестиций в форме (12), (14)
где параметры модели Т, 𝑏0, 𝑏1 подлежат оцениванию.
Для идентификации параметров Т, 𝑏0, 𝑏1 составим расширенную модель вида:
Обозначим 𝑥 𝑡 = (𝑦 𝑡 𝑇 𝑏0 𝑏1)𝑇 . Тогда исходную систему для идентификации можно представить в виде:
𝑥′ 𝑡 = 𝜑 𝑥, 𝑢, 𝑡 + 𝜉 𝑡 , (18)
где
𝜉 𝑡 = (𝜔 𝑡 0 0 0)𝑇 вектор шумов с дисперсионной матрицей
Модель измерения координат состояния имеет вид:
𝑧𝑘 = 𝐻 ∙ 𝑥𝑘 + 𝑣𝑘 , 𝑘 = 1,2, …, (19)
где 𝐻 = 1 0 0 0 .
Модель измерения управления
𝑢𝑘 ∗ = 𝑢𝑘 + 𝜂𝑘 , 𝑘 = 1,2, …, (20)
где 𝑢𝑘 ∗ - измеренные значения, 𝑢𝑘 - истинные значения управления.
В (19) и в (20) 𝑣𝑘 , 𝜂𝑘 - центрированные случайные шумы с известными дисперсиями: 𝑉𝑧 = 𝜎𝑦2, 𝑉𝑢 = 𝜎𝑢2.
Для оценки вектора x(t) модели (18) воспользуемся алгоритмом дискретно-непрерывного метода.
Оценка параметров модели и численное моделирование динамики инвестиций были реализованы с помощью ППП Mathcad.
Результаты идентификации представлены на Рисунке 3.
Результаты проверки соответствия модели экспериментальным данным представлены на Рисунок 4.Рис.4. Z(1) – модельные данные, zY1 – экспериментальные данные.
Рис.4. Z(1) – модельные данные, zY1 – экспериментальные данные.
Из Рисунка 4 видно, что совпадение модельных и экспериментальных данных достаточно высокое. Свидетельством тому является значение коэффициента детерминации R2 = 0,992.
Следующим этапом проверки адекватности модели экспериментальным данным была проверка полноты моделирования динамических свойств модели с лаговыми переменными (5) и непрерывной модели вида (16). Как уже отмечалось выше, неполное отражение динамических свойств в первую очередь скажется на точности прогноза при других значениях фактора (не используемых при идентификации).
С этой целью для оценки параметров моделей (5) и (16) была использована статистика без последних четырех измерений. Результаты эксперимента показали, что оценки модели (16) практически не изменились, а оценки же лаговой модели изменились существенно:
𝑦 𝑡 = 387,62 + 2,46 ∙ 𝑥𝑡 + 0,56 ∙ 𝑥𝑡−1 + 1,18 ∙ 𝑥𝑡−2 + 0,45 ∙ 𝑥𝑡−3 + 1,03 ∙ 𝑥𝑡−4 (21)
Осуществим прогноз по последним четырем наблюдениям объясняющего фактора, т.е. объема ВВП на
1988 – 1991г.г.
На Рисунке 5 показаны ошибки прогноза, полученного с помощью этих моделей.
Оценка параметров динамической модели показала следующее:
1) соответствие модельных и экспериментальных данных является достаточно высоким;
2) моделирование динамических свойств модели является полным. При использовании других значений факторов оценки модели практически не изменились;
3) адекватность динамических свойств модели достаточно высока.
Таким образом, применение динамического моделирования с использованием дифференциальных уравнений помогает избежать проблем, возникающих при использовании лаговой модели, а также дает наиболее точные и достоверные результаты с возможностью прогнозирования. Результаты численного моделирования показали, что предложенный алгоритм идентификации параметров модели достаточно эффективен и может использоваться для оценки динамических свойств экономических процессов.
Список литературы
1. Елисеева И.И., Курышева С.В., Костеева Т.В. и др. Эконометрика / Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2007.
2. Колпаков В.Ф. Компьютерные технологии решения экономических задач. Учебное пособие, 2008 (электронный вариант).
3. Колпаков В.Ф. Моделирование динамических процессов в экономике // Финансовая аналитика: проблемы и решения. – 2014. – № 3. – С. 31–36.
4. Колпаков В.Ф. Параметрическая идентификация модели лесных пожаров // Безопасность жизнедеятельности – 2012. - № 5. – С. 39-44.
5. Кремер Н.Ш., Путко Б.А. Эконометрика. – М.: ЮНИТИ, 2002.
6. Синицын И.И. Фильтры Калмана и Пугачева: Учебное пособие. – М.: Университетская книга, Логос, 2006.