Факторы, определяющие объем прямых иностранных инвестиций в регионы РФ
Отметим, что некоторые переменные были получены путем преобразования исходных переменных. Это было необходимо из экономических соображений для формирования более подходящих переменных для моделирования. К преобразованным показателям относятся миграция в регион (получена делением на численность населения в регионе), выбросы вредных веществ на человека (деление на численность населения в регионе), число административных правонарушений на человека (деление на численность населения в регионе).
Очевидна также необходимость макро данных, то есть таких, которые не изменяются для объектов (в нашем случае регионы), но которые изменяются во времени. К таким переменным относятся индекс Доу Джонса (считалось на помесячных данных), его стандартное отклонение (считалось на помесячных данных), индекс MICEX (считалось на помесячных данных), его стандартное отклонение (считалось на помесячных данных), ВВП России и индекс политического режима.
Отдельно собиралась статистика по кредитным организациям в регионе. Данные были взяты с официального сайта ЦБ www.cbr.ru.
Мы можем получить расширение наших объясняющих переменных за счет включения лагированных значений переменным. Более того, эта процедура, вероятно, приведет к качественно лучшим моделям, так как, очевидно, на переменную прямые иностранные инвестиции могут влиять некоторые переменные с некоторым запаздыванием, лагом.
Особенно стоит подчеркнуть различный временной горизонт переменных, который включает в себя данные с 1990 по 2010 год. Однако, большинство переменных представлены на более коротком промежутке, например прямые иностранные инвестиции представлены с 2004 по 2009 год. В качестве объектов будут выступать регионы России, которых имеется различное количество в разные периоды. В финальной таблице имеется 92 региона. Заметим, что в силу отсутствия данных по некоторым регионам, в регрессиях будет отображаться меньше регионов.
Простыми вычислениями можно получить 1869 наблюдений. В силу ограничения на зависимую переменную, а также в некоторых моделей и ряд объясняющих переменных существенно ограничивает количество наблюдений в регрессии. Это количество не превышает 500 наблюдений.
Выбор лучшей модели
В текущем разделе мы представим результаты моделирования инвестиций в регионы России на современных данных.
Прежде чем строить какую либо модель, проанализируем исходные данные. В таблице ниже приведена корреляция между зависимой и независимыми переменными. Из соображений наглядности и экономии места приводится корреляция только тех переменных, которые имеют высокие по модулю значения или имеют важное значение для последующего моделирования. Все остальные корреляции не превышают по модулю 0.3. Латинский символ l с нижним подчеркиванием означает, что переменная взята с лагом, l2 с нижним подчеркиванием - лаг 2 года.
Корреляция |
y_pc_real |
l_y_pc |
l2_y_pc |
y_constr |
y_natr |
trade_pc |
life_exp |
lforce |
fdi |
0.4023 |
0.4016 |
0.3477 |
0.5585 |
0.3237 |
0.3635 |
-0.1283 |
0.2314 |