База примеров

Текущие экономические показатели: некоторые результаты факторного анализа


Пример выполнен в 5ой версии системы STATISTICA. Информация о текущей версии

И.С.Ульянов, канд. экон. наук,
Госкомстат России

Экономические показатели, значения которых определяются ежемесячно либо ежеквартально, часто называют текущими показателями. Госкомстат России публикует их в ежемесячном бюллетене "Социально-экономическое положение России". Каковы связи между различными показателями - этот вопрос является одной из главных целей их экономического исследования. Задача факторного анализа состоит в представлении наблюдаемых показателей в виде линейной комбинации относительно небольшого числа гипотетических, непосредственно не наблюдаемых параметров - факторов. Определение факторов и их числовых значений означает формирование гипотезы, которую необходимо содержательно интерпретировать. В настоящей статье методами факторного анализа исследуются ряды ежемесячных значений некоторых важнейших макропоказателей за 1996-1999 годы. Этот период характеризуется интенсивными изменениями показателей, что усиливает значимость и интерес их изучения.

Желательно, чтобы экономическое содержание исследуемых показателей было приблизительно "одноуровневым", то есть они не относились бы друг к другу как общее к частному. Именно поэтому в состав анализируемых параметров не включен показатель валового внутреннего продукта, поскольку он по сравнению с большинством других показателей воплощает в себе большую общность. Показатели по возможности не должны находиться в прямой зависимости друг от друга. Например, если один показатель характеризует изменение цен, то остальные не должны зависеть от инфляции.

В таблице 1 приведены значения отобранных для анализа показателей за 46 месяцев (с января 1996 г. по сентябрь 1999 г.), взятые по отношению к значениям соответствующих показателей в декабре 1995 года. Для удобства вычислений значения всех показателей за декабрь 1995 года приняты за единицу, а не за 100%, как это обычно принято. То есть числа в таблице 1 показывают, во сколько раз величина показателя в текущем месяце превышает его величину в декабре 1995 года.

Значения исходных показателей

Таблица 1. Значения исходных показателей
 Вопросы статистики, 2000, №2

Для анализа выбраны следующие показатели.

Y1 - индекс промышленного производства, характеризующий изменение его физического объема по сравнению с базисным месяцем. В качестве базисного месяца выбран декабрь 1995 года. Этот индекс не зависит от инфляции, поскольку формируется на основе данных об изменении выпуска продукции в натуральном выражении с последующей поэтапной агрегацией в подотрасли и отрасли промышленности, и далее - в промышленность в целом.

Y2 - индекс изменения по сравнению с базисным месяцем соотношения между кредиторской и дебиторской задолженностью промышленных предприятий, вычисленный по формуле:

Y2 = Kt / Dt : K0 / D0 

где Kt и Dt - кредиторcкая и дебиторская задолженность промышленных предприятий на начало текущего месяца,

K0 и D0 - кредиторcкая и дебиторская задолженность промышленных предприятий на начало декабря 1995 года.

Расчет по такой формуле позволяет устранить влияние инфляции на изменение превышения кредиторской задолженности предприятий над их дебиторской задолженностью.

Y3 - индекс физического объема инвестиций в основной капитал. Он определяется как отношение объема инвестиций в основной капитал в текущем месяце к их объему в базисном месяце, причем оба этих объема исчисляются в ценах, действовавших в текущем месяце. Для пересчета инвестиций базисного месяца в цены текущего месяца используются индексы цен, предварительно подсчитанные для сравниваемых периодов по важнейшим элементам основного капитала.

Y4 - индекс изменения по сравнению с базисным месяцем соотношения между расходами и доходами федерального бюджета, полученный следующим образом:

Y4 = Pt / Дt : P0 / Д0

где Рt и Дt - расходы и доходы федерального бюджета за текущий месяц,

Р0 и Д0 - расходы и доходы федерального бюджета за декабрь 1995 года.

Y5 - индекс изменения по сравнению с базисным месяцем соотношения между государственным внутренним долгом (по ГКО и ОФЗ) и месячными доходами федерального бюджета. Этот индекс вычислен по формуле:

Y5 = ВДt / Дt : ВД0 / Д0

где ВДt и ВД0 - объем государственного внутреннего долга по ГКО-ОФЗ на начало текущего месяца и начало декабря 1995 года,

Дt и Д0 - доходы федерального бюджета за текущий месяц и декабрь 1995 года. 

Y6 - индекс изменения по сравнению с базисным месяцем соотношения между экспортом товаров из России и их импортом в Россию, вычисленный по формуле:

Y6 = Эt / Иt : Э0 / И0

где Эt и Иt - экспорт и импорт за текущий месяц,

Э0 и И0 - экспорт и импорт за декабрь 1995 года.

Y7 - отношение ставки рефинансирования Центрального банка России в начале текущего месяца к её уровню в начале декабря 1995 года.

Y8 - индекс потребительских цен текущего месяца по отношению к декабрю 1995 года.

Y9 - отношение официального курса доллара США в конце текущего месяца к его курсу в начале декабря 1995 года.

Показатели Y8 - Y8 приведены или рассчитаны на основании материалов ежемесячной публикации Госкомстата "Социально-экономическое положение России", в которой содержится информация, формируемая Госкомстатом, Минфином, ГТК, Центральным банком России и другими ведомствами.

Y10 - сводный фондовый индекс "РТС-Интерфакс", который является одним из индексов рынка ценных бумаг в Российской Федерации. Его значения взяты по данным Российской торговой системы и Интерфакса, которыми в сети "Интернет" помещаются полные ряды этих значений. Согласно пояснениям к указанным рядам, методика расчета сводного фондового индекса основана на взвешивании по рыночной стоимости 100 обращающихся на российском рынке наиболее ликвидных акций. По аналогичной методике исчисляется широко используемый фондовый индекс Standard & Poor’s 500. Значение индекса "РТС-Интерфакс" на текущий момент времени представляет собой отношение текущей суммарной рыночной капитализации (рыночной стоимости) ценных бумаг, включенных в список для расчета индекса, к суммарной рыночной капитализации бумаг на базовый момент времени. Как и для других показателей, в качестве базового момента времени выбран декабрь 1995 года. Необходимое "сцепление" рядов данных выполнено автором статьи.

Исследования процедуры факторного анализа выполнялись с помощью программной системы статистического анализа и обработки данных STATISTICA фирмы StatSoft Inc.

В систему были введены данные таблицы 1. Исходным материалом для проведения факторного анализа является матрица Y, которая получается из таблицы 1 путем её транспонирования. В результате транспонирования столбцы таблицы 1 становятся строками матрицы Y, имеющей порядок 10*45. Любой элемент этой матрицы Yij - это значение i-го показателя за j-й месяц. В силу своей громоздкости матрица Y в статье не приводится.

Компьютерная программа нормирует матрицу Y, превращая ее в матрицу Z порядка 10*45, элементы которой определяются по формуле:

Формула1

где yi - среднее значение показателя yi,

Формула2

- стандартное отклонение показателя yi.

Очевидно, что средние значения всех переменных Zi равны 0, а все их дисперсии равны 1, то есть:

Формула3

Например, графики исходных и нормированных значений показателя Y2 выглядят так:

графики исходных и нормированных значений

Рисунок 1

В отличие от исходных показателей, нормированные величины не зависят от единиц измерения; они колеблются вокруг одной и той же (нулевой) средней, что значительно упрощает анализ.

Несложно доказать, что при умножении (по правилам алгебры) матрицы Z на транспонированную матрицу Z’ и на число 1/(n - 1) получается корреляционная матрица R, содержащая коэффициенты корреляции между нормированными показателями Zi, то есть 1/(n - 1)ZZ’ = R. Система STATISTICA дает возможность просмотра матрицы R:

Коэффициенты корреляции между нормированными исходными показателями

Таблица 2. Коэффициенты корреляции между нормированными исходными показателями

Целью факторного анализа является представление величины zij в виде линейной комбинации нескольких гипотетических переменных или факторов, то есть так: zij = ai1p1j + ai2p2j +…+ airprj (5). Здесь aij являются постоянными коэффициентами, которые надо определить; p1j – prj - значениями факторов за j-й месяц. Формула (5) в матричной форме имеет вид Z=AP (6), где Z - матрица порядка 10*45 нормированных исходных показателей; A - матрица порядка 10*r, называемая факторным отображением (r - количество факторов), P - матрица порядка r*45 значений всех факторов для всех месяцев. Элементы aij матрицы А называются факторными нагрузками.

Подставив (6) в (4), получим R=1/(n - 1)APP’A’ (7). По аналогии с формулой (4) можно утверждать, что выражение 1/nPP’=С является корреляционной матрицей, отражающей связи между факторами, тогда R=ACA’. Если принять условие о некоррелированности факторов, т.е. С=I, то R=AA’ (8).

Если исходные показатели нормированы, факторы нормированы и некоррелированы, то справедливо равенство:

si2 = ai12 + ai22 + ... + aiq2 = 1             (9)

Т.е. сумма квадратов всех нагрузок одного показателя равна дисперсии его нормированных величин, которая (согласно формуле 3) равна единице. Это важное утверждение выводится путем несложных преобразований.

Зная матрицу R, можно, решив систему уравнений (8), определить матрицу A. Точное решение имеет место в том случае, когда R и A – матрицы одного порядка, то есть количество факторов равно количеству наблюдаемых показателей. Если факторов меньше, чем показателей, то достигается та или иная степень приближения к точному решению. Цель состоит в том, чтобы посредством относительно небольшого числа факторов воспроизвести большую часть дисперсии показателей. 

Система STATISTICA предлагает несколько методов выделения факторов. Более простым с теоретической точки зрения является метод главных компонент, который в случае выделения четырех факторов приводит к следующему результату: 

Таблица3

Таблица 3

Выделенные четыре фактора обусловливают более 80 процентов дисперсии всех показателей, кроме Z3 и Z4 (это следует из формулы 9). Если бы факторов было только 3, то дисперсия показателей воспроизводилась бы хуже: на 56 процентов для Z3 и на 31 процент для Z4. Однако в случае трех факторов их интерпретация (особенно геометрическая) значительно упрощается. Поэтому с целью некоторого упрощения целесообразно ограничиться изучением трех факторов, а в дальнейшем при необходимости можно вернуться к рассмотрению четвертого фактора.

Поскольку факторы некоррелированы (ортогональны) их можно представить в виде трех ортогональных координатных осей. Если на этих осях отметить значения факторных нагрузок, соответствующих каждому из 10 нормированных показателей, то получим 10 точек, каждая из которых характеризует одну из строк матрицы А. В результате имеем следующий графический образ этой матрицы: 

Рисунок 2

Рисунок 2

Система уравнений (8) при заданном числе факторов имеет бесконечно много эквивалентных решений, дающих одинаковую степень воспроизведения дисперсии каждого показателя (то есть одинаковую сумму квадратов факторных нагрузок). Различные решения получаются при вращении системы координат вокруг ее центра. Факторные нагрузки при этом изменяются, но остается неизменной сумма их квадратов. Вращая систему координат, необходимо искать наиболее просто интерпретируемое решение. А именно, надо найти такое положение системы координат, которое бы для каждой строки (или столбца) матрицы А увеличивало бы большие факторные нагрузки и уменьшало малые. Метод вращения "квартимакс" обеспечивает выполнение этой операции для строк матрицы А, а метод "варимакс" - для столбцов этой матрицы.

В таблице 3 первый из выделенных факторов обусловливает более 65 процентов дисперсии четырех показателей (Z6, Z8, Z9), второй фактор - двух показателей (Z2, Z7), третий фактор - одного показателя (Z1). Высокая нагрузка первого фактора вообще характерна для метода главных компонент. Для улучшения интерпретации было бы желательно несколько выровнять нагрузки различных факторов, осуществив вращение системы координат. В результате вращения методом варимакс матрица А и ее графический образ принимают следующий вид: 

Рисунок 3

Рисунок 3 

Факторные нагрузки

Таблица 4. Факторные нагрузки

После вращения количество высоких нагрузок первого и второго фактора выровнялось, что облегчает их интерпретацию. Первый фактор в основном обусловливает дисперсию Z6, Z8 и Z9, то есть индекс соотношения между экспортом и импортом товаров, индексы потребительских цен и официального курса доллара США. Обобщая, можно сказать, что этот фактор отражает паритет российской экономики по отношению к остальному миру.

Второй фактор обусловливает главным образом дисперсию Z2, Z5 и Z7, то есть индекс соотношения между кредиторской и дебиторской задолженностью промышленных предприятий, индекс соотношения между государственным внутренним долгом (по ГКО и ОФЗ) и месячными доходами федерального бюджета, индекс ставки рефинансирования Центрального банка России. Этот фактор характеризует степень активности процесса заимствования средств.

Третий фактор выражает уровень материального производства, поскольку он в значительной степени обусловливает значения индексов промышленного производства и инвестиций в основной капитал (Z1 и Z3).

Для получения формулы, позволяющей определить числовые значения факторов, надо обе стороны выражения (6) умножить на А’  и решить его относительно Р. Решение имеет вид P = (A’A)-1A’Z (10). Система STATISTICA позволяет определить нормированные значения факторов и построить их графики. Последние представлены ниже.

Рисунок 4

Рисунок 4

Из графика видно, что в основе анализируемой системы показателей лежат три взаимосвязанные тенденции:

- неустойчивость паритета российской экономики по отношению к остальному миру в 1996-1997 годах, его снижение в 1998 году и некоторое замедление этого процесса в 1999 году;

- рост склонности к заимствованию средств до начала 1998 года и ее постепенное снижение в дальнейшем;

- неустойчивость материального производства с его некоторым ростом во второй половине 1997 года, резким спадом в 1998 году и стабилизацией в 1999 году. Этот фактор в значительной степени отражает также присущие производству сезонные колебания, в частности, всплески промышленного производства в марте и декабре, активизацию строительной деятельности к концу года.

Добавление четвертого фактора не приводит к значительным изменениям значений первых трех факторов (в этом легко убедиться, выполнив все вышеописанные операции для случая четырех факторов). Это говорит о том, что выделенные факторы достаточно полно характеризуют современные тенденции текущих экономических показателей.


В начало


Узнайте больше на курсах Академии Анализа Данных StatSoft

Список курсов    Календарь    Расписание груповых занятий






info@statsoft.ru       (495) 787-77-33       (499) 674-06-15       STATISTICA Data Miner 13.2 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia
1999-2017

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта