База примеров

Исследование данных об авиаперевозках

Содержание

Введение

Выбор порядка

Логарифмическое преобразование

Автокорреляции

Взятие разности

Сезонность

Взятие сезонной разности

Оцениваемые параметры

Интегрированные преобразования АРПСС

Спецификация АРПСС

Параметры АРПСС

Оценивание параметров

Просмотр результатов

Вывод АРПСС

Параметры прогноза

График остатков

Анализ остатков

Нормальный вероятностный график

Автокорреляция остатков

Дальнейший анализ

 


Введение

Рассмотрим данные, которые представляют собой международные месячные авиаперевозки (в тысячах) за 12 последовательных лет с 1949 по 1960 г.

Это типичные данные о перевозках. Такого же рода данные возникают при анализе железнодорожного транспорта, автомобильного транспорта, водного транспорта и т.д. К ним применимы методы, описываемые нами.

Данные содержатся в файле Series_g.sta (переменная SERIES_G). Если у вас установлены примеры STATISTICA, вы можете найти этот файл в папке Examples/Datasets. Можно также скачать этот файл здесь.

Рисунок 1.

Ряд имеет отчетливо возрастающий тренд, а также сезонную составляющую (например, в марте перевозки обычно выше, чем в феврале и апреле).

После запуска модуля Временные ряды откройте файл Series_g.sta, а затем с помощью кнопки Переменные на стартовой панели модуля выберите переменную SERIES_G. Теперь нажмите кнопку АРПСС и автокорреляционные функции.

После загрузки данных вы увидите окно Одномерная АРПСС.

Рисунок 2.

 


Выбор порядка

Прежде чем оценивать параметры, надо определить их количество, т.е. выбрать модель АРПСС. Для идентификации используют автокорреляционные и частные автокорреляционные функции, доступные в этом диалоговом окне. Вначале нажмите кнопку Другие преобразования и графики. Откроется окно Преобразования переменных.

В этом окне вначале выберем подходящую шкалу на оси X графиков. Выделите поле Задать масштаб оси Х, затем введите 1 в поле Мин и 12 в поле Шаг. Файл Series_g.sta содержит имена наблюдений с соответствующими датами. Используйте эти метки на графике. Для этого в переключателе Пометить точки выберите режим Именами наблюдений.

Диалоговое окно Преобразования переменных, вкладка Графики теперь выглядит следующим образом:

Рисунок 3.

Далее нажмите кнопку График рядом с кнопкой Просмотр выдел. переменной и постройте график ряда.

Рисунок 4.

Тренд и сезонная составляющая ряда выглядят очень отчетливо. Для идентификации АРПСС возьмем подходящие разности ряда и рассмотрим соответствующие автокорреляционные и частные автокорреляционные функции.

 


Логарифмическое преобразование

Перейдите на вкладку x=f(x), выберите преобразование Натуральный логарифм x=ln(x) и нажмитеOK (Преобразовать выделенную переменную).

Рисунок 5.

После проведения преобразований всех наблюдений на экране автоматически появится график преобразованного ряда (по умолчанию), если вы не отменили параметр График после каждого преобразования в окне Преобразования переменных.

Рисунок 6.

Из графика вы видите, что цель преобразования достигнута, амплитуда колебаний стала более стабильной и ряд готов для дальнейшего исследования.

 


Автокорреляции

Перейдите на вкладку Автокорреляции, вместо предложенных по умолчанию 15 поставьте 25. Нажмите кнопку Автокорреляции, чтобы построить таблицу результатов с автокорреляциями и график автокорреляционной функции.

Рисунок 7.

График показывает сильную периодическую зависимость, автокорреляции на лагах 1, 12 имеют максимальные значения.

 


Взятие разности

Для удаления периодической зависимости возьмем вначале разность ряда с лагом 1

Заметим, преобразованный (прологарифмированный) ряд автоматически направляется в активную рабочую область.

Выделите преобразованный ряд (с ним работаем далее).Перейдите на вкладку Разность, сумма, выберите преобразование Разность (x=x-x(лаг)) (сохраните лаг, равный 1) и нажмите OK (Преобразовать выделенную переменную). График имеет вид:

Рисунок 8.

Теперь каждый член преобразованного ряда равен разностям между соседними членами прологарифмированного ряда. Заметим, ряд стал короче (на число элементов, равное длине лага 1).

Вернитесь в диалоговое окно Преобразования переменных и снова выберите опцию Автокорреляции.

Рисунок 9.

Вы видите, что после взятия разности исчезла корреляция не только на лаге 1, но также на большинстве других лагов (как объяснялось ранее, автокорреляции для последовательных лагов взаимозависимы).

 


Сезонность

Однако, как часто происходит, удаление зависимостей на малых лагах приводит к более отчетливой зависимости на лагах высокого порядка (в данном случае, это видно на лаге 12). Имеется также отчетливая (сезонная) зависимость на лаге 24 (и других лагах, кратных 12, таких как 36, 48 и т.д.). Это показывает сильную сезонную зависимость. Таким образом, в ряде авиаперевозок отчетливо видна сезонность.

 


Взятие сезонной разности

Возьмем сезонную разность с лагом 12. Вернитесь в окно Преобразования переменных и перейдите на вкладку Разность, сумма. Снова выберите Разность (x=x-x(лаг)), но теперь измените значение лага, положите лаг равным 12. Нажмите OK (Преобразовать выделенную переменную). Снова, по умолчанию, преобразованный ряд будет отображен на графике. Как и ранее, в окне Преобразования переменных выберите опцию Автокорреляции.

Рисунок 10.

Большинство сильных автокорреляций теперь удалено. Хотя еще остались автокорреляции, большие 2-х стандартных ошибок (показанных точечной линией на графике автокорреляций), не нужно брать еще разности ряда, т.к. они могут исключить эффект скользящего среднего.

Выберите опцию Частные автокорреляции.

Рисунок 11.

 


Оцениваемые параметры

В целом коррелограмма выглядит достаточно хорошо, и ряд готов для анализа с помощью АРПСС. Основываясь на разведочном анализе (т.е. идентификации АРПСС), можно прийти к выводу, что сезонная АРПСС (с лагом 12) и несезонная модель (с лагом 1) достаточно хорошо подходят к преобразованному ряду. Будут оцениваться два параметра скользящего среднего модели АРПСС: один сезонный (Qs) и один несезонный (q). Параметры авторегрессии отсутствуют в модели.

Обратитесь к книге В.П. Боровиков, Г.И.Ивченко "Прогнозирование в системе STATISTICA в среде Windows", Финансы и Статистика, 2000) для всестороннего обсуждения проблемы выбора параметров в модели АРПСС.

 


Интегрированные преобразования АРПСС

Ранее было выполнено логарифмическое преобразование данных и два типа разности (несезонная и сезонная) были взяты. Все эти преобразования уже выполнены и результаты просмотрены. Преобразованный ряд можно теперь непосредственно использовать в АРПСС. Однако в ситуациях, похожих на данную, рекомендуется анализировать исходный ряд и задать необходимые преобразования внутри АРПСС (эти преобразования будут частью спецификации АРПСС). Если вы захотите построить прогноз (после оценки параметров АРПСС), то он будет вычислен из проинтегрированных рядов ("интегрирование", более точно суммирование, в данном случае означает просто операцию, обратную взятию разностей с соответствующими лагами). Таким образом, проводя обратные преобразования, вы возвращаетесь к исходному ряду и прогноз соответствует исходным данным (что обеспечивает более легкую интерпретацию результатов).

Заметим, внутри АРПСС доступны только преобразования логарифм, возведение в степень и взятие сезонных/несезонных разностей. В некоторых случаях определенные преобразования рекомендуется выполнять до работы в АРПСС. Речь идет о преобразованиях (например, сглаживание), не изменяющих диапазон данных и к которым не нужно применять обратные преобразования.

 


Спецификация АРПСС

Теперь снова вернемся в диалоговое окно Одномерная АРПСС, нажав Выход в окне Преобразования переменных. В диалоговом окне выделена исходная переменная SERIES_G. Окно Одномерная АРПСС позволяет определить количество параметров авторегрессии и параметров скользящего среднего (сезонных и несезонных), которые нужно оценить. Вы не сможете сделать следующего шага, не задав, по крайней мере, один параметр (по крайней мере, одно из полей P, p, Q или q должно быть не пусто). Но до этого вы должны задать преобразования.

Выберите опции Натуральный логарифм и Разность. Затем задайте Лаг, равный 1, и установите Порядок равным 1. Определите log-преобразование и несезонную разность. Задайте сезонную разность: во втором поле Лаг укажите 12 и снова установите 1 в поле Порядок.

 


Параметры АРПСС

Еще нужно задать параметры модели АРПСС. На этапе идентификации АРПСС мы пришли к выводу, что нужно оценить один регулярный параметр скользящего среднего (q), один сезонный (Q) и ни одного параметра авторегрессии. Ниже показано диалоговое окно Одномерная АРПСС с нужными установками.

Рисунок 12.

 


Оценивание параметров

Как описано в разделе Вводный обзор, параметры АРПСС оцениваются максимизацией функции правдоподобия. Доступны два метода максимизации функции правдоподобия: Приближенный (МакЛеода и Сейлза) и Точный (Меларда). Далее нажмите OK (Начать оценивание параметров) и запустите итеративную процедуру оценивания.

 


Просмотр результатов

После того, как процедура оценивания сойдется, нажмите OK и откройте диалоговое окно Результаты одномерной АРПСС.

Рисунок 13.

 


Вывод АРПСС

Нажмите кнопку Оценки параметров, чтобы увидеть таблицу результатов с оценками, стандартными ошибками, асимптотическими значениями t-статистик и т.д.

Рисунок 14.

Обе оценки (сезонных и несезонных параметров) высоко значимы.

 


Параметры прогноза

По умолчанию, программа вычисляет прогнозы для одного полного сезонного цикла, начиная с последнего наблюдения, т.е. с наблюдения, следующего после 144 (наблюдение 145). Прежде всего, посмотрите прогнозы в таблице результатов. Нажмите кнопку Прогноз. Таблица результатов содержит прогнозы и их доверительные интервалы. Заметим, если вы запросите построить прогнозы для имеющихся наблюдений (что также возможно), таблица результатов будет содержать наблюдаемые значения и остатки.

Рисунок 15.

 


График остатков

Более хорошая "картина" получается, когда прогнозы продолжают наблюдаемый ряд. Нажмите в окне Результаты одномерной АРПСС кнопку График ряда и прогнозов.

Рисунок 16.

Напомним, что раньше вы потребовали пометить точки на оси X именами наблюдений и использовали шаг 12, чтобы аккуратно отобразить последовательные годы. Просматривая график, вы видите, что построенная АРПСС довольно разумно прогнозирует ряд.

Закройте график (нажмите Далее) и вернитесь в диалоговое окно Результаты одномерной АРПСС, чтобы проверить, насколько хорошо построенная модель АРПСС прогнозирует последние 12 наблюдений. Установите в поле Начать с наблюдения значение 133 (т.e. 144-12+1) и снова нажмите кнопку График ряда и прогнозов.

Вы видите, как STATISTICA построила прогноз. 

Рисунок 17.

Видно, что наблюдаемые значения попали в доверительный интервал, т.е. прогноз снова хороший.

 


Анализ остатков

В общем, кажется, что модель достаточно адекватно подходит к данным. Однако имеются и другие важные способы оценки адекватности. Имеются два предположения модели АРПСС: (1) остатки (наблюдаемые минус оцененные значения) нормально распределены, (2) остатки независимы друг с другом, т.е. между ними нет остаточной корреляции. Если последнее условие не выполнено, то, вполне вероятно, что вы не заметили некоторый дополнительный параметр, влияющий на ряд.

 


Нормальный вероятностный график

Предположение о нормальности остатков может быть проверено с помощью нормальных вероятностных графиков. Ниже показаны нормальный график и нормальный график без тренда. 

Рисунок 18.

Рисунок 19.

Стандартный нормальный вероятностный график строится следующим образом. Вначале происходит упорядочение отклонений от соответствующих средних (остатков). По этим рангам вычисляются z значения (стандартизованные значения нормального распределения). z значения откладываются на оси Y. Если наблюдаемые значения (отложенные по оси X) нормально распределены, то все значения попадут на прямую линию. Если распределение отлично от нормального, то на графике будет наблюдаться отклонение от прямой. На этом графике можно отчетливо увидеть выбросы.

Отличие нормальных вероятностных графиков без тренда от простых нормальных вероятностных графиков в том, что линейный тренд исключается из данных.

Единственное отличие полунормальных графиков от нормальных графиков в том, что в них рассматривается только правая часть нормальной плотности. Иными словами, только положительные нормальные значения откладываются на оси Y.

Гистограмма остатков, показанная ниже, также служит визуальным подтверждением нормальности остатков.

Рисунок 20.

 


Автокорреляция остатков

Теперь рассмотрим выполнение первого предположения АРПСС – остатки независимы друг с другом. 

Рисунок 21.

Независимость остатков можно проверить с помощью графика автокорреляционной функции (нажмите кнопку Автокорреляции в окне Результаты одномерной АРПСС). Из графика видно, что остатки практически не коррелированны друг с другом. Поэтому вы можете быть удовлетворены моделью.

 


Дальнейший анализ

Когда вы закроете диалоговое окно Результаты одномерной АРПСС, остатки АРПСС автоматически добавятся в активную рабочую область. Также если установлена (по умолчанию) опция Добавить прогнозы к исход. ряду при Выходе, ряд с исходными данными и прогнозами будет добавлен в активную рабочую область. Теперь закройте окно Результаты одномерной АРПСС, нажав кнопку Отмена. Окно Одномерная АРПСС снова появится на экране.

Рисунок 22.

Как вы видите, оба ряда: остатки и прогнозы добавлены в активную рабочую область. В конце анализа посмотрим другой информативный график. Постройте на одном графике исходный ряд, прогнозы и остатки. Такой график поможет вам обнаружить другие недостатки подобранной модели. Например, если остатки особенно большие, и подгонка плоха на одном из сегментов ряда (например, возможно, имеется трехгодовой период, на котором модель АРПСС устойчиво предсказывает большие значения, чем те, которые наблюдаются). Т.к. остатки и наблюдаемый ряд (и прогнозы) несовместимы (напомним, что остатки относятся к прологарифмированному ряду, к которому затем дважды применялся разностный оператор, тогда как прогнозы относятся к исходному ряду), то лучше использовать кнопку График 2-х списков переменных в разных масштабах во вкладке Прогноз. Пусть первой переменной на графике будет исходный ряд с добавленным прогнозом, а второй переменной (во втором окне) будут остатки.

Рисунок 23.

Нажмите OK, чтобы увидеть график.

Рисунок 24.

Снова из графика видно, что подгонка модели АРПСС очень хорошая, т.к. остатки имеют примерно равную вариацию на всем протяжении ряда и нет очевидного тренда или сдвига в них.


В начало


Узнайте больше на курсах Академии Анализа Данных StatSoft

Список курсов    Календарь    Расписание групповых занятий

 

 





info@statsoft.ru       (495) 787-77-33       (499) 674-06-15       STATISTICA Data Miner 13.3 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia
1999-2017

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта