База примеров

Статистический анализ и прогнозирование авиаперевозок

Содержание

Постановка задачи

Разведочный анализ

Визуальный анализ

Выделение периодичности

Исследование свойств ряда

Прогноз АРПСС

Проверка качества прогноза

Прогноз моделью экспоненциального сглаживания

Выводы

Список литературы

 


Постановка задачи

Рассмотрим задачу построения прогноза авиаперевозок США по историческим данным. Данные взяты с ресурса www.bts.gov и представляют собой помесячное количество пассажиров в период с января 2003 года по декабрь 2009 года.

Количество пассажиров измеряется в миллионах человек.

Фрагмент исходных данных

Табл. 1. Фрагмент исходных данных

Цель исследования – спрогнозировать перелеты по месяцам на 2010 год.

 


Разведочный анализ

Визуальный анализ

Построим линейный график временного ряда (см. рис. 1).

Данные обладают ярко выраженной сезонной структурой.

Как видим, максимумы интенсивности авиаперевозок приходятся на июль.  

Линейный график количества пассажиров

Рис. 1. Линейный график количества пассажиров

Выделение периодичности

Для выявления периодичности применим спектральный анализ. Этот метод можно использовать для подтверждения нашей гипотезы о том, что ряд обладает сезонной структурой. Предполагаемый период сезонного цикла – 12 месяцев.

График спектральной плотности

Рис. 2. График спектральной плотности

На графике спектральной плотности видим, что наибольшее значение плотности соответствует периоду 12 месяцев, из линейного графика видно, что повторяющиеся пики соответствуют месяцу июль, т.е. повторяются через 12 месяцев.

Наибольшие значения перидиограммы

Табл. 2. Наибольшие значения перидиограммы

Исследование свойств ряда

Вид автокорреляционной функции позволяет нам определить, какие параметры прогностической модели АРПСС нужно взять.

Автокорреляционная функция для данного ряда будет иметь вид:

Автокорреляционная функция для исходного ряда

Рис. 3. Автокорреляционная функция для исходного ряда

График показывает сильную периодическую зависимость между компонентами ряда: автокорреляции на лагах 1, 12 имеют максимальные значения.

Прологарифмируем ряд, чтобы сгладить скачки амплитуды, для последующего анализа с помощью автокорреляционных функций.

Прологарифмованный временной ряд

Рис. 4. Прологарифмированный временной ряд

Автокорреляционная функция преобразованного ряда поможет нам более чётко увидеть временные зависимости в нашем ряду:

Автокорреляционная функция для прологарифмованного ряда

Рис. 5. Автокорреляционная функция для прологарифмированного ряда

Автокорреляция имеет ярко выраженный периодический характер. Причем автокорреляция на лагах 1,12 имеет максимальные значения.
От преобразованного ряда возьмём разности с лагом 1.

После логарифмирования ряда и взятия разностей с лагом 1 получаем такую автокорреляционную картину:

Автокорреляционная функция после взятия разности с лагом 1

Рис. 6. Автокорреляционная функция после взятия разности с лагом 1

Теперь возьмём разность с лагом 12:

Автокорреляционная функция после взятия разности с лагом 12

Рис. 7. Автокорреляционная функция после взятия разности с лагом 12

Большинство сильных автокорреляций теперь удалено.
Построим частную автокорреляционную функцию для нашего нового ряда.

В случае, когда лаги на ней будут независимы, можно говорить о том, что ряд поддается анализу АРПСС. Частная автокорреляционная функция будет иметь вид:

Частичная автокорреляционная функция

Рис. 8. Частичная автокорреляционная функция

 


Прогноз АРПСС

В этом разделе для построения прогноза мы будем использовать линейную математическую модель авторегрессии и проинтегрированного скользящего среднего (АРПСС).

Подобрать наилучшую модель АРПСС можно путем перебора моделей с различными параметрами, применяя для их сравнения метод кросс-проверки (cross-validation).

АРПСС позволяет анализировать временные ряды с сезонностью. В данном случае удобно взять модель со следующими параметрами.

Параметры модели АРПСС

Рис. 9. Параметры модели АРПСС

График прогноза на 12 месяцев вперёд будет иметь следующий вид:

Полученный на основе модели АРПСС прогноз на 12 месяцев

Рис. 10. Полученный на основе модели АРПСС прогноз на 12 месяцев

 


Проверка качества прогноза

Проверим объективность прогноза, проведя кросс-сравнения с известными данными (cross-validation).

Кросс-проверка модели

Рис. 11. Кросс-проверка модели

В таблице приведены значения фактического уровня перевозок, прогноза перевозок, а также абсолютная и относительная ошибки:

Результаты кросспроверки

Табл. 3. Результаты кросспроверки

 


Прогноз моделью экспоненциального сглаживания

Для построения прогноза можно также использовать модели экспоненциального сглаживания, учитывающие тренд и сезонность.

Были рассмотрены модели с линейным или экспоненциальным трендом, с аддитивной или мультипликативной сезонностью.

Наиболее удачными оказались модели с аддитивной сезонностью и линейным трендом. Как видно из приведённой ниже таблицы, этот метод дает низкие ошибки: 

Ошибки модели с линейным трендом и аддитивной сезонностью

Табл. 4. Ошибки модели с линейным трендом и аддитивной сезонностью

График прогноза, выполненного методом экспоненциального сглаживания

Рис. 12. График прогноза, выполненного методом экспоненциального сглаживания

 


Выводы

В таблице ниже показано сравнение ошибок, полученных при кросспроверке АРПСС и экспоненциального сглаживания. 

Прогноз, выполненный путем экспоненциального сглаживания, описывает тенденцию авиаперевозок точнее.

Сравнение модели экспоненциального сглаживания с выбранной моделью АРПСС

Табл. 5. Сравнение модели экспоненциального сглаживания с выбранной моделью АРПСС

 


Список литературы

  1. В.П.Боровиков. STATISTICA. Искусство анализа данных на компьютере: для профессионалов (2-е издание), СПб.: Питер, 2003. – 688 с.: ил.

  2. Г.И.Ивченко, Ю.И.Медведев. Математическая статистика. – М.: Высшая школа, 1984. – 248 с.

  3. Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. – М.: Большая Российская энциклопедия, 2003. – 912 с.

  4. Электронный учебник компании StatSoft.


В начало


Узнайте больше на курсах Академии Анализа Данных StatSoft

Список курсов    Календарь    Расписание групповых занятий

 

 





info@statsoft.ru       (495) 787-77-33       (499) 674-06-15       STATISTICA Data Miner 13.2 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia, 2017

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта