База примеров

Анализ структуры поставщиков и выбор оптимального поставщика

Пример выполнен в 5ой версии системы STATISTICA. Информация о текущей версии

Содержание

Описание объекта и цель исследования

Разведочный анализ

Классификация поставщиков 

Построение модели

Выводы


Описание объекта и цель исследования

Анализировалась структура поставщиков предприятия. Поставляемая продукция представляет собой сырье для производства конечного продукта на предприятии. Качество сырья поставщиков различается. Каждый поставщик характеризуется месячным объемом поставок. Рассматривалось 11 поставщиков.

Конечный продукт характеризуется выходным параметром, который является показателем его качества. На выходной параметр оказывает влияние структура поставщиков (поскольку сырье различается по качеству, то в зависимости от объема поставок того или иного поставщика параметр качества будет меняться). Характер зависимости выходного параметра от объема поставок каждого поставщика неизвестен.

Целью исследования является анализ влияния объемов поставок каждого поставщика на значения выходного параметра, характеризующего качество продукции. Стояла задача построения математической модели, описывающей характер влияния объемов поставок каждого поставщика на выходной параметр. В ходе решения задачи рассматривалась также классификация поставщиков по степени их влияния на исходный показатель. Исходные данные представляют месячные ряды объемов поставок каждого поставщика и значения выходного показателя. Мы проводим анализ последовательно в соответствии с технологиями На предварительном этапе производится организация данных для последующего анализа в системе STATISTICA. Данные представлены следующим образом: столбцы соответствуют поставщикам, строки – масяцам. Таким образом, каждый столбец представляет собой временной ряд месячных объемов продаж каждого поставщика. Если поставщик не поставлял продукцию в текущем месяце, то в соответствующих ячейках стоят нули. Файл данных к задаче в формате STATISTICA приведен на рис.1.

Рис.1


В начало

Разведочный анализ

Представим графически зависимость выходного параметра от объемов поставок каждого поставщика (Рис.2). На диаграммах четко прослеживается наличие устойчивого влияния одних поставщиков и достаточно слабое воздействие других.

Рис.2

Анализ диаграмм рассеяния позволяет говорить о том, что статистически значимое влияние на выходную переменную могут оказывать поставщики 2, 3, 5, 8, 9, 11. Влияние поставщиков 4, 7 статистически незначимо – выходной параметр слабо зависит от изменения в их объемах продаж. Динамика объемов продаж на исследуемом промежутке времени представлена на Рис.3.

Рис.3


В начало

Классификация поставщиков 

Проведем классификацию поставщиков по степени их влияния на выходной показатель. Для этого воспользуемся методами модуля "Кластерный анализ" системы STATISTICA. Проведем классификационный анализ поставщиков. Его целью является определение степени сходства поставщиков друг с другом. Процедура носит название "Древовидная кластеризация". Результаты древовидной классификации множества поставщиков представлены на Рис.4.

Рис.4 

Диаграмма классификации иллюстрирует разбиение поставщиков на группы. Анализируя ее, можно, например, утверждать, что поставщики 4, 5, 6, 7, 9, 10 оказывают сходное влияние на выход продукции. Следовательно, можно говорить о сходстве качества сырья у данных поставщиков.


В начало

Построение модели

Строим регрессионную линейную модель влияния объемов поставок на выходную переменную, т.е. будем приближать выходную переменную формулой:

Output = A1+A2*Пост1+... +A11*Пост11+e

– линейная зависимость от объемов продаж каждого поставщика с неизвестными коэффициентами. e – случайная компонента с нулевым математическим ожиданием.

Задача состоит в том, чтобы оценить неизвестные коэффициенты. Для построения регрессионной модели и численной оценки коэффициентов перед объемами продаж поставщиков воспользуемся модулем STATISTICA "Множественная регрессия".

Все оценки строятся легко в диалоговом режиме. Программа автоматически найдет лучшую модель, т.е. исключит поставщиков, влияние которых на выходной параметр очень слабое, и оставит в модели поставщиков, которые действительно оказывают значимое влияние на исследуемую переменную.

Рис.5. Указание зависимой переменной и независимых факторов.

Рис.6. Окно результатов расчетов коэффициентов регрессии. 

Красным цветом выделены статистически значимые независимые переменные, синим – незначимые переменные.

Окончательная формула для расчета выходного показателя в линейной спецификации следующая:

Output = 162.3 - 46.8*Пост1–36.8*Пост2–19.9*Пост3– 58.8*Пост5–38.4*Пост6–38.1*Пост8–150.1*Пост10– 38.2*Пост11

Результаты численного оценивания модели позволяют построить прогноз параметра 1:

Рис.7. Наблюдаемые значения и прогноз.

Определим оптимальное множество поставщиков. Для этого проведем анализ модели на избыточность. Наша цель - проверить обоснованность вхождения всех поставщиков в модель. Проверка проводится методом расчета показателя толерантности для каждой независимой переменной в уравнении. Толерантность переменной показывает, насколько велика ее связь с остальными независимыми переменными. Если связь достаточно велика, то использование данной переменной нецелесообразно и является избыточным. Следовательно, ее можно исключить из модели без большой потери в объясняющих свойствах. В итоге мы получим некоторое множество поставщиков, влияние которых на исследуемый параметр 1 наиболе значимо, причем будет устранена избыточность переменных. С экономической точки зрения избыточность вхождения поставщика в модель означает его слабое влияние на выходной параметр. Целесообразно проводить закупки только у тех поставщиков, качество сырья которых достаточно сильно влияет на параметр 1. Это даст экономию финансовых ресурсов без большого ущерба для параметра 1 конечной продукции предприятия. Результаты проверки на избыточность:

Рис.8. Толерантность для многих переменных низкая, что говорит о том, что спецификация модели нуждается в улучшении.

Реализуем следующий алгоритм поиска оптимальной спецификации модели. Будем включать или исключать из модели независимые переменные на каждом шаге регресии (на первом шаге используем одну переменную, на втором добавляем еще одну и смотрим на результаты. Если значимость коэффициентов ухудшилась, то ищем другую комбинацию из двух переменных). В результате получим оптимальную спецификацию модели. Алгоритм реализован в модуле "Множественная регрессия". Вызвать его можно, выбрав опцию "Пошаговая регрессия с включением":

Рис.9. Выбор опции "Пошаговая регрессия с включением". 

Результаты работы алгоритма:

Рис.10. Результаты работы алгоритма пошаговой регрессии с исключением.

Алгоритм поиска оптимальной спецификации оставил в модели две переменных: поставщика 3 и поставщика 9. Это оптимальные поставщики для предприятия с точки зрения их влияния на параметр 1. Численное оценивание коэффициентов дает следующие результаты:

Рис.11. Итоги численного оценивания модели с оптимальными поставщиками.

Характер влияния всех поставщиков на выходной показатель отрицательный. Значение скорректированного R2= 0.708 довольно высокое для такого количества наблюдений и данной структуры входных переменных, что говорит о достаточно хороших объясняющих свойствах модели.

Первый столбец на рисунке содержит численные значения оценок коэффициентов модели при объемах поставок для каждого поставщика. Интерпретация коэффициентов следующая: при изменении объема поставок для некоторого поставщика на единицу (единицей считается единица измерения представленных данных) значение выходного показателя меняется на величину соответствующего коэффициента в данном столбце.

Построим теперь нелинейную модель влияния поставщиков на выходной параметр 1, которая называется модель экспоненциального роста:

Output = C+exp(b0+b1* Пост1+...+b11*Пост11)

Оценивание коэффициентов проводится с использованием методов модуля STATISTICA "Нелинейное оценивание". Применяем метод оценивания коэффициентов Хука-Дживиса.

Результаты оценивания:

Коэффициент с b0 b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11
Оценка -65.5 6.37 -0.63 -0.58 -0.46 -0.11 -0.67 -0.64 -1.74 -0.56 -0.51 -1.7 -0.56

Рис.12. Численные результаты оценивания.

Окончательная формула для расчета выходного показателя в рассматриваемой спецификации следующая:

Output = -65.5+e6.37-0.63*Пост1- 0.58*Пост2- 0.46*Пост3-0.11*Пост4-0.67*Пост5- 0.64*Пост6-1.74*Пост7-0.56Пост8-0.51*Пост9- 1.7*Пост10-0.56*Пост11

Доля объясненной дисперсии в модели: 84.592%. 

Приведем для сравнения прогнозные свойства двух построенных моделей: линейной и экспоненциальной:

Рис.13. Построим на одном графике прогнозы, сделанные различными способами: с помощью линейной модели и с помощью модели экспоненциального роста.


В начало

Выводы

Исследование проводилось поэтапно. На этапе разведочного анализа данных данные были представлены графически. Установлено, что поставщики распадаются на две категории: поставщики, оказывающие сильное статистическое влияние на выходной параметр и поставщики, влияние которых очень слабое. Методом древовидной классификации выделены группы поставщиков, сырье которых имеет сходное качество. Это 4, 7 и 10. Были построены две различные модели влияния объемов поставок на выходной параметр: линейная модель и экспоненциальная модель. Проведено численное оценивание коэффициентов модели, отражающих влияние каждого поставщика. С помощью алгоритма пошаговой линейной регрессии с включением определено множество оптимальных поставщиков с точки зрения максимизации выходного параметра 1. Это оказались поставщики 3 и 9.


В начало


Узнайте больше на курсах Академии Анализа Данных StatSoft

Список курсов    Календарь    Расписание груповых занятий






info@statsoft.ru       (495) 787-77-33       (499) 674-06-15       STATISTICA Data Miner 13.3 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia
1999-2017

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта