База примеров

Уникальные достижения StatSoft в области машинного обучения и построения предсказательных моделей в промышленности: методология, технология, кейсы

Содержание:

Часть 1. Предсказательные модели электропотребления на промышленных предприятиях

В представленном кейсе описано прогнозирование энергопотребления шагающими экскаваторами.

Задача энергосбережения и эффективного использования электроэнергии является одной из ключевых для промышленных предприятий Экономики 4.0.

Современные технологии машинного обучения и нейронных сетей позволяют строить точные предиктивные модели на основе накопленных исторических данных.

Данные модели предназначены для того, чтобы добиться рационального использования энергетических ресурсов на предприятии, выявлять скрытые факторы и связи влияющие на потребление энергии, находить оптимальные режимы функционирования оборудования.

С помощью точных предиктивных моделей повышается эффективность производства без капитальных затрат в основное оборудование.

В этом состоит смысл цифровой революции и экономики 4.0.

StatSoft предлагает уникальные технологии прогнозирования потребления электроэнергии, основанные на многолетнем опыте компании в области анализа данных, цифровизации и искусственного интеллекта.

Курсы Академии Анализа Данных StatSoft позволяют быстро войти в технологии анализа данных, построения предиктивных моделей и использовать их на практике.

На курсах мы работаем с реальными данными, данными слушателей и добиваемся успеха в решении реальных задач.

StatSoft открывает методы нейросетевого прогнозирования и интеллектуального анализа данных для широкого круга пользователей.

Наши флагманские курсы доступны по ссылкам:

Курсы по нейронным сетям

Введение в анализ данных с помощью нейронных сетей: теория и практика на компьютере

Курсы по Data Mining

Отзывы на курсы Академии Анализа Данных доступны по ссылкам:

http://statsoft.ru/academy/lections.php#tab-responses-link

 

Мы рассмотрим нейросетевое прогнозирование энергопотребления шагающими экскаваторами.

Аналогичные модели работают в металлургии при прогнозировании и оптимизации энергопотребления дуговых сталеплавильных печей (ДСП), в нефтедобывающей промышленности и др. областях.

Учитывая специфику работы ОРЭМ (оптовый рынок электроэнергии и мощности), у предприятий имеется возможность влиять на итоговую стоимость электроэнергии за счет более качественного почасового планирования электропотребления и подачи заявок на сутки вперед.

Заявка подается на каждые сутки и отображает в себе потребление электроэнергии в каждый час.

Область использования шагающих экскаваторов - горнодобывающая промышленность, добыча полезных ископаемых открытым способом, включая уголь, сланцы, руды черных и цветных металлов, золото, сырье для химической промышленности и др.

Назначение экскаваторов заключается в проведении вскрышных работ с дальнейшей укладкой породы в выработанное пространство или на борт карьера.

Экскаваторы способны перемещать объемы горной массы на большие расстояния.

Например, шагающий экскаватор ЭШ 20.90 имеет вместимость ковша 20 м3, длину стрелы 90 м, радиус выгрузки 83 м.

Информационно-диагностическая система на микропроцессорной базе позволяет контролировать производительность экскаватора, расход электроэнергии и др. параметры.

Это позволяет внедрять в практику технологии IoT и искусственного интеллекта.

Ключевым моментом прогнозирования и подачи заявки ОРЭМ является вариабельность почасового электропотребления.

Типичный пример почасового электропотребления шагающим экскаватором показан на графике:

 

Реально в компании имеется сравнительно небольшое количество экскаваторов с большим энергопотреблением.

Соответственно выход одного экскаватора из строя или, наоборот, ввод экскаватора в эксплуатацию, влечет за собой существенные отклонения фактического потребления от заявленного.

Существенной проблемой являются также аварийные простои оборудования.

Традиционно для планирования электропотребления используются усредненными данными предыдущих периодов, также стараются учитывать производственные планы, ремонт техники, погодные условия и др.

Однако погрешность прогноза, получаемого эмпирическими методами, неудовлетворительна, так как варьируется в широких пределах.

Технологии машинного обучения и нейронных сетей позволяют получить существенно более точный прогноз и сформировать заявку для рынка ОРЭМ.

Рассмотрим проведение нейросетевого прогнозирования электропотребления по шагам в системе Statistica.

Реализованные в удобном интерфейсе нейронные сети Statistica являются незаменимым инструментом для широкого круга пользователей.

Statistica позволяет эффективно строить и внедрять модели в практику.

Шаг 1. Запускаем программу Statistica.

Открываем окно анализа – Нейронные сети.

В этом окне выберем временные ряды (регрессия). Нажимаем кнопку ОК.

 

Шаг 2. Выбираем переменную ЭП – энергопотребление в качестве целевой переменной, для которой хотим построить прогноз.

 

 

Шаг 3. В вкладке Временные ряды выбираем размер окна и количество дней, на которые требуется построить прогноз:

 

Шаг 4. Задаем архитектуры сетей: выбираем многослойные персептроны (МПП) и радиальные базисные функции (РБФ).

 

 

В соответствующих полях задаем минимальное и максимальное количество скрытых нейронов.

Шаг 5. Выбираем функции активации в вкладке Функции активации для МПП:

Для запуска модели нажимаем кнопку Обучить.

Шаг 6. В окне Результаты анализируем результаты.

Результаты пяти лучших сетей представлены в таблице:

Гистограмма остатков показывает точность построенной нейросетевой модели:

Диаграмма рассеяния показывает точность прогноза и факта потребления:

Выделенные наблюдения соответствуют выходу из строя оборудования.

Веса нейронов для многослойного персептрона с 61 нейроном на скрытом слое показаны в таблице:

Построенная модель сохраняется в формате PMML или С\С++ далее используется для подготовки заявки на ОРЭМ.

Точность прогноза улучшается при включении в модель факторов погоды, дней недели, конкретного оборудования.

Полученные результаты существенно превосходят эмпирические и классические методы прогнозирования.

Полностью кейс разбирается на курсах StatSoft.

Вопросы по построению предиктивных моделей с помощью нейронных сетей и технологий машинного обучения можно задавать письменно по адресу vladimir@statsoft.ru или по телефонам StatSoft +7 (495) 787-77-33, +7 (906) 734-40-57 

Список литературы:

1.    Боровиков В.П. Нейронные сети Statistica, SNN, Москва, горячая линия телеком, 2008

2.    Боровиков В.П. Популярное введение в современный анализ данных и машинное обучение на Statistica, Москва, горячая линия телеком, 2019

 

Часть 2: Предсказательные модели электропотребления в нефтедобывающей отрасли

В себестоимости добычи нефти и попутного газа доля затрат на электроэнергию составляет 30–35%.

К наиболее энергоемким направлениям нефтедобычи относятся процессы механизированной добычи жидкости из скважин, поддержание пластового давления (ППД), подготовки и перекачки нефти.

Общий расход электроэнергии на подъем жидкости по нефтяным компаниям России составляет от 55 до 62% от общего потребления, на работу системы ППД расходуется от 22 до 30%, на подготовку, транспорт нефти и газа — 8–23%.

На остальные технологические процессы нефтедобычи приходится относительно небольшой процент расхода энергии.

Актуальной является задача снижения нерационального использования энергетических ресурсов, выявление скрытых факторов и связей, влияющих на их потребление.

Для решения данной задачи используются методы интеллектуального анализа данных, включая методы Data mining.

На предприятиях нефтегазовой отрасли накоплены большие объемы данных потребления электроэнергии оборудованием разным производителей, эксплуатируемых в разных геологических условиях и технологических режимах.

На основе собранных данных с помощью современных аналитических технологий Statistica строятся предсказательные модели.

В настоящее время по мнению международных рейтинговых агентств полностью переведенная на русский язык Statistica является одним из лидеров ПО в области data science, см. статью.

Актуальной задачей, которая может быть решена с помощью технологий StatSoft, является задача качественного почасового планирования электропотребления на сутки вперед.

Это позволяет сформировать заявку на сутки вперед с помощью адекватных предиктивных моделей.

Учитывая специфику работы ОРЭМ (оптовый рынок электроэнергии и мощности), у предприятий имеется возможность влиять на итоговую стоимость электроэнергии за счет более качественного почасового планирования электропотребления и подачи заявок на сутки вперед.

Заявка подается на каждые сутки и отображает в себе потребление электроэнергии в каждый час.

Система Statistica, в частности, методы машинного обучения и нейронные сети позволяют решать данные задачи.

К потребителям электроэнергии в нефтяной промышленности относятся:

  • кусты эксплуатационных скважин для добычи нефти;
  • одиночные добывающие скважины;
  • кусты водозаборных скважин;
  • кустовые насосные станции (КНС) для поддержания пластового давления;
  • дожимные насосные станции (ДНС) системы внутрипромыслового сбора нефти;
  • центральные пункты сбора (ЦПС) нефти;
  • установки подготовки нефти (УПН);
  • установки предварительного сброса воды (УПСВ), попутного газа (УПСВГ);
  • перекачивающие насосные станции для транспорта нефти (ПНС, НПС) и др.

К потребителям электроэнергии в газовой промышленности относятся:

  • кусты газовых скважин, одиночные газовые скважины;
  • установки комплексной подготовки природного газа (УКПГ);
  • дожимные компрессорные станции на газовых месторождениях (ДКС);
  • водозаборные насосные станции;
  • водозаборные скважины;
  • буровые установки (БУ);
  • установки для гидронамыва сооружений;
  • компрессорные станции транспорта природного газа и др.

Потребление активной мощности буровой установкой зависит от геологических и технологических факторов, включая режим работы, характеристики разбуриваемой породы, долота и др. факторов.

В состав электрооборудования буровой установки входят лебедка, ротор, буровой насос, компрессоры сжатого воздуха, вибросито, кран-балка, водяной насос, автомат спуска-подъема.

Число основных и вспомогательных механизмов и их электровооруженность определяются классом и назначением буровой установки.

График почасовой нагрузки имеет высокую вариабельность (по оси х отложено время).

Вариабельность потребления электроэнергии куста скважин представлена на линейном графике суточного потребления:

 

Фактор температуры

Правильный учет фактора температуры позволяет повысить качество предиктивных моделей.

На диаграмме отчетливо виден эффект фактора температуры на электропотребление.

Диаграмма 1 относится к низким температурам ниже – 20 градусов, диаграмма 2 относится к температурам выше +10 градусов.

При понижении температуры потребление электроэнергии по подъему жидкости одной и той же скважины существенно повышается.

 

Методы дисперсионного анализа (ANOVA) позволяют разбить диапазон температур на интервалы и ввести поправочные коэффициенты для разных значений (центров интервалов группировки температурного диапазона).

Нейросетевая модель предусматривает проведение расчета энергопотребления, основанного на фактических данных существующего технологического режима мехфонда, а также расчет оптимальных режимов работы скважин.

Также строятся модели подбора оборудования и режимов его работы, способных обеспечить максимальную энергоэффективность добычи из конкретной скважины.

В Statistica построение нейросетевых моделей проводится по шагам в последовательно открывающихся диалоговых окнах.

Построенные модели сохраняются в формате PMML или в формате С\С++ и могут быть внедрены в производственный процесс.

Ниже покажем на реальных данных, как прогнозируется почасовая погода на сутки вперед с использованием нейронных сетей.

Исходные реальные данные представлены в таблице:

В первом столбце дата, во втором час наблюдения, далее температура, измеренная в конкретный час и погодные факторы.

Шаг 1. Запускаем программу Statistica.

Открываем окно анализа – Нейронные сети.

В этом окне выберем временные ряды (регрессия). Нажимаем кнопку ОК.

Шаг 2. Выбираем переменные для анализа.

Целевая (прогнозируемая) переменная температура.

В качестве предикторов используем давление, скорость и направление и др. переменные.

Шаг 3. Во вкладке временные ряды выбираем размер окна и количество дней, на которые требуется построить прогноз:

Шаг 4. Задаем архитектуры сетей: выбираем многослойные персептроны (МПП).

Запускаем процедуру обучения сетей, нажимаем кнопку Обучить.

Шаг 5. В окне Результаты анализируем результаты и точность построенных моделей.

Результаты прогноза на лучших сетях:

Сравнение прогноза на моделях и реальные данные показаны в таблице:

В первом столбце фактическая температура в течение суток, в столбце 2 – нейросетевой прогноз, в столбце 3 – остатки модели.

Средняя величина абсолютных остатков (факт минус прогноз) равна 2 градуса.

Аналогично строятся предиктивные модели для буровых установок, ПЭД, УЦН и др. систем.

Таблица результатов нейросетевого прогноза для буровых установок:

 

Полностью кейс разбирается на курсах StatSoft.

Вопросы по построению предиктивных моделей с помощью нейронных сетей и технологий машинного обучения можно задавать письменно по адресу vladimir@statsoft.ru или по телефонам StatSoft +7 (495) 787-77-33, +7 (906) 734-40-57. 

Список литературы:

1.    Боровиков В.П. Нейронные сети Statistica, SNN, Москва, горячая линия телеком, 2008

2.    Боровиков В.П. Популярное введение в современный анализ данных и машинное обучение на Statistica, Москва, горячая линия телеком, 2019


В начало


Узнайте больше на курсах Академии Анализа Данных StatSoft

Список курсов    Календарь    Расписание груповых занятий






info@statsoft.ru       (495) 787-77-33       (499) 674-06-15       STATISTICA Data Miner 13.3 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia
1999-2020

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта