Круглый стол: Цифровизация промышленности России

Современные методы управления качеством и контроля технологических процессов: методология, технология, кейсы

Круглый стол компании StatSoft

Боровиков Владимир Павлович – директор StatSoft, кандидат физико-математических наук по специальности теория вероятностей и математическая статистика, автор книг по анализу данных и его применениям, директор StatSoft. Автор работ по теории вероятностей и математической статистике, опубликованных в ведущих российских и зарубежных изданиях. 

Автор бестселлера «STATISTICA: искусство анализа данных на компьютере». Руководитель знаковых проектов по применению технологий анализа данных и Data Mining с ведущими российскими и зарубежными компаниями.


Участники круглого стола:

Клячкин Владимир Николаевич – доктор технических наук, профессор кафедры «Прикладная математика и информатика» факультета информационных систем и технологий Ульяновского государственного технического университета (УлГТУ), специалист в области компьютерных технологий статистического анализа, контроля качества, технической диагностики.

Кувайскова Юлия Евгеньевна – кандидат технических наук, доцент, заведующая кафедрой «Прикладная математика и информатика» УлГТУ; область научных и педагогических интересов – статистический анализ данных, информационные технологии, моделирование и прогнозирование временных рядов, техническая диагностика.

Халафян Алексан Альбертович доктор технических наук по специальности системный анализ, профессор кафедры анализа данных и искусственного интеллекта факультета Компьютерных технологий и прикладной математики Кубанского государственного университета. Специалист в области статистического анализа данных, промышленной статистики, методов Data Mining; автор широко известных в России учебных пособий, монографии по аналитике данных, математической статистике.

Коваленко Анна Владимировна  доктор технических наук по специальности математическое моделирование, численные методы и комплексы программ, доцент, заведующий кафедрой анализа данных и искусственного интеллекта Кубанского государственного университета. Специалист в области нейросетевых технологий, анализа данных, математического моделирования мембранных процессов; автор учебных пособий по математическим методам финансово-экономического анализа, математическим методам электроконвекции в мембранных системах, моделированию физико-химических процессов в среде Comsol Multiphysics.

 

В.П.: Уважаемые коллеги, я рад приветствовать вас на нашем круглом столе.
StatSoft является признанным центром анализа промышленных данных, но сегодняшний наш круглый стол посвящен более узкой тематике - управлению качеством в промышленности.
Здесь собрались представители известных российских вузов, имеющие признанный опыт в преподавании, подготовке специалистов и реализованных проектах по управлению качеством в промышленности с использованием технологий STATISTICA.
Наш круглый стол призван определить основные направления в применении технологий управления качеством в частности, классических статистических методов, машинного обучения, нейронных сетей, технологий IoT, виртуализация данных и др.
Это чрезвычайно важные вопросы для современной российской экономики.

Внедрение систем управления качеством является ключевым направлением развития.

Управление качеством на основе реальных данных – это ключевой мировой тренд, см.

"Экономика 4.0 Сквозное управление качеством в масштабе предприятия"

STATISTICA

На современном производстве важно выстроить процесс постоянного повышения качества на основе реальных данных, находить причины потери качества налету, давать заключение о процессах на основе объективной статистической информации, проводить анализ возможных изменений в условиях большого числа взаимозависимых факторов.

Технологии STATISTICA используются крупнейшими международными и российскими компаниями, включая АрселорМитал, ТНК-BP, ВСМПО-АВИСМА и мн. др. для управления качеством и анализа промышленных данных, оптимизации производственных процессов.

" Мировой лидер по производству титана выбирает решения StatSoft серии STATISTICA Quality Control"

"Statistica. Передовые технологии анализа данных"

STATISTICA Process Optimization

Актуальным вопросом является подготовка квалифицированных специалистов по анализу промышленных данных, управлению качеством с использованием современных компьютерных технологий.

Эти блоки вопросов мы обсудим на нашем круглом столе.

Я хотел бы предоставить слово профессору, д.т.н. Владимиру Николаевичу Клячкину, специалисту с большим опытом в области управления качеством, автору известной книги "Статистические методы в управлении качеством: компьютерные технологии", - М.: Финансы и статистика.

В.Н.: Позвольте, прежде всего, сказать несколько слов о нашем университете.

Ульяновский государственный технический университет на сегодняшний день – это кузница кадров для 10 тысяч студентов, обучающихся по 115 аккредитованным программам.

УлГТУ является членом научно-образовательного центра мирового уровня «Инженерия будущего».

Университет принимает активное участие в формировании программы деятельности научно-образовательного центра по индустрии альтернативной энергетики Ульяновской области.

Разработан и успешно реализуется мегапроект «Умный кампус и экосистема цифрового университета», связанный с решением задач, обеспечивающих развитие вуза как территории создания и продвижения энергосберегающих технологий на основе цифровых технологий.

Недавно университет стал обладателем гранта на разработку программ бакалавриата и магистратуры по искусственному интеллекту.

После краткого введения перейду к тематике нашего круглого стола.

Главные цели цифровой трансформации промышленного производства, на мой взгляд, это повышение скорости и качества принятия решений, увеличение вариативности процессов в зависимости от требований клиента, повышение качества продукции, всестороннее управление технологическими процессами.

Я согласен, что управление качеством на современных предприятиях должно быть основано на реальных данных, которые должны поступать в нужное время в нужном месте с ключевых участков производства.

Известно, что карты контроля качества основаны на статистических и вероятностных принципах.

Поэтому базовый курс теории вероятностей и математической статистики представлен практически на всех специальностях университета, расчеты по многим специальностям проводят с применением программы STATISTICA.

Первые рабочие места STATISTICA были приобретены университетом еще в 2001 г.

STATISTICA использовалась в подготовке студентов по специальности «Прикладная математика», «Управление качеством» и др.

Мы использовали также книги StatSoft.

На первом этапе это были:

Позднее к этим книгам добавились еще две:

Современная версия STATISTICA используется как студентами технических, так и студентами экономических специальностей.

Подготовка математиков по направлению «Прикладная математика», как будущих возможных разработчиков методов обеспечения качества и надежности, кроме множества курсов по статистическим методам, включает специальные дисциплины «Статистические методы контроля качества» и «Математические методы теории надежности».

Большой курс статистических методов изучают студенты направления «Управление качеством», как в рамках бакалавриата, так и магистратуры.

Все эти дисциплины включают лабораторный практикум в системе STATISTICA.

Для методического обеспечения курсов на кафедре были разработаны соответствующие учебные пособия:

  • Клячкин В.Н. Статистические методы в управлении качеством: компьютерные технологии. М.: Финансы и статистика, 2007 (переиздана в 2009 г. совместно с издательством ИНФА-М);
  • Клячкин В.Н., Кувайскова Ю.Е., Алексеева В.А. Статистические методы анализа данных. М.: Финансы и статистика, 2016.

Издательство «Финансы и статистика» планирует переиздать обе эти книги в этом году в электронном формате.

В.П.: Это серьезные нужные книги, которые закладывают основы применения методов контроля качества на производстве.

Расскажите, пожалуйста, о конкретных применениях компьютерных технологий StatSoft в управлении качеством.

В.Н.: Система STATISTICA активно используется нами при проведении научно-исследовательской работы совместно с промышленными предприятиями.

Ульяновское предприятие «Системы водоочистки» занималось разработкой системы очистки питьевой воды для водоканала Санкт-Петербурга.

Перед нами был поставлен ряд задач: прогнозирование состояния водоисточника «Западный Кронштадт» и питьевой воды после очистки, анализ стабильности процесса очистки и другие.

Часть задач была решена в системе STATISTICA, для некоторых потребовалась разработка специального программного обеспечения и новых подходов. Например, контроль коррелированных показателей качества очистки проводится с помощью многомерных карт Хотеллинга, такие карты система STATISTICA строит без проблем.

Однако чувствительность обычной карты оказалась недостаточной для обнаружения некоторых нарушений, и были предложены карты с предупреждающими границами.

В.П.: Да, это серьезный проект, который нужно масштабировать в России.

Также хочу поделиться ссылками на наш аналогичный проект:

"Мониторинг и контроль качества воды с помощью STATISTICA"

Еще я хочу упомянуть о нашем проекте прогнозирования потребления воды в Москве и поделится ссылками на видеоматериал:

Контроль качества

В.Н.: Аналогичные исследования проводились на НПО «Марс» по оценке стабильности загрязнения сточных вод.

Гальваническое производство наносит серьезный ущерб окружающей среде, недостаточно очищенные сточные воды предприятий от ионов тяжелых металлов являются основными источниками загрязнения водоемов.

Для мониторинга уровня загрязненности сточных вод было предложено использование методов статистического управления процессами с применением системы STATISTICA.

Mониторинг химического состава сточных вод на НПО «Марс» проводится согласно ежегодному план-графику.

Сотрудники центральной химической лаборатории отбирают пробы в двух контрольных точках, расположенных на выходе системы канализации.

С территории предприятия и далее по сетям сточные воды поступают на городские очистные сооружения, где проходят дополнительную очистку и контроль перед сбросом в природную среду.

Показатели значений загрязняющих веществ должны соответствовать допустимым концентрациям, которые установлены «Ульяновскводоканалом».

В.П.: В каком режиме проводился контроль уровня загрязнения и по каким параметрам контролировался уровень загрязнения?

В.Н.: Контроль сточных вод проводился ежедневно. При ежедневном контроле пробы сточной воды анализируются по кислотно-щелочному балансу, содержанию аммиака, нитритов, фосфатов, железа, меди и нефтепродуктов.

Для оценки стабильности содержания этих веществ использовались контрольные карты Шухарта и Хотеллинга.

Материалы этих исследований публиковались в журналах «Экологические системы и приборы» и «Экология и промышленность России», а также в монографиях, где приведены подробности применения программы STATISTICA при решении исследовательских задач:

  • Клячкин В.Н. Модели и методы статистического контроля многопараметрического технологического процесса. М.: Физматлит, 2011 (издана при поддержке гранта РФФИ);
  • Клячкин В.Н., Крашенинников В.Р., Кувайскова Ю.Е. Прогнозирование и диагностика стабильности функционирования технических объектов. М.: Русайнс, 2021.

В.П.: Вопрос: проводился поиск причин превышения уровня загрязнения, ведь это чрезвычайно важно?

В.Н.: Да, конечно! Но этим вопросом занимались специалисты НПО «Марс» - химики, экологи, технологи. Причины нарушения процесса могут выявить только специалисты в конкретной области, задача математиков – разработать алгоритм своевременного обнаружения нарушения.

В.П.: Коллеги, в этой связи хочу поделиться технологиями применения нейронных сетей и предиктивной аналитики, основанных на технологиях STATISTICA в алюминиевой промышленности.

Один наш проект связан с анализом процесса декомпозиции алюминатного раствора, см. Статистический анализ процесса декомпозиции алюминатного раствора на Statistica: классические и современные методы дейта майнинга

Замечу, что последние версии STATISTICA позволяют интегрировать программное обеспечение с R, python, создавать проекты с использованием методов глубокого обучения.

В.П.: Коллеги, большой проблемой современной российской промышленности является нехватка квалифицированных кадров по анализу данных и управлению качеством на современных предприятиях.

От решения этой проблемы во многом зависит будущее промышленности.

Как вы знаете, подготовка квалифицированных специалистов – это сложный многоступенчатый процесс.

Получение знаний и освоение новых технологий анализа данных идет постепенно от простого к сложному.

Я бы хотел предоставить слово Кувайсковой Юлии Евгеньевне – заведующей кафедрой «Прикладной математики и информатики» УлГТУ.

Юлия Евгеньевна, расскажите, пожалуйста, об опыте кафедры «Прикладной математики и информатики» в подготовке специалистов, уверен, что этот опыт будет востребован нашими читателями.

Ю.Е. Вопрос качественной подготовки специалистов является ключевым для Ульяновского государственного технического университета.

Методы анализа данных, data science находятся на передовом крае современных компьютерных технологий.

Подготовка специалиста, способного эффективно работать в промышленном секторе, это сложный многоступенчатый процесс.

Кафедра «Прикладная математика и информатика» – одна из ведущих кафедр УлГТУ, в составе которой 2 доктора наук, 5 кандидатов наук, 2 работодателя - кандидата наук. При кафедре имеются лаборатории, оснащенные современной компьютерной техникой и программным обеспечением, для выполнения перспективных исследований по научным направлениям кафедры, а также проведения практических и лабораторных работ по специальным дисциплинам.

Кафедра является выпускающей по направлению бакалавриата 01.03.04 «Прикладная математика», магистратуры 01.04.04 «Прикладная математика», а также ведется подготовка аспирантов по направлению 09.06.01 «Информатика и вычислительная техника», профили 05.13.01 «Системный анализ, управление и обработка информации (информационные технологии и промышленность)», 05.13.18 «Математическое моделирование, численные методы и комплексы программ», 05.13.12 «Системы автоматизации проектирования (по отраслям)».

Студенты и выпускники кафедры специализируются в области разработки программного обеспечения и применения информационных технологий для анализа и обработки данных на основе математических методов и моделей (Data Science, машинное обучение, искусственный интеллект).

Кроме вопросов качества, о которых рассказал Владимир Николаевич, студенты – математики изучают курсы «Анализ данных», «Анализ временных рядов», «Прикладное программное обеспечение», а магистры – «Статистические методы прогнозирования» и другие.

Экономисты, финансисты, управленцы проходят «Эконометрику».

При изучении всех этих дисциплин мы используем систему STATISTICA.

На днях кафедра получила лицензию по новому направлению «Математическое обеспечение и администрирование информационных систем», в рамках которого будут читаться курсы по машинному обучению и анализу данных, в том числе с применением системы STATISTICA.

Система STATISTICA интенсивно используется при выполнении студентами курсовых и дипломных работ, особенно в научно-исследовательских работах для промышленных предприятий.

В.П.: Расскажите подробнее об этих работах.

Ю.Е. Одно из направлений повышения эффективности управления гидроагрегатом связано с возможностью раннего предупреждения об аварийной ситуации с помощью прогнозирования состояния агрегата по множеству его характеристик, в частности по вибрациям.

Система вибромониторинга гидроагрегата включает контролируемые характеристики (показания распределенной сети датчиков относительной и абсолютной вибрации, а также датчиков измерения скорости вращения вала), которые образуют систему временных рядов.

Для данной системы можно построить соответствующие математические модели как в режиме запуска агрегата, так и в режиме работы в сети. На базе этой модели возможно прогнозирование изменения характеристик агрегата и обнаружение нарушений процесса до того, как контролируемые параметры превысили предельные значения. Для анализа вибраций гидроагрегата в режиме запуска предложено использовать подход адаптивного регрессионного моделирования, предусматривающего при построении математических моделей временных рядов последовательную адаптацию модели к возможным нарушениям основных предположений регрессионного анализа.

При этом построенная модель вибраций адекватна реальной ситуации и позволяет прогнозировать состояние гидроагрегата, что и предупреждает об аварийной ситуации.

Полученные результаты работы внедрены и использовались на ОАО «Ульяновское конструкторское бюро приборостроения» при многомерном статистическом контроле и прогнозировании показателей вибраций гидроагрегатов Краснополянской ГЭС.

В.П.: Я со своей стороны, отмечу наш проект с Атоммашэкспорт, где проводилась диагностика оборудования на основе шумов и вибрационных характеристик.

Ю.Е.: Другим нашим примером является повышение эффективности функционирования системы водоочистки.

На качество очистки воды оказывают влияние как факторы, характеризующие воду из источника, так и эффективность функционирования самой системы.

Для раннего предупреждения нештатной ситуации, когда значения показателей качества очищенной воды оказываются вне допустимых пределов, необходимо прогнозирование физико-химических показателей источника водоснабжения, контроль которых осуществляется через определенные промежутки времени (температура, цветность, мутность, щелочность и другие).

По результатам мониторинга этих показателей за определенный период необходимо разработать математическую модель процесса, их динамики и на ее основе спрогнозировать значения показателей водоисточника на некоторый горизонт вперед.

Получаемый прогноз состояния водоисточника позволяет контролировать состояние воды на входе и при необходимости определенным образом реагировать на возникающие изменения. Для решения этой задачи использовалась модель векторной авторегрессии. Затем спрогнозированные значения входных показателей выступают в качестве исходных данных при построении моделей кусочно-линейных регрессий с разрывом по отклику. Далее полученные результаты прогнозирования проверяются на соблюдение допустимых границ с целью раннего предупреждения о возможном нарушении процесса. При возможных нарушениях проводится корректировка значений управляемых параметров.

При решении этой задачи для построения моделей кусочных регрессий с разрывом по отклику использовалась система STATISTICA.

Результаты данной работы были внедрены в ЗАО «Системы водоочистки» (г. Ульяновск) при разработке системы водоочистки на водоканале Санкт-Петербурга, источник водоснабжения – «Западный Кронштадт».

Подобным образом решались и задачи технической диагностики. Используя заданную обучающую выборку – при каких значениях входных параметров (для гидроагрегата – вибраций, для системы водоочистки – физико-химических показателей водоисточника) объект может считаться исправным, а при каких – неисправным, по новому набору данных, полученных при мониторинге, надо дать заключение об исправности объекта. 

Качество решения этой задачи зависит и от выбранного метода бинарной классификации (исправен или неисправен?), и от объема обучающей выборки, и от способа ее разбиения на обучающую и тестовую части, и от критерия качества классификации (особенность задачи в том, что информации о неисправном состоянии объекта обычно на порядок меньше, чем об исправном).

Для решения данной задачи использовались различные методы машинного обучения, а в условиях ограниченной информации нечёткие модели, позволяющие анализировать стабильность работы и прогнозировать состояние объекта в виде нечётких высказываний со степенью истинности получаемого результата.

Результаты проведенных исследований были опубликованы в ведущих журналах: «ProcediaEngineering», «CEUR Workshop Proceedings», «Радиотехника», «Вестник компьютерных и информационных технологий», «Автоматизация процессов управления» и других, а также в монографии, докладывались на различных всероссийских и международных конференциях.

В.П.: Да, это интересные серьезные проекты.

Коллеги я хотел бы предоставить слово представителю Кубанского государственного университета, известному специалисту в области анализа данных, автору многочисленных книг и учебных пособий профессору, д.т.н. Алексану Альбертовичу Халафяну.

В течение более многих лет Александр Альбертович и его ученики занимаются внедрением технологий анализа данных в промышленность, экономику, бизнес, медицину.

Им подготовлен комплекс книг по статистическим методам анализа данных на STATISTICA, включая современные методы управления качеством.

А.А.: Управление качеством более чем актуальная тема для российских предприятий, особенно в сфере массового производства.

Я бы выделил два блока вопросов: внедрение передовых компьютерных технологий и лучших мировых практик, чем занимается StatSoft, и подготовка специалистов по data science и управлению качеством в наших вузах.

К сожалению, большинство изделий различных отраслей народного хозяйства, которые выпускались (или пока еще выпускаются), не отличались высоким качеством и не были конкурентоспособными с зарубежными аналогами.

Многие, помнят недавнюю проблему с импортозамещением медицинских препаратов в фармацевтике, когда российские предприятия перешли к выпуску медицинских препаратов дженериков для лечения детей с редкими заболеваниями.

Применение этих препаратов сопровождалось нежелательными побочными эффектами, которые ухудшали и без того тяжелое состояние детей. В СССР проблему качества пытались решить, присваивая изделиям знак качества, если они соответствовали госту и имели исключительное качество.

Сейчас на многие изделия, в том числе и пищевой промышленности, госты либо отменены, либо не являются обязательными. 

На мой взгляд, введение стандартов качества, в частности, стандартов GMP (GoodManufacturingPractice), валидация и верификация процессов особенно важна для фармацевтической промышленности.

Этот вопрос не решишь лозунгами и благими пожеланиями, нужна серьезная планомерная работа, потому что речь идет о здоровье людей…

В.П.: Да, это серьезный вопрос. Производство лекарственных препаратов, контроль качества ключевых этапов производства от сырья до полупродуктов и продуктов актуальная задача для фармацевтической отрасли.

Я бы хотел обратить внимание на результаты StatSoft в этом направлении:

Цифровизация фармацевтического производства

StatSoft поставляет передовые решения в области валидации и верификации процессов в фармацевтической отрасли.

Решения на базе STATISTICA используются передовыми фармацевтическими европейскими компаниями:

"Успешная цифровизация фармацевтического производства CSL Behring – с помощью Statistica Enterprise: как вы можете успешно преобразовать управление данными и аналитику..."

А.А.: Важным вопросом является подготовка специалистов по анализу данных, искусственному интеллекту, написание учебных пособий…

Длительное (более 20 лет) сотрудничество с компанией StatSoft определило приоритеты факультета в выборе основного программного обеспечения при обучении студентов методам анализа данных – сначала использовали STATISTICA v.6, потом STATISTICA Advanced v.10, STATISTICA Advanced + QC v.10, сейчас STATISTICA Ultimate Academic for Windows 13.

Соответственно в учебном процессе при изучении разделов прикладной статистики были задействованы, в том числе и издания, в которых описана технология работы с модулями пакета и интерпретация результатов анализа.

При изучении статистических методов контроля качества основным изданием является учебное пособие «Промышленная статистика. Контроль качества. Анализ процессов. Планирование экспериментов в пакете STATISTICA». В данном пособии наиболее полно изложены разделы промышленной статистики – карты контроля качества, анализ процессов, планирование экспериментов, шесть сигма, реализованные в среде пакета  STATISTICA.

Для изучения возможностей статистического анализа, реализованных в программных продуктах Python, R, студенты пользуются учебными пособиями:

  • Митина О.А. Языки программирования для статистической обработки данных (R);
  • Пирская Л. В. Язык программирования R в среде AndroidStudio;
  • Чернышев С. А.  Основы программирования на Python;
  • Федоров Д. Ю.  Программирование на языке высокого уровня Python.

Замечу, что STATISTICA интегрируется c R, это позволяет использовать в анализе открытое ПО.

Хотел бы поблагодарить руководство StatSoft Russia за образовательные ресурсы, представленные на сайте StatSoft.ru, которые весьма популярны среди преподавателей и студентов.

В.П.: Коллеги, я хотел бы обратить внимание на важную книгу Алексана Альбертовича: Промышленная статистика. Контроль качества, анализ процессов, планирование экспериментов в пакете STATISTICA.

Книга имеет гриф Научно-методического совета по математике Министерства образования и науки РФ

Эта книга посвящена всестороннему описанию статистических методов, которые позволяют при ограниченных объемах анализируемых изделий с заданной степенью точности и достоверности судить о состоянии качества выпускаемой продукции.

Статистический анализ качества продукции и услуг обеспечивает принятие адекватных управленческих решений не на основе интуиции, а при помощи научных методов выявления закономерностей в накапливаемых массивах числовой информации.

В учебнике рассмотрены такие разделы промышленной статистики как: карты контроля качества; анализ процессов; шесть сигма; планирование экспериментов в среде широко известного во всем мире статистического пакета STATISTICA.

Дано подробное описание технологии работы с модулями программы, приведено множество примеров.

Издание адресовано студентам направлений экономика, управление качеством, стандартизация и метрология,  метрология, стандартизация и сертификация, аспирантам, научным работникам, преподавателям вузов, аналитикам и управленцам, а также всем, кто интересуется статистическими методами в управлении качеством.

В.П.: Какие технологии Вы использовали в проектах по анализу данных?

А.А.: Учитывая, что Краснодарский край трансформируется в аграрный курортно-рекреационный регион, актуальными являются вопросы контроля качества переработки сельскохозяйственной продукции и оказываемых услуг. Длительное время мы сотрудничаем с кафедрой аналитической химии, участвуя  в выполнении госзаказов, грантов. 

Присутствие на рынке большого количества некачественной винной продукции, в том числе и фальсификатов, актуализировало работу над проектом  «Разработка многоэлементного образа, оценка качества и региональной принадлежности некоторых белых и красных вин на разных стадиях их производства».

В.П.: Это чрезвычайно актуальное направление, качество продуктов питания напрямую зависит от стабильности и управляемости технологических процессов.

В этой связи хочу отметить наш проект с компанией Ролтон по созданию системы дегустации:

"Система дегустации. Решение для проведения сенсорных исследований в среде STATISTICA"

А.А.: Суть исследований, которые проводились под руководством д.х.н. З.А. Темердашева, сводилась к оценке качества вин, выявлению факторов, влияющих на органолептические свойства вин, установлению их сортовой и региональной  принадлежности по макро- и микроэлементному составу методами анализа данных.

Применение в проекте методов прикладной статистики и процедур машинного обучения Data Mining STATISTICA, включая деревья решений и нейронные сети, позволило решить широкий спектр задач:

  • Прогнозирование дегустационной оценки вин по концентрациям летучих соединений и аминокислот;
  • Определение по концентрациям летучих соединений класса качества вин в номинальной шкале – высокое, среднее, слабое, распознавание фальсификатов;
  • Сравнительная оценка роли летучих соединений, аминокислот и металлов в формировании органолептических свойств вин;
  • Исследование структуры взаимосвязи между концентрациями аминокислот и летучих соединений в формировании вкусовых характеристик вин;
  • Идентификация по концентрациям летучих соединений наименований вин и региона произрастания винограда, из которого произведено вино;
  • Оценка влияния осветления и стабилизации виноматериалов бентонитовыми глинами на формирование их «элементного образа» и идентификацию сортов;
  • Анализ элементного состава цепочки почва-виноград-вино, взаимосвязей концентраций элементов в указанных средах и их кластерной структуры;
  • Определение элементов-маркеров фрагментов ягоды винограда;
  • Определение оптимального состава смеси для производства купажированных вин;
  • Исследование влияния бинарных факторам на качество вин;
  • Реализация и сравнительный анализ деревьев решений, процедур обучения методов Data Mining в идентификации географического происхождения вин и прогнозировании их качества по элементному составу.

С применением методов машинного обучения разработано большое количество программных приложений, которые успешно презентовались на российских и зарубежных выставках.

Подготовлено более 30 статей по применению статистических методов в оценке качества вин, изданных в рецензируемых журналах (WoS, Scopus), в том числе и зарубежных изданиях первой квартили. Подготовлена к изданию монография «Прогностические модели химии качества вина».

В.П.: Что вносит цифровизация в процесс управления качеством?

А.А.: Цифровизация в госструктурах, в медицине, в быту, (например, интернет вещей), на производстве, в бизнес процессах и т.д. позволяет контролировать и управлять процессами. 

Цифровизация сопровождается накоплением огромных массивов данных, несущих в себе скрытые знания об объектах цифровизации и связанных с ними явлениях.  Скрытые потому, что увидеть их «невооруженным» взглядом невозможно. Выявить, описать эти знания можно при помощи средств анализа данных. Поверхностный или разведочный анализ данных позволяет увидеть общие закономерности в данных, например, основные статистики, распределение частот, аномалии и т.д.

В.П.: Управление качеством на основе данных – это мировой тренд…

Современные методы позволяют использовать 95% данных для всестороннего улучшения качества и нахождения причин брака…

А.А.: Да, именно так…

Глубокий анализ данных решает более сложные задачи. Например, построение методами прикладной статистики предсказательных вероятностно-статистических моделей, основанных на парадигме среднего, или регрессионных и классификационных моделей в виде программных кодов, сгенерированных методами Data Mining, кластеризацию объектов на группы однородностей,  классификацию по заранее заданным группам и др.

Цифровизация в сочетании с глубоким анализом данных позволяет принимать эффективные  управленческие решения на всех уровнях технологических процессов, совершенствуя их, добиваясь достижения наивысших показателей качества. 

В.П.: Что позволяют сделать нового методы машинного обучения и нейронные сети в сравнении с классическими картами контроля качества и 6 сигма?

А.А.: Чтобы сравнить эти подходы к проблемам управления качеством, хотелось бы сначала разграничить сферы их применимости.  Классические карты контроля качества, возможно, были первой попыткой к внедрению выборочного контроля с оценкой статистическими методами качества продукции массового промышленного производства.

Этот метод успешно применяется во всем мире уже почти 100 лет, так как впервые был предложен  У.Шухартом еще в 1924г.

После его усовершенствования в 1954г. И. Пейджем, карты контроля качества посредством визуализации параметров процесса в режиме реального времени, позволяют предсказывать разналадку технологического процесса и появление брака.

Как известно, концепция шесть сигма, разработанная Б. Смитом в корпорации Моторола в 1986г. в предположении, что размер изготавливаемого изделия соответствует нормальному распределению, указывает на предельно возможное среднеквадратическое отклонения номинального размера изделия, чтобы количество возможного брака было не более, чем 3,4 на 1 млн. изделий.

Таким образом, оба подхода построены на вычислении основных статистик линейных размеров изделий – среднего арифметического, стандартного отклонения, размаха и др. Но при первом подходе осуществляется непрерывный контроль технологического процесса, при втором регламентируются возможные отклонения от номинального значения. Применение статистических методов к управлению качеством продукции, как мне кажется, являются революционными событиями в развитии массового производства.

Естественно задачи управления качеством не исчерпываются многосерийным промышленным производством, когда качество определяется соответствием параметров изделий определенным величинам. Во многих случаях качество может определяться не одним критерием, а совокупностью параметров, или вовсе измеряться в номинальной (порядковой) шкале.

При этом, как правило, присутствуют явные, или скрытые факторы, влияющие на качество.  В этом случае, наряду с контролем качества, актуализируются задачи анализа качества, позволяющие построить интегрированный критерий качества,  выявить наиболее значимые факторы, влияющие на качество, прогнозировать качество независимо от того оценивается ли оно в номинальной, или количественной шкале и т.д.

Если накоплены данные по значениям количественных и качественных параметров в виде статистической выборки, характеризующих объекты, то методами машинного обучения, включая нейронные сети, можно решить перечисленные выше задачи.  При больших объемах данных целесообразно применение методов Data Mining, или технологии Big Data.

Таким образом, классические карты контроля качества, концепция шесть сигма и более современные методы машинного обучения и анализа данных имеют свои вполне определенные ниши в решении задач анализа, контроля и управления качеством.

В.П.: Что нового позволяет сделать IoT, интернет вещей, в управлении качеством?

А.А.: Искусственный интеллект с маниакальной настойчивостью приникает во все сферы человеческой деятельности, в том числе и предметы окружающего нас мира. Не будет ошибочным утверждение, что интернет вещей – это качественно иной порядок взаимоотношений человека с окружающей средой. Бытовые приборы, автомобили, дома и т.д., наделенные «интеллектом», переходят на новый уровень эффективного дистанционного управления, высвобождая у своего потребителя – человека время. Причем иерархия «умных» вещей будет постоянно возрастать – вслед за умными домами появятся умные города, регионы, государства, сообщества государств.

Но нужно отдавать себе отчет, что при этом и человек становится все более зависимым от интернета и, в лучшем случае, может разучиться совершать примитивные действия, в худшем случае отсутствие интернета может привести к управленческому коллапсу.

Способность умных вещей накапливать и передавать данные в хранилища позволит, применяя технологии   Big Data, совершенствовать контроль и управление не только умными вещами, но и человеческим сообществом в целом. Произойдут определенные трансформации во всех сферах деятельности человека – производственной, финансовой, образовательной, научной, в здравоохранении и т.д. Системы диагностирования человека – рентгеновские установки, магнитно-резонансные томографы, компьютерные томографы и т.д. станут «умными» – разработанные системы смогут не только делать изображение, но и находить и идентифицировать патологию, ставить предварительный прогноз. Новый импульс к развитию получит телемедицина, усовершенствуется процедура дистанционного консилиума сложных больных крупными медицинскими центрами и т.д.

Факультет пытается по мере своих возможностей участвовать в происходящих процессах, Кубанским государственным университетом подана заявка на грант РНФ «Построение нейросетевых моделей искусственного интеллекта обнаружения аневризмы сосудов головного мозга».

Реализация проекта позволит автоматизировать, а значит, и ускорить процесс диагностирования аневризм по изображениям компьютерной томографии головного мозга, уменьшить количество случаев не выявленной патологии, а значит повысить качество диагностирования.

На состоявшемся 23-25 сентября Международном салоне изобретений и новых технологий «НОВОЕ ВРЕМЯ», наша совместная разработка с врачами ККБ 1 «Использование технологий искусственного интеллекта для прогнозирования летального исхода больных с острым коронарным синдромом» награждена золотой медалью.

Участникам круглого стола и гостям предлагаю тему проекта по созданию системы «умного» мониторирования в медицине. Как пример, сейчас состояние больных печально известной коронавирусной инфекцией COVID-19 в реанимации контролируется мониторами, визуализирующими 3 параметра – пульс, артериальное давление и сатурацию в данный момент времени.

Медперсонал вынужден через определенные промежутки времени (каждые 3 часа) вручную переносить их в таблицы для прослеживания врачом динамики изменения созерцанием большого количества числовой информации. Естественно при таком примитивном способе обработки информации, загруженности врача и большого количества больных, можно не разглядеть в данных наметившийся тренд на изменение состояния больного, а постфактум констатировать его.

С другой стороны, применяя, например, принципы карт контроля качества, анализируя и сглаживая средние значения показателей и характеристик разброса за определенные промежутки времени, можно на мониторе показать не только текущее значение, но и линию тренда его предыстории с демонстрацией прогноза на заданный момент времени вперед.

Естественно наличие такой информации позволит врачу увидеть наметившееся изменение в состоянии больного до того, как это произойдет, принять соответствующее решение, что в итоге повысит качество медицинского обслуживания больных.

В.П.: Коллеги, я хочу передать слово Анне Владимировне Коваленко, доктору технических наук, доценту, заведующей кафедрой анализа данных и искусственного интеллекта Кубанского государственного университета.

Подготовка квалифицированных кадров в области data science и управления качеством является ключевым моментом. Именно люди создают новые технологии, без повышения качества образования нельзя решить вопрос развития промышленности.

Общаясь с представителями бизнеса, флагманами нашей индустрии, я всегда сталкиваюсь с вопросом: где найти кадры для решения задач цифровизации и управления качеством?

Компетенция специалиста является ключевым моментом…

А.В.: Коллеги рада приветствовать вас на нашем круглом столе, посвященном исключительно актуальной тематике.

Наша кафедра – кафедра анализа данных и искусственного интеллекта (КАДИИ) получила свое название в январе 2021 г., до этого она называлась кафедрой интеллектуальных информационных систем (КИИС), которая в свою очередь получила название в 2011 г. в результате преобразования кафедры высоких технологий прогноза и предупреждения чрезвычайных ситуаций. Первым заведующим КИИС стал Костенко Константин Иванович, кандидат физико-математических наук, доцент.

Затем обязанности заведующего кафедрой исполнял Юнов Сергей Владленович, доктор педагогических наук, кандидат физико-математических наук, профессор, с сентября 2020 г. кафедру возглавила Коваленко Анна Владимировна, доктор технических наук, кандидат экономических наук, доцент.

КАДИИ ведёт подготовку бакалавров, магистров и аспирантов по многим направлениям.

Это бакалавриат: 01.03.02 «Прикладная математика и информатика», все профили подготовки: «Математическое и информационное обеспечение экономической деятельности», «Программирование и информационные технологии», «Математическое моделирование в естествознании и технологиях»; 02.03.03 «Математическое обеспечение и администрирование информационных систем», профиль «Технология программирования»; 09.03.03 «Прикладная информатика», профиль «Прикладная информатика в экономике». Магистратура: 01.04.02 «Прикладная математика и информатика», профили подготовки: «Математическое и информационное обеспечение экономической деятельности», «Математическое и программное обеспечение вычислительных систем», «Математическое моделирование». Аспирантура: 09.06.01 «Информатика и вычислительная техника», профиль 05.13.18 «Математическое моделирование, численные методы и комплексы программ».

В настоящее время кафедра насчитывает 9 докторов наук и 6 работодателей, в состав которых входят высоко профессиональные специалисты-практики, например, Кадурин А.А. и Кравец Л.С.

Основные направления научных исследований кафедры:

  • Системы искусственного интеллекта, глубокое машинное обучение;
  • Анализ данных (многомерный статистический анализ; Data Mining, Big Data);
  • Проектирование и разработка интеллектуальных информационных систем, информационная безопасность;
  • Математическое и компьютерное моделирование физико-химических задач;
  • Теория и методика преподавания информационно-коммуникационных технологий, профессионального образования.

Дисциплины, которые читаются на  нашей кафедре:

  1. Системный анализ и принятие решений – используется пакет STATISTICA;
  2. Специальные разделы анализа данных (новый) – используется пакет STATISTICA;
  3. Добыча данных (Data Mining) (новый) – используется пакет STATISTICA;
  4. Проектирование и разработка интеллектуальных информационных систем – используются пакеты STATISTICA и Матлаб;
  5. Интеллектуальные системы и технологии – используется среда Эйдос;
  6. Использование методов машинного обучения и искусственного интеллекта для социально-экономического анализа – используются пакеты Статистистика, Матлаб и Python;       
  7. Разработка систем искусственного интеллекта (новый) – используется пакет STATISTICA;
  8. Big Data (новый);
  9. Современные методы биржевой торговли (новый);
  10. Многомерный статистический анализ – используется STATISTICA;   
  11. Язык программирования R (новый);
  12. Эконометрика – используется пакет STATISTICA;  
  13. Системы искусственного интеллекта (новый) – используются пакеты STATISTICA и Матлаб;  
  14. Цифровой маркетинг (новый);
  15. Машинное обучение и анализ данных (новый) – используются пакеты STATISTICA, Матлаб и Python.   

В планах развития кафедры на 2021-2025 годы стоит существенное повышение таких показателей кафедры, как объем привлеченных средств, публикационная активность, эффективность подготовки кадров высшей квалификации и достижение лидирующих позиций среди кафедр Кубанского государственного университета.

Мы планируем максимально использовать опыт и передовые технологии компании StatSoft.

Кроме того, планируется организовать более тесное эффективное и взаимовыгодное сотрудничество с предприятиями и учреждениями Краснодарского края (Роснефть, Мегафон, Табрис, Тандер, Агрокомплекс, Сбербанк и др.) посредством привлечения сотрудников этих организаций к образовательному процессу, а сотрудников кафедры к решению научно-практических задач этих предприятий.

А.А.: Мы хотели бы максимально привлекать StatSoft к реализации наших проектов…

В.П.: С удовольствием примем участие в совместных проектах.

Коллеги, StatSoft внедряет лучшие мировые практики, технологии, которые апробированы в мире и приносят значимый эффект, см.

"Цифровая трансформация и инновации со StatSoft"

"Управление данными"

"Компания TIBCO названа лидером в магическом квадранте Gartner среди решений Data Science и Machine Learning платформ"

Современное управление качеством это синтез различных технологий, включая виртуализацию, потоковую аналитику, добычу данных, классический data science и машинное обучение.

Мир технологий анализа данных стремительно развивается, для управления качеством данные нужны здесь и сейчас, необходимы решения, обеспечивающие нахождение причин потери качества, повышения управляемости технологических процессов.

Наработанные StatSoft кейсы, примеры реальных внедрений открывают широкие перспективы.

Именно в наших совместных действиях мы сможем добиться максимального эффекта.

Уверен, наш круглый стол будет способствовать развитию России и решению тех задач, которые стоят перед российской экономикой.

В вопросе подготовки квалифицированных кадров в области data science важным аспектом является вовлечение студентов и аспирантов в исследовательскую работу уже на ранних стадиях обучения.

Здесь накоплен большой опыт, который предлагаю обсудить.

Ю.Е.: Я бы хотела передать слово нашему аспиранту Санталову Антону Александровичу. Он занимается вопросами применения нейронных сетей для диагностики состояния и управления сложными техническими системами, в частности -  гидроагрегатами.

А.А.: Вопросами диагностики гидроагрегата с применением нейронных сетей я начал заниматься еще в рамках выпускной работы в бакалавриате, затем продолжил в магистратуре, и сейчас, будучи аспирантом, продолжаю эти исследования.

Исследуется эффективность применения нейросетевых методов для вибродиагностики гидроагрегата.

При использовании кросс-валидации исходная выборка разбивается на несколько частей.

Качество классификации оценивается по тестовой выборке. Для оценки эффективности диагностики использовались три разных критерия качества: средняя ошибка на тестовой выборке, площадь под кривой ошибок и F-мера. Практическая реализация поставленной задачи проводилась как в пакете Matlab, так и в STATISTICA.

При обнаружении или прогнозировании отклонения в процессе регулирования, расцениваемого как неисправное состояние, необходимо провести корректировку настроек в системе управления агрегатом.

Традиционно для регулирования гидротурбин используются системы автоматического управления, включающие в себя ПИД-регуляторы.

Регулятор сообщает рабочим органам гидротурбины управляющее воздействие, получаемое из сигнала рассогласования.

В нашей работе при разработке адаптивного регулятора гидротурбины использовались нейросетевые методы. Полученные результаты демонстрируют эффективность настройки коэффициентов с помощью регулятора, включающего в себя нейросетевой блок. Недостатком разработанной системы регулирования является необходимость многократного изменения значения поддерживаемой мощности при настройке коэффициентов. Предложены направления дальнейшей работы по совершенствованию регулятора, так что исследование продолжается.

Ю.Е.: Наша студентка, магистрант Наталья Александровна Ломовцева расскажет о своей работе.

Н.А.: Вопросами разработки роботов наш университет занимается давно. Команда робототехников «RoboLife» УлГТУ заняла первое место на Всероссийском робототехническом фестивале «Робофест-2020». В состав команды вошли студенты кафедры «Вычислительная техника» факультета информационных систем и технологий  под руководством декана ФИСТ Кирилла Валерьевича Святова.

Команда разрабатывала автономного мобильного робота, который, перемещаясь по лабиринту, поражает мишени лазерной пушкой и реагирует на попадания лазерных выстрелов мишеней в робота.

Наша задача состояла в том, чтобы по показаниям ультразвуковых датчиков для измерения расстояний, расположенных на роботе, спрогнозировать направление перемещения робота. Это задача многоклассовой классификации. Такая задача решается методами машинного обучения, или обучения по прецедентам. Для проведения исследования была разработана программа, обеспечивающая разбиение выборки на обучающую и тестовую части в заданном соотношении, проведение кросс-валидации, использование трех различных мер качества – процента ошибок на тестовой выборке, F-меры (применяется при несбалансированных данных, когда информации об одном из состояний объекта существенно меньше, чем о других состояниях) и матрицы неточностей,  машинное обучение с применением различных методов многоклассовой классификации: базовых методов (наивный байесовский классификатор, линейный дискриминантный анализ, логистическая регрессия, метод опорных векторов, дерево решений, метод k ближайших соседей), композиционных методов (случайный лес и адаптивный бустинг), агрегированных методов, отбор значимых показателей, прогнозирование перемещения робота по полученной информации о показаниях датчиков.

Многие из этих методов реализованы и в системе STATISTICA. C помощью программы STATISTICA исследовалось наличие корреляционных связей для решения вопроса о том, какие из факторов или часть из них можно было бы удалить.

Также в системе STATISTICA проводилась оценка качества разработанной программы. Лучший результат классификации показал случайный лес. Его процент ошибок на тестовой выборке составил в разработанной программе 1%, а в системе STATISTICA – 2,75%. Проведенное исследование показало, что многоклассовая классификация с помощью машинного обучения обеспечивает достаточно качественное прогнозирование перемещений робота по результатам показаний датчиков расстояний. Рассмотренный подход может быть использован и при диагностике сложных технических систем, когда необходимо оценить по результатам наблюдений за показателями функционирования, в каком из множеств состояний находится объект.

В.П.: Очень интересные работы, они показывает, что студенты и аспиранты под руководством опытных преподавателей могут активно включаться в исследовательский процесс и работать на передовом уровне современных аналитических технологий.


Новости в образовании

‹‹
››
ПнВтСрЧтПтСбВс


                info@statsoft.ru         +7 (495) 787-77-33      +7 (499) 674-06-15          STATISTICA Data Miner 13.3 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia
1999-2022

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта