Data Mining: Подробнее о STATISTICA Data Miner

Подробнее о методах Data Mining

Подробнее о визуальном Data Mining

Подробнее о доступе к данным

Подробнее о предварительной обработке данных

Подробнее о пользовательских интерфейсах

Подробнее о внедрении моделей

Подробнее о платформах, интеграции решений в STATISTICA

Вывод


Подробнее о методах Data Mining

STATISTICA Data Miner включает всеобщие реализации деревьев, растущих деревьев, случайных лесов классификации и регрессии, автоматизированный поиск нейронных сетей, метод K ближайших соседей, метод машинного обучения на опорных векторах, различные методы кластерного анализа, сети Кохонена, метод частных наименьших квадратов PLS, обобщенные линейные модели, алгоритмы анализа последовательностей, ассоциаций и связей для транзакций БД.

Методы предназначены для автоматической оценки конкурентных моделей, для вычисления среднего прогноза всех моделей.

Применяется расширенное ненормальное и многомерное моделирование и оптимизация для получения окончательной модели Data Mining. К примеру, для оптимизации кампании, процесса/производства.

В дополнение, интегрирует различные методы и технологии в проекты Data Mining – карты контроля качества, анализ пригодности процесса, анализ Вейбулла, анализ мощности, линейные и нелинейные модели. Все процедуры STATISTICA могут быть использованы в проектах Data Mining, это не требует программирования или дополнительных разработок.

Все процедуры STATISTICA могут быть запрограммированы, например, с помощью макросов STATISTICA Visual Basic. Программы также могут использовать сторонние библиотеки и приложения, например алгоритмы, доступные в популярном пакете R.


Подробнее о визуальном Data Mining

Все уникальные и непревзойденные графические возможности STATISTICA доступны для Data Mining, основанном на исходных данных, полученных промежуточных данных и итоговых таблицах результатов.

Доступно средство Кисть, масштабирование, выделение на нескольких графиках.

Доступны сотни типов графиков для визуализации данных после чистки, бурения и расслоения.

Создание итоговых и сравнительных графиков даже для больших источников данных.


Подробнее о доступе к данным

STATISTICA Data Miner обладает способностью обрабатывать одновременно несколько потоков данных в едином процессе; объединять, выравнивать, агрегировать данные.

STATISTICA Data Miner оптимизирован для обработки очень больших выборок данных, и включает в себя уникальные возможности предпросмотра более миллиона параметров/переменных и/или создания стратифицированной или простой случайной выборки с использованием DIEHARD-сертифицированной процедуры создания случайной выборки.

STATISTICA Data Miner предоставляет высоко оптимизированный интерфейс чтения (и записи) БД большого объема, включающий технологию IDP (In-Place Database Processing). Данная технология позволяет асинхронно считывать информацию непосредственно с удаленных серверов баз данных (с использовании распределенной обработки, если она поддерживается сервером), минуя необходимость "импортировать" данные и создавать локальную копию.

Практически все широко используемые форматы файлов могут быть импортированы и экспортированы (включая текстовые, Excel, SAS, SPSS, а также большинство форматов баз данных).

Также поддерживаются разнообразные специальные форматы баз данных, такие как OSI PI (применение методов Data Mining для оптимизации непрерывных процессов).


Подробнее о предварительной обработке данных

STATISTICA Data Miner предоставляет инструменты для автоматического обнаружения и обработки выбросов, нестандартных наблюдений, разреженных данных.

Эффективный автоматический Отбор признаков обеспечивает быстрое обнаружение важных переменных (входных параметров) даже среди более миллиона возможных предикторов (параметров).

Различные инструменты позволяют обрабатывать пропущенные данные, например автоматически заменяя их, используя метод k-ближайших соседей.

Эффективные инструменты для оптимального объединения предикторов, категорий.

Опционально предоставляется функционал для выравнивания, объединения, агрегирования множественных источников данных, например, временных данных процессов группового изготовления, баз данных транзакций.

Эффективный язык трансформирования и редактор позволяют преобразовывать данные за один проход (включая сдвиг, операции с датами и временем, текстовым операциям, выражения с логическими операторами).

STATISTICA Data Miner представляет собой открытую архитектуру с неограниченными возможностями автоматизации, поддерживающую пользовательские расширения (например, с использованием Visual Basic (встроенного), Java или C/C++/C#), что позволяет пользователю применить даже самые сложные алгоритмы предварительной обработки данных или использовать сторонние библиотеки, такие как популярный пакет R.


Подробнее о пользовательских интерфейсах

STATISTICA Data Miner предлагает выбор пользовательских интерфейсов и функциональных возможностей, гибко переключаемых между собой в зависимости от задачи. Благодаря этому специальные интерфейсы обеспечивают построение последовательности аналитических процессов, со стандартными «рецептами» Data Mining, или одновременное выполнение интерактивных специальных анализов с несколькими входами данных и промежуточными результатами, с использованием любой комбинации из сотен методов и графиков.

STATISTICA Data Miner предоставляет простой в использовании, drag-and-drop пользовательский интерфейс для создания последовательности аналитических процессов, которые могут быть использованы даже новичками.

Программа также включает в себя альтернативный, простой в использовании, пользовательский интерфейс типа «Мастер», позволяющий строить модели согласно «рецептам» и передовым практикам Data Mining (Data Miner Recipes).

Для детального и комплексного анализа, программа предоставляет мощные, интерактивные инструменты исследования данных (бурение, расслоение), включая широкий набор интерактивных разведочных средств визуализации.

Все функциональные возможности STATISTICA Data Miner (как и всех продуктов STATISTICA) также доступны в виде программного интерфейса, как внутри приложения (с помощью STATISTICA Visual Basic), так и из других приложений (C++, C#, VB.NET).

Результаты могут быть сохранены в виде отчетов в формате документов MS Word, PDF, таблиц Excel или в высокоэффективном формате Рабочей книги STATISTICA.


Подробнее о внедрении моделей

STATISTICA Data Miner содержит множество функциональных возможностей для гибкого внедрения прогностических моделей.

Программа может генерировать PMML (Predictive Models Markup Language) файлы, основанные на XML, для прогнозирования, предсказательной классификации или кластеризации больших объемов данных.

Функционал для генерации предсказательных моделей в коде языков C (C++,C#), Java, SAS или в формате хранимых процедур баз данных (версия 9.1 или выше).

STATISTICA Data Miner может также записывать предсказанные значения, классификации, вероятности классификации, остатки прогнозирования, принадлежность к кластерам и её вероятности, и другие результаты непосредственно во внешние базы данных для последующих анализов, выборок, с помощью эффективной технологии IDP (In-Place Database Processing) чтения/записи информации из/во внешние базы данных.

Инструмент STATISTICA Data Miner, Быстрое внедрение (Rapid Deployment), позволяет строить ROC кривые (показывающие соотношение между "истинными" и "ложными" предсказаниями модели) и карты прибыли (суммирующие стоимость и оцененную прибыль, основанную на использовании моделей) для оценки внедрения моделей Data Mining.

Data Mining, Карта прибыли


Подробнее о платформах, интеграции решений в STATISTICA

STATISTICA Data Miner можно запустить как на рабочей станции, так и на сервере.

Для серверной установки доступен веб-интерфейс.

Настроенный на рабочей станции анализ (проект Data Mining, "рецепт" Data Mining) может быть выгружен на сервер для обработки. Результаты будут получены после завершения выполнения анализа на сервере.

STATISTICA Data Miner полностью интегрирован со всеми решениями STATISTICA.

Серверная установка STATISTICA Data Miner может использовать клиент-серверную архитектуру WebSTATISTICA для параллельного вычисления и расширенной балансировки нагрузки (между серверами).

При использовании платформы STATISTICA Enterprise, модели Data Mining для прогнозирования (или скоринга) могут быть сохранены непосредственно в защищенном хранилище отчетов, шаблонов анализов и т. д., и опубликованы для авторизованных пользователей по всему предприятию.

Продукты STATISICA позволяют легко интегрировать технологии анализа данных и Data Mining в корпоративную аналитическую систему для создания интеллектуальных систем мониторинга, скоринга и т. д.


Вывод

STATISTICA Data Miner является уникальным приложением с точки зрения полноты, мощности, технологичности, гибкости имеющихся пользовательских интерфейсов.

Никакие другие приложения Data Mining не позволят Вам так быстро преобразовать "сырые данные" в эффективные, действенные решения и знания за счет применения передовых методов и алгоритмов.

‹‹
››
ПнВтСрЧтПтСбВс


                info@statsoft.ru         +7 (495) 787-77-33      +7 (499) 674-06-15          STATISTICA 13.3 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia
1999-2023

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта