STATISTICA Data Miner предоставляет наиболее полный набор статистических, поисковых и визуализационных методов, доступных на рынке, включая передовые и высокоэффективные нейронные сети/машинное обучение и классификацию методов.
Весь аналитический функционал STATISTICA доступен для Data Mining в виде более 300 узлов (процедур), которые могут быть выбраны в структурированном, настраиваемом браузере узлов и добавлены в рабочее пространство проекта Data Mining.
* Модули Data Miner могут также быть приобретены по отдельности
Специализированные преднастроенные шаблоны проектов Data Mining могут быть классифицированы по 5 следующим категориям.
STATISTICA Data Miner предоставляет большое количество узлов (процедур) для создания разведочных графиков, вычисления описательных статистик, табуляций
Специализированный модуль STATISTICA Интерактивное бурение доступен для интерактивного исследования данных путем разбиения на отдельные переменные, категории и диапазоны значений этих переменных. К примеру, вы можете задать разбиение по признаку Пол для изучения распределения переменной Доход только для женщин. Далее вы можете разбить данные по группам доходов, исследуя выбранные переменные, для женщин с выбранным диапазоном уровня доходов.
Уникальная особенность модуля STATISTICA Интерактивное бурение – возможность разбиения и отмены разбиения переменных и категорий в любом порядке. Так вы можете отменить разбиение переменных по признаку Пол и изучать графики и статистики для группы лиц с выбранным диапазоном уровня дохода, но уже для мужчин и женщин вместе.
Другая уникальная возможность модуля STATISTICA Интерактивное бурение – разнообразие методов категоризации.
Таким образом, модуль STATISTICA Интерактивное бурение обеспечивает потрясающую гибкость "бурения и расслоения" данных. Он может быть применен к необработанным данным, соединениям с базой данных для обработки в удаленных БД, или любым промежуточным результатам, полученным в проекте STATISTICA Data Miner.
STATISTICA Data Miner предоставляет самый широкий выбор методов классификаций для Data Mining, включая:
обобщенные линейные модели;
деревья классификации;
общие модели деревьев классификации и регрессии;
общие CHAID модели;
методы кластерного анализа (включающие методы k-средних и EM, с V-кратной кросс-проверкой для автоматического определения оптимального количества кластеров);
общие модели дискриминантного анализа (включая возможность выбора лучшего подмножества предикторов).
Кроме того в STATISTICA Data Miner доступны многочисленные нейросетевые классификаторы (инструмент STATISTICA Automated Neural Networks). Они могут быть использованы как в сочетании, так и в конкуренции с другими классическими методами классификации.
Внедрение. Программа включает в себя функционал генерации кода форматов C, C++, C#, STATISTICA Visual Basic, PMML (XML-синтаксис) для внедрения окончательных моделей в пользовательские приложения. Модели также доступны для внедрения сразу после завершения обучения. Таким образом, все, что вам нужно сделать для вычисления предсказанных результатов классификации – это подключить источник новых данных к специальному узлу Внедрения проекта STATISTICA Data Miner.
STATISTICA Data Miner предлагает широкий выбор инструментов для построения внедряемых моделей Data Mining, основанных на линейных, нелинейных и нейросетевых методах, а также инструментах для исследования данных. Также пользователь может построить модель для прогноза на основе общих многомерных методов.
STATISTICA предлагает полный набор методов от линейных и нелинейных регрессионных моделей, обобщенных линейных и обобщенных аддитивных моделей, деревьев регрессии и CHAID, до расширенных методов нейронных сетей и многомерных адаптивных регрессионных сплайнов (MARSplines).
Кроме того STATISTICA Data Miner включает методы, которые обычно не содержатся в ПО для Data Mining, такие как:
метод частичных наименьших квадратов (для отбора признаков);
анализ выживаемости (для анализа цензурированных данных, например, для медицинских исследований или исследований надежности и контроля качества);
метод моделирования на основе структурных уравнений (для построения и оценивания подтверждающих линейных моделей);
анализ соответствий (для анализа структуры сложных таблиц);
методы факторного анализа и многомерного шкалирования (для исследования структуры в данных высокой размерности);
и многие другие.
Внедрение. Программа включает в себя функционал генерации кода форматов C, C++, C#, STATISTICA Visual Basic, PMML (XML-синтаксис) для внедрения законченных решений в пользовательские приложения. Модели также доступны для внедрения сразу после завершения обучения. Все, что вам нужно сделать для вычисления предсказанных значений – это подключить источник новых данных к специальному узлу Внедрения проекта STATISTICA Data Miner.
STATISTICA Data Miner включает широкий набор традиционных методов прогнозирования (включая ARIMA, экспоненциальное сглаживание с сезонными компонентами, спектральное разложение Фурье, сезонную декомпозицию, полиноминальный и регрессионный анализ лагов), а также методы нейронных сетей для временных рядов.
Внедрение. Прогноз может быть автоматически вычислен для множества моделей в проекте Data Mining, и добавлен на единственный график для сравнительной оценки. К примеру, вы можете вычислить и сравнить предсказанные результаты множества ARIMA моделей, различных методов экспоненциального сглаживания с сезонными и несезонными составляющими, нейросетевых архитектур.
Этот инструмент включает самый обширный набор нейросетевых методов, доступных на рынке. Этот мощный компонент STATISTICA Data Miner предлагает инструменты, подходящие для решения практически любой задачи Data Mining (включая классификацию, обнаружение скрытых структур, прогнозирование).
Одной из уникальных особенностей мастера нейронных сетей является интеллектуальный выбор решения проблемы и автоматический мастер, использующий методы искусственного интеллекта для решения наиболее важных проблем, возникающих при нейросетевом анализе (таких как выбор лучшей архитектуры сети и лучшего подмножества переменных).
Мастер предлагает широкий набор передовых архитектур нейронных сетей, процедур и высоко оптимизированных алгоритмов, включающих:
многослойный персептрон;
радиальную базисную функцию;
вероятностные нейронные сети;
обобщенные регрессионные нейронные сети;
самоорганизующиеся карты;
линейные модели;
сети основных компонент;
кластерные сети.
Также могут быть оценены ансамбли сетей этих архитектур.
Методы оценки включают:
метод обратного распространения;
сопряжение градиентов;
квази Ньютон;
метод Левенберга-Марквардта;
быстрое распространение;
дельта-бар-дельта;
LVQ;
алгоритмы отсечения;
и другие.
Имеются функциональные возможности перекрестной проверки, бутсрепинга, создания подвыборок, анализа чувствительности и др.
Внедрение. STATISTICA Automated Neural Networks содержит возможность генерации кода форматов C, C++, C#, и STATISTICA Visual Basic как для одной или нескольких обученных сетей, так и для ансамблей сетей. Этот код может быть быстро внедрен в вашу собственную программу для дальнейшего применения. В дополнение, все обученные нейронные сети и ансамбли нейронных сетей могут быть сохранены для последующего вычисления предсказанных значений или классификации новых данных. Модели также доступны для внедрения сразу после завершения обучения. Все, что вам нужно сделать для вычисления предсказанных значений – это подключить источник новых данных к специальному узлу Внедрения проекта STATISTICA Data Miner.
Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
|
© StatSoft Russia |
StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран. |