STATISTICA Data Miner Recipes (или Мастер Data Mining) представляет собой пошаговый процесс:
Получение данных;
Подготовка/модификация данных;
Выполнение вычислений;
Просмотр результатов;
Сохранение/Внедрение.
Файл проекта Data Miner Recipe может быть создан и сохранен на любом шаге процесса, а также может быть внедрен в STATISTICA Enterprise для скоринга.
Общей тенденцией в Data Mining является усиление акцента на решениях, основанных на простых аналитических процессах, а не на создании все более сложных общих аналитических инструментов.
STATISTICA Data Miner Recipe (SDMR) предоставляет интуитивно понятный графический интерфейс, позволяющий, даже при недостатке опыта в добыче данных, выполнять аналитический процесс шаг за шагом, как по рецепту. Благодаря этому интуитивно понятному интерфейсу Вы можете решать различные задачи, связанные с добычей данных, такие как регрессия, классификация и кластеризация. Другие "рецепты" могут быть построены быстро как пользовательское решение. Готовые шаблоны могут быть сохранены и внедрены, как проект для обработки новых данных.
STATISTICA Data Miner Recipe охватывает весь процесс добычи данных – от запросов к внешним базам данных до окончательного внедрения решения – и, обычно, состоит из следующих шагов.
1. Получение данных
Получение данных из таблиц STATISTICA, табличных файлов различных форматов или через интерфейс Обработка данных на месте (In-place Database Processing – IDP).
2. Чистка данных и удаление избыточных предикторов
Эффективные и гибкие методы создания выборок данных (простые, стратифицированные, систематические и другие типы выборок);
Больше гибких способов для определения и обработки пропущенной информации;
Нахождение выбросов (нетипичных значений);
Преобразование данных до выполнения последующих шагов;
Выявление и устранение избыточных предикторов.
3. Выявление важных предикторов из большого множества предикторов, тесно связанных с зависимыми (целевыми или результирующими) переменными
Отбор признаков для выборок большого объема (тысячи переменных);
Выявление важных взаимодействий между предикторами с использованием методов, основанных на деревьях.
4. Создание множества приемлемых моделей
Широкий выбор передовых методов предсказательной добычи данных;
Выгрузка задач, требующих высокой нагрузки центрального процессора, на сервер STATISTICA Enterprise Server, что позволяет освободить ваш локальный компьютер для выполнения других задач.
5. Выполнение автоматической оценки для определения оптимальной по производительности и сложности модели
6. Внедрение модели для обработки новых данных с использованием встроенного эффективного инструментария
За несколько щелчков мыши программа проведет Вас через полный аналитический процесс – от определения исходных данных и анализа проблемы, чистки и подготовки данных, к построению моделей, вплоть до окончательного выбора модели и ее использования.
Большинство вычислительных проблем Data Mining будут решены автоматически в STATISTICA Data Miner Recipes, который позволяет быстро перейти от определения задачи к её решению, даже если Вы – новичок. Программа "применит и испытает" ряд передовых алгоритмов добычи данных и автоматически определит, какой подход является наиболее успешным.
Таким образом, методология и пользовательский интерфейс STATISTICA Data Miner Recipes позволяют использовать самую богатую коллекцию алгоритмов интеллектуального анализа и добычи данных в едином пакете для решения Ваших задач.
Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
|
© StatSoft Russia |
StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран. |