Запрос прайс-листа STATISTICA

Систематическое введение в современный Data Mining и Text Mining

Уникальный курс, синтезирующий методологию, современный подход и стратегии применения методов Data Mining для решения актуальных задач в различных областях: маркетинге, финансах, телекоммуникациях, медицине, геологии и др.

Данный курс особенно полезен тем, кто желает научиться осознанно использовать технологии Data Mining для решения практических задач классификации, регрессии, построения предсказательных моделей (predictive analytics).

Обучение проводится на уникальных кейсах StatSoft или на основе данных слушателя. Для понимания теории не требуется специальных математических знаний, все необходимые понятия даются в процессе курса.

См. также презентацию "Уникальные технологии Data Mining"


Цель курса

Познакомить и дать основные навыки работы с методами Data Mining для решения прикладных задач.


Для кого этот курс?

Данный курс особенно полезен тем, кто желает научиться осознанно использовать технологии Data Mining и извлекать пользу в конкретных областях: маркетинге, финансах, телекоммуникациях, медицине, геологии и др.


Подробнее о системах
STATISTICA Data Miner
STATISTICA Automated Neural Networks

Программа курса

  1. Что такое Data Mining (интеллектуальный анализ данных): парадигма Data Mining, общая концепция Data Mining

  2. Импорт, подготовка и интерактивное исследование данных

    • Связь с базами данных

    • Сначала данные нужно увидеть: визуализация данных

    • Чистка и верификация данных: пропущенные данные, обработка выбросов, повторных наблюдений, некорректных значений и др.

    • Интерактивное бурение и расслоение данных

  3. Решение задачи классификации

    • Ключевые понятия и определения

    • Деревья принятия решений

      • Деревья классификации и регрессии (С&RT)

      • CHAID (Chi-squared Automatic Interaction Detection)

      • Растущие деревья (Boosted trees)

      • Случайные леса (Random forests)

    • Методы машинного обучения (machine learning)

      • Метод опорных векторов

      • Байесовские методы

      • Метод k-ближайших соседей

    • Дискриминантный анализ

    • Логистическая регрессия

  4. Решение задачи кластеризации

    • Иерархическое объединение

    • Метод k-средних

    • EM-алгоритм

  5. Решение задачи регрессии

    • Ключевые понятия и определения

    • Множественная линейная регрессия

    • Деревья принятия решений

    • Моделирование сплайнами

  6. Правила ассоциаций (Association rules)

    • Технология нахождение групп товаров, покупаемых в одной корзине

    • Интерпретация результатов

    • Анализ последовательностей (Sequence analysis)

  7. Текстовая добыча данных

    • Ключевые понятия и определения

    • Препроцессинг и индексация текстов

    • Применение фильтров, стоп-листов, морфологических алгоритмов

    • Использование готовой модели для анализа новых документов

    • Анализ контента сайтов (web-crawling)

  8. Нейронные сети

    • Ключевые понятия и определения

    • Архитектура сетей, обучение

    • Использование нейронных сетей в задачах классификации и регрессии

  9. Case Studies

  10. Вопросы и ответы


Длительность курса

12 академических часов, курс обычно разбивается на 3 рабочих дня


Курс читается как индивидуально, так и в группах.

Ближайшие групповые занятия по курсу:

23-25 августа

16-18 октября

29 ноября - 1 декабря

Записаться   Календарь курсов




Стоимость курса                                  Условия и порядок обучения

Другие курсы по Data Mining                Все курсы лекций

‹‹
››
ПнВтСрЧтПтСбВс


info@statsoft.ru       (495) 787-77-33       (499) 674-06-15       STATISTICA Data Miner 13.2 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia
1999-2017

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта