Уникальный курс "Основы Data Mining и Text Mining в системе STATISTICA"

Уникальный курс, синтезирующий методологию, современный подход и стратегии применения методов Data Mining для решения актуальных задач в различных областях: маркетинге, финансах, телекоммуникациях, медицине, геологии и др.

Данный курс особенно полезен тем, кто желает научиться осознанно использовать технологии Data Mining для решения практических задач классификации, регрессии, построения предсказательных моделей (predictive analytics).

Обучение проводится на уникальных кейсах StatSoft или на основе данных слушателя. Для понимания теории не требуется специальных математических знаний, все необходимые понятия даются в процессе курса.

Место и время проведения мероприятия:

Санкт-Петербург: 23-24 октября 2014 г., 15.00-19.00 
"Гостиница Октябрьская", Санкт-Петербург, Лиговский проспект, дом 10, комната переговоров 4


Программа курса

  1. Что такое Data Mining (интеллектуальный анализ данных): парадигма Data Mining,
    общая концепция Data Mining

  2. Импорт, подготовка и интерактивное исследование данных

    • Связь с базами данных

    • Сначала данные нужно увидеть: визуализация данных

    • Чистка и верификация данных: пропущенные данные, обработка выбросов,
      повторных наблюдений, некорректных значений и др.

    • Интерактивное бурение и расслоение данных

  3. Решение задачи классификации

    • Ключевые понятия и определения

    • Деревья принятия решений

      • Деревья классификации и регрессии (С&RT)

      • CHAID (Chi-squared Automatic Interaction Detection)

      • Растущие деревья (Boosted trees)

      • Случайные леса (Random forests)

    • Методы машинного обучения (machine learning)

      • Метод опорных векторов

      • Байесовские методы

      • Метод k-ближайших соседей

  4. Решение задачи регрессии
    • Ключевые понятия и определения

    • Множественная линейная регрессия

    • Деревья принятия решений

    • Моделирование сплайнами

  5. Текстовая добыча данных

    • Ключевые понятия и определения

    • Препроцессинг и индексация текстов

    • Применение фильтров, стоп-листов,  морфологических алгоритмов

    • Использование готовой модели для анализа новых документов

    • Анализ контента сайтов (web-crawling)

  6. Нейронные сети

    • Ключевые понятия и определения

    • Архитектура сетей, обучение

    • Использование нейронных сетей в задачах классификации и регрессии

  7. Case Studies

  8. Вопросы и ответы

Регистрация завершена.


Длительность курса

10 академических часов, курс разбивается на 2 рабочих дня

Записаться   Календарь курсов


См. также: Бесплатный семинар «Современные технологии прогнозирования, Data Mining и Text Mining на STATISTICA» в Санкт-Петербурге


Взаимодействие
‹‹
››
ПнВтСрЧтПтСбВс


Полезные ссылки

                info@statsoft.ru         +7 (495) 787-77-33      +7 (499) 674-06-15          STATISTICA 13.3 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia
1999-2023

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта