Уникальный курс, синтезирующий методологию, современный подход и стратегии применения методов Data Mining для решения актуальных задач в различных областях: маркетинге, финансах, телекоммуникациях, медицине, геологии и др.
Данный курс особенно полезен тем, кто желает научиться осознанно использовать технологии Data Mining для решения практических задач классификации, регрессии, построения предсказательных моделей (predictive analytics).
Обучение проводится на уникальных кейсах StatSoft или на основе данных слушателя. Для понимания теории не требуется специальных математических знаний, все необходимые понятия даются в процессе курса.
Место и время проведения мероприятия:
Санкт-Петербург: 23-24 октября 2014 г., 15.00-19.00
"Гостиница Октябрьская", Санкт-Петербург, Лиговский проспект, дом 10, комната переговоров 4
Что такое Data Mining (интеллектуальный анализ данных): парадигма Data Mining,
общая концепция Data MiningИмпорт, подготовка и интерактивное исследование данных
Связь с базами данных
Сначала данные нужно увидеть: визуализация данных
Чистка и верификация данных: пропущенные данные, обработка выбросов,
повторных наблюдений, некорректных значений и др.Интерактивное бурение и расслоение данных
Решение задачи классификации
Ключевые понятия и определения
Деревья принятия решений
Деревья классификации и регрессии (С&RT)
CHAID (Chi-squared Automatic Interaction Detection)
Растущие деревья (Boosted trees)
Случайные леса (Random forests)
Методы машинного обучения (machine learning)
Метод опорных векторов
Байесовские методы
Метод k-ближайших соседей
- Решение задачи регрессии
Ключевые понятия и определения
Множественная линейная регрессия
Деревья принятия решений
Моделирование сплайнами
Текстовая добыча данных
Ключевые понятия и определения
Препроцессинг и индексация текстов
Применение фильтров, стоп-листов, морфологических алгоритмов
Использование готовой модели для анализа новых документов
Анализ контента сайтов (web-crawling)
Нейронные сети
Ключевые понятия и определения
Архитектура сетей, обучение
Использование нейронных сетей в задачах классификации и регрессии
Case Studies
Вопросы и ответы
Регистрация завершена.
10 академических часов, курс разбивается на 2 рабочих дня
Записаться Календарь курсов
Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
|
© StatSoft Russia |
StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран. |