Посмотреть видеоурок на Statistica
С ростом популярности социальных сетей, мониторинг накапливающейся в сети информации является неотъемлемой частью ведения бизнеса. Наличие у компании своей собственной страницы в различных социальных сетях (или ведение блогов) стало так называемым корпоративным стандартом, а анализ поступающих комментариев и сообщений– важным звеном в представлении имиджа фирмы.
Очевидно, что «ручной» сбор и анализ информации в данном случае не применим, поэтому особую важность для компаний представляет выбор эффективного инструмента, позволяющего в режиме реального времени производить автоматический сбор и анализ представленной в социальных сетях информации. Система STATISTICA Enterprise полностью соответствует самым высоким требованиям к корпоративным системам, гибко и быстро настраивается под задачи компании.В данном кейсе мы рассмотрим пример применения системы STATISTICA Enterprise для анализа сообщений в Twitter.
Для примера возьмем американскую авиакомпанию American Airlines, с помощью методов Text Mining будем анализировать полученные о данной компании сообщения в Twitter. Корпоративная платформа STATISTICA Enterprise позволит нам производить автоматический мониторинг твитов в режиме реального времени, а также настроить автоматическое оповещение о возникающих «тревогах».
Данный пример посвящен анализу уже полученных сообщений в Twitter об авиакомпании American Airlines. Необходимо классифицировать отзывы (например, на положительные, отрицательные и нейтральные), анализировать ситуацию с течением времени.
Откроем вкладку Предприятие, выберем Запуск Анализа/Отчета.
Затем откроем папку Tweets, выберем одноименный узел, отвечающий за выкачку твитов за текущие сутки по ключевым словам и их последующую классификацию (в данном примере мы не рассматриваем, каким образом был создан данный узел).
Твиты обрабатываются с помощью Text mining - технологии обработки неструктурированных текстовых данных. После того, как обработка завершится, появится таблица, в которой представлены уже классифицированные отзывы о компании (зеленым цветом выделены положительные отзывы, красным – отрицательные, желтым – нейтральные).
Кроме этого, отобразится круговая диаграмма, показывающая количественные и процентные показатели каждого из 3 видов отзывов по отношению к их общему числу.
На следующем этапе рассмотрим, как оценивать не только данные за текущие сутки, но и анализировать динамику изменения мнений о компании.
Для этого откроем вкладку Предприятие, выберем Запуск Анализа/Отчета.
Выберем узел анализа collect_stat, который классифицирует твиты и накапливает статистику мнений об авиакомпании в таблице STATISTICA (данный узел был настроен заранее, в данном примере мы не касаемся принципов его создания).
Теперь можно посмотреть на динамику мнений об авиакомпании. В примере мы будем анализировать мнения за 12 дней.
Для этого запустим узел Tweets_daily_stats.
Нам будут доступны 3 карты Шухарта – для позитивных, негативных и нейтральных мнений и таблица, показывающая количество и доли отзывов в каждой категории.
Рассмотрим карту Шухарта для долей негативных мнений: карту индивидуальных наблюдений и карту скользящих размахов.
Итак, на верхней карте отображены доли негативных отзывов в каждый из 12 рассматриваемых дней (со средним значением 0,157). Заметен некий повышающийся тренд за первые 11 дней, однако на 12-й день произошел резкий спад доли негативных отзывов, что сразу же отразилось на карте скользящих размахов. В нашем случае отображение красной точки на карте не является причиной для беспокойства. Однако, при появлении точек, выходящих за контрольные пределы, необходимо обратить на них внимание и установить причину их появления, т.к. это событие является индикатором нестабильности процесса.
Для автоматизации мониторинга поступающих в Twitter сообщений в режиме реального времени, воспользуемся специальной надстройкой STATISTICA - STATISTICA Monitoring and Alerting Server (MAS).
Во вкладке Панели Мониторинга выберем пункт Мониторинг твитов.
Доступный на панели индикатор наглядно показывает состояние процесса на данный момент (зеленый цвет – процесс стабилен, значения лежат в рамках допустимых границ; красный цвет - значения вышли за рамки допустимых границ).
После перерасчета на поступивших новых данных индикатор стал красного цвета, что в нашем случае, как было разобрано выше, свидетельствует о выходе за контрольный предел значения скользящего размаха (из-за резкого понижения доли негативных отзывов).
Нажимаем на кнопку STOP и получим информацию о «тревоге».
Кроме того, STATISTICA MAS позволяет автоматически отправить пользователю оповещения о возникающих тревогах (например, направить письмо на электронную почту).
Наличие такого рода автоматических отчетов является очень удобным, т.к. если настроен запуск анализа по расписанию один раз в сутки, то у пользователя нет необходимости каждый раз заходить в STATISTICA Enterprise – все случаи возникновенияудут указаны в электронных письмах.
Итак, с помощью методов Text Mining, платформа STATISTICA Enterprise позволяет производить мониторинг мнений о компании в социальных сетях, блогах, что является важной частью оценки эффективности той или иной маркетинговой кампании, представления имиджа фирмы в целом.
Подробнее о возможностях STATISTICA Enterprise
Подробнее о методах Text Mining
Узнайте больше на курсах Академии Анализа Данных StatSoft
Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
|
© StatSoft Russia |
StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран. |