База примеров

Анализ мнений в социальных сетях: мониторинг сообщений Twitter в системе STATISTICA Enterprise

Введение

Наглядный пример использования Text Mining

Автоматизация мониторинга

Выводы

Введение

С ростом популярности социальных сетей, мониторинг накапливающейся в сети информации является неотъемлемой частью ведения бизнеса. Наличие у компании своей собственной страницы в различных социальных сетях (или ведение блогов) стало так называемым корпоративным стандартом, а анализ поступающих комментариев и сообщений– важным звеном в представлении имиджа фирмы.

Очевидно, что «ручной» сбор и анализ информации в данном случае не применим, поэтому особую важность для компаний представляет выбор эффективного инструмента, позволяющего в режиме реального времени производить автоматический сбор и анализ представленной в социальных сетях информации. Система STATISTICA Enterprise полностью соответствует самым высоким требованиям к корпоративным системам, гибко и быстро настраивается под задачи компании.

В данном кейсе мы рассмотрим пример применения системы STATISTICA Enterprise для анализа сообщений в Twitter.

Для примера возьмем американскую авиакомпанию American Airlines, с помощью методов Text Mining будем анализировать полученные о данной компании сообщения в Twitter. Корпоративная платформа STATISTICA Enterprise позволит нам производить автоматический мониторинг твитов в режиме реального времени, а также настроить автоматическое оповещение о возникающих «тревогах».

Наглядный пример использования Text Mining

Данный пример посвящен анализу уже полученных сообщений в Twitter об авиакомпании American Airlines. Необходимо классифицировать отзывы (например, на положительные, отрицательные и нейтральные), анализировать ситуацию с течением времени.

Откроем вкладку Предприятие, выберем Запуск Анализа/Отчета.

Затем откроем папку Tweets, выберем одноименный узел, отвечающий за выкачку твитов за текущие сутки по ключевым словам и их последующую классификацию (в данном примере мы не рассматриваем, каким образом был создан данный узел).

Твиты обрабатываются с помощью Text mining - технологии обработки неструктурированных текстовых данных. После того, как обработка завершится, появится таблица, в которой представлены уже классифицированные отзывы о компании (зеленым цветом выделены положительные отзывы, красным – отрицательные, желтым – нейтральные).

Кроме этого, отобразится круговая диаграмма, показывающая количественные и процентные показатели каждого из 3 видов отзывов по отношению к их общему числу.

Автоматизация мониторинга

На следующем этапе рассмотрим, как оценивать не только данные за текущие сутки, но и анализировать динамику изменения мнений о компании.

Для этого откроем вкладку Предприятие, выберем Запуск Анализа/Отчета.

Выберем узел анализа collect_stat, который классифицирует твиты и накапливает статистику мнений об авиакомпании в таблице STATISTICA (данный узел был настроен заранее, в данном примере мы не касаемся принципов его создания).

Теперь можно посмотреть на динамику мнений об авиакомпании. В примере мы будем анализировать мнения за 12 дней.

Для этого запустим узел Tweets_daily_stats.

Нам будут доступны 3 карты Шухарта – для позитивных, негативных и нейтральных мнений и таблица, показывающая количество и доли отзывов в каждой категории.

Рассмотрим карту Шухарта для долей негативных мнений: карту индивидуальных наблюдений и карту скользящих размахов.

Итак, на верхней карте отображены доли негативных отзывов в каждый из 12 рассматриваемых дней (со средним значением 0,157). Заметен некий повышающийся тренд за первые 11 дней, однако на 12-й день произошел резкий спад доли негативных отзывов, что сразу же отразилось на карте скользящих размахов. В нашем случае отображение красной точки на карте не является причиной для беспокойства. Однако, при появлении точек, выходящих за контрольные пределы, необходимо обратить на них внимание и установить причину их появления, т.к. это событие является индикатором нестабильности процесса.

Для автоматизации мониторинга поступающих в Twitter сообщений в режиме реального времени, воспользуемся специальной надстройкой STATISTICA - STATISTICA Monitoring and Alerting Server (MAS).

Во вкладке Панели Мониторинга выберем пункт Мониторинг твитов.

Доступный на панели индикатор наглядно показывает состояние процесса на данный момент (зеленый цвет – процесс стабилен, значения лежат в рамках допустимых границ; красный цвет - значения вышли за рамки допустимых границ).

После перерасчета на поступивших новых данных индикатор стал красного цвета, что в нашем случае, как было разобрано выше, свидетельствует о выходе за контрольный предел значения скользящего размаха (из-за резкого понижения доли негативных отзывов).

Нажимаем на кнопку STOP и получим информацию о «тревоге».

Кроме того, STATISTICA MAS позволяет автоматически отправить пользователю оповещения о возникающих тревогах (например, направить письмо на электронную почту).

Наличие такого рода автоматических отчетов является очень удобным, т.к. если настроен запуск анализа по расписанию один раз в сутки, то у пользователя нет необходимости каждый раз заходить в STATISTICA Enterprise – все случаи возникновенияудут указаны в электронных письмах.

Выводы

Итак, с помощью методов Text Mining, платформа STATISTICA Enterprise позволяет производить мониторинг мнений о компании в социальных сетях, блогах, что является важной частью оценки эффективности той или иной маркетинговой кампании, представления имиджа фирмы в целом.

Подробнее о возможностях STATISTICA Enterprise

Подробнее о методах Text Mining


В начало


Узнайте больше на курсах Академии Анализа Данных StatSoft

Список курсов    Календарь    Расписание груповых занятий






info@statsoft.ru       (495) 787-77-33       (499) 674-06-15       STATISTICA Data Miner 13.2 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia
1999-2017

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта