STATISTICA Reporting Tables

Таблицы отчетности STATISTICA (STATISTICA Reporting Tables) является эффективным инструментом Business Intelligence (BI), позволяющим быстро агрегировать и форматировать большой объем исходных данных, получая наглядную и полезную информацию для принятия бизнес-решений.

STATISTICA легко интегрируется в имеющееся IT-окружение. STATISTICA не использует нестандартные языки программирования, собственные закрытые хранилища данных и проприетарные интерфейсы взаимодействия – данные для анализа легко импортируются (в том числе возможно обновление исходных данных в режиме реального времени) из большинства современных источников данных (Oracle, MS SQL Server, Access, Excel, CSV и др.).

Читать подробнее об интеграции STATISTICA с другими источниками данных и приложениями ->

С помощью модуля Таблицы отчетности STATISTICA, данные агрегируются и форматируются согласно настройкам пользователя. Пользовательский интерфейс модуля Таблицы отчетности STATISTICA дает возможность визуально перетаскивать переменные в диалог (drag and drop).

Инструмент позволяет задавать дополнительные настройки для переменных, на основе которых данные автоматически сортируются, агрегируются, и становятся доступны для предварительного просмотра. По завершению настройки результаты могут быть получены одним нажатием кнопки.

Модуль может быть внедрен в корпоративную среду STATISTICA Enterprise для последующего совместного использования (при наличии прав доступа) пользователями системы. Таблицы отчетности могут быть утверждены в качестве подтвержденного шаблона (в соответствии с правами доступа), который разворачивается в регулируемой среде. Кроме того, с помощью STATISTICA Enterprise созданные по расписанию отчеты направляются в систему управления документами или по электронной почте на определенный список рассылки.

Таким образом, все заинтересованные лица имеют доступ в режиме реального времени к данным в удобном и наглядном формате, что позволяет принимать своевременные и продуманные бизнес-решения.

Таблицы отчетности STATISTICA являются надстройкой (add-on) для продуктов серии STATISTICA 12.

Рассмотрим на примере, как работают Таблицы отчетности (Reporting tables)

Демонстрировать возможности данного инструмента будем на файле из базы примеров программы STATISTICA, для этого выберем File -> Open Examples -> Datasets -> Loan applications.sta:

Рисунок 1. Таблица Loan applications.sta

В данной таблице представлены следующие данные потенциальных заемщиков:

AVG_INCO – средний доход в год в тысячах долларов США

AGE – возраст на момент подачи заявки

HOMEOWNER – есть ли в собственности жилье

MAR_STAT – семейный статус

BALANCE – количество денег на счете

GROUP – статус заявки на получение кредита

Таблицы отчетности можно найти в пункте меню Data.

Рисунок 2. Reporting Tables находятся в меню Data

Интерфейс инструмента Таблицы отчетности выглядит следующим образом.

Рисунок 3. Рабочая область Reporting Tables

Данное окно условно можно разделить на три части:

Область 1

Расположена слева – область переменных; как можно заметить в нашей таблице всего 6 (шесть) переменных, плюс по умолчанию сгенерированная переменная, отвечающая за количество строк в таблице. Стоит отметить, что программа автоматически присваивает различные метки категориальным и непрерывным переменным, т.е. столбцам с большим количеством различных значений, чаще всего записанных в десятичной форме и столбцам, содержащим малое количество целых чисел.

Рисунок 4. Переменные из исходной таблицы

В данном примере переменные AVG_INCO, AGE, BALANCE – непрерывные переменные, а

HOMEOWNER , MAR_STAT, GROUP – категориальные.

Область 2

По середине окна состоит из 4 частей (осевых полей), заполняются все они простым перетаскиванием (drag & drop) из области переменных, рассмотренной в пункте 1).

2.1. В левом верхнем углу (Layers) ожидаются категориальные переменные – это область фильтров, т.е. для каждого значения добавленного в эту зону предиктора будет сформирована отдельная таблица. Другими словами мы расслаиваем данные, т.е. производим стратификацию.

2.2. В правом верхнем углу (Column Label) - область для категориальных переменных, значения которых будут выступать в качестве образующих столбцы в итоговой таблице.

2.3. В левом нижнем углу (Row Label) - область для категориальных переменных, значения которых будут выступать в качестве образующих строки в итоговой таблице.

2.4. В правом нижнем углу - область для непрерывных переменных, которые выступают в качестве объекта изучения.

Область 3

Кнопочная область, позволяющая сформировать таблицу и настроить вывод результатов.

Заполним осевые поля, например, следующим образом.

Рисунок 5. Рабочая область Reporting Tables

После того, как категориальная переменная была добавлена в анализ, детали спецификации можно легко настроить с помощью двойного щелчка по имени переменной:

Рисунок 6. Окно спецификаций категориальной переменной

Заголовки переменных можно перекрывать (span), скрыть (suppress) или накладывать (stack)

Рисунок 7. Настройки отображения названия полей итоговой таблицы

Значения переменных могут быть представлены ​​в порядке возрастания, убывания, по усмотрению пользователя:

Рисунок 8. Настройка порядка сортировки

В данной реализации, в качестве фильтра используется переменная GROUP, т.е. будет выведено две таблицы, одна - для получивших одобрение на кредит, вторая для тех, кому было отказано.

Есть возможность группировать по строкам, используя вложение (так называемый гнездовой план). На рисунке ниже владельцы жилья будут разделены по семейному признаку, как и те, кто жильем не владеет, они тоже будут разбиты по семейному статусу:

Рисунок 9. Вложение переменных

Пример вложенных переменных (гнездовой план):

Рисунок 10. Пример отображения вложенных переменных в итоговой таблице

Конечно, можно было бы обойтись и без вложения, располагая категориальные переменные последовательно, тогда мы отдельно группировали бы по наличию\отсутствию жилья и семейному статусу:

Рисунок 11. Последовательное расположение переменных

Пример переменных, находящихся одна-за-другой (side-by-side):

Рисунок 12. Пример отображения последовательно расположенных переменных

В качестве непрерывных переменных, по которым будет формироваться таблица, были добавлены: количество строк в таблице, т.е. наблюдений (Valid N), возраст (AGE) и средний доход (AVG_INCO):

Рисунок 13. Переменные для формирования таблицы

Если поставить галочку у пункта Suppress all statistics names, то в итоговой таблице не будут отображаться названия переменных используемых для ее формирования, это может быть удобно, если из контекста понятен принцип формирования таблицы, и не хочется перегружать результаты избыточной информацией.

Как можно заметить, в итоговой таблице будет отображен средний возраст (Mean) и максимальный доход (Max) для ранее выбранных категорий людей. Кроме данных описательных статистик доступен огромный перечень других, чтобы все их просмотреть, достаточно дважды кликнуть на имя переменной, появится следующее окно.

Рисунок 14. Выбор описательных статистик в окне спецификаций

В нем можно выбрать одну из описательных статистик, а также изменить имя переменной, поставить фильтр на включаемые значения, выбрать отображение в процентах:

Рисунок 15. Выбор типа отображения значений в итоговой таблице

Стоит отметить, что переменные могут быть добавлены несколько раз, с использованием разных статистик

Рисунок 16. Возможность использования одной переменной с разными описательными статистиками

В диалоге также присутствует опция предварительного просмотра, она доступна после нажатия кнопки Refresh Preview:

Рисунок 17. Опция предварительного просмотра позволяет взглянуть на итоговую таблицу, не покидая рабочей области инструмента Reporting Tables

Если переменную GROUP использовать для группировки по столбцам,

Рисунок 18. Настройка анализа

то итоговая таблица будет выглядеть следующим образом:

Рисунок 19. Итоговая таблица

Из данной таблицы видно, например, что заём одобряют чаще возрастным соискателям. Как и следовало ожидать, наличие жилья благоприятно влияет на шанс получения займа. О влиянии же семейного статуса выводы сделать затруднительно из-за небольшого количества данных.

Для итоговой таблицы доступны все стандартные инструменты форматирования – выбор цвета фона, типа шрифта и так далее:

Рисунок 19. Итоговая таблица после форматирования

Форматированные таблицы легко читаются, эффектно смотрятся в отчетах и презентациях.

Таким образом, инструмент STATISTICA Reporting Tables позволяет за пару минут с помощью одной лишь мыши настроить наглядные таблицы презентационного качества.

Таблицы отчетности будут полезны как аналитику, так и топ-менеджеру для анализа текущей ситуации, нахождения особенностей в данных (артефактов), выявления скрытых связей.

‹‹
››
ПнВтСрЧтПтСбВс


info@statsoft.ru       (495) 787-77-33       (499) 674-06-15       STATISTICA Data Miner 13.3 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia
1999-2017

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта