Визуализация

Система STATISTICA включает широкий спектр графических методов для визуального представления исходных данных и результатов исследований. Все графические средства системы STATISTICA обеспечивают возможность выбора встроенного аналитического интерактивного метода анализа и содержат большой набор программ настройки, позволяющих пользователю интерактивно управлять отображением информации на экране. Гибкие средства управления одновременно несколькими графиками дают возможность пользователю объединять различные графические изображения и осуществлять динамический обмен между приложениями (используя средства OLE).

Графика STATISTICA традиционно признаётся самой точной и удобной в использовании.

В основном, графики применяются для следующих целей:

  • объяснение структуры исходных данных и результатов исследования человеку, незнакомому с методами прикладной статистики

  • выяснение природы распределения случайных величин, подгонка распределения, визуальная проверка статистических гипотез

В программном пакете STATISTICA предлагаются разнообразные графические методы, с помощью которых пользователь может запрашивать или самостоятельно организовывать построение графиков. Эти методы, включающие большой набор графиков различных типов, таких как пользовательские, статистические и специализированные, они дополняют друг друга, обеспечивая высокий уровень взаимосвязи между числовыми данными (начальными, промежуточными и конечными) и их графическим представлением.

Например, в качестве элемента автоматического вывода в программе статистической обработки может быть введен запрос на построение специализированных графиков. Кроме того, фактически любые данные (и/или метки), которые создаются в процессе работы программы, могут быть выведены в графическом виде с помощью встроенных сервисных программ.

В разделе Продукты представлен общий обзор графических возможностей STATISTICA.

Двумерные графики

Трёхмерные последовательные графики

Трёхмерные статистические графики

Пиктографики

Матричные графики

Категоризованные графики

Расширение графических возможностей с помощью STATISTICA Visual Basic

Японские свечи

Многомерные дихотомии


Двумерные графики

2М графики представляют наиболее общие методы визуализации данных. Построение двумерных графиков на плоскости "XY" в STATISTICA дает множество способов интерпретации значений как координат точек в двумерном пространстве. Они представляют собой, с одной стороны, стандартный метод графического представления исходных данных (например, различные диаграммы рассеяния, гистограммы и др.), а с другой стороны, стандартный способ графического анализа (например, категоризованные нормальные вероятностные графики, вероятностные графики с исключенным трендом и др.).

Построить графики перечисленных типов можно из меню Графика.

Рис. 1. Пункт меню Графика/2M Графики

Приведём несколько примеров построения двумерных графиков.

Рис. 2. Сечения графиков плотностей двумерного нормального распределения (нулевой вектор мат. ожидания, ковариационная матрица с 1 на главной диагонали) плоскостью z=0.05

Рис. 3. Диаграмма рассеяния. Выделены точки с параметрами, максимально близкими к заданным

Рис. 4. Диаграмма рассеяния с гистограммами. Построена диаграмма рассеяния двух переменных и их гистограммы с подгонкой распределения Лапласа

К 2M Графикам относятся:

2М Гистограммы

2М Диаграммы рассеяния

2М Диаграммы рассеяния с ошибками

Диаграммы концентрации

Графики средних с ошибками

2М Диаграммы размаха

Диаграммы изменчивости

2М Диаграммы диапазонов

Пиктографики рассеяния

Диаграммы рассеяния с образами

2М Диаграммы рассеяния с гистограммами

2М Диаграммы рассеяния с диаграммами размаха

Нормальные вероятностные графики

Графики квантиль – квантиль

Графики вероятность – вероятность

2М Столбчатые диаграммы

2М Линейные графики

2М Линейные графики (профили наблюдений)

Последовательные/наложенные графики

Круговые диаграммы

Графики пропущенных данных/диапазонов


Трёхмерные последовательные графики

3М последовательные графики предлагают различные методы визуализации в трехмерном пространстве простых последовательностей значений, диапазонов значений или статистической информации о группах или подмножествах (частоты, распределения).

Рис. 5. Трёхмерная гистограмма переменных

3M последовательные графики включают:

 

3М Диаграммы исходных данных

 

3М Диаграммы диапазонов

 

3М Гистограммы двух переменных

 

3М Диаграммы размаха


Трёхмерные статистические графики

Статистические XYZ графики содержат опции для создания различных типов 3М графиков, где расположение точек данных определяется тремя (а в случае тернарных графиков, четырьмя) координатами.

Независимо от типа создаваемого 3М XYZ графика и метода его создания (т.е. независимо от того, откуда были взяты данные для графика и как они вычислялись), к нему могут быть применены все средства настройки графиков системы STATISTICA для изменения вида графика или соединения его с другими графиками или документами. Также, все встроенные аналитические средства, вызываемые из самого графика (такие как функции подгонки, сглаживание, закрашивание и т.д.), можно применить к любому графику, независимо от источника данных и метода создания графика.

Рис. 6. Трёхмерная диаграмма рассеяния

Ниже перечислены разновидности трёхмерных графиков:

3М Диаграммы рассеяния

3М Диаграммы рассеяния с образами

3М Графики поверхностей

3М Карты линий уровня

Графики проекций

Тернарные графики

Категоризованные XYZ графики

Категоризованные тернарные графики

Графики функций пользователя

Пиктографики

Пиктографики обеспечивают графическое представление данных, где наблюдения или отдельные испытания отображаются в виде символов со многими элементами. Главная идея пиктографиков состоит в представлении отдельных единиц наблюдения в виде определенных графических объектов; при этом значения переменных ставятся в соответствие определенным характеристикам или параметрам объектов (обычно одно наблюдение равно одному объекту). Это соответствие таково, что общий вид объектов меняется как функция конфигурации значений. Таким образом, наблюдатель может "идентифицировать" уникальные для каждого набора значений наглядные характеристики объектов. Исследование таких пиктограмм может помочь обнаружить определенные группы простых зависимостей и взаимосвязей между переменными.

Рис. 7. Пиктографик типа Лучи для трёх переменных, содержащих некоторые данные для каждого месяца года


Матричные графики

Матричные графики отражают зависимости между несколькими переменными в виде матрицы графиков X-Y. Наиболее часто используемым типом матричных графиков является матрица диаграмм рассеяния, которую можно считать графическим эквивалентом корреляционной матрицы.

Рис. 8. Матричный график трёх переменных



Категоризованные графики

Один из наиболее важных аналитических методов использует разделение множества данных на категории, чтобы сравнивать структуру данных в получившихся подмножествах. Этот способ известен под несколькими названиями (например, классификация, группировка, категоризация, разбиение, расслоение) и используется как для разведочного анализа данных, так и для проверки гипотез. Пример: зависимость возраста и риска инфаркта может различаться для женщин и мужчин. Зависимость между приёмом лекарств и снижением уровня холестерина может присутствовать только у женщин с низким кровяным давлением и только в возрасте тридцати-сорока лет. Индексы мощности процесса или гистограммы мощности могут различаться для временных промежутков, когда управление осуществляется разными операторами. Наклоны регрессии могут различаться для разных экспериментальных групп.

Многие вычислительные средства, основывающиеся на группировке, предназначены для количественного описания различий, выявляемых с помощью группировки (например, в дисперсионном анализе). Однако графические средства дают особые преимущества, которых нельзя достичь, используя лишь вычислительный метод: они могут выявлять закономерности, которые трудно поддаются количественному описанию (например, сложные взаимодействия, исключения, аномалии), и предоставляют уникальные обширные возможности аналитического исследования или "добычи данных".

Рис. 9. Категоризованные круговые диаграммы

Виды категоризованных графиков:

2М Категоризированные гистограммы

 

2М Категоризированные диаграммы рассеяния

 

Категоризированные графики средних с ошибками

 

Категоризированные диаграммы размаха

 

Категоризированные нормальные вероятностные графики

 

Категоризированные графики квантиль – квантиль

 

Графики вероятность – вероятность

 

Категоризированные линейные графики

 

Категоризированные круговые диаграммы

 

Категоризированные графики пропущенных данных/диапазонов

 

3М XYZ Категоризированные графики

 

3М Категоризированные тернарные графики


Расширение графических возможностей с помощью STATISTICA Visual Basic

STATISTICA Visual Basic (SVB) - язык программирования, интегрированный в STATISTICA, позволяющий получать доступ практически ко всем функциональным возможностям пакета программными средствами. С помощью SVB вы можете создавать свои вычислительные процедуры, разрабатывать собственные графики и статистические функции.

Японские свечи

В техническом анализе часто используется специальный вид графиков: «японские свечи». На этом графике отрезок отображает диапазон изменения цены в течение определённого времени.

«Свеча» состоит из «тела» (красного либо зеленого) и «тени» (или «фитиля») (верхнего либо нижнего). Верхняя и нижняя граница фитиля отображает максимум (HIGH) и минимум (LOW) цены в ходе торгов соответственно, в то время как границы тела отображают цену открытия (OPEN) и закрытия (CLOSE).

Если котировки росли, то тело свечи белое, нижняя граница тела отражает цену открытия, верхняя — цену закрытия. Если котировки падали, то тело свечи чёрное, верхняя граница тела отражает цену открытия, нижняя — цену закрытия.

В России используется красный цвет для падения и зеленый для роста. В некоторых странах (например, КНР) вместо белого цвета используется красный, а вместо чёрного — зелёный.

Многие комбинации свечек имеют свои названия («hammer» –молот, «evening star» – вечерняя звезда и т.д.). Выявление и дальнейший анализ подобных комбинаций помогают спрогнозировать цену.

Пример "японских свечей", построенных на базе SVB, приведен ниже.

Многомерные дихотомии

Многомерные дихотомии (греч. διχο - на две части + τομία - сечение) часто возникают в практических задачах: в маркетинговых исследованиях, в анализе анкетных данных, данных соцопросов, медицине (наличие у пациента тех или иных признаков), контроле качества и т.д.

Дихотомия кодирует нулем и единицей ответы типа «нет» и «да».

В многомерной дихотомии имеется набор нулей и единиц, соответствующий многим вопросам и ответам.

Например, предположим, что мы проводим исследование-опрос предпочтений покупателей в супермаркете. В анкету мы включаем вопросы, на которые можно отвечать либо «да», либо «нет». В итоге, после проведения опроса, всех покупателей можно разделить на группы, согласно набору ответов на вопросы.

Если, например, вопросов в анкете было всего два (двумерная дихотомия), то всего может получиться 4 группы покупателей («да», «да»; «да», «нет»; «нет», «да»; «нет», «нет»).

Подобное представление данных довольно понятно для малых размерностей дихотомий. Однако если количество вопросов в анкете возрастет до пяти или больше, то целостное представление о структуре данных начинает пропадать.

Поэтому важно уметь визуально представить многомерные дихотомийные данные.

Увидеть многомерные данные сложно - один из способов - с помощью многомерных кубов.

На рисунке ниже приведена модель пятимерного куба, описывающая опрос с анкетой, состоящей из пяти вопросов. Каждая группа опрашиваемых представляется в виде вершины с бинарным кодом (самая нижняя вершина имеет код (0,0,0,0,0), а самая верхняя - (1,1,1,1,1)).

Здесь «0» (или «1») обозначают ответ «нет» (или «да») на каждый из пяти вопросов. В метках вершин рядом с кодом группы, указано число, соответствующее числу людей относящихся к данной группе. На рисунке оно обведено красным прямоугольником.

см. подробнее Визуализация многомерных дихотомий

В начало

Академия Анализа Данных предлагает широкий набор курсов по любым темам анализа данных. Перейти к списку тем

Наиболее популярные курсы по визуализации данных:

‹‹
››
ПнВтСрЧтПтСбВс


info@statsoft.ru       (495) 787-77-33       (499) 674-06-15       STATISTICA Data Miner 13.2 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia, 2017

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта