Интеграция с базой данных

Содержание

Связь с базами данных

Импорт данных

Добавление критерия

Экспорт таблицы в STATISTICA

 


Связь с базами данных

Анализ данных начинается с данных. Ранее выгрузка данных являлась сложным и трудоемким процессом. Благодаря современным технологиям этот процесс качественно упростился.

Запрос STATISTICA (STATISTICA Query) используется для легкого доступа к базам данных, включая Oracle, MS SQL Server, Sybase с помощью технологий Microsoft OLE DB (Object Linking and Embedding Database). OLE DB – это мощная технология, обеспечивающая универсальную интеграцию через локальную сеть предприятия от сервера к рабочим станциям независимо от типов данных.

Записи (строки таблиц) выбираются путем ввода SQL выражений, которые STATISTICA автоматически создает, после того как вы выбрали компоненты запроса с помощью графического интерфейса или опций меню и диалогов. Для создания даже сложных запросов не требуются глубокие знания синтаксиса SQL. Также можно создавать составные запросы к одной или нескольким базам данных.

 


Импорт данных

Покажем, как несколькими щелчками мыши можно импортировать внешние данные в таблицу STATISTICA.

Повторите действия вслед за нами и вы поймете, как это делается.

Для примера рассмотрим базу данных MS Access – baseball.mdb, находящуюся в папке: Examples/Database/baseball.mdb.

В этой базе содержится одна таблица данных по продажам бейсбольной экипировки (биты, бейсболки, перчатки, футболки) в разных штатах Америки в период с 1993 по 1998 год.

В меню Файл выберем Внешние данные, далее в выпадающем меню выберем пункт Создать Запрос.

Выбор пункта меню Создать Запрос

Рис. 1. Выбор пункта меню Создать Запрос

На экране появится окно Соединение с базой данных:

Диалоговое окно Соединение с базой данных

Рис. 2. Диалоговое окно Соединение с базой данных

В поле Соединения отображаются ранее созданные запросы (в данном случае окно пусто).

Кнопка Обзор... в нижней части окна служит для нахождения и открытия ранее сохраненных связей, которые содержат информацию о параметрах соединения с базами данных (при нажатии кнопки появляется стандартное окно Выбор файлов канала передачи данных).

Для установления нового соединения нажмем кнопку Создать. На экране появляется окно Свойства канала передачи данных:

Диалоговое окно Свойства канала передачи данных

Рис. 3. Диалоговое окно Свойства канала передачи данных

Вкладка Поставщик данных используется для выбора поставщика OLE DB. В списке приведены все обнаруженные на диске поставщики OLE DB. В нашем случае выбираем Microsoft OLE DB Provider for ODBC Drivers – Поставщик Microsoft OLE DB для драйверов ODBC. Нажимаем на кнопку Далее >> и переключаемся на вкладку Соединение (имеется возможность сразу перейти на вкладку Соединение, дважды щелкнув мышкой на названии поставщика).

Диалоговое окно Свойства канала передачи данных – вкладка Соединение

Рис. 4. Диалоговое окно Свойства канала передачи данных – вкладка Соединение

Вкладка Соединение позволяет настроить параметры подключения.

Во вкладку выносятся только свойства соединения, которые необходимы для поставщика OLE DB для ODBC.

В поле Использовать имя источника данных можно выбрать или ввести имя источника.

В нашем случае выбираем MS Access Database – База данных MS Access, именно с этой базой данных мы будем работать.

Если вход на сервер ограничен, то необходимо ввести имя пользователя и пароль для подключения к источнику данных. Поле Пустой пароль позволяет поставщику возвращать строку подключения с пустым паролем. Поле Разрешить сохранение пароля разрешает сохранение пароля вместе со строкой подключения.

В поле Введите начальный каталог вносится имя каталога (или базы данных), можно также выбрать его из раскрывающегося списка. В этой строке указывается полный путь к файлу.

Нажатием кнопки Проверить соединение проверяем соединение с указанным источником.

На вкладке Дополнительно окна Свойства канала передачи данных можно указать время (в секундах), в течение которого поставщик ожидает завершения инициализации. Если по истечении этого времени соединение не установлено, то возникнет ошибка.

Диалоговое окно Свойства канала передачи данных – вкладка Дополнительно

Рис. 5. Диалоговое окно Свойства канала передачи данных – вкладка Дополнительно

На этой вкладке также можно задать права доступа (Read - только чтение; ReadWrite - чтение и запись; Share Deny None - никому не отказывать ни в чтении, ни в записи; Share Deny Read - запретить всем работу в режиме чтения; Share Deny Write - запретить всем работу в режиме записи; Share Exclusive - запретить всем работу в режиме чтения/записи; Write - только запись).

Вкладка Все предназначена для просмотра и настройки параметров инициализации, которые поддерживает текущий поставщик. В зависимости от используемого поставщика OLE DB параметры могут меняться.

В нашем примере мы не будем менять настроек в последних двух вкладках. Нажмём кнопку ОК, на экране появится окно Добавить соединение с базой данных, в котором введем имя создаваемого запроса, пусть это будет: baseball.

Диалоговое окно Добавить соединение с базой данных

Рис. 6. Диалоговое окно Добавить соединение с базой данных

В поле Соединение с базой данных можно отредактировать соединение. В данном случае этого не требуется.

Нажимаем на кнопку ОК и возвращаемся к окну Соединение с базой данных.

В этом окне нажимаем ОК и на экране появляется окно Запроса.

Окно Запроса

Рис. 7. Окно Запроса

Запрос STATISTICA предлагает два режима работы: графический и текстовый.

Для большинства пользователей графический режим – самый простой способ работы. Графический режим предоставляет пользователям интуитивно-понятные графические средства для построения запросов. Запрос STATISTICA автоматически создает SQL код, как только вы начинаете выбирать компоненты запроса в графическом окне или с помощью меню и вспомогательных диалогов. Использование графического интерфейса помогает создавать сложные SQL выражения несколькими щелчками мыши.

Для пользователей, имеющих навыки в SQL, возможно, удобнее пользоваться текстовым режимом для редактирования SQL выражения, которое было создано в графическом режиме. Для редактирования нужно переключиться в текстовый режим (для этого следует войти в меню Вид и отключить метку Графический режим). После того как вы оказались в текстовом режиме, можно включать в SQL запросы параметры, которые не поддерживаются в графическом режиме.

В окне Запрос STATISTICA по умолчанию используется графический режим. В этом режиме окно Запрос STATISTICA делится на три панели (см. рисунок): панель Дерево – с левой стороны, панель Графика – вверху с правой стороны и панель Табуляция (содержащая вкладки Последовательность полей, Критерии, Сортировка, Предпросмотр данных, SQL Выражение).

Рассмотрим вначале панель Дерево. Здесь имеются различные типы пиктограмм, позволяющие идентифицировать объекты при подключении к БД:

Вы можете показать выбранные таблицы на панели Графика двойным щелчком на поле внутри Дерева. На панели Табуляция автоматически появится последовательность полей, ключей и операторов SQL, которые были выбраны с помощью панелей Дерево, Графика, или параметров меню.

Можно также переносить таблицы в графическую часть экрана двойным щелчком мыши на поле внутри таблицы на Дереве.

В графическом режиме можно редактировать элементы, выбранные внутри Дерева и графической части окна и во вкладке Критерии (с помощью меню Правка и/или команд мыши и клавиатуры), но нельзя редактировать содержимое вкладки Последовательность полей или вкладки SQL Выражение.

В качестве примера импортируем поля таблицы Orders – Заказы. Для этого перетянем левой кнопкой мыши значок таблицы Orders. Альтернативный способ: нажмите правой кнопкой мыши и выберите поля из выпадающего меню опцию Добавить. Выберите все переменные таблицы, как показано на рисунке ниже:

Добавление полей таблицы Orders

Рис. 8. Добавление полей таблицы Orders

Вкладка Последовательность полей отображает список таблиц и полей, которые включены в запрос в формате Таблица.Поле.

Вкладка Предпросмотр данных позволяет просмотреть результаты.

Предпросмотр данных

Рис. 9. Предпросмотр данных

Если в окне Глобальные параметры (вызываемого из меню Запроса Править) на опции Автоматический предпросмотр стоит флажок, то содержимое вкладки Просмотр данных автоматически обновляется, отражая все изменения, которые вы делаете при создании запроса. Можно также выбрать Автоматический предпросмотр в меню Запроса Вид.

Во вкладке SQL Выражение находится исходный текст SQL запроса. С помощью опции Копировать можно копировать часть (или все) SQL выражение в буфер обмена. Для ручной правки нужно переключиться в текстовый режим ввода запросов в STATISTICA.

 


Добавление критерия

Предположим, нас интересуют не все данные о продажах, а только за январь 1993 года. Воспользуемся опцией Добавить критерий.

Диалоговое окно Добавить критерий

Рис. 10. Диалоговое окно Добавить критерий

В строке Поле выберем Date – Дата, в строке Операторменьше либо равен, в строке Значение с помощью кнопки Выбрать выбираем 31 января 1993 года. Нажатие кнопки Добавить приведет к включению этого критерия в запрос. Таким образом, в запрос попадут только наблюдения за январь 1993 года.

 


Экспорт таблицы в STATISTICA

Заключительный шаг – экспорт данных из базы в новую таблицу.

Для экспорта выбранных данных необходимо нажать на треугольник (Возврат данных в STATISTICA) в верхней части окна. На экране появляется окно Экспорт внешних данных в таблицу:

Диалоговое окно Экспорт внешних данных в таблицу

Рис. 11. Диалоговое окно Экспорт внешних данных в таблицу

В поле Имя введите имя запроса (это имя необходимо, если вы присоединили несколько запросов к одной таблице). Данное имя может не совпадать с именем, которое вы задали для запроса через Сохранить как в меню Файл).

Если вы хотите поместить данные в новую таблицу, то выберите поле В новую таблицу. Выберите В текущую таблицу, если хотите, чтобы данные помещались в текущую таблицу STATISTICA. Используйте поля Переменная и Наблюдение, чтобы задать, куда будут помещены данные в таблице. По умолчанию, данные будут находиться в Переменной 1, Наблюдении 1 (т.е. строка 1, наблюдение 1). Можно создать несколько запросов для одной таблицы, просто указывая отдельные независимые ячейки для отдельных запросов. Если вы укажите перекрестные ячейки, то Запрос STATISTICA выдаст предупреждение.

Чтобы таблица данных имела тот же размер, что и возвращаемые данные, используйте опцию Подогнать таблицу.

Опция Максимальное количество строк направлена против случайного создания запроса, в котором получается очень большое число записей. Если число строк в запросе превысит введенное значение, то STATISTICA попросит отменить запрос (отложить чтение данных), чтобы прочитать лишние строки или получить оставшиеся данные без дополнительного запроса.

Используйте опцию Сохранить как параметры по умолчанию, если необходимо сохранить установки для будущих запросов.

Нажатие кнопки Больше приведет к выводу окна Свойства внешних данных с дополнительными параметрами запросов.

После настройки необходимых параметров нажимаем кнопку Экспортировать.

Итоговая таблица данных

Рис. 12. Итоговая таблица данных

Данные импортированы из источника в таблицу данных размером 8 на 31 – 8 переменных на 31 наблюдение. В итоге мы получили таблицу с данными, которые можно анализировать в модулях STATISTICA.

 

‹‹
››
ПнВтСрЧтПтСбВс


info@statsoft.ru       (495) 787-77-33       (499) 674-06-15       STATISTICA Data Miner 13.2 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia, 2017

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта