База примеров

Оценка мощности и объема выборки для независимых выборок, t-критерий

Поставим задачу: определить мощность t-критерия (критерия Стьюдента) и необходимый для него объем выборки. И решим эту задачу с помощью STATISTICA, а именно в модуле Анализ мощности.

Выбор типа анализа. В этом примере мы проведем оценку мощности для t-критерия с независимыми выборками. Выберите Анализ мощности в меню Анализ для вызова стартовой панели диалога Анализ мощности/Интервальное оценивание.

ex2_1.gif

В левой части Стартовой панели находится поле Анализ. Существует четыре основных типа анализа: Оценка мощности, Оценка объема выборки, Интервальное оценивание и Функции распределения.

В правой части Стартовой панели находится список видов анализов, доступных в соответствии с выбранным типом анализа. Выберите Оценка мощности, а затем дважды нажмите на Два средних, t-критерий, независимые выборки для вызова диалога Независимые выборки, t-критерий: Параметры оценки мощности.

Диалоги подобного вида, в которых вы можете задать фиксированные параметры для анализа, появляются всегда при начале процедуры оценки мощности критерия.

Выбор основных параметров. На вкладке Быстрый в диалоге Параметры оценки мощности (в данном случае в диалоге Независимые выборки, t-критерий: Параметры оценки мощности - вкладка Быстрый), в поля группы Параметры введите основные параметры для анализа мощности критерия.

t-критерий с двумя независимыми выборками является одним из классических критериев в статистике. В случае "двустороннего" критерия, нулевая гипотеза H0 проверяется вместе с альтернативной гипотезой H1, где

H0: m1 = m2

H1: m1 <> m2

(1)

m1 является значением среднего в первой группе, а m2 есть значение среднего во второй группе. В t-критерии с двумя выборками предполагается, что сравниваемые группы имеют нормальное распределение, а стандартные отклонения в обеих совокупностях совпадают. Для анализа мощности критерия в этом случае вам необходимо ввести "основные" параметры в этом диалоге.

Предположим, например, что вы находитесь на стадии планирования эксперимента, в котором вам необходимо сравнить две группы, в каждой из которых стандартное отклонение равно 15.

Проведение многочисленных наблюдений в вашем исследовании затруднено по различным причинам, поэтому вы хотели бы ограничиться исследованием 25 наблюдений в каждой группе.

В контрольной группе 3 предполагается, что среднее равно 100. По сравнению с этим, в экспериментальной группе среднее значение равно 107.5. Предположим, что уровень ошибки I рода (a) = .05. Введите соответствующие значения в поля на вкладке Быстрый.

Диалоговое окно Независимые выборки

После этого нажмите кнопку OK, чтобы перейти к следующему этапу анализа.

Оценка мощности. Диалог Независимые выборки, t-критерий: Результаты оценки мощности используется для исследования зависимости мощности критерия от параметров, заданных в диалоге Независимые выборки, t-критерий: Параметры оценки мощности.

Результаты оценки мощности

В верхней части диалога отображаются основные параметры, на основе которых проводится анализ. В дополнении к ним, STATISTICA также отображает значение Стандартизованного эффекта (Es), соответствующего значениям m1, m2 и s.

Es, стандартизованный эффект, вычисляется как:

Es = (m1 - m2) / s

 


(2)

то есть является стандартизованной разницей между двумя средними.

Основные параметры можно изменить в любой момент, вернувшись в диалог Параметры оценки мощности (в данном случае Независимые выборки, t-критерий: Параметры оценки мощности).

Существует два способа вернуться в предыдущий диалог. Нажмите кнопку Назад в диалоге Результаты или нажмите клавишу ESC для того, чтобы вернуться в предыдущий диалог без сохранения изменений в полях Параметры оси Х на вкладке Результаты оценки мощности - вкладка Быстрый. Нажмите кнопку Параметры для того, чтобы вернуться в предыдущий диалог, сохранив значения в полях Параметры оси Х.

Для вычисления статистической мощности критерия с заданными параметрами нажмите кнопку Вычислить P. Итоговая таблица данных будет содержать результаты оценки мощности критерия, как показано на рисунке.

Оценка мощности критерия

В таблице данных выводится, что для заданной комбинации параметров Мощность должна быть равна .4101. Если вы хотите привести (в статье или книге) результаты оценки мощности критерия, вы можете воспользоваться результатами анализа, которые сразу выводятся в Отчет, из которого вы можете скопировать информацию в Буфер обмена.

Замечание: итоги анализа будут направлены в Отчет только в том случае, если в диалоге Диспетчер вывода Анализа/Графика была установлена соответствующая опция. (Для вызова этого диалога нажмите кнопку Параметры в диалоге Результаты, а затем выберите команду Диспетчер вывода.)

Обе опции, Направлять также в окно Отчетов и Отображать информацию полностью, должны быть отмечены. Протокол результатов анализа будет автоматически создан после того, как вы нажмете кнопку Вычислить P.

В данном случае значение мощности критерия является неадекватной. Для анализа причин мы сначала кратко рассмотрим теорию. Выше мы уже обсуждали понятие Стандартизованного эффекта (Es). Для того чтобы полностью понять важность этого определения возвратимся к рассмотренному примеру. Мы представили ситуацию, в которой исследователь при вычислении мощности критерия рассматривает частный эффект (то есть разницу m1 - m2 между средними в двух случаях) и предполагает, что известно значение стандартного отклонения совокупности s. В большинстве случаев шансов, что исследователь знает значение s не больше, чем шансов, что исследователь знает само значение m1 или m2. Другими словами, оценка мощности критерия основываться на предположении, что исследователь каким-нибудь образом может узнать значение s. В некоторых примерах возможны случаи, когда значение s может быть известно с некоторой степенью точности.

Много примеров использует понятие коэффициента IQ, у которого стандартное отклонение равно 15, поскольку это является хорошо известной нормой. На самом деле, вам нет необходимости знать s, m1 или m2 для оценки мощности критерия. Вместо этого вы просто можете указать гипотетический экспериментальный эффект, как стандартизованный эффект, который объединяет величины m1, m2 и s в одно число, Es. Es имеет ряд преимуществ, одно из которых заключается в том, что это значение инвариантно относительно линейных преобразований шкалы. Например, стандартизованный эффект, вычисленный для значений роста в дюймах, останется таким же для значений роста в сантиметрах. Авторы книг по анализу мощности придерживаются некоторых "соглашений" о значении Es. Например, Cohen (1983) в классическом труде Statistical Power Analysis for the Behavioral Sciences предложил следующие соглашения:

1. Малый эффект (Es = .20)

2. Средний эффект (Es = .50)

3. Большой эффект ( Es = .80)

Таким образом, вам не нужно знать точные значения m1, m2 и s для оценки мощности критерия. В данном случае, стандартизованный эффект соответствует "среднему эффекту".

Предполагается, что объем выборки слишком мал для того, чтобы напрямую определить средний эффект в данной ситуации. Для исследования того, насколько большая выборка необходима для достижения подходящего уровня мощности критерия, вы должны воспользоваться несколькими функциями, описанными в следующем разделе.

Графический анализ статистической мощности. Поскольку при наличии 25 наблюдений в обеих группах достигается недостаточная мощность критерия .4101, вы должны определить, как возможно достигнуть подходящего уровня мощности критерия. Одним из способов решения этой проблемы является выявление связи между мощностью и объемов выборки.

Нажмите кнопку P от N в группе Графики мощности в диалоге Независимые выборки, t-критерий: Результаты оценки мощности - вкладка Быстрый для построения графика зависимости мощности от объема выборки.

График для объема выборки

На этом графике видно, что для того, чтобы достигнуть мощности .80 (обычно минимальный допустимый уровень), объем выборки должен быть равен 64 в каждой группе. Для достижения лучшей мощности .90, объем выборки должен быть увеличен приблизительно до 86 наблюдений.

Эти результаты получены в предположении, что уровень ошибки I рода равен .05, что часто используется в данном контексте. Связь между мощностью и уровнем ошибки I рода (a) можно проследить на графике, нажав кнопку P от Alpha.

График для альфа

На этом графике видно, что мощность увеличивается, когда значение a также увеличивается. В данном примере даже значительные изменения величины a не позволят достичь подходящего уровня мощности критерия.

В случае среднего эффекта объем выборки должен быть увеличен более чем в два раза для достижения подходящего уровня мощности критерия. Насколько зависимы эти утверждения от размера стандартизованного эффекта? Нажмите кнопку P от Es для построения графика зависимости мощности критерия от стандартизованного эффекта.

График для станартизированного эффекта

Построение нескольких подобных графиков часто позволяет достичь понимания зависимости между размером эффекта, размером выборки и мощностью.


В начало


Узнайте больше на курсах Академии Анализа Данных StatSoft

Список курсов    Календарь    Расписание груповых занятий






info@statsoft.ru       (495) 787-77-33       (499) 674-06-15       STATISTICA Data Miner 13.2 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia, 2017

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта