База примеров

Свободный от распределения критерий «Новое Лучше Старого (НЛС)». Анализ отказов кондиционеров Боинга

Введение

Анализ надежности

Таблицы времен жизни

Подгонка распределения

Множительные оценки Каплана-Мейера

Сравнение выборок

Регрессионные модели

Анализ процессов

Анализ пригодности процессов

Повторяемость и воспроизводимость измерений

Анализ Вейбулла

Планы выборочного контроля

Диаграмма причин и следствий отказов

Математическая модель

Пример применения

Список литературы

 

Введение

STATISTICA предлагает широкий набор методов для анализа надежности и прогнозирования отказов оборудования.

Эти методы находят самое широкое применение в промышленности.

Анализ надежности можно выполнить в модуле Анализ выживаемости, где доступны следующие процедуры:

  • оценки Каплана-Мейера функции надежности

  • непараметрические критерии проверки значимости различия в группах

  • регрессионные модели Кокса и другие процедуры

Стартовое окно "Анализ выживаемости"

Рис. 1. Стартовое окно "Анализ выживаемости"

Вы можете оценить функцию надежности для подшипников и сравнить надежность оборудования разных заводов изготовителей (см. вкладку Сравнение нескольких выборок).

Далее вы можете экономически обосновать, почему одного поставщика следует предпочесть оборудованию другого.

С помощью моделей Кокса можно построить различные регрессионные модели, решить множество важных практических задач, например, показать, как увеличивается прочность подшипников с увеличением доли молибдена, каков эффект дают уплотнительные кольца, изготовленные из нового материала и т. д.

В металлургии и машиностроении типичные задачи, связанные с отказом оборудования, – износ роликов, разрушение подшипников, заклинивание подшипников и т. д.

Большой спектр задач, связанных с надежностью, возникает при ремонте и обслуживании авиационной техники (одна из таких задач будет рассмотрена ниже).

Требуется проводить всесторонний анализ отказов по частоте и длительности простоев, планировать ремонт и рассчитывать количество запчастей на складе.

Имеется возможность работать как с полными, так и неполными (цензурированными) данными, что увеличивает точность оценок.

Ниже приведен график функции надежности оборудования для трех разных заводов-изготовителей.

Функция надежности для трех групп

Рис. 2. Функция надежности для трех групп

Очевидно, что оборудование, выпускаемое третьим заводом, обладает большей надежностью, чем остальные.

 


Анализ надежности

Основная задача, которая решается в Анализе выживаемости, заключается в оценке функции выживаемости (или, что тоже, функции надежности) по данным, содержащим как полные, так и неполные наблюдения за временем работы оборудования.

Интерпретация функции надежности очень проста и естественна - это вероятность того, что оборудование будет функционировать больше t дней после запуска.

Таблицы времен жизни

Наиболее естественный способ описания выживаемости в выборке - построение Таблиц времен жизни.

Такую таблицу можно рассматривать как "расширенную" таблицу частот. Область возможных времен наступления критических событий (отказов, смертей и др.) разбивается на некоторое число интервалов.

Для каждого интервала вычисляют число и долю объектов, которые в начале рассматриваемого интервала были "живы", число и долю объектов, которые "умерли" в данном интервале, а также число и долю объектов, которые были изъяты или цензурированы в каждом интервале.

На основании этих величин вычисляются некоторые дополнительные статистики:

Число изучаемых объектов. Это число объектов, которые были "живы" в начале рассматриваемого временного интервала, минус половина числа изъятых или цензурированных объектов.

Доля умерших. Эта отношение числа объектов, умерших в соответствующем интервале к числу объектов, изучаемых на этом интервале.

Доля выживших. Эта доля равна единице минус доля умерших.

Кумулятивная доля выживших (функция выживания). Это кумулятивная доля выживших к началу соответствующего временного интервала. Поскольку вероятности выживания считаются независимыми на разных интервалах, эта доля равна произведению долей выживших объектов по всем предыдущим интервалам.

Полученная доля как функция от времени называется также выживаемостью или функцией выживания [точнее, это оценка функции выживания].

Плотность вероятности. Это оценка вероятности отказа в соответствующем интервале, определяемая таким образом:

Плотность вероятности

где Fi - оценка вероятности отказа в i-ом интервале, Pi - кумулятивная доля выживших объектов (функция выживания) к началу i-го интервала, hi- ширина i-ого интервала.

Функция интенсивности. Функция интенсивности (этот термин был впервые использован в работе Barlow, 1963) определяется как вероятность того, что объект, выживший к началу соответствующего интервала, откажет или умрет в течение этого интервала.

Оценка функции интенсивности вычисляется как число отказов, приходящихся на единицу времени соответствующего интервала, деленное на среднее число объектов, доживших до момента времени, находящегося в середине интервала.

Медиана ожидаемого времени жизни. Это точка на временной оси, в которой кумулятивная функция выживания равна 0.5. Другие процентили (например, 25- и 75-процентиль или квартили) кумулятивной функции выживания вычисляются по такому же принципу.

Отметим, что 50-процентиль (медиана) кумулятивной функции выживаемости обычно не совпадает с точкой выживания 50% выборочных наблюдений. (Совпадение происходит только когда за прошедшее к этому моменту время не было цензурированных наблюдений).

Объем выборки. Чтобы получить надежные оценки трех основных функций (функции выживания, плотности вероятности и функции интенсивности) и их стандартных ошибок на каждом временном интервале, рекомендуется использовать не менее 30 наблюдений.

Подгонка распределения

Общее знакомство. В общем случае таблица времен жизни дает хорошее представление о распределении отказов или смертей объектов во времени.

Однако для прогноза часто необходимо знать форму рассматриваемой функции выживания. Наиболее важны следующие семейства распределений, которые используются для описания продолжительности жизни: экспоненциальное (в том числе, линейное экспоненциальное) распределение, распределение Вейбулла экстремальных значений и распределение Гомперца.

Оценивание. Процедура оценивания параметров использует алгоритм метода наименьших квадратов. Для проведения оценивания применима модель линейной регрессии, поскольку все четыре перечисленных семейства распределений могут быть "сведены к линейным" (относительно параметров) с помощью подходящих преобразований.

Такие преобразования приводят иногда к тому, что дисперсия остатков зависит от интервалов (т.е. дисперсия различная на различных интервалах). Чтобы учесть это, в алгоритмах подгонки используют оценки взвешенных наименьших квадратов двух типов.

Согласие. Зная параметрическое семейство распределений, можно вычислить функцию правдоподобия по имеющимся данным и найти ее максимум.

Такие оценки называются оценками максимального правдоподобия. При весьма общих предположениях эти оценки совпадают с оценками наименьших квадратов.

Аналогичным образом находится максимум функции правдоподобия при нулевой гипотезе, т.е. для модели, допускающей различные интенсивности на разных интервалах.

Сформулированная гипотеза может быть проверена, например, с помощью критерия отношения правдоподобия, статистика которого имеет (по крайней мере, асимптотически) хи-квадрат распределение.

Графики. В модуле можно строить графики как эмпирических, так и теоретических функций распределения и интенсивности. Эти графики представляют собой прекрасное средство проверки согласия данных с теоретическим распределением. Ниже показана эмпирическая функция выживания и функции из семейства распределений Вейбулла.

мпирическая функция выживания и функции из семейства распределений Вейбулла

Рис. 3. Эмпирическая функция выживания и функции из семейства распределений Вейбулла

На этом графике три линии обозначают теоретические распределения, полученные с помощью трех различных процедур оценивания (методом наименьших квадратов и двумя методами взвешенных наименьших квадратов).

Множительные оценки Каплана-Мейера

Для цензурированных, но не группированных наблюдений времен жизни, функцию выживания можно оценить непосредственно (без таблицы времен жизни). Представьте, что вы создали файл, в котором каждое наблюдение содержит точно один временной интервал. Перемножая вероятности выживания в каждом интервале, получим следующую формулу для функции выживания:

Множительные оценки Каплана-Мейера

В этом выражении, S(t) - оценка функции выживаемости, n - общее число событий и Сигмаозначает произведение (геометрическую сумму) по всем наблюдениям, завершившимся к моменту t.

Сигма(j) равно 1, если j-ое наблюдение нецензурированное (законченное), и равно 0, если это наблюдение потеряно (цензурирование). Данная оценка функции выживаемости, называемая множительной оценкой, впервые была предложена Капланом и Мейером (1958).

Функция Выживаемости

Рис. 4. Функция Выживаемости

Преимущество метода Каплана-Мейера (по сравнению с методом таблиц жизни) состоит в том, что оценки не зависят от разбиения времени наблюдения на интервалы, т.е. от группировки. Метод множительных оценок и метод таблиц времен жизни приводят, по существу, к одинаковым результатам, если временные интервалы содержат, максимум, по одному наблюдению.

Сравнение выборок

Общее знакомство. Можно сравнить времена жизни или, на техническом языке, наработки до отказа нескольких выборок. В принципе, т.к. времена жизни не являются нормально распределенными, можно использовать непараметрические тесты, основанные на рангах.

Непараметрические статистики предлагают широкий набор непараметрических критериев, которые могли бы быть применены для сравнения времен жизни; однако эти критерии не "работают" с цензурированными данными.

Доступные критерии. В Анализе выживаемости имеется пять различных (в основном непараметрических) критериев для цензурированных данных: обобщенный (Геханом) критерий Вилкоксона, F-критерий Кокса, логарифмический ранговый критерий, а также обобщенный Пето (Peto R. и Peto J.) критерий Вилкоксона.

Большинство этих критериев приводят соответствующие z-значения (значения стандартного нормального распределения); эти z-значения могут быть использованы для статистической проверки любых различий между группами. Однако критерии дают надежные результаты лишь при достаточно больших объемах выборок. При малых объемах выборок их "поведение" менее поддается осмыслению.

Выбор двухвыборочного критерия. Не существует твердо установленных рекомендаций по применению определенных критериев. Однако известно, что F - критерий Кокса обычно более мощный, чем критерий Вилкоксона - Гехана, если:

1. выборочные объемы малы (то есть объем группы n меньше 50);

2. если выборки извлекаются из экспоненциального распределения или распределения Вейбулла;

3. если нет цензурированных наблюдений.

В работе Lee, Desu, and Gehan (1975) авторы сравнили критерий Гехана с некоторыми другими критериями и показали, что критерий Кокса-Ментела и логарифмически ранговый критерий являются более мощным (безотносительно к цензурированию), если выборки извлечены из экспоненциального распределения или распределения Вейбулла; при этих условиях между критерием Кокса-Ментела и логарифмически ранговым критерием почти нет различия.

Критерий для нескольких выборок. Многовыборочный критерий представляет собой развитие критерия Вилкоксона, обобщенного Геханом, критерия Вилкоксона, обобщенного Пето, и логарифмически рангового критерия.

Сначала каждому времени жизни приписывается его вклад в соответствии с процедурой Ментела (Mantel, 1967); далее на основе этих вкладов (по группам) вычисляется значение статистики хи-квадрат.

Если выделены только две группы, то критерий эквивалентен критерию Вилкоксона, обобщенному Геханом.

Неравные доли цензурированных наблюдений. Если сравниваются две или более группы, то важно проверить доли цензурированных наблюдений в каждой.

Регрессионные модели

Самая большая проблема инженерных и других статистических исследований состоит в выяснении того, являются ли некоторые непрерывные переменные связанными с наблюдаемыми временами жизни.

Есть две главные причины, по которым в таких исследованиях не может быть непосредственно применена классическая техника множественной регрессии.

Во-первых, времена жизни обычно не являются нормально распределенными, а это является серьезным нарушением предположений для оценивания множественной регрессии по методу наименьших квадратов.

Времена жизни обычно имеют экспоненциальное распределение или распределение Вейбулла.

Во-вторых, имеется проблема с цензурированными, т.е. незавершенными наблюдениями.

Модель пропорциональных интенсивностей Кокса

Модель пропорциональных интенсивностей - наиболее общая регрессионная модель, поскольку она не связана с какими-либо предположениями относительно распределения времени выживания.

Эта модель предполагает, что функция интенсивности имеет некоторый уровень y, являющийся функцией независимых переменных. Никаких предположений о виде функции интенсивности не делается. Поэтому модель Кокса может рассматриваться как в некотором смысле непараметрическая. Модель может быть записана в следующем виде: Модель пропорциональных интенсивностей Кокса

где h(t,...) обозначает результирующую интенсивность, при заданных для соответствующего наблюдения значениях m ковариат (z1, z2, ..., zm) и соответствующем времени жизни (t).

Множитель h0(t) называется базовой функцией интенсивности; она равна интенсивности в случае, когда все независимые переменные равны нулю. Можно линеаризовать эту модель, поделив обе части соотношения на h0(t) и взяв натуральный логарифм от обеих частей:

Линеаризация модели

Теперь мы имеем достаточно "простую" линейную модель, которая легко поддается изучению.

Предположения. В то время как никаких прямых предположений о виде функции интенсивности ранее не делалось, модельное уравнение, приведенное выше, подразумевает два предположения.

Во-первых, зависимость между функцией интенсивности и логлинейной функцией ковариат является мультипликативной. Это соотношение называется также предположением (гипотезой) пропорциональности.

Реально оно означает, что для двух заданных наблюдений с различными значениями независимых переменных отношения их функций интенсивности не зависит от времени (чтобы ослабить это предположение, используются ковариаты, зависящие от времени; см. ниже).

Второе предположение состоит именно в логарифмической линейности соотношения между функцией интенсивности и независимыми переменными.

Экспоненциальная регрессия

В своей основе эта модель предполагает, что распределение продолжительности жизни является экспоненциальным и связано со значениями некоторого множества независимых переменных (zi). Параметр интенсивности экспоненциального распределения выражается в виде:

Экспоненциальная регрессия

Здесь S(z) обозначает время жизни, a - константа, а bi - параметры регрессии.

Согласие. Значение критерия хи-квадрат может быть вычислено как функция логарифма правдоподобия для модели со всеми оцененными параметрами (L1) и логарифма правдоподобия модели, в которой все ковариаты обращаются в 0 (L0). Если значение хи-квадрат статистически значимо, отвергаем нулевую гипотезу и принимаем, что независимые переменные значимо влияют на время жизни.

Стандартная экспоненциальная порядковая статистика. Один из способов проверки предположения экспоненциальности - построение остатков времен жизни и сравнение их со значениями стандартных экспоненциальных порядковых статистик альфа.

Нормальная и логнормальная регрессия

В этой модели предполагается, что времена жизни (или их логарифмы) имеют нормальное распределение. Модель в основном идентична обычной модели множественной регрессии и может быть описана следующим образом:

Нормальная и логнормальная регрессия

Здесь t означает время жизни. Если принимается модель логнормальной регрессии, то t заменяется ln t.

Модель нормальной регрессии особенно полезна, поскольку часто данные могут быть преобразованы в нормальные применением нормализующих аппроксимаций.

Таким образом, в некотором смысле это наиболее общая параметрическая модель (в противоположность модели пропорциональных интенсивностей Кокса, которая является непараметрической), оценки которой могут быть получены для большого разнообразия исходных распределений времен жизни.

Согласие. Значение хи-квадрат может быть вычислено как функция логарифма правдоподобия для модели со всеми независимыми переменными (L1) логарифма правдоподобия для модели, в которой все независимые переменные заменены 0 (L0).

Стратифицированный анализ

Цель стратифицированного анализа - проверить гипотезу о том, что одна и та же регрессия является подходящей для разных групп (данных); то есть зависимость между выживаемостью и регрессорами одна и та же для разных групп данных.

При стратифицированном анализе Анализ выживаемости вначале строит регрессионные модели отдельно для каждой группы. Сумма логарифмов правдоподобия для разных моделей представляет собой логарифм правдоподобия модели с разными коэффициентами регрессии (и свободными членами, если требуется) в разных группах.

Далее программа подгоняет требуемую регрессионную модель ко всем данным обычным образом, не учитывая разбиение на группы, и вычисляет общий логарифм правдоподобия.

По разности этих двух логарифмов правдоподобия проверяется статистическая значимость различия между группами (с точки зрения хи-квадрат статистики).

 


Анализ процессов

Большое количество статистических процедур для расчета надежности имеется в группе модулей Промышленная статистика.

Мы остановимся подробнее на модуле Анализ процессов.

Стартовое окно "Анализ процессов"

Рис. 5. Стартовое окно "Анализ процессов"

Анализ пригодности процессов

Вопрос пригодности производственного процесса возникает, когда процесс становится управляемым.

Если средние значения последовательных выборок сильно флуктуируют или явно находятся вне заданного допуска, то вначале нужно решить проблемы качества.

Ниже приведены некоторые важнейшие показатели, используемые для описания пригодности производственного процесса.

Размах процесса. Обычно вначале находят границы ± 3 сигма по обе стороны от номинала. Эти границы обозначают размах процесса. Если используется интервал ± 3 сигма, то в предположении нормальности распределения можно сделать вывод о том, что примерно 99% всех наблюдений находятся в этих границах.

Границы допуска НГД, ВГД. Обычно технические условия задают некий диапазон допустимых значений – нижнюю и верхнюю границу допуска (НГД и ВГД).

Потенциальная пригодность (Cp). Это простейший и самый естественный показатель пригодности производственного процесса. Он определяется как отношение размаха допуска к размаху процесса; при использовании границ ± 3 сигма данный показатель можно выразить в виде:

Потенциальная пригодность

Данное отношение выражает долю размаха кривой нормального распределения, попадающую в границы допуска.

Отношение пригодности (Cr). Этот показатель эквивалентен Cp; а именно, он вычисляется как 1/Сp.

Нижняя/верхняя потенциальная пригодность: Cpi, Cpu. Недостаток показателя Cp (и Cr) состоит в том, что он может дать неверную информацию о производственном процессе в том случае, если среднее процесса отличается от номинального, иными словами, если процесс не центрирован.

Нецентрированность или смещенность процесса производства можно выразить следующим образом. Сначала можно вычислить верхний и нижний показатели пригодности, чтобы отразить отклонение наблюдаемого среднего процесса от НГД и ВГД. Приняв в качестве размаха процесса границы ± 3 сигма, вычислим следующие показатели:

Cpi = (Среднее - НГД)/3*сигма

Cpu = (ВГД - Среднее)/3*сигма

Ясно, что если эти значения не совпадают, то процесс не центрирован.

Поправка на нецентрированность (K). Можно скорректировать индекс Cp, чтобы учесть смещение. А именно, вычислим:

K=abs(Номинал - Среднее)/(1/2*(ВГД - НГД)) ,

где Номинал = (ВГД+НГД)/2.

Этот поправочный множитель выражает отношение нецентрированности (номинал минус среднее) к допуску.

Подтвержденное качество (Cpk). Наконец, Cp можно скорректировать, внеся поправку на нецентрированность посредством вычисления:

Cpk = (1-k)*Cp

Если процесс идеально центрирован, то k равно нулю и Cpk равно Cp. Однако когда процесс смещается от номинального значения, k увеличивается, и Cpk становится меньше Cp.

Потенциальная пригодность II: Cpm. Недавно введенная модификация показателя Cp направлена на уточнение оценки сигмы с целью учета влияние случайной нецентрированности. При этом вычисляется другое значение сигма (сигма2) как:

Потенциальная пригодность

где xi – значение i-го наблюдения в выборке;

НЗ – номинальное значение;

n – число наблюдений в выборке.

Затем можно использовать эту оценку параметра сигма при вычислении Cp по тем же формулам, что и прежде. Полученный показатель будет обозначаться Cpm.

Повторяемость и воспроизводимость измерений

Анализ повторяемости и воспроизводимости связан с изучением вопроса о точности измерений.

Анализ повторяемости

Рис. 6. Анализ повторяемости

Цель анализа повторяемости и воспроизводимости - определить, какая часть изменчивости результатов измерений вызвана

1) различием измеряемых изделий или деталей (изменчивость деталей);

2) различием операторов или приборов, осуществляющих измерения (воспроизводимость);

3) ошибками (погрешностями) измерений, осуществляемых теми же операторами при нескольких измерениях одинаковыми приборами одних и тех же деталей (повторяемость).

В идеальном случае все колебания результатов измерений вызваны изменчивостью самих деталей, и лишь пренебрежимо малая часть зависит от воспроизводимости (приборов и операторов) и повторяемости (повторных измерений).

Анализ Вейбулла

Знаменитое распределение Вейбулла позволяет моделировать реальные процессы старения и износа оборудования.

Это очень важное распределение, возникающее на практике в самых разных ситуациях.

Анализ Вейбулла

Рис. 7. Анализ Вейбулла

Распределение Вейбулла имеет следующую функцию плотности (для положительных параметров b, c и Тетта):

Функция плотности,

где b – параметр масштаба;

c – параметр формы;

Тетта- параметр положения;

e – основание натурального логарифма, число Эйлера (2,71…).

Границы для параметров

Во многих случаях параметр положения можно считать равным 0.

В частном случае распределение Вейбулла переходит в экспоненциальное распределение.

Положим с=1. Нетрудно догадаться, что в данном случае получаем экспоненциальное распределение с параметром 1/b. Обычно этот параметр обозначается λ.

Кумулятивная функция распределения. Распределение Вейбулла имеет следующую кумулятивную функцию распределения (для положительных параметров b, c и Тетта):

Кумулятивная функция распределения

Функция надежности. Функция надежности Вейбулла имеет вид:

R(x) = 1 - F(x)

Функция надежности

Рис. 8. Функция надежности

Функция риска. Функция риска описывает вероятность отказа за очень маленький промежуток времени в предположении, что до этого момента не было ни одного отказа. Распределение Вейбулла имеет следующую функцию риска (для положительных параметров b, c и Тетта):

Функция риска

Функция риска

Рис. 9. Функция риска

Кумулятивная функция риска. Распределение Вейбулла имеет следующую кумулятивную функцию риска (для положительных параметров b, c и Тетта):

Кумулятивная функция риска

Функцию риска можно описать в терминах кривой "работоспособности": в самом начале работы машины риск отказа достаточно высок (поскольку новые детали еще не адаптировались друг к другу); после этого риск отказа уменьшается и становится равным некоторой константе.

После некоторого времени риск отказа снова возрастает до тех пор, пока все детали или все устройства не сломаются.

Распределение Вейбулла позволяет гибко смоделировать поведение подобной функции риска. Ниже показаны графики функции риска для 4 параметров формы: c=0.5, c=1, c=2 и c=5.

Функция риска Вейбулла

Рис. 10. Функция риска Вейбулла

Начальную стадию работы системы можно аппроксимировать функцией риска Вейбулла с параметром формы c<1; стабильную фазу можно смоделировать, используя параметр c=1; а на заключительной стадии работы необходимо использовать параметр c>1.

Планы выборочного контроля

Планы выборочного контроля

Рис. 11. Планы выборочного контроля

Общая проблема, с которой сталкиваются инженеры по контролю качества, состоит в том, чтобы определить, сколько изделий из партии (например, полученной от поставщика) необходимо исследовать, чтобы быть уверенными в том, что изделия этой партии обладают приемлемым качеством.

Процедуры выборочного контроля применяются в том случае, когда нужно решить, удовлетворяет ли определенным спецификациям партия изделий, не изучая при этом все изделия.

Очевидное преимущество выборочного контроля над полным (сплошным) состоит в том, что изучение только выборки (а не всей партии) требует меньшего времени и финансовых затрат.

В некоторых случаях исследование изделия является разрушающим (например, испытание стали на предельную прочность), и сплошной контроль уничтожил бы всю партию.

Наконец, с точки зрения управления производством, отбраковка всей партии или поставки от данного поставщика (на основании выборочного контроля) вместо браковки лишь определенного процента дефектных изделий (на основании сплошного контроля) часто заставляет поставщиков строже придерживаться стандартов качества.

Диаграмма причин и следствий отказов

Стартовое окно "Диаграмма причин и следствий"

Рис. 12. Стартовое окно "Диаграмма причин и следствий"

Диаграмма причин и следствий является эффективным способом исследования влияния факторов на процесс. Ее можно использовать в качестве схемы распределения средств с целью улучшения качества продукта.

Диаграмму иногда называют "рыбий скелет" (так как после построения она очень похожа на скелет рыбы) или диаграммой Ишикавы (в честь профессора Токийского Университета Kaoru Ishikawa, который первый предложил использовать этот график при анализе процесса).

Диаграмма причин и следствий отказов

Рис. 13. Диаграмма причин и следствий отказов

Показанная выше диаграмма причин и следствий иллюстрирует возможные причины неисправности лампы.

Обычно, эту диаграмму строят, чтобы выявить главные категории причин, влияющих на процесс и отдельные факторы или причины, которые разделены на главные классы.

Наличие языка SVB позволяет гибко интегрировать в STATISTICA новые методы.

Рассмотрим классическую задачу, связанную с отказами кондиционеров самолетов класса Боинг.

Задача основана на реальных данных, опубликованных в книге [1].

 


Математическая модель

Допустим, у нас имеется выборка из n времен наработки на отказ X1,...,Xn некоторого изделия. Причем случайные величины X1,...,Xn взаимно независимы и все Xi извлечены из одной непрерывной совокупности.

Нас интересует проверка следующей гипотезы

Гипотеза для всех Условие

Эта гипотеза эквивалентна утверждению о том, что работающие изделия любого «возраста» не лучше и не хуже, чем новые.

В альтернативу Ho ставится гипотеза «Новое Лучше Старого (НЛС)»:

гипотеза &laquo;Новое Лучше Старого (НЛС)&raquo; для всех Условие

(причем хотя бы для некоторых Условие неравенство строгое). Иными словами – новые изделия надежнее, чем уже проработавшие некоторое время.

Для проверки гипотезы Ho, необходимо выполнить следующие шаги:

1. упорядочить Xi по возрастанию. Пусть Упорядоченные значения- упорядоченные значения.

2. Вычислить  Формула для T, где

Условие

3. Тогда односторонний критерий уровня Альфа (вероятность ошибки первого рода) для H0 таков:

отклонить H0 (принять НЛС), если Условие для T;

принять H0, если Условие для T.

Где константа t1 удовлетворяет соотношению Соотношение для P0.

Приближенные значения t1 можно найти в книге [1].

 


Пример применения

Рассмотрим следующий пример на основе данных Прошана [2]. Он исследовал распределение сроков службы системы кондиционирования воздуха отряда реактивных самолетов Боинг-720.

В таблице 1 представлены интервалы между отказами кондиционера Боингов.

Интервалы между отказами кондиционера

Таблица 1. Интервалы между отказами кондиционера

Сначала необходимо проверить, удовлетворяет ли данная выборка допущениям, описанным в математической модели.

Для этого используем критерий Манна для тренда [1, гл. 8]. Применение критерия к данным таблицы 1 говорит об отсутствии очевидных доводов в пользу тренда.

Теперь применим метод проверки гипотезы о том, что эта совокупность удовлетворяет H0 против альтернативы НЛС. В данном примере можно интерпретировать эту гипотезу как утверждение о том, что после ремонта система кондиционирования так же надежна, как новая.

Для этого воспользуемся SVB-макросом, реализованным в системе STATISTICA.

Проверка гипотезы НЛС

Рис. 14. Проверка гипотезы НЛС в системе STATISTICA

На основе входных данных вычисляется значение Т. Далее, исходя из объема выборки и заданного пользователем уровня Альфа, делается вывод о принятии или отклонении гипотезы НЛС.

Подадим на вход макроса таблицу 1 (см. рис. 14). Как видно, в нашем случае значение Т равно 12. Можно убедиться, что на любом из предложенных уровней альфа от 0.01 до 0.1 гипотеза НЛС отвергается.

Отвержение гипотезы НЛС

Рис. 15. Отвержение гипотезы НЛС

Таким образом, используя макрос «Критерий Холлендера-Прошана», мы принимаем гипотезу о том, что после ремонта система кондиционирования также надежна, как новая.

 


Список литературы

1. М. Холлендер, Д. Вульф (1983) Непараметрические методы статистики. – Финансы и статистика, 260-264, 206.

2. Proshan F. (1963) Theoretical explanation of observed decreasing failure rate. – Technometrics 5, 375-383.


В начало


Узнайте больше на курсах Академии Анализа Данных StatSoft

Список курсов    Календарь    Расписание груповых занятий






info@statsoft.ru       (495) 787-77-33       (499) 674-06-15       STATISTICA Data Miner 13.2 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia
1999-2017

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта