База примеров

Исследование свойств многокомпонентной стали в системе STATISTICA

О задаче

Предел текучести

Временное сопротивление

Разведочный анализ

Файл данных

Описательный анализ

Выбор стали с нужными свойствами без построения явной модели смеси

Планирование эксперимента

Анализ эксперимента

Линейная модель

Квадратичная модель

Список литературы

 

О задаче

Сталь – деформируемый (ковкий) сплав железа с углеродом (и другими элементами), содержание углерода в котором не превышает 2,14%, но не меньше 0,02%. Углерод придаёт сплавам железа прочность и твёрдость, снижая пластичность и вязкость. Учитывая, что в сталь могут быть добавлены легирующие элементы, сталью называется содержащий не менее 45% железа сплав железа с углеродом и легирующими элементами (легированная, высоколегированная сталь).

Предел текучести

Важнейшим критерием при выборе металлического материала, от которого требуется высокая упругость, является предел текучести. У самых лучших пружинных сталей практически такой же модуль упругости, как и у самых дешевых строительных, но пружинные стали способны выдерживать гораздо большие напряжения, поскольку у них выше предел текучести. Свойства металлического материала можно изменять путем сплавления и термообработки. Так, предел текучести железа подобными методами можно повысить в 50 раз. Предел текучести чистого железа составляет примерно 40 МПа, тогда как предел текучести сталей, содержащих 0,5% углерода и несколько процентов хрома и никеля, после нагревания до 950° С и закалки может достигать 2000 МПа.

Временное сопротивление

Прочностью называют свойство твердых тел сопротивляться разрушению, а также необратимыми изменениями формы. Основным показателем прочности металла является временное сопротивление, определяемое при разрыве цилиндрического образца, предварительно подвергнутого отжигу. По прочности металлы можно разделить на следующие группы:

  • непрочные (временное сопротивление не превышает 50 МПа) - олово, свинец, висмут, а также мягкие щелочные металлы;

  • прочные (от 50 до 500 МПа) - магний, алюминий, медь, железо, титан и другие металлы, составляющие основу важнейших конструкционных сплавов;

  • высокопрочные (более 500 МПа) - молибден, вольфрам, ниобий и др.

Примеры значений временного сопротивления чистых металлов приведены в таблице:

Временное сопротивление чистых металлов

 


Разведочный анализ

Файл данных

Таблица данных содержит информацию о 424 образцах стали различного состава:

  • процентное содержание в стали различных примесей (переменные 1-15: C-…-Ca),

  • величины временного сопротивления и предела текучести сталей данного состава.

Исходные данные

На рисунке приведён фрагмент исходных данных.

Описательный анализ

Основные описательные статистики по составу имеющихся в таблице образцов стали были вычислены в модуле Основные статистики и таблицы:

Основные статистики и таблицы

Таблица описательных статистик:

Таблица описательных статистик

Наиболее сильно в исследуемых образцах варьируется содержание Mn, Cr, Ni и Cu.

Диаграмма размаха

Введём новый показатель – суммарную процентную долю всех изучаемых нами 15 примесей в составе образца стали:

Суммарная процентная доля

Тогда процентная доля железа (и, возможно, прочих примесей) в составе стали:

Процентная доля железа

Диаграммы размаха процентного содержания всех примесей:

Диаграммы размаха для всех примесей

Медиана содержания примесей составляет 2,64% (50% образцов содержит более 2,64% примесей, 50% образцов – менее). Нижняя квартиль 2,60%, верхняя квартиль 2,70% (у 50% образцов содержание примесей в этом диапазоне, т.е. это наиболее типичный диапазон).

Если рассмотреть диаграмму рассеяния по переменным Предел текучестиВременное сопротивление, можно заметить, что эти величины сильно скоррелированы: коэффициент корреляции Пирсона равен r = 0,92 и является статистически значимым. Скоррелированность показателей может объясняться как реально существующей взаимосвязью между ними, так и особенностями планирования составов смесей при проведении эксперимента.

Диаграмма рассеяния

Ряд наблюдений, наиболее сильно отклоняющихся от подгоночной прямой, можно выделить прямо на графике с помощью инструмента Интерактивное закрашивание, и быстро найти соответствующие образцы в массиве исходных данных:

Интерактивное закрашивание

Эти отклонения могут объясняться или необычным составом смеси (нетипичным для нашей экспериментальной выборки), или высокой погрешностью измерения показателей свойств стали.

Для поиска нетипичных наблюдений по сочетанию пары количественных признаков (в нашем случае это Предел текучести и Временное сопротивление) в STATISTICA можно также использовать графический инструмент Bag Plot (2-мерный аналог диаграммы размаха):

Bag Plot

Точки, соответствующие образцам с нетипичными для данной выборки сочетаниями параметров выделены на графике «крестиками».

 


Выбор стали с нужными свойствами без построения явной модели смеси

Если мы уже имеем собранные экспериментальные данные, нас может заинтересовать поиск стали с нужным нам сочетанием свойств Предел текучести – Временное сопротивление.

В исходном массиве данных некоторые строки повторяются, т.е. эксперимент для соответствующих составов смеси повторялся неоднократно. Эту информацию необходимо учитывать при решении задачи.

В модуле Анализ эксперимента диалог Анализ плана для смеси позволяет получить таблицу для всех видов стали, встречающихся в исходных данных, и усреднённые значения Предела текучести и Временного сопротивления:

Анализ плана для смеси

Напомним, что исходная таблица содержала информацию о 424 опытах (число всех опытов, в т.ч. повторяющихся). Результирующая таблица содержит данные о 137 комбинациях компонент смеси (число различных опытов). Число реплик (повторений опыта с одним и тем же составом смеси) составило от 2 до 16 раз. Чаще всего проводилось 2 опыта для каждого состава.

Фрагмент результирующей таблицы представлен ниже:

Таблица результатов

Заметим, что диаграмма рассеяния по усреднённым значениям показателей Предел текучести – Временное сопротивление уже не содержит резких отклонений экспериментальных точек от общей прямой. Скорее всего, эти отклонения объяснялись не необычным составом смеси, а погрешностью измерения показателей свойств стали:

Диаграмма рассеяния по усреднённым значениям

С помощью диаграмм размаха можно выявить составы смеси, для которых разброс измеренных в эксперименте значений предела текучести и временного сопротивления был аномально высок. Такие эксперименты будут идентифицированы как выбросы на диаграмме рассеяния для стандартных отклонений:

Диаграмма размаха

Для предела текучести значения стандартного отклонения выше 34,65 являются нетипичными. Такие значения встречались в следующих опытах:

Таблица - предел текучести

Заметим, что во всех случаях эксперимент с таким составом смеси повторялся 2 раза, и при этом были измерены сильно отличающиеся друг от друга характеристики стали.

Для временного сопротивления нетипичными являются значения стандартного отклонения выше 24,04. Такие значения встречались в следующих опытах:

Таблица - временное сопротивление

Построим диаграмму Вороного по переменным Временное сопротивление и Предел текучести:

Диаграмма Вороного

На диаграмме Вороного значения двух переменных изображаются, как на диаграмме рассеяния, а затем пространство между отдельными точками данных делится границами, окружающими каждую точку данных, на области по следующему принципу: каждая точка области находится ближе к заключенной внутри точке данных, чем к любой другой соседней точке данных.

Приведем пример практического использования диаграммы Вороного для решения задачи поиска стали с желаемыми свойствами без построения явной модели смеси.

Предположим, что мы хотим определить состав стали, обладающей временным сопротивлением 620 и пределом текучести 720.

Для этого было бы полезно узнать, какой состав из экспериментально исследованных обладал похожим сочетанием параметров.

Проведём на графике соответствующие прямые; точка пересечения прямых будет соответствовать стали с искомыми свойствами:

Диаграмма Вороного - опредение состава

Точку, ближайшую к искомой, можно выделить прямо на графике с помощью инструмента Интерактивное закрашивание, и быстро найти соответствующий образец в массиве исходных данных:

Диаграмма Вороного - закрашивание

Это оказался образец 62, его состав указан в таблице, экспериментально измеренное временное сопротивление 724, предел текучести 621.

Искомый образец в таблице

 


Планирование эксперимента

В условиях промышленного эксперимента основная цель обычно заключается в извлечении максимального количества объективной информации о влиянии изучаемых факторов на производственный процесс с помощью наименьшего числа дорогостоящих наблюдений.

Если большинство факторов (компоненты смеси) при проведении эксперимента изменяются непрерывно и могут быть установлены на заранее выбранных уровнях, то применима во всей ее полноте методология изучения поверхности отклика.

Как правило, перед построением моделей взаимодействия компонентов смеси (см. далее раздел Анализ эксперимента) вначале планируют эксперимент: составляют т.н. план, состоящий из оптимального (в плане числа измерений) списка составов смесей, для которых впоследствии производится замер характеристик сплава – в нашем случае, временного сопротивления и предела текучести.

Планирование экспериментов

В нашей задаче уже было проведено 424 опыта со 137 комбинациями компонент стали. По имеющейся таблице с помощью модуля Основные статистики и таблицы вычислим минимальные и максимальные концентрации составляющих стали, которые присутствовали в имеющихся данных:

Таблица основных статистик

Эту таблицу можно использовать при планировании новой серии экспериментов для того, чтобы задать ограничения на нижние и верхние значения концентраций элементов смеси. Задание ограничений на компоненты смеси необходимо, т.к. в противном случае в построенном плане могут присутствовать опыты с любыми комбинациями компонент смеси, что недопустимо с практической точки зрения. Исходя из таблицы минимумов и максимумов в имеющемся плане, установим, например, такие границы:

Планирование серии экспериментов

В модуле Планирование эксперимента/Планы для поверхностей и смесей с ограничениями можно также задать дополнительные ограничения на экспериментальную область, например, ограничение вида Sn+Ca<0,025.

Определение параметров

После установки необходимых ограничений при нажатии кнопки OK получается таблица результатов, содержащая точки-вершины и центроиды (ниже приведён лишь фрагмент этой таблицы):

Таблица результатов

Полная таблица содержит 2904 комбинации 16 компонент смеси, необходимых для полноценного оценивания в дальнейшем всех коэффициентов модели смеси и их влияния на характеристики стали.

Ниже показана диаграмма рассеяния точек полученного плана на треугольнике с вершинами С – Mn – Si:

Диаграмма рассеяния точек плана

 


Анализ эксперимента

В нашем случае рассматривается смесь различных компонент стали, которые образуют в сумме 100%. Необходимо выявить влияние каждой компоненты и их взаимодействий на характеристики стали (Предел текучести, Временное сопротивление). Для данного типа задач существует специальный метод анализа экспериментов – анализ смеси.

Анализ экспериментов для смесей похож на множественную регрессию со свободным членом, равным нулю. Основное ограничение - сумма всех компонент должна быть постоянной - может быть реализовано в подгонке модели множественной регрессии, не включающей свободный член.

К значениям зависимой переменной (Предел текучести, Временное сопротивление) в STATISTICA подгоняется поверхность отклика возрастающей сложности, начиная с линейной модели, затем продолжая квадратичной моделью, и т. д., завершая полной кубической моделью.

Модуль Планирование экспериментов вычисляет коэффициенты выбранной модели вместе с соответствующими стандартными ошибками и доверительными интервалами.

В качестве зависимых переменных в нашей задаче выступают Предел текучести и Временное сопротивление, а в качестве независимых факторов – значения долей элементов смеси (С, Cr, Mn … , Fe+…):

Планирование и анализ планов для смесей

Линейная модель

Для анализа основных компонент, без взаимодействий, смеси нам необходимо выбрать линейный тип модели в модуле Анализ и планирование экспериментов:

Построение модели

Все необходимы результаты анализа эффектов находятся на вкладке Быстрый:

Вкладка Быстрый

Нажав на кнопку Дисперсионный анализ, получим таблицы для пары характеристик стали:

Дисперсионный анализ - таблица 1

Дисперсионный анализ - таблица 2

Из таблицы видно, что полученные результаты являются статистически значимыми (p<<0,05), доля объясненной дисперсии равна 0,45 для предела текучести и 0,46 для временного сопротивления. Нажав на кнопку Оценки исходных компонент, получим численные оценки эффектов:

Оценки исходных компонент - предел текучести

Оценки исходных компонент - временное сопротивление

Визуализировать численные значения таблиц можно, построив диаграммы Парето (кнопка Карта Парето эффектов):

Построение диаграммы Парето

Из диаграммы Парето для предела текучести видно, что из основных компонент статистически значимым оказался эффект Мо, Cr, Fe+…, Mn, Ca, Al, Sn и P, остальные являются слабо значимыми. Значения коэффициентов регрессии указаны в таблице (см. выше): например, напротив Mn стоит цифра 145,3 - это означает, что в среднем при изменении на 1% значения Mn, предел текучести увеличивается на 145,3 единицы.

Обратите внимание, что коэффициенты перед Ca и Sn имеют отрицательный знак – т.е., вообще говоря, из построенной модели следует, что увеличение концентрации этих элементов ведёт к уменьшению предела текучести.

Диаграмма Парето для предела текучести

Из диаграммы Парето для временного сопротивления видно, что из основных компонент статистически значимым оказался эффект Fe+…, Mo, Cr, C, Mn, Al, Ca, Sn, P и V, остальные являются слабо значимыми. Значения коэффициентов регрессии указаны в таблице (см. выше): например, напротив Cr стоит цифра 151,8 - это означает, что в среднем при изменении на 1% значения Cr, временное сопротивление увеличивается на 151,8 единицы.

Коэффициенты перед Ca и Sn имеют отрицательный знак – т.е. из построенной модели следует, что увеличение концентрации этих элементов ведёт к уменьшению временного сопротивления.

Диаграмма Парето для временного сопротивления

Квадратичная модель

Для оценки взаимодействий необходимо воспользоваться квадратичной моделью, для этого нужно изменить соответствующие условия на вкладке Модель:

Вкладка Модель

Допустим, что за исключением интересующих нас факторов и их сочетаний, остальные факторы не важны, и любые различия между верхними и нижними их установками обусловлены случайными колебаниями. В этом случае целесообразно провести объединение эффектов в ошибку: мы можем объединить вариабельности этих незначимых факторов для получения оценки вариабельности ошибки. Для этого необходимо на вкладке Модель отметить пункт Игнорировать некоторые эффекты. Затем в открывшемся окне выбрать все факторы, за исключением не интересующих нас или тех, вклад которых мы заведомо не сможем оценить точно.

Например, в рассматриваемой нами задаче целесообразно игнорировать эффекты:

  •  с Fe+… (т.к. это основная составляющая стали)

  •  с С, Nb, O – т.к. в имеющемся у нас плане эксперимента концентрации этих примесей могут принимать всего лишь 3 различных значения – а этого скорее всего будет недостаточно для точной оценки их вкладов.

Таблица результатов - предел текучести

Таблица результатов - временное сопротивление

Из таблиц видно, что полученные результаты являются статистически значимыми (p<<0,05), доля объясненной дисперсии равна 0,66 для предела текучести и 0,69 для временного сопротивления.

Нажав на кнопку Оценки исходных компонент, получим численные оценки эффектов и их взаимодействий (взаимодействия закодированы латинскими буквами, например BC означает взаимодействие Si (B) и Mn (C)):

Оценки исходных компонент - Таблица 1

Оценки исходных компонент - Таблица 2

Обратите внимание, что здесь для наглядности приведены только фрагменты таблиц коэффициентов.

Визуализировать численные значения таблиц можно, построив диаграммы Парето:

Диаграмма Парето

Обратите внимание, что по вертикальной оси подписаны не все имена коэффициентов (это сделано в целях наглядности).

Для проверки адекватности модели можно построить диаграмму рассеяния наблюдаемых значений и предсказанных согласно модели значений. Например, для временного сопротивления диаграмма выглядит так:

Диаграмма для временного сопротивления

Разброс точек относительно подгоночной прямой характеризует точность модели.

Для оценки величины ошибок можно построить гистограмму остатков. Наиболее типичный диапазон ошибок – около 20 единиц временного сопротивления. Гистограмма остатков для временного сопротивления симметрична относительно нуля, что говорит о несмещённости модели:

Гистограмма остатков

Итак, в данном примере мы выявили основные компоненты и их взаимодействия, влияющие на характеристики стали, и получили значения их эффектов влияния.

Для получения более подробной информации о методах анализа и планирования экспериментов обратитесь к соответствующей литературе (см. список литературы) или к электронному руководству к системе STATISTICA.

 


Список литературы

1. В.П.Боровиков. STATISTICA. Искусство анализа данных на компьютере: для профессионалов (2-е издание), СПб.: Питер, 2003. – 688 с.: ил.

2. Бежаева З.И., Малютов М.Б. Введение в теорию планирования регрессионных экспериментов, Московский государственный институт электронного машиностроения, Темплан, 1983.

3. Бродский В.З. Введение в факторное планирование эксперимента, Наука, 1976.

4. Дэниел К. Применение статистики в промышленном эксперименте, Мир, 1976.

5. Дрейпер Н., Смит Г. Прикладной регрессионный анализ, Финансы и статистика, 1986.

6. Кендалл М.Дж., Стьюарт А. Многомерный статистический анализ и временные ряды, Наука, 1976.

7. Налимов В.В., Чернова Н.А. Статистические методы планирования экстремальных экспериментов, Наука, 1965.

8. Г.И.Ивченко, Ю.И.Медведев. Математическая статистика. – М.: Высшая школа, 1984. – 248 с.

9. Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. – М.: Большая Российская энциклопедия, 2003. – 912 с. 10.

10. Электронный учебник компании StatSoft.


В начало


Узнайте больше на курсах Академии Анализа Данных StatSoft

Список курсов    Календарь    Расписание груповых занятий






info@statsoft.ru       (495) 787-77-33       (499) 674-06-15       STATISTICA Data Miner 13.2 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia, 2017

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта