Знаменитое Фрэмингхемское исследование было выполнено в 1969 году и стимулировало целый ряд медицинских исследований, связанных с массовыми обследованиями населения (см. Truett, J., Cornfield, J., and Kendall, W. (1967). A Multivariate Analysis of the Risk of Coronary Heart Disease in Framingham, Journal of Chronic Disease 20, 511-524.).
В этих исследованиях были собраны данные о проявлениях ишемической болезни у 1929 мужчин и 2540 женщин в возрасте от 30 до 62 лет.
В начале обследования все пациенты были здоровы.
Факторами риска служили: возраст (в годах), количество холестерина в крови (мг/100 мл), систолическое давление (мм рт. ст.), относительный вес (100*вес – средний вес соответственно полу обследуемого), количество гемоглобина в крови (г/100 мл), количество выкуриваемых сигарет в день (0 – для не курящих, 1 – для выкуривающих меньше одной пачки, 2 – одну пачку, 3 – больше одной пачки), ЭКГ (0 – нормальная, 1 – ненормальная или неясная).
По результатам анализа была получена эмпирическая функция распределения риска возникновения ишемической болезни в течении 12 лет.
Мы покажем, как проверить адекватность построенной модели, иными словами, соответствуют рассчитанные с помощью модели частоты возникновения заболевания наблюдаемым частотам.
Рассмотрим файл, где приведены наблюдаемые и ожидаемые частоты для каждой децили распределения отдельно для мужчин и женщин.
Распределение наблюдаемого числа случаев ишемической болезни сердца было разделено на децили. Суммированием вычисленных рисков по всем объектам, попавшим в дециль. Таким образом, было определено ожидаемое число случаев болезни коронарных сосудов.
Шаг 1. Откройте модуль Непараметрическая статистика. Создайте файл данных, показанный на рисунке ниже.
Рис. 1. Данные исследований
Значения первой переменной разделяют наблюдения на группы риска. Всего имеется 10 групп.
Во втором столбце таблицы даны наблюдаемые частоты заболевания у мужчин для различных групп риска (определяемым значениями первой переменной), в третьем столбце – ожидаемые частоты для мужчин.
Аналогичный смысл имеют четвертая и пятая переменные для женщин.
Шаг 2. Выберите опцию Наблюдаемые частоты в сравнении с ожидаемыми, дважды щелкнув мышью.
Рис. 2. Стартовая панель модуля Непараметрическая статистика
Шаг 3. Вначале рассмотрим модель для мужчин. В качестве наблюдаемых частот выберите M_OBS, в качестве ожидаемых частот выберите M_EXP.
Нажмите ОК.
Рис. 3. Результаты анализа: мужчины
Шаг 4. На экране появится таблица наблюдаемых и ожидаемых частот и значений статистики хи-квадрат.
Критерий хи-квадрат позволяет сказать, что модель достаточно адекватно описывает данные, другими словами, согласие данных с моделью достаточно высокое.
Шаг 5. Проведем анализ рисков для женщин в Фрэмингхемском исследовании.
В качестве наблюдаемых частот выберите W_OBS, в качестве ожидаемых частот выберите W_EXP (пятую и четвертую переменную в файле данных).
Нажмите ОК.
Рис. 4. Результаты анализа: женщины
Шаг 6. На экране появится таблица наблюдаемых и ожидаемых частот и значений статистики хи-квадрат для каждой децили.
Критерий хи-квадрат позволяет сказать, что и для женщин модель адекватна данным. Иными словами ту же мысль можно выразить следующим образом: различие между данными и моделью статистически незначимо.
Более десяти лет Фремингхемская шкала (FraminghamRiskScore) используется для оценки риска возникновения сердечного приступа.
Известно, что в этой шкале имеется шесть основных показателей: возраст, пол, уровень общего холестерина, холестерина ЛПВП, курение в анамнезе и систолическое артериальное давление (age, sex, totalcholesterol, HDLcholesterol, smokingstatus, andsystolicbloodpressure).
Используя эту шкалу, врачи знают, что посоветовать людям, имеющим высокую и низкую степень риска. Не совсем понятно, что рекомендовать людям, у кого имеется средняя степень риска по Фремингхемской шкале.
На протяжении многих лет ученые пробовали добавлять различные факторы в классическую методику, чтобы попытаться сузить “серую зону” средних оценок. И сейчас, после тестирования различных факторов, ученые Гарвардского университета обнаружили, что добавление всего двух факторов - С-реактивного белка и наличия или отсутствия в анамнезе сердечных приступов у родителей в возрасте до шестидесяти лет делает прогноз намного более точным.
Основываясь на информации, полученной от 24000 женщин, обследованных в течение последних десяти лет, исследователи создали новый инструмент под названием Шкала Рейнолдса (Reynoldsriskscore).
При использовании эта шкала показала себя не хуже Фремингхемской шкалы для женщин имеющих высокую и низкую степени риска. А для группы со средним риском шкала Рейнолдса подошла даже лучше чем Фремингхемская.
Благодаря этому почти половина женщин из группы среднего риска была переклассифицирована в группы с высокой и низкой степенями риска. Новые распределения, выполненные при помощи компьютера, почти идеально соответствовали тому, что на самом деле случилось с этими женщинами за следующие десять лет.
Сейчас группа исследователей проверяет, так ли хороша новая модель для прогнозирования риска возникновения сердечного приступа у мужчин, см.
Узнайте больше на курсах Академии Анализа Данных StatSoft
Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
|
© StatSoft Russia |
StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран. |