Коллективная модель предполагает, что в течение времени, когда внешние факторы (в частности, инфляция) изменяются незначительно, случайные величины размера убытка в отдельном страховом случае у рассматриваемого портфеля независимы и одинаково распределены.
Если предположение независимости после некоторых преобразований (например, сложения выплат по одному клиенту) признаётся выполненным, то предположение одинаковой распределённости кажется нереалистичным уже хотя бы в свете различия страховых сумм.
Но поскольку в коллективной модели убытки не сопоставляются отдельным рискам, а рассматриваются в совокупности на определённом временном промежутке, можно считать, что они представляют собой выборку из одного-единственного распределения, а именно из смеси из различных распределений отдельных убытков.
Конечно, каждому виду страхования и каждому портфелю соответствует своё (смешанное) распределение убытков, зависящее, в частности, от размеров страховых сумм по отдельным рискам, а также от страхуемых событий.
Например, средний убыток от пожара на промышленном предприятии значительно выше, чем от пожара в жилом здании; оба отличаются от средних убытков в страховании автогражданской ответственности и страховании КАСКО, в свою очередь отличающихся между собой.
Тем не менее, как показывает практика, структуры убытков во всех видах страхования очень схожи.
Обычно наблюдается намного больше мелких убытков, чем больших.
Строго говоря, «концентрация убытков» с увеличением размера убытка всё сильнее уменьшается. (Зачастую совсем мелкие убытки тоже малочисленны, но с экономической точки зрения они не имеют большого значения.)
Правда, количественное соотношение крупных и мелких убытков, также как и граница между крупными и мелкими убытками (в любом случае неточная) у разных видов страхования различны.
Таблица ниже (см. Т. Мак. Математика рискового страхования, М.: ЗАО «Олимп-Бизнес", 2005) содержит пример эмпирического распределения размера убытка в огневом страховании сталелитейных заводов (размеры убытков исчисляются в тысячах).
Мы будем использовать непрерывные распределения для подгонки к реальному распределению убытков в силу их большой гибкости.
Нормальное распределение стоит заранее отклонить, оно не исключает отрицательных убытков и симметрично по форме, в то время как типичное распределение размера убытка имеет правостороннюю асимметрию из-за существенного преобладания мелких убытков.
В то же время мы пока не обращаем внимания на то, что нормальное и другие рассматриваемые ниже распределения теоретически допускают сколь угодно большие убытки, тогда как в страховой практике размеры убытков зачастую ограничены сверху, например, максимальной для данного портфеля страховой суммой.
Для многих практических задач наиболее важна адекватность модели распределения размера убытка в области больших убытков.
Этот факт подтверждает таблица для сгруппированных данных:
Убытки свыше |
Доля в совокупном количестве, % |
Доля в совокупном размере, % |
6500 |
0.1 |
19 |
750 |
1.1 |
50 |
48 (среднее значение) |
12.4 |
87 |
Рис. 1. Доля в совокупном количестве, %
Рис. 2. Доля в совокупном размере, %
По этой таблице видно, что большие убытки имеют решающий экономический вес. Несмотря на существенное количественное преобладание мелких убытков (более 85% убытков находятся ниже среднего уровня), их суммарный вклад в совокупный убыток составляет менее 15%.
Поэтому в наших интересах – как можно точнее описать искомым распределением размера убытков большие убытки.
Правда, важнейшая с экономической точки зрения часть распределения всегда представлена слишком малым количеством наблюдений.
Проверим с помощью STATISTICA, какое распределение будет иметь размер убытков в данном случае.
Данные представлены в следующем файле STATISTICA:
Рис. 3. Файл данных STATISTICA
Здесь в первой переменной содержится номер договора в базе данных, а во втором столбе – ущерб по данному конкретному договору.
Для подгонки распределений мы будем использовать модуль Подгонка и моделирование. Для того чтобы запустить анализ, необходимо зайти в меню Анализ->Подгонка и моделирование. Стартовое окно модуля:
Рис. 4. Модуль Подгонка и моделирование
Выберем в списке пункт Подгонка, нажмём ОК и попадем в главное окно модуля Подгонка и моделирование:
Рис. 5. Подгонка распределений
На вкладке Быстрый необходимо выбрать переменные, нажав кнопку переменные. Мы будет подбирать распределение только для непрерывных признаков (убыток от пожара), поэтому в окне выбора укажем лишь одну переменную:
Рис. 6. Выбор переменных для анализа
Теперь на вкладке Непрерывные переменные стало возможно выбрать, какое распределение мы хотим подогнать:
Рис. 7. Выбор распределения для подгонки
Мы не будем исключать никакое распределение и нажмём ОК. Попадаем в окно результатов:
Рис. 8. Результаты подгонки распределений
На вкладке Подгонка:
Рис. 9. Результаты подгонки распределений
В списке распределений распределения упорядочены по убыванию р-значения для критерия Колмогорова-Смирнова. Таким образом, наиболее подходящее распределение окажется в начале списка.
В нашем случае наиболее подходящим является обобщённое распределение Парето, что не удивительно, так как с помощью распределения Парето часто описывается распределение признаков с «тяжёлыми хвостами» (в данном случае – большáя часть убытков обусловлена малым количеством случаев с убытками более 5000).
Обобщённое распределение Парето имеет следующую плотность:
здесь a - параметр масштаба и b - параметр формы.
Оценки параметров обобщённого распределения Парето можно найти в правой части таблицы:
Рис. 10. Параметры распределения
Таким образом, в данном случае:
На вкладке Быстрый можно получить более детальные данные о качестве подгонки. Предварительно нужно выбрать в выпадающем списке Обобщённое распределение Парето:
Рис. 11. Результаты подгонки распределений
После этого нажмём Статистики распределения и получим таблицу со значениями статистик критериев и р-значениями:
Рис. 12. Статистики критериев и p-значения
Как мы уже видели, для критерия Колмогорова-Смирнова р-значение оказывается намного больше, чем 0.05, поэтому мы будем считать, что сумма ущерба имеет обобщённое распределение Парето с указанными выше параметрами масштаба и формы.
Также мы можем оценить качество подгонки с помощью построения эмпирической функции распределения.
Для её построения нажмём кнопку Эмпирическая ФР:
Рис. 13. Эмпирическая функция распределения
На графике мы можем видеть, что соответствие достаточно точное. Как было указано выше, особенно важно, чтобы подгонка была точно в области большого ущерба.
Для того чтобы более точно рассмотреть эту область на графике, мы воспользуемся графическим инструментом STATISTICA под названием Увеличить:
Рис. 14 Настройка графика
С его помощью мы выделим интересующую нас область:
Рис. 15 Настройка графика
Получим следующий график:
Рис. 16. Эмпирическая функция распределения: увеличенная
На графике мы можем видеть, что функция распределения для обобщённого распределения Парето очень точно повторяет поведение эмпирической функции распределения, что говорит о высоком качестве подгонки.
Стоит отметить, что вторым и третьим наилучшими распределениями оказались обобщённое распределение экстремальных значений и логнормальное распределение, которые часто используются соответственно для моделирования признаков с сильным влиянием больших значений и с сильной асимметрией в сторону малых значений.
Логнормальное распределение (параметр формы | |
Функция распределения |
|
Плотность распределения |
|
Моменты |
|
Логарифмированное логистическое распределение
| |
Функция распределения |
|
Плотность распределения |
|
Моменты |
|
Логарифмированное распределение Лапласа (параметр формы | |
Функция распределения |
|
Плотность распределения |
|
Моменты |
|
Распределение Парето (параметр формы | |
Функция распределения |
|
Плотность распределения |
|
Моменты |
|
Распределение Парето с нулевой точкой (параметр формы | |
Функция распределения |
|
Плотность распределения |
|
Моменты |
|
Распределение Вейбулла (параметр формы | |
Функция распределения |
|
Плотность распределения |
|
Моменты |
|
Таблица 1. Модели распределения размера убытка
1. Ивченко Г.И., Медведев Ю.И. Математическая статистика, Высшая школа, 1992.
2. Боровиков В.П. Популярное введение в программу STATISTICA, Компьютер Пресс 1998.
3. Боровиков В.П., Боровиков И.П. STATISTICA. Статистический анализ и обработка данных в среде Windows, Филинъ 1998.
4. Боровиков В.П. STATISTICA, искусство анализа данных на компьютере, Питер 2001.
5. Боровиков В.П, Ивченко Г.И. Прогнозирование в системе STATISTICA в среде Windows, Финансы и статистика 1999.
6. Розанов Ю.А. Теория вероятностей, случайные процессы и математическая статистика, Наука 1985.
7. Т. Мак. Математика рискового страхования, М.: ЗАО «Олимп-Бизнес", 2005
Узнайте больше на курсах Академии Анализа Данных StatSoft
Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
|
© StatSoft Russia |
StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран. |