ИССЛЕДОВАНИЕ ТОЧНОСТИ НАХОЖДЕНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ РЕГРЕССИИ МЕТОДАМИ МНК, М-ОЦЕНКИ, LTS И ИХ МОДИФИКАЦИЙ ПРИ РАЗЛИЧНЫХ УСЛОВИЯХ ПРОВЕДЕНИЯ ЭКСПЕРИМЕНТА
Секция: Физико-математические науки
LXI Студенческая международная научно-практическая конференция «Технические и математические науки. Студенческий научный форум»
ИССЛЕДОВАНИЕ ТОЧНОСТИ НАХОЖДЕНИЯ НЕИЗВЕСТНЫХ ПАРАМЕТРОВ РЕГРЕССИИ МЕТОДАМИ МНК, М-ОЦЕНКИ, LTS И ИХ МОДИФИКАЦИЙ ПРИ РАЗЛИЧНЫХ УСЛОВИЯХ ПРОВЕДЕНИЯ ЭКСПЕРИМЕНТА
В регрессионный анализ входит множество различных подходов к моделированию или анализу отношений между зависимыми и независимыми переменными. Существуют методы, которые позволяют находить неизвестные параметры регрессионных моделей. Одни из самых распространённых методов — это метод наименьших квадратов (МНК). Для того, чтобы в условиях появления в выборке выбросов, можно было получать корректные результаты оценивания параметров, ученые разработали методы, которые устойчивы к появлению выбросов. Были разработаны такие методы, как метод наименьшей медианы квадратов, М-оценки, метод наименьших уравновешенных квадратов (LTS) и другие. В данной работе подробно будут рассмотрены методы LTS м М-оценки. Эти методы оценивают параметры регрессионных зависимостей по максимально информативным наблюдениям, и, как следствие, получают устойчивые к выбросам оценки параметров регрессионных моделей.
Рассмотрим случай присутствия долей выбросов. С дисперсией наблюдений равной 0.01 и дисперсией ошибок 0.5. Размер подмножества (1- m)n . В таблице 1 представлены результаты оценивания
Таблица 1.
Оценка точности при различных долях выбросах = 0.5
|
Доля выбросов, % |
||||||
Метод |
0 |
5 |
10 |
15 |
20 |
25 |
30 |
МНК |
0.3568% |
0.0127% |
0.3583% |
0.159% |
0.1663% |
0.8791% |
2.036% |
LTS(res) |
0.3568% |
0.00 08% |
0.1045% |
0.0417% |
0.1248% |
0.0998% |
0.0885% |
LTS (cook) |
0.3568% |
0.0011% |
0.1202% |
0.0391% |
0.0937% |
0.1207% |
0.1925% |
LTS(standart) |
0.3568% |
0.0007% |
0.1045% |
0.0417% |
0.1248% |
0.0998% |
0.0885% |
LTS(dffits) |
0.3568% |
0.0007% |
0.1005% |
0.0380% |
0.0845% |
0.0923% |
0.0778% |
Метод Хьюбера |
0.4762% |
0.0027% |
0.1633% |
0.0489% |
0.1438% |
0.2664% |
0.2946% |
Все данные показывают, что при увеличении доли выбросов LTS наилучший в оценке неизвестных параметров и он выигрывают в точности у МНК и М-оценки, это связано с тем, что LTS проводит оценку по наиболее информативным наблюдениям. Разница между методами определения выбросов невелика.
Рассмотрим случай присутствия долей выбросов. С дисперсией наблюдений равной 0.01 и различными значениями дисперсией ошибок. Размерность подмножества h = (1- m)n. В таблицах 1-3 представлены результаты оценивания.
Таблица 2.
Оценка точности при различных долях выбросах = 0.5
|
Доля выбросов, % |
||||
Метод |
10 |
15 |
20 |
25 |
30 |
МНК |
0.3583% |
0.159% |
0.1663% |
0.8791% |
2.036% |
LTS(res) |
0.1045% |
0.0417% |
0.1248% |
0.0998% |
0.0885% |
LTS (cook) |
0.1202% |
0.0391% |
0.0937% |
0.1207% |
0.1925% |
LTS(standart) |
0.1045% |
0.0417% |
0.1248% |
0.0998% |
0.0885% |
LTS(dffits) |
0.1005% |
0.0380% |
0.0845% |
0.0923% |
0.0778% |
Метод Хьюбера |
0.1633% |
0.0489% |
0.1438% |
0.2664% |
0.2946% |
Таблица 2.
Оценка точности при различных долях выбросах = 1
|
Доля выбросов, % |
||||
Метод |
10 |
15 |
20 |
25 |
30 |
МНК |
0.216% |
4.5158% |
4.5158% |
0.4326% |
0.8961% |
LTS(res) |
0.021% |
0.3108% |
0.3108% |
0.083% |
0.1218% |
LTS (cook) |
0.0046% |
0.1315% |
0.1315% |
0.012% |
0.0677% |
LTS(standart) |
0.0087% |
0.1949% |
0.1949% |
0.0174% |
0.0755% |
LTS(dffits) |
0.0041% |
0.1302% |
0.1302% |
0.011% |
0.0620% |
Метод Хьюбера |
0.0036% |
0.1215% |
0.1215% |
0.010% |
0.8961% |
Таблица 3.
Оценка точности при различных долях выбросах = 2
|
Доля выбросов, % |
||||
Метод |
10 |
15 |
20 |
25 |
30 |
МНК |
2.6397% |
2.708% |
0.5055% |
2.5405% |
2.6374% |
LTS(res) |
0.4796% |
0.0225% |
0.0885% |
0.5743% |
0.1591% |
LTS (cook) |
0.1809% |
0.0032% |
0.138% |
0.3724% |
0.1804% |
LTS(standart) |
0.0937% |
0.0024% |
0.1393% |
0.3351% |
0.0529% |
LTS(dffits) |
0.1745% |
0.0030% |
0.135% |
0.3721% |
0.1804% |
Метод Хьюбера |
0.0837% |
0.0021% |
0.124% |
0.3701% |
0.1674% |
Провели сравнение алгоритмов метода наименьших квадратов, метода наименьших уравновешенных квадратов и М-оценки. М-оценки и LTS показали результаты, приближенные к истинному значению. МНК же начал отдаляться от истинного значения с появлением выбросов. В случае нормальнораспредленных ошибок точность оценки LTS и М-оценки значительно отличаются. Однако, МНК оценивает неизвестные параметры регрессионных уравнений более точно.
При появлении в выборке аномальных наблюдений методы М-оценки и LTS показывают более приближенные результаты к истинным значениям. МНК проигрывает в точности из-за отклонения от нормального закона распределения ошибок наблюдений.
Также провели исследование влияния дисперсии выброса на оценку неизвестных параметров. При увеличении дисперсии выбросов М-оценки и LTS также показали более точные результаты по сравнению с методом наименьших квадратов.При изменении размера оценочного подмножества метод LTS показывает наилучшие оценки. Наиболее точные оценки LTS показывает при размере подмножества равным . Это связано с тем, что данный метод производит оценку по наиболее информативным наблюдениям.