Змішана модель — це статистична модель, що містить як фіксовані, так і випадкові ефекти. Ці моделі використовують в широкому діапазоні дисциплін, зокрема, у галузі фізичних, біологічних і соціальних наук. Вони особливо корисні в ситуаціях, коли повторні виміри застосовуються до тих же статистичних одиниць. Завдяки перевагам змішаних моделей у роботі з відсутніми значеннями, їм часто віддають перевагу, на відмінну від більш традиційних підходів, таких як дисперсний аналіз.
У матричному вигляді змішана модель має вигляд:
де
Сумарна густина y {\displaystyle {\boldsymbol {y}}} і u {\displaystyle {\boldsymbol {u}}} має вигляд: f ( y , u ) = f ( y | u ) f ( u ) {\displaystyle f({\boldsymbol {y}},{\boldsymbol {u}})=f({\boldsymbol {y}}|{\boldsymbol {u}})\,f({\boldsymbol {u}})} . Припустимо, що u ∼ ∼ --> N ( 0 , G ) {\displaystyle {\boldsymbol {u}}\sim {\mathcal {N}}({\boldsymbol {0}},G)} , ϵ ϵ --> ∼ ∼ --> N ( 0 , R ) {\displaystyle {\boldsymbol {\epsilon }}\sim {\mathcal {N}}({\boldsymbol {0}},R)} і C o v ( u , ϵ ϵ --> ) = 0 {\displaystyle Cov({\boldsymbol {u}},{\boldsymbol {\epsilon }})={\boldsymbol {0}}} , тоді максимізація сумарної густини β β --> {\displaystyle {\boldsymbol {\beta }}} і u {\displaystyle {\boldsymbol {u}}} дає рівняння змішаної моделі Хендерсона:[1][2][3]
Розв'язки цього рівняння β β --> ^ ^ --> {\displaystyle \textstyle {\hat {\boldsymbol {\beta }}}} і u ^ ^ --> {\displaystyle \textstyle {\hat {\boldsymbol {u}}}} є найкращими лінійними оцінками для β β --> {\displaystyle {\boldsymbol {\beta }}} і u {\displaystyle {\boldsymbol {u}}} відповідно, що є наслідком з теореми Гаусса — Маркова.
Уявімо, що ми хочемо дослідити зміну ваги пацієнтів протягом року. У дослідженні взяло участь 10 пацієнтів i = 1 , . . . , 10 {\displaystyle i=1,...,10} які вимірювали свою вагу кожного місяця t = 1 , . . . , 12 {\displaystyle t=1,...,12} . Тобто ми маємо 10 ∗ ∗ --> 12 = 120 {\displaystyle 10*12=120} значень ваги Y i t {\displaystyle Y_{it}} .
Пунктирна лінія на графіку зображує модель звичайної лінійної регресії. Це рівняння не враховує відмінностей у вимірах ваги кожного пацієнта, іншими словами, воно не враховує той факт, що дані утворюють кластери, і обчислює значення так, ніби вони отримані від одного єдиного суб'єкта. Кольорові лінії представляють рівняння, побудовані на основі 12 вимірювань кожного пацієнта. Ми бачимо, що кожен пацієнт мав свою початкову вагу (інтерцепт) і різний тренд зміни ваги (кут нахилу прямої).
Змішана модель відрізняється від звичайної лінійної регресії тим, що вона враховує кластеризацію даних і вимірює варіативність значень ваги, яка виникає від різниць між пацієнтами.
Існує модель випадкового відтину (англ. random intercept model), яка враховує початкове значення ваги для кожного унікального пацієнта, та модель випадкового нахилу (англ. random slope model), яка враховує, що вага кожного пацієнта змінюється по-різному з часом. Змішана модель може включати як випадковий відтин, так і випадковий нахил.
Lokasi Pengunjung: 3.21.158.224