Modelo linear generalizado misto

Em estatística, um modelo linear generalizado misto (GLMM) é uma extensão do modelo linear generalizado (GLM) em que o preditor linear contém efeitos aleatórios além dos efeitos fixos usuais.[1][2][3] Eles também herdam dos GLMs a ideia de estender os modelos lineares mistos a dados não normais.

O GLMM fornecem uma ampla gama de modelos para a análise de dados agrupados, uma vez que as diferenças entre os grupos podem ser modeladas como um efeito aleatório. Esses modelos são úteis na análise de muitos tipos de dados, incluindo dados longitudinais.[4]

Modelo

O GLMM é geralmente definido de modo que, condicionados aos efeitos aleatórios , a variável dependente é distribuída de acordo com a família exponencial com sua expectativa relacionada ao preditor linear através de uma função de link  :

.

Aqui, e são a matriz de design de efeitos fixos e os efeitos fixos, respectivamente; e são a matriz de design de efeitos aleatórios e os efeitos aleatórios, respectivamente. Para entender esta definição muito breve, você primeiro precisará entender a definição de um modelo linear generalizado e de um modelo misto .

Modelos lineares generalizados mistos são casos especiais de modelos lineares generalizados hierárquicos nos quais os efeitos aleatórios são normalmente distribuídos.

A probabilidade completa[5]

não tem uma forma geral fechada e a integração sobre os efeitos aleatórios costuma ser extremamente intensiva em termos de computação. Além de aproximar numericamente essa integral (por exemplo, via quadratura de Gauss-Hermite), métodos motivados pela aproximação de Laplace foram propostos.[6] Por exemplo, o método de quase-verossimilhança penalizado, que envolve essencialmente o ajuste repetido (isto é, duplamente iterativo) de um modelo combinado normal ponderado com uma variável de trabalho,[7] é implementado por vários programas estatísticos comerciais e de código aberto.

Ajustando um modelo

Ajustar GLMMs por meio de probabilidade máxima (como via AIC) envolve a integração sobre os efeitos aleatórios. Em geral, essas integrais não podem ser expressas de forma analítica. Vários métodos aproximados foram desenvolvidos, mas nenhum tem boas propriedades para todos os modelos e conjuntos de dados possíveis (por exemplo, dados binários desagrupados são particularmente problemáticos). Por esta razão, os métodos que envolvem quadratura numérica ou cadeia de Markov Monte Carlo têm aumentado em uso, à medida que o aumento do poder de computação e os avanços nos métodos os tornam mais práticos.

O critério de informação de Akaike (AIC) é um critério para seleção de modelo. As estimativas de AIC para GLMMs com base em certas distribuições de famílias exponenciais foram recentemente obtidas.[8]

Programas

  • Vários pacotes contribuídos em R fornecem funcionalidade GLMM[9][10]
  • O GLMM pode ser instalado usando SAS e SPSS[11]
  • O Matlab também fornece uma função chamada "fitglme" para ajustar os modelos GLMM.
  • O pacote Python Statsmodels suporta implementação binomial e poisson[12]
  • O pacote Julia MixedModels.jl fornece uma função chamada GeneralizedLinearMixedModel que se ajusta a um GLMM para os dados fornecidos.[13]

Ver também

  • Equação de estimativa generalizada
  • Modelo linear generalizado hierárquico

Referências

  1. Breslow, N. E.; Clayton, D. G. (1993), «Approximate Inference in Generalized Linear Mixed Models», Journal of the American Statistical Association, 88 (421): 9–25, doi:10.2307/2290687 
  2. Stroup, W.W. (2012), Generalized Linear Mixed Models, CRC Press 
  3. Jiang, J. (2007), Linear and Generalized Linear Mixed Models and Their Applications, Springer 
  4. Fitzmaurice, G. M.; Laird, N. M.; Ware, J.. (2011), Applied Longitudinal Analysis, ISBN 978-0-471-21487-8 2nd ed. , John Wiley & Sons 
  5. Pawitan, Yudi. In All Likelihood: Statistical Modelling and Inference Using Likelihood Paperbackition ed. [S.l.]: OUP Oxford. 459 páginas. ISBN 978-0199671229 
  6. Breslow, N. E.; Clayton, D. G. (20 de dezembro de 2012). «Approximate Inference in Generalized Linear Mixed Models». Journal of the American Statistical Association. 88: 9–25. doi:10.1080/01621459.1993.10594284 
  7. Wolfinger, Russ; O'connell, Michael (dezembro de 1993). «Generalized linear mixed models a pseudo-likelihood approach». Journal of Statistical Computation and Simulation. 48: 233–243. doi:10.1080/00949659308811554 
  8. Saefken, B.; Kneib, T.; van Waveren, C.-S.; Greven, S. (2014), «A unifying approach to the estimation of the conditional Akaike information in generalized linear mixed models» (PDF), Electronic Journal of Statistics, 8: 201–225, doi:10.1214/14-EJS881 
  9. Pinheiro, J. C.; Bates, D. M. (2000), Mixed-effects models in S and S-PLUS, Springer, New York 
  10. Berridge, D. M.; Crouchley, R. (2011), Multivariate Generalized Linear Mixed Models Using R, CRC Press 
  11. «IBM Knowledge Center». www.ibm.com. Consultado em 6 de dezembro de 2017 
  12. «Statsmodels Documentation». www.statsmodels.org. Consultado em 17 de março de 2021 
  13. «Details of the parameter estimation · MixedModels». juliastats.org. Consultado em 16 de junho de 2021