En estadística, la estimación por máxima verosimilitud (conocida también como EMV y, en ocasiones, MLE por sus siglas en inglés) es un método habitual para ajustar un modelo y estimar sus parámetros.
La idea de este método es la de encontrar primero la función de densidad conjunta de todas las observaciones, que bajo condiciones de independencia, es
Observando esta función bajo un ángulo ligeramente distinto, se puede suponer que los valores observados son fijos mientras que puede variar libremente. Esta es la función de verosimilitud:
En la práctica, dependiendo de la distribución que generó los datos, se suele utilizar el logaritmo de esta función:
El método de la máxima verosimilitud estima buscando el valor de que maximiza . Este es el llamado estimador de máxima verosimilitud (MLE) de :
En ocasiones este estimador es una función explícita de los datos observados , pero muchas veces hay que recurrir a optimizaciones numéricas. También puede ocurrir que el máximo no sea único o no exista.
En la exposición anterior se ha asumido la independencia de las observaciones, pero no es un requisito necesario: basta con poder construir la función de probabilidad conjunta de los datos para poder aplicar el método. Un contexto en el que esto es habitual es el del análisis de series temporales.
Propiedades del estimador de máxima verosimilitud
En muchos casos, el estimador obtenido por máxima verosimilitud posee un conjunto de propiedades asintóticas atractivas:
e incluso eficiencia de segundo orden tras corregir el sesgo.
Consistencia
Bajo ciertas condiciones bastante habituales,[2] el estimador de máxima verosimilitud es consistente: si el número de observaciones n tiende a infinito, el estimador converge en probabilidad a su valor verdadero:
Bajo condiciones algo más fuertes,[2] la convergencia es casi segura:
Normalidad asintótica 2
Si las condiciones para la consistencia se cumplen y, además,
;
y es dos veces continuamente diferenciable respecto a θ en algún entorno N de θ0;
∫ supθ∈N||∇θf(x|θ)||dx < ∞, y ∫ supθ∈N||∇θθf(x|θ)||dx < ∞;
I = E[∇θlnf(x|θ0) ∇θlnf(x|θ0)′] existe y no es singular;
,
entonces el estimador de máxima verosimilitud tiene una distribución asintótica normal:[3]
Invariancia funcional
Si es el EMV de θ y g(θ) es una transformación de θ, entonces el EMV de α = g(θ) es
Además, el EMV es invariante frente a ciertas transformaciones de los datos. En efecto, si y una aplicación biyectiva que no depende de los parámetros que se estiman, entonces la función de densidad de Y es
Es decir, las funciones de densidad de X e Y difieren únicamente en un término que no depende de los parámetros. Así, por ejemplo, el EMV para los parámetros de una distribución lognormal son los mismos que los de una distribución normal ajustada sobre el logaritmo de los datos de entrada.
Otras propiedades
El EMV es √n-consistente y asintóticamente eficiente. En particular, esto significa que el sesgo es cero hasta el orden n−1/2. Sin embargo, al obtener los términos de mayor orden de la expansión de Edgeworth de la distribución del estimador, θemv tiene un sesgo de orden −1. Este sesgo es igual a[4]
Gracias a estas fórmulas es posible estimar el sesgo de segundo orden del estimador y corregirlo mediante substracción:
Este estimador, insesgado hasta el orden n−1, se llama estimador de máxima verosimilitud con corrección del sesgo.
Ejemplos
Distribución uniforme discreta
Supóngase que n bolas numeradas de 1 a n se colocan en una urna y que una de ellas se extrae al azar. Si se desconoce n, su EMV es el número m que aparece en la bola extraída: la función de verosimilitud es 0 para n < m y 1/n para n ≥ m; que alcanza su máximo cuando n = m. La esperanza matemática de , es (n + 1)/2. Como consecuencia, el EMV de n infravalorará el verdadero valor de n por (n − 1)/2.
Distribución discreta con parámetros discretos
Supóngase que se lanza una moneda sesgada al aire 80 veces. La muestra resultante puede ser algo así como x1 = H, x2 = T, ..., x80 = T, y se cuenta el número de caras, "H". La probabilidad de que salga cara es p y la de que salga cruz, 1 − p (de modo que p es el parámetro θ). Supóngase que se obtienen 49 caras y 31 cruces. Imagínese que la moneda se extrajo de una caja que contenía tres de ellas y que éstas tienen probabilidades p iguales a 1/3, 1/2 y 2/3 aunque no se sabe cuál de ellas es cuál.
A partir de los datos obtenidos del experimento se puede saber cuál es la moneda con la máxima verosimilitud. Usando la función de probabilidad de la distribución binomial con una muestra de tamaño 80, número de éxitos igual a 49 y distintos valores de p, la función de verosimilitud toma tres valores siguientes:
La verosimilitud es máxima cuando p = 2/3 y éste es, por lo tanto, el EMV de p.
Distribución discreta con parámetros continuos
Ahora supongamos que sólo había una moneda pero su p podría haber sido cualquier valor 0 ≤ p ≤ 1. La función de verosimilitud a maximizar es
y que la maximización se realiza sobre todos los valores posibles de 0 ≤ p ≤ 1.
Una forma de maximizar esta función es diferenciando con respecto a p y asignando a cero:
Lo cual posee las soluciones p = 0, p = 1, and p = 49/80. La solución que maximiza la verosimilitud es claramente p = 49/80 (dado que p = 0 y p = 1 resultan en una verosimilitud nula). Por lo tanto el estimador de máxima probabilidad para p es 49/80.
Este resultado es fácilmente generalizado si se sustituye una letra como ser t en lugar del 49 para representar el número de 'éxitos' observados de nuestrs ensayos de Bernoulli, y una letra por ejemplo n en lugar del 80 para representar el número de ensayos de Bernoulli. El mismo cálculo exacto provee el estimador de máxima verosimilitudt / n para toda secuencia de n ensayos de Bernoulli resultando en t 'éxitos'.
La función densidad de probabilidad correspondiente para una muestra de n variables aleatorias normales aleatoriamente distribuidas identicamente de manera independiente (la probabilidad) es
o más convenientemente:
donde es la media de la muestra.
Esta familia de distribuciones posee dos parámetros: θ = (μ, σ), por lo que se maximiza la verosimilitud, , sobre ambos parámetros simultáneamente, o si es posible, individualmente.
Dado que el logaritmo es una función continua estrictamente creciente sobre el range of the likelihood, los valores que maximizan la verosimilitud también maximizan su logaritmo. Dado que maximizar el logaritmo a menudo requiere de álgebra simple, es el logaritmo el que se maximizará a continuación. (Nota: la verosimilitid-logarítmica está estrechamente relacionada con la entropía de información y la información de Fisher.)
lo cual se resuelve haciendo
Se trata efectivamente del máximo de la función, ya que es el único punto de inflexión en μ y la segunda derivada es estrictamente menor que cero. Su valor de expectativa es igual al parámetro μ de la distribución dada,
lo que significa que el estimados de la versosimilitud máximan no está sesgado.
Similarmente se diferencia la versosimilitud logarítmica con respecto a σ y se iguala a cero:
lo cual se resuelve mediante
Insertando se obtiene
Para calcular su valor esperado, es conveniente reescribir la expresión en términos de variables aleatorias de media cero (error estadístico) . Expresando el estimador mediante estas variables se obtiene
Simplificando la expresión anterior, utilizando el hecho que y , permite obtener
Lo cual significa que el estimador es sesgado. Sin embargo, es consistente.
Formalmente decimos que el estimador de máxima verosimilitud para es:
En este caso, los MLE podrían obtenerse individualmente. En general, puede que no sea el caso, y los MLE tendrían que obtenerse simultáneamente.
Variables no independientes
Puede darse el caso de que las variables estén correlacionadas, es decir, que no sean independientes. Dos variables aleatorias X e Y son independientes sólo si su función de densidad de probabilidad conjunta es el producto de las funciones de densidad de probabilidad individuales, es decir
Supongase que se construye un vector gausiano de orden n a parir de variables aleatorias , donde cada variable posee valor medio corresponsiente a . Y sea la matriz covariante expresada mediante
La función de densidad de probabilidad conjunta de estas n variables aleatorias viene dada entonces por:
En el caso de dos variables, la función de densidad de probabilidad conjunta viene dada por:
En éste y otros casos en los que existe una función de densidad conjunta, la función de verosimilitud se define como arriba, en Principios, utilizando esta densidad.
Aplicaciones
El estimador de máxima verosimilitud se usa dentro de un gran número de modelos estadísticos:
Anderson, Erling B. 1970. "Asymptotic Properties of Conditional Maximum Likelihood Estimators". Journal of the Royal Statistical SocietyB 32, 283-301.
Andersen, Erling B. 1980. Discrete Statistical Models with Social Science Applications. North Holland, 1980.
Debabrata Basu. Statistical Information and Likelihood : A Collection of Critical Essays by Dr. D. Basu ; J.K. Ghosh, editor. Lecture Notes in Statistics Volume 45, Springer-Verlag, 1988.
Cox, D.R.; Snell, E.J. (1968). «A general definition of residuals». Journal of the Royal Statistical Society. Series B (Methodological): 248-275. JSTOR2984505.
Edgeworth, F.Y. (Sep de 1908). «On the probable errors of frequency-constants». Journal of the Royal Statistical Society71 (3): 499-512. JSTOR2339293.
Edgeworth, F.Y. (Dec de 1908). «On the probable errors of frequency-constants». Journal of the Royal Statistical Society71 (4): 651-678. JSTOR2339378.
Ferguson, Thomas S (1996). A course in large sample theory. Chapman & Hall.
Hald, Anders (1998). A history of mathematical statistics from 1750 to 1930. Nueva York: Wiley.
Newey, Whitney K.; McFadden, Daniel (1994). Large sample estimation and hypothesis testing. Handbook of econometrics, vol.IV, Ch.36. Elsevier Science. pp. 2111-2245.
Stigler, Stephen M. (1978). «Francis Ysidro Edgeworth, statistician». Journal of the Royal Statistical Society. Series A (General)141 (3): 287-322. JSTOR2344804.
Provinsi Chikuzen (筑前国code: ja is deprecated , chikuzen no kuni) adalah nama provinsi lama Jepang di pulau Kyushu, menempati sebagian wilayah yang sekarang disebut sebagai Prefektur Fukuoka. Chikuzen berbatasan dengan provinsi Buzen, Bungo, Chikugo, dan Hizen. Ibu kota diperkirakan berada dekat kota Dazaifu, sedangkan pusat perdagangan berada di kota Fukuoka. Di akhir abad ke-13, Chikuzen merupakan tempat mendarat pasukan bangsa Mongol yang bermaksud menaklukkan Jepang. Kekuatan utama ...
Marvel ComicsJenisAnak perusahaan dari The Walt Disney CompanyIndustriPenerbitanGenrePahlawan super, kriminal, komedi, horor, misteri, romantis, fiksi ilmiah, perang, Western (budaya Barat)Didirikan1934 (sebagai Timely Comics)PendiriStan lee dan Martin GoodmanKantorpusat135 W. 50th Street, New York City, New YorkWilayah operasiSeluruh duniaProdukKomikPendapatanUS$125,700,000 (2007) Laba operasiUS$53,500,000 (2007) [1]PemilikThe Walt Disney CompanyIndukMarvel EntertainmentDivisiMarvel ...
Public university in Williamsburg, Virginia, US This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: College of William & Mary – news · newspapers · books · scholar · JSTOR (July 2023) (Learn how and when to remove this template message) The College of William & Mary in VirginiaLatin: Collegium Gulielmi e...
Extinct subspecies of carnivore Cave lynx Jaw bone fossil Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Chordata Class: Mammalia Order: Carnivora Suborder: Feliformia Family: Felidae Subfamily: Felinae Genus: Lynx Species: L. pardinus Subspecies: †L. p. spelaeus Trinomial name †Lynx pardinus spelaeusBoule, 1910 The cave lynx or Mediterranean cave lynx (Lynx spelaeus or Lynx pardinus spelaeus) is an extinct felid species that lived during the Pleistoce...
Gustavo Lopez Informasi pribadiNama lengkap Gustavo Fabián LópezTanggal lahir 28 April 1983 (umur 40)Tempat lahir Isidro Casanova, ArgentinaTinggi 1,80 m (5 ft 11 in)Posisi bermain GelandangInformasi klubKlub saat ini Arema IndonesiaNomor 8Karier senior*Tahun Tim Tampil (Gol)2003 Lanús 8 (0)2003 CA Los Andes 2004 Estudiantes de Mérida 2005 Huracán C.R. 2006 Barracas Central 2006-2007 Persela Lamongan 18 (4)2007 Alianza FC 2007-2009 Budućnost Podgorica 32 (3)2009-201...
Fictional cartoon family The topic of this article may not meet Wikipedia's general notability guideline. Please help to demonstrate the notability of the topic by citing reliable secondary sources that are independent of the topic and provide significant coverage of it beyond a mere trivial mention. If notability cannot be shown, the article is likely to be merged, redirected, or deleted.Find sources: The Frankenstones – news · newspapers · books · scholar&...
Это заготовка статьи о гербе. Помогите Википедии, дополнив её. Герб Таиланда Детали Утверждён 18 января 2007 Медиафайлы на Викискладе Герб Таиланда (тайск. ตราแผ่นดินของไทย) — один из государственных символов Таиланда, наряду с флагом и гимном. Герб предста...
Dalam nama Tionghoa ini, nama keluarganya adalah Xu. Xu Teli徐特立Xu Teli, di Yan'an. Wakil Menteri Departemen Publisitas Partai Komunis TiongkokMasa jabatan1949–1949PemimpinLu Dingyi (menteri)Menteri Pendidikan Republik Soviet TiongkokMasa jabatanNovember 1931 – September 1937 Informasi pribadiLahirXu Maoxun(1877-02-01)1 Februari 1877Kabupaten Changsha, Changsha, Hunan, Tiongkok QingMeninggal28 November 1968(1968-11-28) (umur 91)Beijing, TiongkokPartai politikPartai Komu...
الدوري الهولندي الدرجة الأولى تفاصيل الموسم 1989–1990 البلد هولندا البطل Schiedamse Voetbal Vereniging مباريات ملعوبة 342 أهداف مسجلة 927 1988–1989 1990–1991 تعديل مصدري - تعديل الدوري الهولندي الدرجة الأولى 1989–1990 هو الموسم الرابع والثلاثون من الدوري الهولندي الدرجة الأولى منذ إنش�...
Roket Soyuz di landasan peluncur. Roket peluncur Soyuz adalah sebuah sistem peluncuran yang didesain Biro Desain Korolev (Uni Soviet) dan digunakan untuk meluncurkan pesawat luar angkasa Soyuz, sebagai bagian dari program Soyuz. Meskipun begitu, roket Soyuz sebenarnya adalah peluncur kegunaan umum yang mempunyai fungsi-fungsi lain, termasuk peluncuran pesawat luar angkasa kargo dan peluncuran komersial yang dioperasikan TSeEsKAbe dan perusahaan Starsem. Ada 11 peluncuran Soyuz pada tahun 2001...
Artikel ini memerlukan pemutakhiran informasi. Harap perbarui artikel dengan menambahkan informasi terbaru yang tersedia. Tom SykesSykes di Silverstone, Kejuaraan Dunia Superbike di 2012KebangsaanInggrisLahir19 Agustus 1985 (umur 38)[1][2]Huddersfield, West Yorkshire, InggrisTim saat iniBMW Motorrad WorldSBK TeamNo. motor66 Catatan statistik Karier Kejuaraan Dunia SuperbikeTahun aktif2008– PabrikanSuzuki, Yamaha, Kawasaki, BMWJuara dunia1 (2013)Klasemen 20173rd (373 poi...
Artikel ini bukan mengenai Nick Saban. Nick SaganSagan pada 2018Lahir16 September 1970 (umur 53)Boston, Massachusetts, Amerika SerikatKebangsaanAmerika SerikatPekerjaanNovelis, penulis naskahKarya terkenalIdlewild, Edenborn, EverfreeOrang tuaCarl Sagan (bapak)Linda Salzman (ibu) Nick Sagan (lahir 16 September 1970) adalah seorang novelis dan penulis naskah asal Amerika Serikat. Ia adalah pengarang novel-novel fiksi ilmiah Idlewild, Edenborn, dan Everfree, dan juga menulis naskah untuk ep...
سرينيفاسا فارادهان (بالتاميلية: சாத்தமங்கலம் ரங்க ஐயங்கார் ஸ்ரீனிவாச வரதன்) معلومات شخصية الميلاد 2 يناير 1940(1940-01-02)تشيناي الهند البريطانية مواطنة الهند الولايات المتحدة عضو في الجمعية الملكية، والأكاديمية النرويجية للعلوم والآداب، ...
The interior of Coutances Cathedral, Normandy, France The larger medieval churches of France and England, the cathedrals and abbeys, have much in common architecturally, an east–west orientation, an external emphasis on the west front and its doors, long arcaded interiors, high vaulted roofs and windows filled with stained glass. The eastern end of the building contains the Sanctuary and the Altar. The part of the cathedral that shows the greatest diversity and the greatest change is the ea...
Chemical compound VCHSRIdentifiers IUPAC name 5-(4-chlorophenyl)- 3-[(E)-2-cyclohexylethenyl]-1-(2,4-dichlorophenyl)-4-methyl-1H-pyrazole ChemSpider21378331Chemical and physical dataFormulaC24H23Cl3N2Molar mass445.81 g·mol−13D model (JSmol)Interactive image SMILES C4CCCCC4C=Cc(c(C)c1-c(cc3)ccc3Cl)nn1-c2ccc(Cl)cc2Cl InChI InChI=1S/C24H23Cl3N2/c1-16-22(13-7-17-5-3-2-4-6-17)28-29(23-14-12-20(26)15-21(23)27)24(16)18-8-10-19(25)11-9-18/h7-15,17H,2-6H2,1H3/b13-7+Key:UMOLSRBHNLXWGD-NTUHNPAUS...
Ancient Greek and Roman system of medicine involving four fluid types This article is about humors in ancient and medieval medicine. For the related theory of temperament, see four temperaments. For humors in Ayurvedic medicine, see Ayurveda. For the use of humor in writing or public speaking, see Humorist. 16th-century German illustration of the four humors: Flegmat (phlegm), Sanguin (blood), Coleric (yellow bile) and Melanc (black bile), divided between the male and female sexes Humorism, t...
Public research university in Edmonton, Canada This article may have been created or edited in return for undisclosed payments, a violation of Wikipedia's terms of use. It may require cleanup to comply with Wikipedia's content policies, particularly neutral point of view. (December 2021) University of AlbertaCoat of armsLatin: Universitas Albertensis[1]MottoQuaecumque vera (Latin)Motto in EnglishWhatsoever things are trueTypePublicEstablished1908; 116 years ago ...
1930 mystery novel by Dorothy L. Sayers Strong Poison First editionAuthorDorothy L. SayersLanguageEnglishSeriesLord Peter WimseyGenreMystery novelPublisherGollancz[1]Publication date1930[1]Publication placeUnited KingdomMedia typePrintPages288[1]Preceded byThe Unpleasantness at the Bellona Club Followed byThe Five Red Herrings Strong Poison is a 1930 mystery novel by Dorothy L. Sayers, her fifth featuring Lord Peter Wimsey and the first in whi...