El teorema central del límite o teorema del límite central indica que, en condiciones muy generales, si es la suma de variables aleatorias independientes, con media y varianza finitas, entonces la función de distribución de «se aproxima bien» a una distribución normal (también llamada distribución gaussiana, curva de Gauss o campana de Gauss). Así pues, el teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e independientes es lo suficientemente grande.[1][2]
El nombre viene de un documento científico escrito por George Pólya en 1920, titulado Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem[3] [Sobre el «teorema del límite» (Grenzwertsatz) central del cálculo probabilístico y el problema de los momentos], por lo que la denominación más fiel a la original
sería teorema central del límite.
Este teorema ha sufrido muchos cambios durante el desarrollo formal de la teoría de la probabilidad. Las versiones anteriores del teorema se remontan a 1811, pero en su forma general moderna, este resultado fundamental en la teoría de la probabilidad se enunció con precisión en una fecha tan tardía como 1920,[4] sirviendo así de puente entre la teoría de la probabilidad clásica y la moderna.
Por ejemplo, supongamos que se obtiene una muestra que contiene muchas observaciones, cada observación se genera aleatoriamente de forma que no depende de los valores de las demás observaciones, y que se calcula la media aritmética de los valores observados. Si este procedimiento se realiza muchas veces, el teorema del límite central dice que la distribución de probabilidad de la media se aproximará mucho a una distribución normal.
El teorema del límite central tiene diversas variantes. En su forma común, las variables aleatorias deben ser independientes e idénticamente distribuidas (i.i.d.). En sus variantes, la convergencia de la media a la distribución normal también se produce para distribuciones no idénticas o para observaciones no independientes, si cumplen ciertas condiciones.
Se define la variable aleatoria como la suma de variables aleatorias independientes e idénticamente distribuidas, cada una de ellas con una media y varianza , es decir
donde y . Con lo anterior, la media de es y la varianza es pues son variables aleatorias independientes. Con tal de hacer más fácil la comprensión del teorema y su posterior uso, se hace una estandarización de como
El teorema clásico del límite central describe el tamaño y la forma de distribución de las fluctuaciones estocásticas alrededor del número determinista durante esta convergencia. Más concretamente, afirma que a medida que se hace mayor, la distribución de la diferencia entre la media muestral y su límite , cuando se multiplica por el factor ( es decir ) se aproxima a la distribución normal con media 0 y varianza . Para n suficientemente grande, la distribución de se aproxima arbitrariamente a la distribución normal con media y varianza .
La utilidad del teorema es que la distribución de se aproxima a la normalidad independientemente de la forma de la distribución de cada . Formalmente, el teorema puede enunciarse de la siguiente manera:
Teorema de Lindeberg–Lévy CLT:
Supongamos que es una secuencia de variables aleatorias i.i.d. con and . Entonces se tiene se aproxima a infinito, las variables aleatorias convergen en la distribución a una normal:[7]
En el caso , converger en la distribución significa que la función de distribución acumulativa de convergen puntualmente a la cdf de la distribución: para cada real number ,
donde es la fdc normal estándar evaluada at . La convergencia es uniforme en en el sentido de que
donde denota el límite superior mínimo (o supremum) del conjunto.[8]
Teorema
De manera formal y compacta el teorema enuncia[9]
Sean variables aleatorias independientes e idénticamente distribuidas con y , se define
Entonces la función de distribución de converge hacia la función de distribución normal estándar cuando , es decir,
Es muy común encontrarlo con la variable estandarizada en función de la media muestral, es decir
puesto que son equivalentes (sólo se divide tanto numerador como denominador entre ).
Es importante remarcar que este teorema no dice nada acerca de la distribución de la variable aleatoria , excepto la existencia de media y varianza.[10]
Propiedades
El teorema del límite central garantiza una distribución aproximadamente normal cuando es suficientemente grande.
Existen diferentes versiones del teorema, en función de las condiciones utilizadas para asegurar la convergencia. Una de las más simples establece que es suficiente que las variables que se suman sean independientes, idénticamente distribuidas, con valor esperado y varianza finitas.
La aproximación entre las dos distribuciones es, en general, mayor en el centro de las mismas que en sus extremos o colas, motivo por el cual se prefiere el nombre "teorema del límite central" ("central" califica al límite, más que al teorema).
En el caso de variables aleatorias independientes e idénticamente distribuidas, cada una de ellas con varianza nula o infinita, la distribución de las variables
no convergen en distribución hacia una normal.
A continuación se presentan los dos casos por separado.
En este caso puede demostrarse que la distribución asintótica de viene dada por otra distribución de Cauchy:
Para otras distribuciones de varianza infinita no es fácil dar una expresión cerrada para su distribución de probabilidad aunque su función característica sí tiene una forma sencilla, dada por el teorema de Lévy-Khintchine:[11]
donde y:
Las condiciones anteriores equivalen a que una distribución de probabilidad sea una distribución estable.
Varianza nula
Este caso corresponde trivialmente a una función degenerada tipo delta de Dirac cuya función de distribución viene dada por:
En este caso resulta que la variable trivialmente tiene la misma distribución que cada una de las variables independientes.
↑Montgomery, Douglas C.; Runger, George C. (2014). Estadística aplicada y probabilidad para ingenieros (6th edición). Wiley. p. 241. ISBN9781118539712.
Blaiotta, Jimena; Delieutraz, Pablo (30 de julio de 2004). «Teorema central del límite»(PDF). Consultado el 15 de diciembre de 2010.
Behar Gutiérrez, Roberto; Grima Cintas, Pere (2004). 55 respuestas a dudas típicas de Estadística. Madrid: Ediciones Díaz de Santos, S.A. pp. 187-189. ISBN84-7978-643-4.