Corrección de Bessel

En estadística, la corrección de Bessel — así llamada por su creador, el astrónomo y matemático alemán Friedrich Bessel (1784-1846) — consiste en el uso de (n − 1) en lugar de n en las fórmulas de la varianza muestral y de la desviación típica muestral (siendo n el número de observaciones de una muestra). Corrige el sesgo estadístico en la estimación de la varianza poblacional, y algunos (pero no todos) los sesgos en la estimación de la desviación estándar poblacional.

Conceptos clave: población y muestra

Cuando se quiere estimar la desviación estándar como indicador estadístico de una población a partir de una muestra (lógicamente, porque no se dispone de datos sobre la población completa), es importante distinguir los conceptos de población (un conjunto, generalmente muy amplio de datos, como por ejemplo, "la estatura de todas las alumnas de una determinada edad de un país"), y de muestra (un subconjunto, generalmente pequeño, formado por algunos elementos pertenecientes a la población total, como por ejemplo, "las estaturas de las alumnas de la edad considerada de un determinado colegio"). Los términos poblacional y muestral se asocian a su vez a los conceptos anteriormente citados de población y de muestra.

Bessel se dedicaba a la astronomía, y una parte importante de su trabajo era estimar las órbitas de distintos objetos astronómicos (es decir, necesitaba conocer los parámetros de una población formada por las posiciones que definen la trayectoria de uno de estos objetos astronómicos), generalmente a partir de muy pocas observaciones (una pequeña muestra de posiciones del objeto), que generalmente tenía que tratar estadísticamente para reducir el efecto de los errores asociados a la toma de datos.

La varianza muestral se estima como la media aritmética de los cuadrados de las desviaciones de los valores de la muestra respecto a la media muestral. En este cálculo se usa el factor multiplicador 1/n (correspondiente al concepto de media aritmética)— que como se analiza más adelante, es un estimador sesgado a la baja de la varianza poblacional. Para corregir este efecto, Bessel multiplicaba por n/(n − 1) (equivalentemente, usando 1/(n − 1) en lugar de  1/n en la fórmula del estimador). El costo de esta corrección es que el estimador insesgado es uniformemente mayor que el sesgado. A veces[1][2]​ el factor n/(n − 1) es llamado Corrección de Bessel.

Un aspecto sutil de esta corrección implica que, mientras que la varianza muestral (usando la corrección de Bessel) es un estimador insesgado de la varianza poblacional, su raíz cuadrada (o sea, la desviación estándar muestral) sigue siendo un estimador sesgado de la desviación estándar poblacional. Ya que la raíz cuadrada es una función cóncava, se produce un sesgo por defecto debido a la desigualdad de Jensen. No hay una fórmula general para evitar el sesgo de la estimación de la desviación estándar poblacional, aunque hay varios factores correctores para distribuciones particulares, como en el caso de la distribución normal. Una aproximación del factor corrector exacto en la distribución normal se da usando el factor (n −  1.5) en la fórmula. El sesgo decae cuadráticamente (en lugar de linealmente, como en la forma que no usa la corrección de Bessel).

Puede entenderse la Corrección de Bessel intuitivamente, a partir de los grados de libertad del vector de residuos

donde es la media muestral. Mientras que hay n muestras independientes, hay solamente n − 1 residuos independientes, que suman 0. Es decir, calculados n − 1 residuos, es inmediato conocer el residuo restante, cuyo valor es la suma de los otros residuos cambiado de signo. Esta circunstancia es debida a la propiedad de la media aritmética que se utiliza en el cálculo de los residuos, que hace que estos siempre sumen 0.

Por último, debe resaltarse que a medida que el número de elementos de las muestras utilizadas es mayor, la diferencia entre las estimaciones corregidas y sin corregir (es decir, la diferencia entre la raíz de 1/n y la raíz de 1/(n-1)), es cada vez más pequeña. Sin embargo, el efecto de la corrección es especialmente relevante para muestras pequeñas (formadas por 10 o menos observaciones), como las que Bessel manejaba habitualmente.

La fuente del sesgo

Supóngase que la media de cierta población es 2050, pero el estadístico no la conoce. Por lo tanto, la estima basado en una pequeña muestra elegida al azar de entre la población:

Se puede calcular la media muestral:

Este valor puede servir como un estimador insesgado de la media poblacional, que es desconocida. Ahora, hay que enfrentarse al problema de estimar la varianza poblacional. O sea, de estimar el promedio entre el cuadrado de las desviaciones respecto a  2050. Si el estadístico supiera que la media poblacional es de 2050, entonces podría proceder de la siguiente forma:

Pero el estimador de la media poblacional del que dispone el estadístico es la media muestral 2052, no 2050. En consecuencia, solo puede calcular:

La estimación es substancialmente menor. Por lo tanto surge el interrogante: el estimador de la varianza poblacional calculado usando la media muestral, ¿es siempre menor que la verdadera varianza poblacional? La respuesta es que sí, excepto cuando la media muestral sea igual a la media poblacional.

En términos intuitivos, se busca la suma de los cuadrados de las diferencias respecto a la media poblacional, pero el estadístico termina calculando la suma de los cuadrados de las diferencias de los valores de cada observación respecto a la media muestral, que es, como se verá a continuación, el valor que minimiza la suma de las diferencias al cuadrado. Por lo tanto, a menos que la muestra tenga como media un valor igual al de la media poblacional, su estimador siempre subestimará la varianza poblacional.

Para ver cómo se produce esta circunstancia, se usa una identidad simple en álgebra:

Con se representa la desviación de una observación individual con respecto a la media muestral, y con se representa la diferencia entre la media muestral y la media poblacional. Nótese que lo que se ha hecho ha sido simplemente descomponer la desviación respecto a la media poblacional (que es desconocida) en dos componentes: la desviación respecto a la media muestral -que se conoce- y la desviación adicional respecto a la media poblacional -que se desconoce-. Ahora, aplicando esta identidad, se descompone:

Operando los cuadrados:

Ahora se aplica esta fórmula desarrollada a las 5 observaciones, y se analiza el patrón resultante:

La suma de los valores de la columna del medio debe ser cero, porque la suma de las desviaciones respecto a la media muestral debe ser cero. Dado que la columna del medio se anula, entonces se observa que

  • La suma de los valores en la primera columna (a2) es la suma de los cuadrados de las diferencias entre los valores de la variable y la media muestral.
  • La suma de todos los valores de las dos columnas que quedan, (a2 y b2) es la suma de los cuadrados de las diferencias entre los valores de la variable y su media poblacional, debido a la forma en que se comenzó con la primera observación,  [2053 − 2050]2, haciéndose lo mismo con las siguientes cuatro observaciones.
  • La suma de todas las columnas debe ser mayor que la suma de los valores de la primera columna, ya que todos los valores que no se eliminaron son positivos (excepto cuando la media poblacional y la media muestral coinciden, en cuyo caso todos los números de la última columna serán 0).

Por lo tanto, la suma de los cuadrados de las diferencias respecto a la media poblacional siempre será mayor que la suma de las desviaciones al cuadrado respecto a la media muestral (excepto cuando la media poblacional y la media muestral coincidan, en cuyo caso ambas son iguales). Es por esto que la suma de los cuadrados de las desviaciones respecto a la media muestral resulta ser un estimador sesgado a la baja de la varianza poblacional.

Notación y terminología

Esta corrección es tan común, que los términos "varianza muestral" y "desvío estándar muestral" se refieren frecuentemente al estimador corregido, usando n − 1. Sin embargo se debe ser cauto: algunas calculadoras y paquetes estadísticos pueden dar la opción de usar ambos estimadores, o solamente la versión menos usual. Para mayor precisión, en este artículo se denomina "desviación estándar muestral" a la desviación estándar muestral, que por definición usa n, y está sesgado con respecto a la desviación estándar poblacional.

Este artículo usa los siguientes símbolos y definiciones:

μ es la media poblacional
es la media muestral
σ2 es la varianza poblacional
sn2 es el estimador sesgado de la varianza (sin la corrección de Bessel)
s2 es el estimador insesgado de la varianza poblacional (con la corrección de Bessel)

Las desviaciones estándar se obtienen aplicando la raíz cuadrada a sus varianzas respectivas. Ya que las desviaciones estándar producen sesgo, la terminología "no corregido" o "corregido" se prefiere para los estimadores de la varianza poblacional.

sn es la desviación estándar muestral no corregida (sin la corrección de Bessel)
s es la desviación estándar muestral corregida (con el estimador de Bessel), que está menos sesgado, pero sigue estando sesgado

Fórmulas

La media muestral se calcula como:

La varianza muestral sesgada tiene la fórmula:

Y la varianza muestral no sesgada se escribe como:

Pruebas de consistencia

A continuación se incluyen dos pruebas de la consistencia de la corrección de Bessel como factor apropiado para evitar el sesgo de la varianza muestral:

Véase también

Referencias

  1. W.J. Reichmann, W.J. (1961) Use and abuse of statistics, Methuen. Reprinted 1964–1970 by Pelican. Appendix 8.
  2. Upton, G.; Cook, I. (2008) Oxford Dictionary of Statistics, OUP. ISBN 978-0-19-954145-4 (entry for "Variance (data)")

Enlaces externos

Read other articles:

2002 Newark mayoral election ← 1998 May 14, 2002 2006 → Turnout19.58%   Candidate Sharpe James Cory Booker Party Nonpartisan Nonpartisan Popular vote 28,300 24,800 Percentage 52.3% 46.7% Mayor before election Sharpe James Democratic Elected Mayor Sharpe James Democratic Elections in New Jersey Federal government U.S. President 1788-89 1792 1796 1800 1804 1808 1812 1816 1820 1824 1828 1832 1836 1840 1844 1848 1852 1856 1860 1864 1868 1872 1876 1880 1884 1888 18...

 

National university in Nagoya, Japan Not to be confused with Nagoya City University. Nagoya University名古屋大学Motto勇気ある知識人 (courageous intellectual)TypePublic (national)Established1871; 153 years ago (1871)(Chartered 1939)PresidentNaoshi SugiyamaAcademic staff3,847 (2020)Undergraduates9,585 (2020)Postgraduates6,187 (2020)LocationNagoya, Aichi, Japan35°09′17″N 136°58′01″E / 35.15472°N 136.96694°E / 35.15472; 136.96694Ca...

 

American college basketball tournament 1995 NCAA Division Iwomen's basketball tournamentTeams64Finals siteTarget CenterMinneapolis, MinnesotaChampionsConnecticut Huskies (1st title, 1st title game,2nd Final Four)Runner-upTennessee Volunteers (5th title game,8th Final Four)SemifinalistsStanford Cardinal (4th Final Four)Georgia Bulldogs (3rd Final Four) NCAA Division I women's tournaments «1994 1996» The 1995 NCAA Division I women's basketball tournament featured 64 teams. The Final F...

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus. Certaines informations figurant dans cet article ou cette section devraient être mieux reliées aux sources mentionnées dans les sections « Bibliographie », « Sources » ou « Liens externes » (juillet 2018). Vous pouvez améliorer la vérifiabilité en associant ces informations à des références à l'aide d'appels de notes. Pour les articles homonymes, voir Dreyer. Carl The...

 

Voce principale: Eccellenza 2010-2011. Eccellenza Puglia 2010-2011 Competizione Eccellenza Puglia Sport Calcio Edizione 20° Organizzatore FIGC - LNDComitato Regionale Puglia Date dal 2010al 2011 Luogo  Italia Partecipanti 18 Formula 1 girone Risultati Vincitore Martina Retrocessioni ManduriaMaruggioLuceraCastellanaStefanizzi Sogliano Cronologia della competizione 2009-2010 2011-2012 Manuale Il campionato italiano di calcio di Eccellenza regionale 2010-2011 è stato il ventesimo...

 

SokarajaKecamatanPeta lokasi Kecamatan SokarajaNegara IndonesiaProvinsiJawa TengahKabupatenBanyumasPemerintahan • CamatJakarta Tisam S.STP M.SiPopulasi (2023) • Total91,988 [1] jiwaKode Kemendagri33.02.19 Kode BPS3302230 Luas29,92 km²[2]Desa/kelurahan18 Desa Stasiun kereta api Sokaraja pada tahun 1900-an Sokaraja (Hanacaraka: ꦱꦺꦴꦏꦫꦗ) adalah sebuah kecamatan di Kabupaten Banyumas, Provinsi Jawa Tengah, Indonesia. Jumlah penduduk Ke...

Diplomatic mission of the United States of America in Singapore Embassy of the United States, SingaporeLocationSingaporeAddress27 Napier Rd, Singapore 258508Coordinates1°18′19″N 103°49′13″E / 1.305329°N 103.820391°E / 1.305329; 103.820391AmbassadorJonathan E. KaplanWebsitesg.usembassy.gov The Embassy of the United States of America, Singapore is the diplomatic mission of the United States to Singapore. It is one of the largest American embassies in the Asia...

 

Lakshmi Chand Jain2018Lahir(1925-12-13)13 Desember 1925Bahadurpur, Rajasthan, IndiaMeninggal14 November 2010(2010-11-14) (umur 84)New Delhi, IndiaKebangsaanIndiaNama lainL.C. JainPekerjaanpejuang kemerdekaan, pemimpin kooperatifDikenal atasGandhian, pejuang kemerdekaan, mantan birokrat dan pemenang Penghargaan Ramon Magsaysay 1989Tanda tangan Lakshmi Chand Jain (1925–2010) adalah seorang penggiat Gandhian[1] dan penulis. Pada masa mudanya, ia sempat ikut dalam gerakan kem...

 

Point Loma Sea LionsUniversityPoint Loma Nazarene UniversityConferencePacWestNCAADivision IIAthletic directorEthan HamiltonLocationSan Diego, CaliforniaVarsity teams11 (4 men's, 7 women's)Basketball arenaGolden GymnasiumBaseball stadiumCarroll B. Land StadiumNicknameSea LionsWebsiteplnusealions.com PLNU's Golden Gym The Point Loma Sea Lions (officially the Point Loma Nazarene Sea Lions or PLNU Sea Lions) are the intercollegiate athletic teams that represent Point Loma Nazarene University. The...

Edward Clark PotterPhoto of Edward Clark Potter in 1899.LahirEdward Clark Potter(1857-11-26)26 November 1857New London, ConnecticutMeninggal21 Juni 1923(1923-06-21) (umur 65)New London, ConnecticutKebangsaanAmericanPendidikanSchool of the Museum of Fine Arts, Boston, Académie JulianDikenal atassculpture Signature Edward C. Potter Edward Clark Potter (26 November 1857 – 21 Juni 1923) adalah seorang pematung Amerika yang terkenal karena patung berkuda dan hewannya. Karyan...

 

Group of stereoisomers NomifensineClinical dataTrade namesMeritalRoutes ofadministrationOralATC codeN06AX04 (WHO) Legal statusLegal status BR: Class C1 (Other controlled substances)[1] Withdrawn Pharmacokinetic dataElimination half-life1.5–4 hoursExcretionKidney (88%) within 24 hours[2]Identifiers IUPAC name (±)-2-Methyl-4-phenyl-1,2,3,4-tetrahydroisoquinolin-8-amine CAS Number24526-64-5 NPubChem CID4528IUPHAR/BPS4792DrugBankDB04821 YChemSpider4371&...

 

2014 concert tour by the Saturdays Greatest Hits Live!Tour by The SaturdaysAssociated albumFinest Selection: The Greatest HitsStart date7 September 2014End date23 September 2014No. of shows12 in EuropeThe Saturdays concert chronology All Fired Up!(2011) Greatest Hits Live!(2014) N/A Greatest Hits Live! (also known as the Finest Selection Tour) was the fourth and final headlining concert tour by English-Irish girl group The Saturdays. It was their first tour in three years, launched in support...

الأميرة النائمةSleeping Beauty (بالإنجليزية) معلومات عامةالتصنيف فيلم رسوم متحركة الصنف الفني مغامرة، فنتازياالمواضيع لعنة — انتقام — سحر تاريخ الصدور 1959مدة العرض 75 دقيقةاللغة الأصلية الإنجليزيةمأخوذ عن The Beauty Sleeping in the Wood (en) [1] — الجمال النائم[2] البلد الولايات المتحدة...

 

This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article relies largely or entirely on a single source. Relevant discussion may be found on the talk page. Please help improve this article by introducing citations to additional sources.Find sources: Medical Household – news · newspapers · books · scholar · JSTOR (June 2021) An editor has perform...

 

British physicist Cyril HilsumCBE FRS HonFInstP FREngHilsum at the Second International Conference on Research and Communications in PhysicsBorn (1925-05-17) 17 May 1925 (age 99)NationalityBritishAlma materUniversity College LondonKnown forliquid-crystal science and technologyChildrenLindsey Hilsum and Karen BurtAwardsFREng[1] (1978)Max Born Prize (1987)Faraday Medal (1988)Richard Glazebrook Medal and Prize (1997)Royal Medal (2007) Cyril Hilsum CBE FRS&#...

Stasiun Fujikawa藤川駅Stasiun Fujikawa pada Agustus 2012Lokasi182 Matsumoto Fujikawacho, Okazaki-shi, Aichi-ken 444-352JepangKoordinat34°54′49″N 137°13′06″E / 34.9135°N 137.2184°E / 34.9135; 137.2184Koordinat: 34°54′49″N 137°13′06″E / 34.9135°N 137.2184°E / 34.9135; 137.2184Operator MeitetsuJalur■ Jalur Meitetsu NagoyaLetak23.1 kilometer dari ToyohashiJumlah peron2 peron sampingInformasi lainStatusTanpa stafKode stas...

 

Palazzo di BreraLocalizzazioneStato Italia RegioneLombardia LocalitàMilano IndirizzoVia Brera, 28 Coordinate45°28′19.43″N 9°11′17.28″E45°28′19.43″N, 9°11′17.28″E Informazioni generaliCondizioniIn uso Costruzione1651-XVIII secolo StileManierista UsoSede della Pinacoteca di Brera, della Biblioteca Nazionale Braidense e dell'Accademia di belle arti RealizzazioneArchitettoFrancesco Maria Richini CommittenteGesuiti Modifica dati su Wikidata · Manuale Il palazzo di B...

 

Water poloat the Games of the XXIV OlympiadVenueJamsil Indoor Swimming PoolDates21 September – 1 October 1988Competitors156 from 12 nationsMedalists  Yugoslavia  United States  Soviet Union← 19841992 → Water polo at the 1988 Summer Olympics as usual was part of the swimming sport, the other two being swimming and diving. They were not seen as three separate sports, because they all were governed by one federation — FINA. Water polo disci...

Species of snake Not to be confused with Burmese python. For other uses of rock python, see Rock python. Indian python Near Nagarhole National Park Conservation status Near Threatened  (IUCN 3.1)[1] Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Chordata Class: Reptilia Order: Squamata Suborder: Serpentes Family: Pythonidae Genus: Python Species: P. molurus Binomial name Python molurus(Linnaeus, 1758)[2] Distribution of Indian python Synonyms B...

 

O Ranking Feminino Mundial da FIFA (oficialmente FIFA/Coca-Cola Women's World Ranking), é um que classifica as 177 seleções nacionais de futebol feminino associadas à Federação Internacional de Futebol (FIFA). O ranking é utilizado desde julho de 2003. Primeiro ranking O primeiro ranking feminino da FIFA foi divulgado em 16 de julho de 2003 e a primeira Seleção à liderá-lo foi a Seleção dos Estados Unidos. Estas foram as 30 primeiras colocações do primeiro ranking feminino elab...