Statistiko estas scienco pri la metodoj por kolekti, analizi kaj interpreti empiriajn nombrajn donitaĵojn kaj por prezenti la rezultojn. Tio fariĝas komplike, kiam la donitaĵoj kaj la interdependoj ne estas tute konataj, estas neprecizaj aŭ tro multenombraj por esti detale traktataj. Statistiko estas rimedo por kompari sciencan teorion kun la reala mondo
kaj por serĉi novajn interrilatojn por nova teorio.
Fojfoje oni renkontas la vorton statistiko (minuskle kaj ofte plurale) ankaŭ por bazaj statistikaĵoj: statistikaj datumoj, tabeloj kaj aliaj statistikaj datum-prezentoj. Tio imitas uzadon en iuj gentaj lingvoj, sed en Esperanto tia malpreciza uzado impresas nenature, eĉ misgvide, kaj estas evitinda.
La dedukta statistiko, kiu dediĉas sin al la generado de la modeloj, deduktoj kaj antaŭdiroj asociitaj al la fenomenoj studataj konsiderante la hazardecon de la observoj. Oni ĝin uzas por modeli regulojn en la datumoj kaj ĉerpi konkludojn. Ĉi tiuj deduktaĵoj povas preni la formon de respondoj al demandoj se/ne (provo de hipotezo), alpreno de nombraj karakterizaĵoj, prognozoj de futuraj observoj, priskriboj de asocio (korelacio) aŭ modelado de rilatoj inter variabloj. Aliaj teknikoj de modelado estas anova, serioj de tempo kaj minado de datumoj.
Ambaŭ branĉoj apartenas al la aplikita statistiko. Estas ankaŭ disciplino nomata matematika statistiko, kiu referencas al la teoriaj bazoj de la materio. La vorto «statistikoj» ankaŭ aludas al la rezulto apliki algoritmon statistikan al aro de datumoj, kiel en ekonomiaj, kriminalaj statistikoj, inter aliaj.
Etimologio
La germana termino Statistik, kiu estis unue enkondukita de Gottfried Achenwall (1749), referencis origine al la analizo de datumoj de la Ŝtato, tio estas, la "scienco de la ŝtato" (ankaŭ nomata aritmetika politiko laŭ ĝia rekta traduko).[1] La termino statistiko akiris la signifon de kolektado kaj klasifikado de datumoj nur en la 19a jarcento. Ĉi tiun koncepton enkondukis anglo John Sinclair.
Historio de statistiko
Formalaj studoj pri dedukta statistiko datiĝas el arabaj matematikistoj kaj kriptografoj, dum la Islama Orepoko inter la 8-a kaj la 13-a jarcentoj. Al-Ĥalil (717–786) verkis la Libron de Kriptografiaj Mesaĝoj, kiu enhavas unu el la unuaj uzoj de permutaĵoj kaj kombinaĵoj, por listigi ĉiujn eblajn arablingvajn vortojn kun kaj sen vokaloj.[2] La verko de Al-Kindi nome Manuskripto pri Deĉifrado de Kriptografiaj Mesaĝoj havigis detalan priskribon kiel uzi analizon pri frekvencoj por deĉifri ĉifritajn mesaĝojn, havigante fruan ekzemplon de dedukta statistiko por dekodigi. Ibn Adlan (1187–1268) poste faris gravan kontribuon al la uzado de montrogrando en analizo pri frekvencoj.[2]
La termino 'statistiko' estis enkondukita fare de la itala fakulo Girolamo Ghilini en 1589 reference al tiu scienco.[3][4] La plej frua verko enhavanta statistikojn en Eŭropo datiĝas el 1663, pro la publikigo de la verko Natural and Political Observations upon the Bills of Mortality de John Graunt.[5] Fruaj aplikaĵoj de statistika pensaro temis pri la bezonoj de ŝtatoj bazi sian politikon sur demografiaj kaj ekonomiaj datumoj, kaj el tio devenas la etimologio de statistiko el ŝtato. La alrigardo de la fako statistiko ampleksiĝis en la komenco de la 19-a jarcento por inkludi la kolektadon kaj analizon de ĝeneralaj datumoj. Nuntempe, statistiko estas amplekse uzata en politiko, aparte regado, negocado, kaj naturaj kaj sociaj sciencoj. Malfacile oni povas nun atenti gazetaron aŭ televidan novaĵprogramon netrafinte statistikojn.
La matematikaj fundamentoj de statistiko disvolviĝis el studoj pri hazardludoj inter matematikistoj kiel Gerolamo Cardano, Blaise Pascal, Pierre de Fermat, kaj Christiaan Huygens. Kvankam la ideo de probablo estis jam pritraktita en antikva kaj mezepoka juro kaj filozofio (kiel ĉe la verkaro de Juan Caramuel), la probabloteorio kiel matematika fako formiĝis nur en la plej frua komenco de la 17-a jarcento, partikulare en la postmorta verko de Jacob Bernoulli nome Ars Conjectandi.[6] Tiu estis la unua libro en kiu la temoj de hazardludoj kaj de probableco (kiuj postulis opinion, pruvaron kaj argumentojn) estis kombinitaj kaj submetitaj al la matematika analizo.[7][8] La metodo de "malplej nombraj kvadratoj" estis por la unua fojo priskribita de Adrien-Marie Legendre en 1805, kvankam Carl Friedrich Gauss supozeble uzis ĝin unu jardekon antaŭe, nome en 1795.[9]
La moderna fako de statistiko aperis fine de la 19-a kaj komenco de la 20-a jarcentoj en tri etapoj.[10] La unuan ondon, fine de la jarcento, enkondukis la verkaroj de Francis Galton kaj Karl Pearson, kiuj transformis statistikon en rigore matematika fako uzebla por analizoj, ne nur en scienco, sed ankaŭ en ekonomio kaj politiko. La kontribuoj de Galton inkludis la enkondukon de la konceptoj de norma devio, korelacio, analizo de regreso kaj la aplikadon de tiuj metodoj al la studo de la varieco de homaj trajtoj — alto, pezo kaj eĉ longo de okulharoj inter aliaj.[11]
Pearson disvolvis la korelacian koeficienton de Pearson difinita per produkt-momanto,[12] la metodon de momantoj por la kongruigo de distribuaĵoj al montraĵoj kaj la Pearson distribuon, inter multaj aliaj konceptoj.[13] Galton kaj Pearson fondis Biometrika nome la unua scienca gazeto pri matematika statistiko kaj biostatistiko (tiam nomita biometrio), kaj la laste menciita fondis la unuan universitatan statistikan departementon en la mondo nome en la Universitato-Kolegio de Londono.[14]
La duan ondon, de la 1910-aj kaj la 1920-aj jaroj, iniciatis William Sealy Gosset, kaj atingis sian kulminon en la alrigardoj fare de Ronald Fisher, kiu verkis la lernolibrojn kiuj difinos la akademian fakon en universitatoj tra la tuta mondo. La plej gravaj publikaĵoj de Fisher estis lia ŝlosila artikolo de 1918 nome The Correlation between Relatives on the Supposition of Mendelian Inheritance (Korelacio inter parencoj pri supozoj de mendela heredo) kiu estis la unua verko kiu uzis la poste tre utilan statistikan terminon, varianco), lia klasika verko de 1925 nome Statistical Methods for Research Workers (Statistikaj metodoj por esploristoj) kaj lia verko de 1935 nome The Design of Experiments (Dezajno de eksperimentoj),[15][16][17] en kiu li disvolvis rigorajn modelojn por dezajno de eksperimentoj.
Fisher kreis la konceptojn de "sufiĉeco" kaj "komplementa statistiko", la diskriminantan analitikon de Fisher kaj la "informaron de Fisher".[18] Li ankaŭ stampis la terminon "nula hipotezo" dum la eksperimento de la "Sinjorino tegustumanta", kio "estas neniam pruvita aŭ establita, sed ĝi estas eble dispruvita, laŭ la daŭro de la eksperimentado".[19][20] En sia libro de 1930 nome The Genetical Theory of Natural Selection (La genetika teorio de natura selektado), li aplikis statistikon al variaj biologiaj konceptoj kiel la "principo de Fisher"[21] (kion A. W. F. Edwards nomis "probable la plej fama argumento en evolucia biologio") kaj la "modelo de natura selektado pere de masklornamo de Fisher",[22][23][24][25][26][27] koncepto pri seksa selektado pri pozitiva reenfuĝa efiko troviĝanta en evolucio.
La fina ondo, kiu ĉefe konsistis el rafinado kaj ekspansio de pli fruaj disvolviĝoj, aperis el la kunlabora verkado inter Egon Pearson kaj Jerzy Neyman en la 1930-aj jaroj. Ili enkondukis la konceptojn de eraroj "Tipo II", "statistika povo" kaj konfidintervaloj. Jerzy Neyman en 1934 montris, ke tavoligita hazarda montraĵaro estas ĝenerale pli bona metodo de ĉirkaŭkalkulado ol la celita (kvota) montraĵaro.[28]
Aktuale, statistikajn metodojn oni aplikas en ĉiaj fakokampoj, kiuj postulas decidfaradon, por atingi akuratajn inferencojn el kolektita korpuso de datumoj kaj por decidfarado antaŭ necerteco bazite sur statistika metodologio. La uzado de modernaj komputiloj ebligis faradon de grandskalaj statistikaj komputadojn kaj ebligis ankaŭ novajn metodojn kiuj estis nepraktike plenumeblaj permane. Statistiko plue estas areo de aktiva esplorado, por ekzemplo por la problemo kiel analizi datumaregon (anglebig data).[29]
Originoj en probablo
La metodoj statistika-matematikaj emerĝis de la teorio de probablo, kiu datiĝas de la mesaĝado inter Blaise Pascal kaj Pierre de Fermat (1654). Christiaan Huygens (1657) donis la unuan sciencan traktadon de la fako. La Ars coniectandi (postmorta, 1713) de Jakob Bernoulli kaj la Doktrino de ebloj (1718) de Abraham de Moivre studis la disciplinon kiel branĉo de la matematikoj. En la moderna erao, la laboro de Andrej Kolmogorov estis kolono en la formulado de la fundamenta modelo de probablo-teorio, kiu estas uzita tra la statistiko.
Hodiaŭ la uzo de la statistiko etendiĝis for de ĝiaj originoj kiel servo al la Ŝtato aŭ al la registaro. Personoj kaj organizoj uzas statistikon por kompreni datumojn kaj preni decidojn en sociaj kaj naturaj sciencoj, medicino, negocoj kaj aliaj areoj. La statistiko estas komprenita ĝenerale ne kiel sub-areo de la matematikoj sed kiel malsama scienco «aliancita». Multaj universitatoj havas akademiajn fakojn de matematiko kaj statistiko aparte. La statistiko instruas en fakoj tiel diversaj kiel psikologio, eduko kaj publika sano.
Regresa statistiko estas unu el aro da statistikaj metodoj tre uzataj por analizi rilaton de dependa variablo al unu aŭ pluraj aliaj nedependaj variabloj. Pli specife, regreso helpas komprenigi, kiel tipa valoro de dependa variablo ŝanĝas, kiam unu el la nedependaj variabloj varias, dum la aliaj nedependaj variabloj restas senŝanĝaj. Regresanalizo estas vaste uzata por prognozo kaj antaŭvido, kiam la laborkampo proksimiĝas al artefarita intelekto.
Granda aro da teĥnikoj por trakti analizojn estis realigitaj. Konataj metodoj, kiel la lineara regreso kaj la metodo de kvadrataj minimumoj, estas parametraj regresoj, ĉar ilia regresofunkcio, kiu bildigas la problemon, estas difinita per finia nombro da nekonataj parametroj, kiuj estas laŭtaksataj el la datenoj. Neparametraj regresoj estas malpli konataj, kaj rilatas al teĥnikoj, kiuj permesas regresojn ligitajn al specifa aro da funkcioj, kun okazeble nefiniaj dimensioj.
Statistika mekaniko
Statistika mekaniko, unu el la pilieroj de la moderna fiziko, priskribas kiel makroskopaj observoj (kiel temperaturo kaj premo) estas rilataj al mikroskopaj parametroj kiuj fluktuas averaĝe. Ĝi konektas termodinamikajn kvantojn (kiel varmokapacito) al mikroskopa konduto, dum, en klasika termodinamiko, la nura disponebla eblo estus la mezuro kaj tabeligo de tiaj kvantoj por variaj materialoj.[30]
↑"Statistik" en Digitales Wörterbuch der deutschen Sprache
↑ 2,02,1 (1 November 2011) “An Account of Early Statistical Inference in Arab Cryptology”, The American Statistician65 (4), p. 255–257. doi:10.1198/tas.2011.10191. 123537702.
↑ (2014) “The emergence of statistical science”, Śląski Przegląd Statystyczny12 (18), p. 76–77. doi:10.15611/sps.2014.12.04.
↑Willcox, Walter (1938) "The Founder of Statistics". Review of the International Statistical Institute 5(4): 321–328. JSTOR 1400906
↑J. Franklin, The Science of Conjecture: Evidence and Probability before Pascal, Johns Hopkins Univ Press. 2002
↑Schneider, I. (2005). Jakob Bernoulli, Ars Conjectandi (1713). En I. Grattan-Guinness (eld.), Landmark writings in Western Mathematics, 1640-1940 (pp. 88-103).
↑Box, JF (Februaro 1980). “R.A. Fisher and the Design of Experiments, 1922–1926”, 'The American Statistician'34 (1), p. 1–7. doi:10.2307/2682986.
↑Yates, F (June 1964). “Sir Ronald Fisher and the Design of Experiments”, 'Biometrics'20 (2), p. 307–321. doi:10.2307/2528399.
↑ (1966) “The Influence of Fisher's "The Design of Experiments" on Educational Research Thirty Years Later”, American Educational Research Journal3 (3), p. 223–229. doi:10.3102/00028312003003223. 145725524.
↑OED quote: 1935 R.A. Fisher, The Design of Experiments ii. 19, "We may speak of this hypothesis as the 'null hypothesis', and the null hypothesis is never proved or established, but is possibly disproved, in the course of experimentation."
↑Fisher|1971|loc=Chapter II. The Principles of Experimentation, Illustrated by a Psycho-physical Experiment, Section 8. "The Null Hypothesis"
↑ (1998) “Natural Selection and the Sex Ratio: Fisher's Sources”, American Naturalist151 (6), p. 564–569. doi:10.1086/286141. 40540426.
↑Fisher, R.A. (1915) The evolution of sexual preference. Eugenics Review (7) 184:192
↑Fisher, R.A. (1930) The Genetical Theory of Natural Selection. (ISBN 0-19-850440-3)
↑Edwards, A.W.F. (2000) Perspectives: Anecdotal, Historical and Critical Commentaries on Genetics. The Genetics Society of America (154) 1419:1426
↑Andersson, M. kaj Simmons, L.W. (2006) Sexual selection and mate choice. Trends, Ecology and Evolution (21) 296:302
↑Gayon, J. (2010) Sexual selection: Another Darwinian process. Comptes Rendus Biologies (333) 134:144
↑ (1934) “On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection”, 'Journal of the Royal Statistical Society'97 (4), p. 557–625. doi:10.2307/2342192.
↑ 30,030,1Gibbs, Josiah Willard (1902). Elementary Principles in Statistical Mechanics. New York: Charles Scribner's Sons.
↑ Tolman, R. C. (1938). The Principles of Statistical Mechanics. Dover Publications. ISBN 9780486638966.
↑ Balescu, Radu (1975). Equilibrium and Non-Equilibrium Statistical Mechanics. John Wiley & Sons. ISBN 9780471046004.
↑ La termino statistika mekaniko estas foje uzata por referenci nur al statistika termodinamiko. Tiu artikolo sekvas la larĝan rigardon. Laŭ kelkaj difinoj, statistika fiziko estas eĉ pli larĝsenca termino kun statistikaj studoj de ajna tipo de fizika sistemo, sed ĝi estas ofte komprenita kiel sinonimo kun statistika mekaniko.
Bibliografio
Best, Joel (2001). Damned Lies and Statistics: Untangling Numbers from the Media, Politicians, and Activists. University of California Press. ISBN 0-520-21978-3.
Hacking, Ian (1990). The Taming of Chance. Cambridge University Press. ISBN 0-521-38884-8.
Lindley, D. V. (1985). Making Decisions (2a eldono). John Wiley & Sons. ISBN 0-471-90808-8.
Stigler, Stephen M. (1990). The History of Statistics: The Measurement of Uncertainty before 1900. Belknap Press/Harvard University Press. ISBN 0-674-40341-X.
Tijms, Henk (2004). Understanding Probability: Chance Rules in Everyday life. Cambridge University Press. ISBN 0-521-83329-9.
Volle, Michel (1984). Le métier de statisticien (2a eld.). Económica. ISBN 2-7178-0824-8. rete
Bernard Delmas, Statistique descriptive pour l’économie et la gestion, Presses Universitaires du Septentrion, 2009 (ISBN 978-2-7574-0074-6).
Olivier Martin, L'enquête et ses méthodes : l'analyse de données quantitatives, Paris, Armand Colin, 2005 puis 2009.
Michel Volle, Histoire de la statistique industrielle, Economica, 1982, ISBN 2-7178-0520-6, rete.
Georges Hostelet, Le concours de l’analyse mathématique à l’analyse expérimentale des faits statistiques, Paris, Hermann, Actualités Scientifiques et Industrielles, no 585), 1937, 70 pp.
T.H. kaj R.J. Wonnacott, Statistique, éd. Economica, 1995 (4e éd.), 922 p., ISBN 2-7178-2072-8
Gilbert Saporta, Probabilités, Analyse des données et Statistiques, Paris, Éditions Technip, 2006, 622 p. (ISBN 978-2-7108-0814-5, rete)
Mathieu Rouaud, Probabilités, statistiques et analyses multicritères Un livre de 182 pages pour s'initier à la statistique.
Nicolas Gauvrit, Statistiques : Méfiez-vous !, Ed. Ellipses (Paris), 2007, ISBN 978-2-7298-3070-0
Stéphanie Dupays, "Déchiffrer les statistiques économiques et sociales" Ed. Dunod, 2008, ISBN 2-10-051584-5
Alain Desrosières, La politique des grands nombres : histoire de la raison statistique, Paris, La Découverte, 2000 (ISBN 978-2-7071-6504-6) (2004). La política de los grandes números. Ed. Melusina. ISBN 84-933273-5-2.
Anders Hald, A History of Mathematical Statistics, New-York, Wiley, 1998 (ISBN 0-471-17912-4)
David Salsburg, The Lady Tasting Tea : How statistics revolutionized science in the twentieth century, Holt McDougal, mai 2002, 1e éd. (ISBN 978-0-8050-7134-4)