Studentova t Funkcija gustine verovatnoće
Funkcija kumulativne raspodele
Parametri
ν ν -->
>
0
{\displaystyle \nu >0}
stepeni slobode (realnih )Nositelj
x
∈ ∈ -->
(
− − -->
∞ ∞ -->
,
∞ ∞ -->
)
{\displaystyle x\in (-\infty ,\infty )}
PDF
Γ Γ -->
(
ν ν -->
+
1
2
)
ν ν -->
π π -->
Γ Γ -->
(
ν ν -->
2
)
(
1
+
x
2
ν ν -->
)
− − -->
ν ν -->
+
1
2
{\displaystyle \textstyle {\frac {\Gamma \left({\frac {\nu +1}{2}}\right)}{{\sqrt {\nu \pi }}\,\Gamma \left({\frac {\nu }{2}}\right)}}\left(1+{\frac {x^{2}}{\nu }}\right)^{-{\frac {\nu +1}{2}}}\!}
CDF
1
2
+
x
Γ Γ -->
(
ν ν -->
+
1
2
)
× × -->
2
F
1
(
1
2
,
ν ν -->
+
1
2
;
3
2
;
− − -->
x
2
ν ν -->
)
π π -->
ν ν -->
Γ Γ -->
(
ν ν -->
2
)
{\displaystyle {\begin{matrix}{\frac {1}{2}}+x\Gamma \left({\frac {\nu +1}{2}}\right)\times \\[0.5em]{\frac {\,_{2}F_{1}\left({\frac {1}{2}},{\frac {\nu +1}{2}};{\frac {3}{2}};-{\frac {x^{2}}{\nu }}\right)}{{\sqrt {\pi \nu }}\,\Gamma \left({\frac {\nu }{2}}\right)}}\end{matrix}}}
gde je 2 F 1 hipergeometrijska funkcija Prosek 0 za
ν ν -->
>
1
{\displaystyle \nu >1}
, inače nedefinisana Medijana 0 Modus 0 Varijansa
ν ν -->
ν ν -->
− − -->
2
{\displaystyle \textstyle {\frac {\nu }{\nu -2}}}
za
ν ν -->
>
2
{\displaystyle \nu >2}
, ∞ za
1
<
ν ν -->
≤ ≤ -->
2
{\displaystyle 1<\nu \leq 2}
, inače nedefinisana Koef. asimetrije 0 za
ν ν -->
>
3
{\displaystyle \nu >3}
, inače nedefinisana Kurtoza
6
ν ν -->
− − -->
4
{\displaystyle \textstyle {\frac {6}{\nu -4}}}
za
ν ν -->
>
4
{\displaystyle \nu >4}
, ∞ za
2
<
ν ν -->
≤ ≤ -->
4
{\displaystyle 2<\nu \leq 4}
, inače nedefinisana Entropija
ν ν -->
+
1
2
[
ψ ψ -->
(
1
+
ν ν -->
2
)
− − -->
ψ ψ -->
(
ν ν -->
2
)
]
+
ln
-->
[
ν ν -->
B
(
ν ν -->
2
,
1
2
)
]
(nats)
{\displaystyle {\begin{matrix}{\frac {\nu +1}{2}}\left[\psi \left({\frac {1+\nu }{2}}\right)-\psi \left({\frac {\nu }{2}}\right)\right]\\[0.5em]+\ln {\left[{\sqrt {\nu }}B\left({\frac {\nu }{2}},{\frac {1}{2}}\right)\right]}\,{\scriptstyle {\text{(nats)}}}\end{matrix}}}
MGF nedefinisano CF
K
ν ν -->
/
2
(
ν ν -->
|
t
|
)
⋅ ⋅ -->
(
ν ν -->
|
t
|
)
ν ν -->
/
2
Γ Γ -->
(
ν ν -->
/
2
)
2
ν ν -->
/
2
− − -->
1
{\displaystyle \textstyle {\frac {K_{\nu /2}\left({\sqrt {\nu }}|t|\right)\cdot \left({\sqrt {\nu }}|t|\right)^{\nu /2}}{\Gamma (\nu /2)2^{\nu /2-1}}}}
za
ν ν -->
>
0
{\displaystyle \nu >0}
U verovatnoći i statistici , Studentova t -raspodela (ili jednostavno t -raspodela ) je bilo koji član familije kontinuarnih raspodela verovatnoće koje nastaju iz procenjivanja srednje vrednosti normalne raspodele populacije u situacijama gde je veličina uzorka mala i populaciona standardna devijacija nije poznata. Ovu raspodelu je razvio Vilijam Goset pod pseudonimom Student .
t -Raspodela igra ulogu u velikom broju široko korištenih statističkih analiza, uključujući Studentov t -test za procenu statističke važnosti razlike između dve srednje vrednosti uzorka, izgradnju intervala pouzdanosti za razliku između dve populacijske sredine, i u linearnoj regresionoj analizi . Studentova t -distribucija se takođe pojavljuje u Bajesovoj analizi podataka iz normalne porodice.
Ako se uzme uzorak sa n opažanja iz normalne raspodele , onda se t -raspodela sa
ν ν -->
=
n
− − -->
1
{\displaystyle \nu =n-1}
stepeni slobode može definisati kao raspodela lokacija srednje vrednosti uzorka u odnosu na pravu sredinu, podeljena sa standardnom devijacijom uzorka, nakon što se pomnoži sa standardizacionim članom
n
{\displaystyle {\sqrt {n}}}
. Na taj se način, t -raspodela se može koristiti za izgradnju intervala pouzdanosti za pravu sredinu.
t -Raspodela je simetrična i zvonastog oblika, poput normalne raspodele , ali ima teže repove, što znači da je sklonija stvaranju vrednosti koje padaju daleko od srednje vrednosti. Ovo je korisno za razumevanje statističkog ponašanja određenih vrsta odnosa slučajnih veličina, u kojima je varijacija u deliocu pojačana i može da proizvede udaljene vrednosti kada brojilac odnosa padne blizu nule. Studentova t-raspodela je poseban slučaj generalizovane hiperbolične raspodele .
Istorija i etimologija
Statističar Wilijam Sili Goset, poznat kao „Student”
U statistici, t -raspodelu su prvi izveli kao posteriornu raspodelu Helmert [ 2] [ 3] [ 4] i Lirot 1876. godine.[ 5] [ 6] [ 7] t -Raspodela se isto tako pojavila u opštijoj formi kao Pirsonova raspodela tipa IV u publikaciji Karla Pirsona iz 1895. godine.
U litiraturi na engleskom jeziku ova raspodela nosi ime iz publikacije Vilijama Goseta iz 1908. godine u časopisu Biometrika objavljene pod pseudonimom „Student”.[ 8] Goset je radio u Ginisovoj pivari u Dablinu u Irskoj , i bio je zainteresovan za probleme malih uzoraka – na primer, hemijskih svojstva ječma gde veličina uzorka može da bude samo 3. Jedna verzija porekla pseudonima je da je Gosetov poslodavac preferirao da zaposleni koriste književne pseudonime kad objavljuju naučne radove umesto svojih stvarnih imena, tako da je on koristio ime „Student” da bi prikrio svoj identitet. Druga verzija je da Ginis nije želeo da njegovi konkurenti znaju da oni koriste t -test za određivanje kvaliteta sirovina.[ 9] [ 10]
Gosetova publikacija naziva ovu raspodelu „frekvencija distribucije standardnih devijacija uzoraka uzetih iz normalne populacije”. Ona je postala dobro poznata zahvaljujući radu Ronalda Fišera , koji je nazivao ovu raspodelu „Studentova raspodela” i predstavljao testne vrednosti slovom t .[ 11] [ 12]
Nastanak Studentove raspodele iz uzorkovanja
Neka je
X
1
,
… … -->
,
X
n
{\textstyle X_{1},\ldots ,X_{n}}
nezavisno i identično raspodeljeni kao
N
(
μ μ -->
,
σ σ -->
2
)
{\displaystyle N(\mu ,\sigma ^{2})}
, i.e. ovo je uzorak veličine
n
{\displaystyle n}
iz normalno raspodeljene populacije sa očekivanom srednjom vrednošću
μ μ -->
{\displaystyle \mu }
i varijansom
σ σ -->
2
{\displaystyle \sigma ^{2}}
.
Neka je
X
¯ ¯ -->
=
1
n
∑ ∑ -->
i
=
1
n
X
i
{\displaystyle {\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}}
srednja vrednosti uzorka i neka je
S
2
=
1
n
− − -->
1
∑ ∑ -->
i
=
1
n
(
X
i
− − -->
X
¯ ¯ -->
)
2
{\displaystyle S^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}(X_{i}-{\bar {X}})^{2}}
(korigovana po Beselu ) varijansa uzorka. Onda randomna promenljiva
X
¯ ¯ -->
− − -->
μ μ -->
σ σ -->
/
n
{\displaystyle {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}}
ima standardnu normalnu raspodelu (i.e. normalnu sa očekivanom vrednosti 0 i varijansom 1), i randomna promenjiva
X
¯ ¯ -->
− − -->
μ μ -->
S
/
n
,
{\displaystyle {\frac {{\bar {X}}-\mu }{S/{\sqrt {n}}}},}
gde je
S
{\displaystyle S}
supstituisano za
σ σ -->
{\displaystyle \sigma }
, ima Studentovu t -raspodelu sa
n
− − -->
1
{\displaystyle n-1}
stepeni slobode. Brojilac i delilac u prethodnom izrazu su nezavisne randmne promenljive uprkos toga što se zasnivaju na istom uzorku
X
1
,
… … -->
,
X
n
{\textstyle X_{1},\ldots ,X_{n}}
.
Definicija
Funkcija gustine verovatnoće
Studentova t -raspodela ima funkciju raspodele datu sa
f
(
t
)
=
Γ Γ -->
(
ν ν -->
+
1
2
)
ν ν -->
π π -->
Γ Γ -->
(
ν ν -->
2
)
(
1
+
t
2
ν ν -->
)
− − -->
ν ν -->
+
1
2
,
{\displaystyle f(t)={\frac {\Gamma ({\frac {\nu +1}{2}})}{{\sqrt {\nu \pi }}\,\Gamma ({\frac {\nu }{2}})}}\left(1+{\frac {t^{2}}{\nu }}\right)^{\!-{\frac {\nu +1}{2}}},\!}
gde je
ν ν -->
{\displaystyle \nu }
broj stepeni slobode i
Γ Γ -->
{\displaystyle \Gamma }
je gama funkcija . Ovo se isto tako može napisati kao
f
(
t
)
=
1
ν ν -->
B
(
1
2
,
ν ν -->
2
)
(
1
+
t
2
ν ν -->
)
− − -->
ν ν -->
+
1
2
,
{\displaystyle f(t)={\frac {1}{{\sqrt {\nu }}\,\mathrm {B} ({\frac {1}{2}},{\frac {\nu }{2}})}}\left(1+{\frac {t^{2}}{\nu }}\right)^{\!-{\frac {\nu +1}{2}}}\!,}
gde je B Beta funkcija . Za celobrojne vrednosti stepena slobode
ν ν -->
{\displaystyle \nu }
važi:
Za
ν ν -->
>
1
{\displaystyle \nu >1}
parno,
Γ Γ -->
(
ν ν -->
+
1
2
)
ν ν -->
π π -->
Γ Γ -->
(
ν ν -->
2
)
=
(
ν ν -->
− − -->
1
)
(
ν ν -->
− − -->
3
)
⋯ ⋯ -->
5
⋅ ⋅ -->
3
2
ν ν -->
(
ν ν -->
− − -->
2
)
(
ν ν -->
− − -->
4
)
⋯ ⋯ -->
4
⋅ ⋅ -->
2
⋅ ⋅ -->
{\displaystyle {\frac {\Gamma ({\frac {\nu +1}{2}})}{{\sqrt {\nu \pi }}\,\Gamma ({\frac {\nu }{2}})}}={\frac {(\nu -1)(\nu -3)\cdots 5\cdot 3}{2{\sqrt {\nu }}(\nu -2)(\nu -4)\cdots 4\cdot 2\,}}\cdot }
Za
ν ν -->
>
1
{\displaystyle \nu >1}
neparno,
Γ Γ -->
(
ν ν -->
+
1
2
)
ν ν -->
π π -->
Γ Γ -->
(
ν ν -->
2
)
=
(
ν ν -->
− − -->
1
)
(
ν ν -->
− − -->
3
)
⋯ ⋯ -->
4
⋅ ⋅ -->
2
π π -->
ν ν -->
(
ν ν -->
− − -->
2
)
(
ν ν -->
− − -->
4
)
⋯ ⋯ -->
5
⋅ ⋅ -->
3
⋅ ⋅ -->
{\displaystyle {\frac {\Gamma ({\frac {\nu +1}{2}})}{{\sqrt {\nu \pi }}\,\Gamma ({\frac {\nu }{2}})}}={\frac {(\nu -1)(\nu -3)\cdots 4\cdot 2}{\pi {\sqrt {\nu }}(\nu -2)(\nu -4)\cdots 5\cdot 3\,}}\cdot \!}
Funkcija gustine verovatnoće je simetrična , i njen sveukupni oblik podseća na zvonasti oblik promenljive sa normalnom raspodelom sa srednjom vrednosti od 0 i varijansom od 1, izuzev što je nešto niža i šira. Sa porastom broja stepeni slobode, t -raspodela prilazi normalnoj raspodeli sa srednjom vrednosti 0 i varijansom 1. Iz tog razloga
ν ν -->
{\displaystyle {\nu }}
je isto tako poznato kao parametar normalnosti.[ 13]
Sledeće slike prikazuju gustinu t -raspodele za povećane vrednosti od
ν ν -->
{\displaystyle \nu }
. Normalna raspodela je prikazana plavom linijom radi poređenja. Treba uočiti da t -raspodela (crvena linija) postaje bliža normalnoj raspodeli sa povećanjem
ν ν -->
{\displaystyle \nu }
.
Gustina t -raspodele (crveno) za 1, 2, 3, 5, 10, i 30 stepeni slobode u poređenju sa standardnom normalnom distribucijom (plavo). Prethodni grafikoni su prikazani zeleno.
1 stepen slobode
2 stepena slobode
3 stepena slobode
5 stepeni slobode
10 stepeni slobode
30 stepeni slobode
Funkcija kumulativne raspodele
Funkcija kumulativne raspodele se može napisati u smislu I , regulisane nekompletne beta funkcija . Za t > 0,[ 14] [ 15]
F
(
t
)
=
∫ ∫ -->
− − -->
∞ ∞ -->
t
f
(
u
)
d
u
=
1
− − -->
1
2
I
x
(
t
)
(
ν ν -->
2
,
1
2
)
,
{\displaystyle F(t)=\int _{-\infty }^{t}f(u)\,du=1-{\tfrac {1}{2}}I_{x(t)}\left({\tfrac {\nu }{2}},{\tfrac {1}{2}}\right),}
gde je
x
(
t
)
=
ν ν -->
t
2
+
ν ν -->
.
{\displaystyle x(t)={\frac {\nu }{t^{2}+\nu }}.}
Druge vrednosti se mogu dobiti simetrijom. Jedna alternativna formula, validna za
t
2
<
ν ν -->
{\displaystyle t^{2}<\nu }
, je[ 14]
∫ ∫ -->
− − -->
∞ ∞ -->
t
f
(
u
)
d
u
=
1
2
+
t
Γ Γ -->
(
1
2
(
ν ν -->
+
1
)
)
π π -->
ν ν -->
Γ Γ -->
(
ν ν -->
2
)
2
F
1
(
1
2
,
1
2
(
ν ν -->
+
1
)
;
3
2
;
− − -->
t
2
ν ν -->
)
,
{\displaystyle \int _{-\infty }^{t}f(u)\,du={\tfrac {1}{2}}+t{\frac {\Gamma \left({\tfrac {1}{2}}(\nu +1)\right)}{{\sqrt {\pi \nu }}\,\Gamma \left({\tfrac {\nu }{2}}\right)}}\,{}_{2}F_{1}\left({\tfrac {1}{2}},{\tfrac {1}{2}}(\nu +1);{\tfrac {3}{2}};-{\tfrac {t^{2}}{\nu }}\right),}
gde je 2 F 1 poseban slučaj hipergeometrijske funkcije .
Za informacije o njenoj inverznoj funkciji kumulativne distribucije, pogledajte kvantilna funkcija § Studentova t-distribucija .
Specijalni slučajevi
Određene vrednosti
ν ν -->
{\displaystyle \nu }
daju posebno jednostavnu formu.
ν ν -->
=
1
{\displaystyle \nu =1}
Funkcija raspodele:
F
(
t
)
=
1
2
+
1
π π -->
arctan
-->
(
t
)
.
{\displaystyle F(t)={\tfrac {1}{2}}+{\tfrac {1}{\pi }}\arctan(t).}
Funkcija gustine:
f
(
t
)
=
1
π π -->
(
1
+
t
2
)
.
{\displaystyle f(t)={\frac {1}{\pi (1+t^{2})}}.}
Pogledajte Košijevu raspodelu
ν ν -->
=
2
{\displaystyle \nu =2}
Funkcija raspodele:
F
(
t
)
=
1
2
+
t
2
2
1
+
t
2
2
.
{\displaystyle F(t)={\tfrac {1}{2}}+{\frac {t}{2{\sqrt {2}}{\sqrt {1+{\frac {t^{2}}{2}}}}}}.}
Funkcija gustine:
f
(
t
)
=
1
2
2
(
1
+
t
2
2
)
3
2
.
{\displaystyle f(t)={\frac {1}{2{\sqrt {2}}\left(1+{\frac {t^{2}}{2}}\right)^{\frac {3}{2}}}}.}
ν ν -->
=
3
{\displaystyle \nu =3}
Funkcija raspodele:
F
(
t
)
=
1
2
+
1
π π -->
[
1
3
t
1
+
t
2
3
+
arctan
-->
(
t
3
)
]
.
{\displaystyle F(t)={\tfrac {1}{2}}+{\tfrac {1}{\pi }}{[{\frac {1}{\sqrt {3}}}{\frac {t}{1+{\frac {t^{2}}{3}}}}+\arctan({\frac {t}{\sqrt {3}}})]}.}
Funkcija gustine:
f
(
t
)
=
2
π π -->
3
(
1
+
t
2
3
)
2
.
{\displaystyle f(t)={\frac {2}{\pi {\sqrt {3}}\left(1+{\frac {t^{2}}{3}}\right)^{2}}}.}
ν ν -->
=
4
{\displaystyle \nu =4}
Funkcija raspodele:
F
(
t
)
=
1
2
+
3
8
t
1
+
t
2
4
[
1
− − -->
1
12
t
2
1
+
t
2
4
]
.
{\displaystyle F(t)={\tfrac {1}{2}}+{\frac {3}{8}}{\frac {t}{\sqrt {1+{\frac {t^{2}}{4}}}}}{[1-{\frac {1}{12}}{\frac {t^{2}}{1+{\frac {t^{2}}{4}}}}]}.}
Funkcija gustine:
f
(
t
)
=
3
8
(
1
+
t
2
4
)
5
2
.
{\displaystyle f(t)={\frac {3}{8\left(1+{\frac {t^{2}}{4}}\right)^{\frac {5}{2}}}}.}
ν ν -->
=
5
{\displaystyle \nu =5}
Funkcija raspodele:
F
(
t
)
=
1
2
+
1
π π -->
[
t
5
(
1
+
t
2
5
)
(
1
+
2
3
(
1
+
t
2
5
)
)
+
arctan
-->
(
t
5
)
]
.
{\displaystyle F(t)={\tfrac {1}{2}}+{\frac {1}{\pi }}{[{\frac {t}{{\sqrt {5}}\left(1+{\frac {t^{2}}{5}}\right)}}(1+{\frac {2}{3\left(1+{\frac {t^{2}}{5}}\right)}})+\arctan({\frac {t}{\sqrt {5}}})]}.}
Funkcija gustine:
f
(
t
)
=
8
3
π π -->
5
(
1
+
t
2
5
)
3
.
{\displaystyle f(t)={\frac {8}{3\pi {\sqrt {5}}\left(1+{\frac {t^{2}}{5}}\right)^{3}}}.}
ν ν -->
=
∞ ∞ -->
{\displaystyle \nu =\infty }
Funkcija raspodele:
F
(
t
)
=
1
2
[
1
+
erf
-->
(
t
2
)
]
.
{\displaystyle F(t)={\tfrac {1}{2}}{[1+\operatorname {erf} ({\frac {t}{\sqrt {2}}})]}.}
Pogledajte funkciju greške
Funkcija gustine:
f
(
t
)
=
1
2
π π -->
e
− − -->
t
2
2
.
{\displaystyle f(t)={\frac {1}{\sqrt {2\pi }}}e^{-{\frac {t^{2}}{2}}}.}
Pogledajte normalnu raspodelu .
Reference
^ Hurst, Simon. The Characteristic Function of the Student-t Distribution , Financial Mathematics Research Report No. FMRR006-95, Statistics Research Report No. SRR044-95 Архивирано 2010-02-18 на сајту Wayback Machine
^ Helmert FR (1875). „Über die Berechnung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler”. Z. Math. U. Physik . 20 : 300—3.
^ Helmert FR (1876). „Über die Wahrscheinlichkeit der Potenzsummen der Beobachtungsfehler und uber einige damit in Zusammenhang stehende Fragen”. Z. Math. Phys . 21 : 192—218.
^ Helmert FR (1876). „Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit”. Astron. Nachr. 88 (8–9): 113—32. Bibcode :1876AN.....88..113H . doi :10.1002/asna.18760880802 .
^ Lüroth J (1876). „Vergleichung von zwei Werten des wahrscheinlichen Fehlers” . Astron. Nachr. 87 (14): 209—20. Bibcode :1876AN.....87..209L . doi :10.1002/asna.18760871402 .
^ Pfanzagl J, Sheynin O (1996). „Studies in the history of probability and statistics. XLIV. A forerunner of the t-distribution.” . Biometrika . 83 (4): 891—898. MR 1766040 . doi :10.1093/biomet/83.4.891 .
^ Sheynin O (1995). „Helmert's work in the theory of errors”. Arch. Hist. Exact Sci. 49 (1): 73—104. doi :10.1007/BF00374700 .
^ "Student" [William Sealy Gosset ] (1908). „The probable error of a mean” (PDF) . Biometrika . 6 (1): 1—25. JSTOR 2331554 . doi :10.1093/biomet/6.1.1 .
^ Wendl MC (2016). „Pseudonymous fame”. Science . 351 (6280): 1406. doi :10.1126/science.351.6280.1406 .
^ Mortimer RG (2005). Mathematics for physical chemistry (3rd изд.). Burlington, MA: Elsevier. стр. 326 . ISBN 9780080492889 . OCLC 156200058 .
^ Fisher RA (1925). „Applications of "Student's" distribution” (PDF) . Metron . 5 : 90—104. Архивирано из оригинала (PDF) 5. 3. 2016. г.
^ Walpole RE, Myers R, Myers S, et al. (2006). Probability & Statistics for Engineers & Scientists (7th изд.). New Delhi: Pearson. стр. 237. ISBN 9788177584042 . OCLC 818811849 .
^ Kruschke JK (2015). Doing Bayesian Data Analysis (2nd изд.). Academic Press. ISBN 9780124058880 . OCLC 959632184 .
^ а б Johnson NL, Kotz S, Balakrishnan N (1995). „Chapter 28”. Continuous Univariate Distributions . 2 (2nd изд.). Wiley. ISBN 9780471584940 .
^ Hogg RV , Craig AT (1978). Introduction to Mathematical Statistics (4th изд.). New York: Macmillan. ASIN B010WFO0SA . Sections 4.4 and 4.8
Literatura
Spoljašnje veze