Sannolikhetsfördelning

Normalfördelningen är en mycket vanligt förekommande sannolikhetsfördelning i statistiska modeller

Sannolikhetsfördelning är inom sannolikhetsteori, statistik och matematisk statistik, en beskrivning (ofta i form av en funktion) av sannolikheterna för utfallen i ett utfallsrum.

Sannolikhetsfördelningar, ibland bara "fördelningar", förekommer i både diskreta och kontinuerliga utfallsrum och kallas därför ibland diskret fördelning eller kontinuerlig fördelning, för att ange typen av utfallsrum.

Exempelvis är en likformig fördelning en fördelning där alla utfall är lika sannolika, vilket är fallet till exempel vid en dragning av ett nummer i en lottorad: där är alla utfall i det diskreta utfallsrummet [1, 2, 3, ... 34, 35] lika sannolika med sannolikheten 1/35.

Matematisk beskrivning

En sannolikhetsfördelning tilldelar varje intervall tillhörande de reella talen en sannolikhet sådan att sannolikhetsaxiomen är uppfyllda. I tekniska termer är en sannolikhetsfördelning en sannolikhetsrum vars underliggande σ-algebra är Borel-algebran på de reella talen.

Varje slumpvariabel ger upphov till en sannolikhetsfördelning, och denna fördelning innehåller den viktigaste informationen om variabeln. Om X är en slumpvariabel så tilldelar motsvarande sannolikhetsfördelning intervallet [a, b] sannolikheten P(aXb), d.v.s. sannolikheten att variabeln X kommer att anta ett värde i intervallet [a, b].

Sannolikhetsfördelningen för variabeln X kan beskrivas unikt genom sin kumulativa fördelningsfunktion F(x), vilken definieras som

för varje x i R.

En fördelning kallas diskret om dess kumulativa fördelningsfunktion består av en sekvens av ändliga steg (hopp), vilket innebär att den tillhör en diskret slumpvariabel X: en variabel som endast kan anta värden från en ändlig eller uppräknelig mängd. En fördelning kallas kontinuerlig om dess kumulativa fördelningsfunktion är kontinuerlig, vilket innebär att den tillhör en kontinuerlig slumpvariabel X för vilken det gäller att P( X = x ) = 0 för alla x i R.

De så kallade absolut kontinuerliga sannolikhetsfördelningarna kan beskrivas med en täthetsfunktion (ibland frekvensfunktion): en icke-negativ integrerbar funktion f definierad på de reella talen så att

för alla x i R. Diskreta fördelningar tillåter inte en sådan täthetsfunktion, men det finns kontinuerliga fördelningar som djävulens trappa som inte heller tillåter en täthetsfunktion.

Två viktiga karakteristika för en sannolikhetsfördelning är fördelningens väntevärde och dess varians.

Stödet för en fördelning är den minsta slutna mängd vars komplement har sannolikheten noll.

Flera sannolikhetsfördelningar är så viktiga att de har fått särskilda namn. Några av dessa redovisas nedan.

Diskreta fördelningar

  • Med ändligt stöd
    • Den degenererade fördelningenx0, där X antar värdet x0. Detta ser inte slumpmässigt ut, men det uppfyller definitionen för en slumpvariabel. Detta är användbart, eftersom det sätter deterministiska variabler och slumpvariabler i samma formalism. Den kallas också för enpunktsfördelningen.
    • Tvåpunktsfördelningen där det bara finns två utfall.
    • Den diskreta likformiga sannolikhetsfördelningen, där alla utfall i ett ändligt utfallsrum är lika sannolika.
    • Bernoullifördelningen, ett specialfall av tvåpunktsfördelningen, som antar värdet 1 med sannolikheten p och värdet 0 med sannolikheten q=1-p.
    • Binomialfördelningen, vilken beskriver antalet lyckade försök i en serie av oberoende ja/nej-försök.
    • Multinomialfördelningen, vilken beskriver antalet lyckade försök i en serie av oberoende försök med flera möjliga utfall.
    • Hypergeometriska fördelningen, som anger sannolikheten för att få k antal träffar när man drar utan återläggning m element ur en population med given andel element med en viss egenskap.
  • Med oändligt stöd

Kontinuerliga fördelningar

  • Med stöd på ett ändligt intervall
    • Den kontinuerliga likformiga sannolikhetsfördelningen eller rektangulärfördelningen på [a,b], där alla värden i ett ändligt intervall är lika sannolika.
    • Betafördelningen på [0,1], av vilken rektangulärfördelningen är ett specialfall, och som är användbar för att skatta sannolikheten för lyckade försök.
  • Med stöd på halvoändliga intervall, vanligen [0,∞)
    • Exponentialfördelningen, som beskriver tiden mellan slumpmässiga oberoende händelser.
    • Gammafördelningen, vilken beskriver tiden till dess att n sällsynta slumpmässiga händelser inträffar.
    • Extremvärdesfördelningen, beskriver variabler vilkas sällsynta extremvärden är av intresse; exempel: högsta vattenståndet i Themsenmynningen, hållfastheten hos en kedjas svagaste länk.
    • Lognormalfördelningen, beskriver variabler som kan modelleras som produkten av många små oberoende positiva variabler.
    • Weibullfördelningen, använd bland annat till att modellera livstiden för tekniska anordningar. Har en parameter som kan modellera olika grader av skevhet hos fördelningen: vänster, symmetrisk, höger.
    • Chitvåfördelningen, χ2-fördelning, vilket kvadratsumman av n oberoende normalfördelade slumpvariabler. Det är ett specialfall av gammafördelningen, och används mycket vid statistiska fördelningstest.
  • Med stöd på hela den reella tallinjen
    • Normalfördelningen, också kallad gaussisk fördelning eller klockkurva. Den är allmänt förekommande i naturen och statistiken genom centrala gränsvärdessatsen (CGS): alla variabler som kan modelleras som summan av många små oberoende variabler är approximativt normalfördelade.
    • Students t-fördelning, användbar till att skatta okända medelvärden och konfidenser för små stickprov ur normalfördelningspopulationer. Vid små stickprov är nämligen stickprovets standardavvikelse en dålig skattning av populationens standardavvikelse.
    • Cauchyfördelningen, ett exempel på en fördelning som inte har något väntevärde eller varians. Inom fysiken kallas den vanligen Lorentzfördelning och är till exempel fördelningen för ett instabilt tillstånd inom kvantmekaniken.

Måtteoretisk definition

Det finns också en definition för sannolikhetsfördelning som använder Andrej Kolmogorovs axiomatiska måtteori.[1] Här är sannolikhetsfördelningen ett bildmått med avseende på en stokastisk variabel. Mer precist är en sannolikhetsfördelning för en stokastik variabel formellt ett sannolikhetsmått , definierat som:

,

för en Borelmängd . Formellt innebär detta att sannolikhetsfördelningen är bildmåttet .

En kumulativ fördelningsfunktion för X är -måttet för intervallet , dvs

för varje x i R eftersom .

Det finns också en abstrakt definition för en sannolikhetsfördelnings täthetsfunktion. Om sannolikhetsfördelningen för X är absolutkontinuerligt med avseende på Lebesguemåttet , dvs

om så är

Radon-Nikodyms sats säger att det finns en icke-negativ -funktion med egenskapen att

för alla Borelmängder A i R. Det här innebär att funktionen f är Radon-Nikodym derivata för med avseende på 1-dimensionella Lebesguemåttet, dvs

Funktionen f är en täthet för sannolikhetsfördelningen X. "Täthet" är ett resonligt namn eftersom för så är

dvs. den kumulativa fördelningsfunktionen för X.

Exempel

Låt vara en stokastik variabel så att den är normalfödelad med väntevärdet och variansen , det vill säga . Det här innebär att sannolikhetsfördelningen för X, det vill säga måttet , är

Här karakteriseras normalfördelningen av måttet , definierat som:

för alla Borelmängder A i R.

Måttet är absolutkontinuerligt med avseende på Lebesguemåttet. Så det finns en täthetsfunktion f för X. Definitionen ovan säger att f måste vara

för alla x i R

Se även

Referenser

Noter

  1. ^ Williams, David. Probability with martingales, Cambridge University Press, 1991.

Externa länkar