En population, der består af et konstant antal af N individer, vil under modellen deles op i tre grupper: de modtagelige, S (susceptible), de syge (I for inficerede), og de fjernede, R, dvs. immune og/eller døde (R for removed). Det antages i SIR-modellen, at individer i populationen i tilfælde af smitte vil overgå fra den ene gruppe til den anden til den tredje, således at de til start er susceptible, hvorefter de er inficerede, hvorefter de overgår til den fjernede gruppe.
Dette sygdomsforløb er en grov forsimpling, idet der ikke tages højde for bl.a. latenstid, der er en periode imellem den raske og den infektiøse, hvor et individ er inficeret, men ikke smittende, og der tages heller ikke forbehold for, at personer i den fjernede gruppe kan overgå til den modtagelige igen (eksempelvis ved at immuniteten fortager sig). Det er umuligt at tage højde for alle variable der har kan have indflydelse i den virkelige verden. Det ændre dog ikke ved at denne model er en af de bedste til at modellere hvordan sygdomme spreder sig over tid i en befolkning. Desuden antager modellen også, at populationen er konstant, hvilket under længerevarende epidemier kan skabe en usikkerhed, der skyldes befolkningstilvækst, indvandring osv (men de har også en relativ lille betydning). Hvis det vurderes, at disse usikkerhedsfaktorer er insignifikante, kan man med forbehold anvende SIR-modellen til en epidemiologisk undersøgelse af en epidemi.
Disse differentialligninger beskriver overførslen af individer fra det første kompartment til det andet til det tredje, hvor S(t) beskriver antallet af susceptible, I(t) antallet af infektiøse og R(t) antallet af fjernede (jf. forklaringen ovenfor).
En heuristisk forklaring for første ligning er, at en susceptile, hvoraf der er S(t), i et lille tidsinterval har en chance på I(t)/N for at møde en inficeret, raten for infektion er i det korte tidsinterval lig risikoen for infektion ved kontakt givet ved koefficienten beta. Tredje ligning følger per definition af gamma koefficienten, der beskriver raten, hvormed en syg forlader populationen. Anden ligning er en sammenstilling af første og tredje ligning, idet disse beskriver tilstrømning og afvandring.
Endvidere har vi, eftersom modellen antager, at populationen er konstant, at den samlede population N er givet ved:
Typisk, så vil fordi der endnu ikke er nogen, der er påvirket af epidemien. Endvidere vil , dvs den indledende smitte vil være meget lille. Dermed vil .
Egenskaber
Den samlede population er konstant (og er således en bevaret størrelse), idet
.
Der findes endnu en bevaret størrelse, som findes på følgende måde [3]:
I ligning 3 isoleres I(t) og dette indsættes i ligning 1. Det giver
.
Ved at dividere med S(t) får vi:
.
Venstresiden kan skrives som . Hermed kan vi integere på begge sider:
.
Nu benytter vi, at R(0)=0, og resultatet kan dermed skrives som:
Estimation af parametre
For at kunne bruge modellen kræves kendskab til parametrene , og ,
samt begyndelsesværdien .
Estimering af
I det følgende antages det, at er kendt. Lader vi i ligning 5 så får vi
Vi lader nu også i ligning 4, og det giver:
.
Efter lang tid er alle de syge enten døde eller raske, og derfor er . Det giver:
.
Fra før havde vi, at , og dermed kan vi skrive ligning 6 som:
Vi indfører nu overlevelsen , så bliver ovenstående ligning reduceret til:
Denne ligning giver altså en relation mellem de to ukendte parametre og , ud fra kendskab til den samlede overlevelse af epidemien. Det kan vises, at denne brøk er det samme som det basale reproduktionstal.[4]
Det er vigtigt at huske, at når der skrives overlevelse i denne udledning refererer det til brøkdelen af individer i gruppen af modtagelige (S) efter uendelig lang tid. I praksis vil en stor del af individerne i gruppen R også overleve med mindre sygdommen har 100% dødelighed. Dermed vil brøkdelen af individer som overlever epidemien være større end p med en faktor som afhænger af sandsynligheden for at et inficeret individ som går fra gruppen I til gruppen R enten dør eller overlever og er immun.
Estimering af
Det forudsættes, at er kendt, og specielt også, at de ugentlige dødstal er kendt. Vi betragter nu det tidspunkt , hvor dødstallet har sit maksimum. Dette sker (ifølge ligning 3) netop når har et maksimum. Ifølge ligning 2 så har et maksimum, når højresiden er lig med 0, dvs.
Ved at dividere med så får vi:
Indsættes nu i ligning 5, så får vi:
,
idet vi også har sat . Ligeledes giver ligning 4, at
.
I den sidste ligning isoleres og det indsættes i den forrige ligning:
Heri indsætter vi det fundne udtryk for :
Ud fra denne ligning kan bestemmes til:
Den maksimale værdi af antages kendt og kaldes for . Indsættes i ligning 3 får vi så:
og dermed, at
.
Ud fra ovenstående er det således muligt at estimere ud fra kendskab til det maksimale dødstal og den samlede overlevelse .
Eksempel på estimation af parametre ud fra data
Betragt følgende fiktive data. En population på 10000 personer oplever en epidemi. For hver uge er dødstallet opgjort til:
uge
1
2
3
4
5
6
7
8
9
dødstal
86
291
813
1462
1388
776
331
128
47
Først summerer vi alle de døde, det giver 5322 i alt. Resten må være overlevet, dvs. 4678 personer. Det giver en overlevelse . Herfra udregner vi brøken:
Dernæst udregner vi det maksimalt antal smittede:
Til sidst aflæser vi det største dødstal, det giver , og finder heraf:
samt
Hermed har vi fundet et estimat på modellens parametre.
Estimation ved hjælp af regression
En alternativ måde at estimere parametrene på går ud på at bruge regression [5].
Ud fra ligning 2 kan man isolere på højresiden:
Når er lille, så er næsten konstant. Så i begyndelsen af epidemien vil differentialligningen for approksimeres med:
fordi
Tilsvarende, når epidemien er næsten slut, så vil samme differentialligning kunne approksimeres med:
I begge tilfælde er der tale om en ekspontiel sammenhæng, og vi har derfor følgende egenskaber for :
,
hvor og er ukendte konstanter. Konstanterne og opfylder:
Værdierne of og kan bestemmes ved eksponentiel regression af dødstallene , og dermed kan man bestemme og :
Eksempel med regression
Ved at lave eksponentiel regression på henholdsvis de første tre uger, og de sidste tre uger, så finder vi:
Heraf beregner man
Referencer
^Kermack WO, McKendrick AG (August 1, 1927). "A Contribution to the Mathematical Theory of Epidemics". Proceedings of the Royal Society A 115 (772): 700–721. doi:10.1098/rspa.1927.0118.
^Allan Baktoft "Matematik i virkeligheden. Bind 1", Forlaget Natskyggen, 2. udgave, 2011, s. 47-60 (s. 45-70 behandles desuden andre epidemimodeller)