Teoria statului la coadă sau teoria așteptării este studiul matematic al liniilor de așteptare, sau cozi. Modelul unei așteptări (unui stat la coadă) este construit astfel încât lungimea cozii și timpul de așteptare pot fi prezise. Teoria așteptării este, în general, inclusă în cercetarea operațională, deoarece rezultatele sunt adesea folosite în luarea deciziilor de business în funcție de resursele necesare.
Teoria așteptării își are originea în cercetările lui Agner Krarup Erlang, atunci când a creat modele pentru a descrie schimbarea telefoanelor în Copenhaga. Ideile au avut multe aplicații, inclusiv în telecomunicații, ingineria traficului, de calcul[1]
și, în special în ingineria industrială, în proiectarea de fabrici, magazine, birouri și spitale, precum și în managementul proiectelor.[2][3]
Nodurile unei cozi cu un singur rând
Nodurile unei cozi cu un singur rând sunt de obicei descrise cu ajutorul notației lui Kendall în formă de O/S/C, în care O descrie timpul dintre sosirile la coadă, S dimensiunea deservirilor și C numărul de servere pe nod.[4][5] În teoria așteptării, multe teoreme pot fi demonstrate prin reducerea cozilor la sisteme matematice cunoscute sub numele de lanțuri Markov, descrise pentru prima dată de către Andrei Markov în 1906.[6]
Inginerul danez Agner Krarup Erlang și-a publicat prima sa lucrare despre ceea se numește acum teoria așteptării, în 1909.[7][8][9] El a modelat numărul de apeluri care sosesc la un schimb într-un proces Poisson și a rezolvat coada M/D/1 în 1917 și modelul M/D/k de așteptare la coadă în 1920.[10] În notația Kendall:
M este pentru Markov sau fără memorie (memoryless) și înseamnă incidența sosirilor potrivit unui proces Poisson
D este pentru deterministic și înseamnă locurile de muncă afectate unei cozi necesitând un număr de servicii
k descrie numărul de servere într-un nod al unei cozi (k = 1, 2,...). Dacă există mai multe locuri de muncă la un nodul decât există servere, atunci locurile de muncă sta la coadă și așteptând pentru servicii
Coada M/M/1 este un model simplu, în care un singur server servește locuri de muncă care sosesc potrivit unui proces Poisson și au cereri de servicii distribuite exponențial. Într-o coadă M/G/1, G înseamnă general și indică o distribuție de probabilitate arbitrară. Modelul M/G/1 a fost rezolvată de Felix Pollaczek în 1930,[11] o soluție mai târziu reformulată în termeni probabilistici de Aleksandr Khinchin și acum cunoscută sub numele de formula Pollaczek–Khinchine.
După 1940, teoria cozilor de așteptare a devenit un domeniu de cercetare de interes pentru matematicieni. În 1953, David George Kendall a rezolvat coada GI/M/k și a introdus o notație modernă pentru cozi, acum cunoscută sub numele de notația Kendall. În 1957 Pollaczek a studiat GI/G/1, folosind o ecuație integrală. John Kingman a dat o formula pentru timpul mediu de așteptare într-o coadă G/G/1: formula Kingman.
Metoda matricei geometrice și metoda matricei analitice au permis luarea în considerare a unor cozi cu intrasosire distribuită de tip fază și cu distribuții ale timpului de deservire.
Probleme precum ar fi măsurarea performanței pentru o coadă M/G/k rămâne o problemă deschisă.
Tipuri de disciplină la statul la coadă
Diferite politici de planificare pot fi folosite în nodurile de așteptare:
First in first out (Primul înăuntru primul afară)
Numit și primul-venit, primul-servit (first come, first served, FCFS),[12] acest principiu afirmă că sunt serviți clienții unul după altul și că acel client care a așteptat cel mai mult este servit primul (conform imaginii).[13]
Acest principiu, de asemenea, servește clienții unul după altul,, dar clientul cu cel mai scurt timp de așteptare va fi servit primul. Cunoscut și sub numele de stivă.
Partajarea procesorului
Capacitatea de deservire este împărțită în mod egal între clienți.
Prioritate
Clienții cu prioritate mare sunt serviți primii. Cozile cu priorități pot fi de două tipuri, non-preemptive (în cazul în care un loc de muncă în service nu poate fi întrerupt) și premptive (în care o deservire în curs poate fi întreruptă de o deservire cu o prioritate superioară). În niciunul dintre modele nu se pierde muncă.[14]
Shortest job first (cea mai scurtă deservire prima la rând)
Următoarea deservire este cea mai scurtă ca timp de desfășurare
Preemptive shortest job first (cea mai scurtă deservire preemptivă prima la rând)
Următoarea deservire este cea mai scurtă ca timp de desfășurare de la bun început[15]
Shortest remaining processing time (cel mai scurt timp de procesare rămas)
Următoarea deservire este cea cu cel mai scurt timp de procesare rămas.[16]
Facilitatea deservirii
Single server: customers line up and there is only one server
Parallel servers: customers line up and there are several servers
Tandem queue: there are many counters and customers can decide going where to queue
Comportamentul clienților la coadă
Balking: clienții decid să nu se mai așeze la coadă dacă este prea lungă
Jockeying: clienții se mută de la o coadă la alta
Reneging: clienții părăsesc coada de așteptare dacă au așteptat prea mult pentru a fi serviți
Rețele de cozi de așteptare
Rețele de cozi de așteptare sunt sisteme în care un număr de cozi sunt conectate la ceea ce este cunoscut sub numele de rutarea clientului. Atunci când un client este deservit la un nod, el se poate alătura unui alt nod și unei alte cozi pentru a fi servit, sau poate părăsi rețeaua.
Pentru rețelele cu m noduri, starea sistemului poate fi descrisă printr-un vector m–dimensional (x1,x2,...,xm) unde xi reprezintă numărul de clienți la fiecare nod.
Primele rezultate semnificative în acest domeniu au fost rețelele Jackson,[17][18] pentru care există o distribuție staționară eficientă și o analiză a valorii medii[19], care permit măsurători medii, cum ar fi calculul timpilor de tranzitare și de ședere.[20] Dacă numărul total de clienți în rețea rămâne constant, rețeaua se numește rețea închisă și s-a prezentat o formă de distribuție staționară în teorema Gordon–Newell.[21] Acest rezultat a fost extins la rețeaua BCMP[22] în care o rețea cu un timp foarte general de deservire, regimurile și rutarea clienților sunt prezentate ca un produs cu formă de distribuție staționară. Constanta de normalizare poate fi calculată cu algoritmul lui Buzen, propus în 1973.[23]
Rețele de clienți au fost de asemenea investigate, rețelele Kelly, în care clienții din diferite clase experimentează diferite nivele de prioritate la diferite noduri de servicii.[24] Un alt tip de rețele sunt G-rețele, propus pentru prima dată de Erol Gelenbe în 1993:[25] Aceste rețele nu presupun exponențială timp distribuții, cum ar fi clasic Jackson Rețea.
Algoritmi de rutare
În rețelele discrete de timp în care există o constrângere la care nodurile de deservire pot fi active la un moment dat, algoritmul programării max-greutate alege o politica de deserviri pentru a oferi transfer optim în cazul în care fiecare loc de muncă vizitează doar un singur nod de deservire. În cel mai general caz în care locurile de muncă pot vizita mai mult de un nod, rutarea de contrapresiune oferă transfer optim. Un programator de rețea trebuie să aleagă un algoritm de așteptare, care afectează caracteristicile unei rețele mai mari. A se vedea, de asemenea, programarea stohastică, pentru mai multe detalii despre programarea sistemelor de așteptare.
Limite medii de câmp
Limite medii de câmp iau în considerare limitarea comportamentul limitativ al măsurătorii empirice (proporția cozilor în stări diferite), când numărul cozilor (m de mai sus) tinde spre infinit. Impactul altor cozi asupra oricărei cozi în rețea este aproximată printr-o ecuație diferențială. Modelul determinist converge spre aceeași distribuție staționară ca și modelul original.[26]
Limite fluide
Limitele fluide sunt analogi determiniști continui ai rețelelor de așteptare obținute luarea limitei când procesul este scalat în timp și spațiu, permițând obiecte eterogene. Această traiectorie scalată converge spre ecuație deterministă care permite demonstrarea stabilității sistemului. Este cunoscut faptul că o rețea de cozi poate fi stabilă, dar are o limită fluidă instabilă.[27]
Trafic greu / aproximări ale difuziei
Într-un sistem cu rate mari de ocupare (utilizare aproape de 1) aproximarea unui trafic intens poate fi folosită pentru a aproxima lungimea procesului de așteptare prin reflectarea mișcării browniene (RMB),[28] procesul Ornstein–Uhlenbeck sau, mai general, procesul de difuzie.[29] Numărul de dimensiuni ale RMB este egal cu numărul nodurilor de așteptare și difuzia este limitată orthantul nenegativ.
^A.A. Markov, Extension of the law of large numbers to dependent quantities, Izvestiia Fiz.-Matem. Obsch. Kazan Univ., (2nd Ser.), 15(1906), pp. 135–156 [Also [37], pp.
339–361].
^Van Dijk, N. M. (). „On the arrival theorem for communication networks”. Computer Networks and ISDN Systems. 25 (10): 1135–2013. doi:10.1016/0169-7552(93)90073-D.
^Baskett, F.; Chandy, K. Mani; Muntz, R.R.; Palacios, F.G. (). „Open, closed and mixed networks of queues with different classes of customers”. Journal of the ACM. 22 (2): 248–260. doi:10.1145/321879.321887.
^Bobbio, A.; Gribaudo, M.; Telek, M. S. (). „Analysis of Large Scale Interacting Systems by Mean Field Method”. 2008 Fifth International Conference on Quantitative Evaluation of Systems. p. 215. doi:10.1109/QEST.2008.47. ISBN978-0-7695-3360-5.
^en Bramson, M. (). „A stable queueing network with unstable fluid model”. The Annals of Applied Probability. 9 (3): 818. doi:10.1214/aoap/1029962815. JSTOR2667284.
^en Chen, H.; Whitt, W. (). „Diffusion approximations for open queueing networks with service interruptions”. Queueing Systems. 13 (4): 335. doi:10.1007/BF01149260.
^en Yamada, K. (). „Diffusion Approximation for Open State-Dependent Queueing Networks in the Heavy Traffic Situation”. The Annals of Applied Probability. 5 (4): 958. doi:10.1214/aoap/1177004602. JSTOR2245101.