Détection de ruptures

Exemple de signal ayant des changements dans la moyenne.
Exemple de signal ayant des changements dans la distribution.

En analyse statistique, le problème de détection de ruptures (ou détection de points de changement) est un problème de régression ayant pour but d'estimer les instants où un signal présente des changements dans la distribution. Ces instants sont matérialisés sur les deux figures par des lignes verticales bleues. Classiquement, on réalise de la détection de rupture pour un signal ayant des changements dans la moyenne. De manière plus générale, on réalise de la détection de ruptures pour un signal ayant des changements dans la distribution (par exemple, dans la moyenne et la variance).

La détection de ruptures peut s'appliquer à un signal sonore d'une émission dont on souhaite estimer les instants où l'on change de situations, à la détection d'attaques informatiques (variations de flux réseaux)[1], ou encore au contrôle qualité.

Cet article traite du problème de détection de ruptures rétrospective (dite offline) où l'on dispose de l'ensemble des données du signal. Ce contexte est différent d'une détection temps réel (dite online) où les données du signal arrivent à la volée, mais moins à même de détecter précisément l'instant de rupture.

Formalisation du problème

Soit un signal réel, provenant d'observations recueillies au cours des instants , présentant des changements dans la distribution. En notant la loi de probabilité de , la distribution de vérifie :

avec étant les vrais instants de ruptures (on note ( est le vrai nombre de segments) avec la convention et ). On cherche à estimer ces instants de ruptures à l'aide d'un algorithme.

Dans le cas de la détection de rupture dans la moyenne, le modèle est :

avec est la fonction de régression et est un bruit d'espérance nulle et de variance . La fonction de régression est supposée constante par morceaux avec des discontinuités à chaque vrai instant de ruptures .

Dans le cas de la détection de ruptures dans la distribution, on recode les observations initiales par de nouvelles observations définies par est un noyau symétrique et semi-défini positif (en) (par exemple  : est le noyau linéaire ; autre exemple  : est le noyau Gaussien de paramètre ). Pour un noyau symétrique et semi-défini positif , le théorème de Moore-Aronszahn assure l'existence d'un espace de Hilbert à noyau reproduisant de noyau reproduisant .

Le modèle est :

avec est la fonction de régression et est un bruit d'espérance nulle et de variance . De plus, appartiennent à . La fonction de régression est supposée constante par morceaux avec des discontinuités à chaque vrai instant de ruptures .

Méthodes existantes

Le problème de détection de ruptures peut être vu comme un problème de sélection de modèle[2]: chaque segmentation candidate (i.e. liste d'instants de ruptures candidats) est reliée à un modèle qu'il faut choisir. Nous présentons deux approches : l'une utilisant le principe de la programmation dynamique et l'autre l'heuristique de segmentation binaire dans le cadre classique de la détection de ruptures dans la moyenne puis dans le cas général de la détection de ruptures dans la distribution. Pour chacune de ces deux méthodes, nous présentons les algorithmes permettant de calculer une segmentation en segments optimisant un critère (ici, le risque empirique).

Notations

Nous présentons les notations communes aux deux méthodes puis celles qui leur sont spécifiques :

Notation commune

l'ensemble des segmentions en segments .

Notations pour le cas de la détection de ruptures dans la moyenne

  • et .
  •  : est l'ensemble des vecteurs constants par morceaux sur les segments de .
  • Estimateur du risque empirique : .

Notations pour le cas de la détection de ruptures dans la distribution

  • et .
  • pour avec .
  •  : est l'ensemble des vecteurs constants par morceaux sur les segments de .
  • Norme dans  : .
  • Estimateur du risque empirique : .

Les méthodes proposées ci-dessous utilisent le risque empirique comme critère à minimiser ( pour la détection de ruptures dans la moyenne ; pour la détection de ruptures dans la distribution). Pour le noyau linéaire , , les méthodes utilisées dans le cadre classique se déduisent de celles du cas des noyaux par le biais de  : donc on ne présentera les algorithmes que dans le cas des noyaux.

Programmation dynamique

La méthode de la programmation dynamique utilise le principe d'optimalité de Bellman : toute solution optimale s'appuie elle-même sur des sous-problèmes résolus localement de façon optimale. On utilise cette méthode exacte pour récupérer pour la meilleure segmentation en segments minimisant le risque empirique i.e. :


Nous présentons dans cette section l'algorithme de programmation dynamique appliquée au problème de détection de ruptures[3],[4]. Dans un premier temps, nous exprimons le risque empirique en fonction du noyau et de à l'aide des deux résultats suivants ci-dessous.

On montre tout d'abord que, pour , pour , .

On montre que, pour ,

avec, pour ,

KPGD est l'implémentation du principe de la programmation dynamique à noyau appliquée au problème de détection de ruptures. Elle prend en paramètre la matrice de coût et elle renvoie .

 algorithme KPGD () 
   for  do
     for  do
       
       
     end for        
   end for
 Fin algorithme


avec .

La sélection de modèle[4] permet de récupérer un estimateur du nombre de segments . est défini par

avec . La méthode utilisée pour calibrer la constante est l'heuristique de pente[5]. On obtient ainsi un estimateur .

Segmentation binaire

L'heuristique de segmentation binaire[6] est une méthode, fonctionnant par dichotomie, permettant de récupérer un minimiseur local du risque empirique . Plus précisément, la segmentation binaire cherche à la première itération l'indice de l'instant de ruptures candidat qui minimise le risque empirique  : cet indice est l'indice de notre premier instant de ruptures estimé. Puis, elle détermine récursivement, à la deuxième itération, deux instants de ruptures candidats sur chacun des segments délimités par les instants de ruptures estimés. Elle retient comme second instant de ruptures estimé celui (parmi ces deux instants de ruptures candidats) qui minimisent le risque empirique. Puis, on procède de la même manière pour les itérations suivantes. Nous illustrons sur un exemple le fonctionnement de l'algorithme utilisant le principe de la segmentation binaire :

  • Étape 1 : A l'itération , on cherche qui minimise le risque empirique avec pour avec :

est notre premier instant de ruptures estimé noté .

  • Étape 2  : A l'itération on , on cherche minimisant le risque empirique sur et respectivement. Par exemple,

avec . Puis on choisit parmi les instants de ruptures candidats celui qui minimise le risque empirique
et on le note . Puis, on continue récursivement.

Ainsi, au bout de itérations, on récupère une segmentation en segments vérifiant :

avec l'espace des segmentations en segments où les instants de ruptures estimés ont été calculés aux itérations précédentes.

Une méthode alternative de segmentation binaire avec temps d'arrêt[7] permet d'estimer le nombre de segments et donc de récupérer un estimateur de .

Notes et références

Articles
  1. [PDF] Alexandre Lung-Yut-Fong, « Détection de ruptures pour les signaux multidimensionnels. Application à la détection d’anomalies dans les réseaux. », HAL,‎ (lire en ligne)
  2. [PDF] Lucien Birgé et Pascal Massart, « Gaussian model selection. », Journal of the European Mathematical Society,‎ , p. 203-268
  3. [PDF] Zaid Harchaoui et Olivier Cappé, « Retrospective Mutiple Change-Point Estimation with Kernels. », IEEE,‎ , p. 768-772 (lire en ligne)
  4. a et b [PDF] Sylvain Arlot, Alain Celisse et Zaid Harchaoui, « A kernel multiple change-point algorithm via model selection. », Arxiv,‎ (lire en ligne)
  5. Lucien Birgé et Pascal Massart, « Minimal Penalties for Gaussian Model Selection », Probability Theory and Related Fields, vol. 138,‎ , p. 33--73 (lire en ligne).
  6. [PDF] Rebecca Killick, « Optimal detection of changepoints with a linear computational cost. », Journal of the American Statistical Association,‎ , p. 1590--1598
  7. [PDF] Piotr Fryzlewicz, « Wild binary segmentation for multiple change-point detection. », The Annals of Statistics, vol. 42, no 6,‎ , p. 2243--2281 (lire en ligne)

Read other articles:

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Februari 2023. Katak-puru eropa Bufo bufo Rekaman Status konservasiRisiko rendahIUCN54596 TaksonomiKerajaanAnimaliaFilumChordataKelasAmphibiaOrdoAnuraFamiliBufonidaeGenusBufoSpesiesBufo bufo (Linnaeus, 1758) Tata namaSinonim takson Daftar Bufo (Bufo) bufo Dubois and...

 

Danau Tangxun汤逊湖Tangxun Hu, Danau Tangsun, Tangsun Hu, T’ang-sun HuLetakDistrik Hongshan/Distrik Jiangxia, Wuhan, HubeiBagian dariCekungan Sungai YangtzeTerletak di negaraTiongkokArea permukaan> 476 km2 (184 sq mi)Ketinggian permukaan10 meter (33 ft)KepulauanPulau Zanglong (藏龙岛)[1] Danau Tangxun Hanzi tradisional: 湯遜湖 Hanzi sederhana: 汤逊湖 Alih aksara Mandarin - Hanyu Pinyin: Tāngxùn Hú Yue (Kantonis) - Jyutping: tong1seon3 wu4 Danau ...

 

Queen of Crete in Greek mythology For the moon of Jupiter, see Pasiphae (moon). Not to be confused with Pasithea. PasiphaëSorceress goddessPasiphaë sits on a throne, a Roman mosaic from Zeugma Mosaic MuseumAbodeCretePersonal informationParentsHelios and Perse or CreteSiblingsCirce, Aeetes, Aloeus, Perses, Phaethon, the Heliades, the Heliadae and othersConsortMinos, Cretan BullChildrenAcacallis, Ariadne, Androgeus, Glaucus, Deucalion, Phaedra, Xenodice, Catreus and the Minotaur. Part of a se...

German cyclist Leon RohdeRohde in 2018Personal informationFull nameLeon R. RohdeBorn (1995-05-10) 10 May 1995 (age 28)Altona, HamburgHeight1.87 m (6 ft 2 in)Weight72 kg (159 lb)Team informationCurrent teamRad-Net OßwaldDisciplinesTrackRoadRoleRiderAmateur team2017Team Sunweb (stagiaire) Professional teams2014–2016LKT Team Brandenburg2017Development Team Sunweb2018–Heizomat–rad-net.de[1] Medal record Representing  Germany Men's track ...

 

Cet article est une ébauche concernant un coureur cycliste français. Vous pouvez partager vos connaissances en l’améliorant (comment ?). Pour plus d’informations, voyez le projet cyclisme. Léon Comès1909InformationsNaissance 11 février 1889PerpignanDécès 16 octobre 1915 (à 26 ans)Saint-Étienne-au-TempleNationalité françaiseDistinctions Croix de guerre 1914-1918Mort pour la Francemodifier - modifier le code - modifier Wikidata Léon (Adolphe) Comès (11 février 1889...

 

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus. Cet article ne cite pas suffisamment ses sources (février 2023). Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ». En pratique : Quelles sources sont attendues ? ...

Chemical compound EpimestrolClinical dataTrade namesAlene, StimovulOther namesStimovul; ORG-817; NSC-55975; 3-Methoxyestriol; 3-Methoxy-17-epiestriolRoutes ofadministrationBy mouthDrug classEstrogen; Estrogen etherATC codeG03GB03 (WHO) Identifiers IUPAC name (8R,9S,13S,14S,16R,17S)-3-methoxy-13-methyl-6,7,8,9,11,12,14,15,16,17-decahydrocyclopenta[a]phenanthrene-16,17-diol CAS Number7004-98-0PubChem CID244809ChemSpider214111UNII7IVE3SDZ38KEGGD04021ECHA InfoCard100.027.526 Chemical an...

 

У этого термина существуют и другие значения, см. Пулково. Аэропорт Пулково Аэропорт Пулково с высоты птичьего полёта в 2009 году ИАТА: LED – ИКАО: ULLI – Внутр. код: ПЛК Информация Вид аэропорта Гражданский Страна  Россия Расположение  Санкт-Петербург Дата открытия 2...

 

Republik Akhzivlandמדינת אכזיבNegara mikro Bendera Lambang Semboyan: יחי אחזיבלנדVivat Akhzivland(Indonesia: Hidup Akhzivland)Lagu kebangsaan: הַתִּקְוָהHatikvah(Indonesia: Harapan)Ibu kotaAchzivBahasa resmiIbrani, Arab, InggrisStruktur OrganisasiRepublik Presidensial• Presiden Eli Avivi Pendirian• Deklarasi Kemerdekaan 02 Agustus 1971[1] Zona waktuWaktu Standar Israel(UTC+2) Sunting kotak info • Lihat • BicaraBantua...

2nd-century BCE Greco-Bactrian and Indo-Greek king Menander IMaharaja BasileusPortrait of Menander I Soter, from his coinageIndo-Greek KingReign165/155–130 BCPredecessorAntimachus IISuccessorStrato I (Agathoclea as regent)Bornc. 180 BCKalisi (in present-day Bagram, Afghanistan)[1][2] or Sagala (present-day Sialkot, Pakistan)[3]Died130 BC (aged 50)Sagala (present-day Sialkot)BurialStupas across the Indo-Greek KingdomConsortAgathocleaIssueStrato IReligionGreco-Bu...

 

Ellmaker State WaysideShow map of OregonShow map of the United StatesTypePublic, stateLocationLincoln County, OregonNearest cityCorvallisCoordinates44°36′52″N 123°37′54″W / 44.6145637°N 123.6317743°W / 44.6145637; -123.6317743[1]Operated byOregon Parks and Recreation Department Ellmaker State Wayside is a state park in the U.S. state of Oregon, administered by the Oregon Parks and Recreation Department. It is located on U.S. Route 20 appr...

 

Moluccan people living outside Indonesia The Moluccan diaspora (Indonesian: Diaspora Maluku) refers to overseas Indonesians of Moluccan birth or descent living outside Indonesia. The most significant Moluccan diaspora community lives in the Netherlands, where it numbers c. 70,000 people as of 2018.[1] Terminology In the Netherlands, a number of names are in circulation to refer to its Moluccan community, which do not all technically refer to the same group of people. The most commonly...

Town in ancient Ionia PygelaΠύγελα or ΦύγελαCoins issued by Pygela ca. 350-300 BCAdmiralty Chart No 1546 Samos Strait to Mandelyah Gulf, Published 1898. The ruins of Pygela are noted near the top of the chart.RegionIoniaCoordinates37°51′44″N 27°15′49″E / 37.862209°N 27.263729°E / 37.862209; 27.263729TypeDifferent at different periodsPart ofMunicipal unit of MeliaMunicipal unit of SamosStand-alone polisPolis with sympoliteia (double citizens...

 

Nature reserve in Somerset, England Aller HillSite of Special Scientific InterestLocation within SomersetLocationSomersetGrid referenceST408291Coordinates51°03′29″N 2°50′46″W / 51.05817°N 2.84608°W / 51.05817; -2.84608InterestBiologicalArea18.4 hectares (0.184 km2; 0.071 sq mi)Notification1988 (1988)Natural England website Aller Hill (grid reference ST408291) is an 18.4 hectare (45.4 acre) biological Site of Special Scientific Interest n...

 

此條目可能包含不适用或被曲解的引用资料,部分内容的准确性无法被证實。 (2023年1月5日)请协助校核其中的错误以改善这篇条目。详情请参见条目的讨论页。 各国相关 主題列表 索引 国内生产总值 石油储量 国防预算 武装部队(军事) 官方语言 人口統計 人口密度 生育率 出生率 死亡率 自杀率 谋杀率 失业率 储蓄率 识字率 出口额 进口额 煤产量 发电量 监禁率 死刑 国债 ...

伊斯兰合作组织Organisation of Islamic Cooperation(英語)Organisation de la Coopération Islamique(法語)منظمة التعاون الإسلامي(阿拉伯語) 旗帜格言:To safeguard the interests and ensure the progress and well-being of Muslims  成员国  观察国  暂停会籍行政总部 沙地阿拉伯吉达 官方语言阿拉伯语英语法语类型宗教成员国57个在籍成员国(英语:Member states of the Organisation ...

 

  لمعانٍ أخرى، طالع الناحية المركزية (توضيح). الناحية المركزية الإحداثيات 36°28′11″N 52°21′03″E / 36.469722°N 52.350833°E / 36.469722; 52.350833   تقسيم إداري  البلد إيران  التقسيم الأعلى مقاطعة آمل[1]  عدد السكان  عدد السكان 296800 (2016)[1]   عدد الأسر 98147 (2016)[...

 

The former Freimans department store on Rideau Street, now owned by Hudson's Bay Company Freimans department store on Rideau Street, 1938 A.J. Freiman Limited, or Freimans (/ˈfriːmənz/ FREE-mənz), was a landmark department store at 73 Rideau Street in Ottawa, Ontario, Canada, founded in 1918 by Archibald J. Freiman. Archibald Jacob Freiman was born in Lithuania in 1880, and emigrated to Hamilton, Ontario. Freimans rose to become the most successful department store in Ottawa because of i...

Cone-shaped marker used for traffic management Traffic cones are usually used to divert traffic. The reflective sleeves are for nighttime visibility; the bosses at the top ease handling and can be used for attaching caution tape. Traffic cones, also called pylons, witches' hats,[1][2] road cones, highway cones, safety cones, caution cones, channelizing devices,[3] construction cones, roadworks cones, or just cones, are usually cone-shaped markers that are placed on roa...

 

Jungian archetypes of the collective unconscious For other uses, see Wise old man and Wise Woman (disambiguation). Part of a series of articles onPsychoanalysis Concepts Psychosexual development Psychosocial development (Erikson) Unconscious Preconscious Consciousness Psychic apparatus Id, ego and superego Ego defenses Projection Introjection Libido Drive Transference Countertransference Resistance Denial Dreamwork Cathexis Important figures Abraham Adler Balint Bion Breuer Chodorow Erikson F...