Inégalité d'Azuma

L’inégalité d'Azuma, parfois appelée inégalité d'Azuma-Hoeffding, est une inégalité de concentration concernant les martingales dont les accroissements sont bornés. C'est une généralisation de l'inégalité de Hoeffding, une inégalité de concentration ne concernant, elle, que les sommes de variables aléatoires indépendantes et bornées.

Énoncé courant

Un des énoncés les plus courants est

Inégalité d'Azuma — Soit une martingale par rapport à une filtration et vérifiant

Alors, pour tout

Notons que le choix entraine que

Énoncé général

Un énoncé plus général (McDiarmid, Théorème 6.7) est le suivant

Théorème — Soit une martingale par rapport à une filtration Supposons qu'il existe une suite de variables aléatoires et une suite de constantes telles que, pour tout

  • soit -mesurable ;

Alors, pour tout

L'énoncé courant, donné à la section précédente, est obtenu en spécialisant l'énoncé général aux choix

Principe de Maurey

Le principe de Maurey a été énoncé pour la première fois par Maurey dans une note aux Comptes rendus de l'Académie des Sciences en 1979, et découvert plus tard, semble-t-il indépendamment, par Harry Kesten, en théorie de la percolation. Il est d'usage fréquent en théorie des graphes aléatoires, dans l'analyse des algorithmes randomisés, et en théorie de la percolation. Il est parfois appelé method of bounded differences ou MOBD.

Énoncé

Soit deux ensembles A et B et soit l'ensemble des applications de B dans A. On se donne une filtration

Définition — Une application est dite -lipshitzienne si, pour tout et pour tout on a l'implication :

Autrement dit, si les deux applications coïncident à l'intérieur de et à l'extérieur de (i.e. dans les zones vertes et bleues de la figure ci-dessous), alors X varie peu de l'une à l'autre.

Principe de Maurey et condition de Lipschitz.

Théorème — On suppose muni d'une structure d'espace probabilisé telle que les images forment une famille de variables aléatoires indépendantes. On suppose également que la variable aléatoire réelle X, définie sur , est -lipshitzienne. Alors, pour tout

Application à un modèle d'urnes et de boules

Dans cet exemple, l'intérêt d'une inégalité de concentration précise est de justifier une méthode statistique de comptage approximatif[1] pouvant servir, par exemple, à déceler une attaque de virus informatique.

Une inégalité de concentration

On jette m boules au hasard dans n boîtes, expérience probabiliste dont un événement élémentaire est décrit par une application de dans  : est le numéro de la boîte dans laquelle est rangée la boule numéro k. Ainsi les sont bien des variables aléatoires indépendantes, et, accessoirement, des variables aléatoires uniformes. Considérons l'application X, qui, à une distribution de m boules dans n boîtes, associe le nombre de boîtes vides à la fin de cette distribution On peut calculer l'espérance de X aisément à l'aide d'une décomposition de X en somme de variables de Bernoulli. On trouve alors que

Pour le choix l'application X est -lipshitzienne : en effet, si, d'une distribution à une autre, seule la place de la boule n°t change ( est réduit au seul élément t ), alors le nombre de boîtes vides varie d'au plus une unité. Ainsi, en vertu du principe de Maurey,

Une inégalité plus précise[2] est obtenue en appliquant la forme générale de l'inégalité d'Azuma.

Un problème de comptage approché

Il s'agit d'estimer le nombre m d'utilisateurs différents, identifiés, à un nœud du réseau, par l'entête du paquet de données qu'ils envoient. L'idée est qu'une attaque de virus ne se traduit pas par une augmentation décelable du volume du trafic (le gros du volume étant fourni, par exemple, par des téléchargements de fichiers, lesquels sont scindés en nombreux paquets qui ont tous le même entête, caractérisant le même utilisateur), mais par une augmentation drastique du nombre d'utilisateurs différents, à cause d'un envoi massif et concerté de mails (tous de petit volume, comparés à des téléchargements).

Chaque fois qu'un paquet de données est reçu à un nœud du réseau, l'utilisateur b émetteur du paquet est reconnu à l'aide de l'entête du paquet de données (une suite de longueur L de 0 et de 1). Cet entête est haché, i.e. transformé en un nombre aléatoire uniforme sur l'intervalle [0,1] : cette transformation (la fonction de hachage) est conçue de telle sorte que m paquets émis par m utilisateurs différents produisent m entêtes différents et, après hachage de ces entêtes, produisent une suite de m variables aléatoires indépendantes et uniformes sur l'intervalle [0,1]. Par contre paquets émis par le même utilisateur b produisent fois la même entête , et hachages successifs de cet entête produisent une suite de valeurs aléatoires identiques, toutes égales au même nombre tiré au hasard, une fois pour toutes, uniformément sur l'intervalle [0,1].

On reçoit un grand nombre (P) de paquets en un laps de temps très court. On dispose seulement de n cases mémoires et on veut compter le nombre m d'utilisateurs différents émetteurs de ces paquets. Par manque de place mémoire, il est impossible de stocker au fur et à mesure les entêtes des paquets déjà reçus, et par manque de temps il serait impossible de tester si un nouvel entête reçu fait partie de la liste des entêtes déjà récoltés. Un calcul exact de m est donc impossible. On se donne alors n cases, numérotées de 1 à n, considérées comme libres, ou bien occupées. Au départ toutes les cases sont considérées comme libres. À chaque paquet reçu, l'entête correspondant est haché, produisant un nombre U aléatoire uniforme sur [0,1], et la case n° est marquée occupée, quel qu'ait été son statut antérieur. Qu'une entête apparaisse une fois ou 10 000 fois, le résultat sera le même : c'est, du fait de cet entête, le même nombre aléatoire U qui sera engendré et la même case n° qui sera marquée occupée.

Ainsi l'état de l'ensemble des n cases après réception des P paquets ne dépend pas du volume P du trafic, mais uniquement de la suite des m entêtes hashés correspondant aux m utilisateurs différents. Plus précisément, le nombre X de cases libres à la fin du processus a même loi que dans le problème de boîtes et de boules évoqué à la section précédente. L'inégalité de concentration assure que, pour n et m assez grands, avec une forte probabilité, l'approximation de par X, c'est-à-dire :

est assez précise pour permettre de reconstituer le ratio r=m/n, et, partant de là, le nombre m d'utilisateurs différents, inconnu jusque-là, en fonction de X et de n, qui sont connus : on choisit comme approximation de r le nombre Dans cette situation particulière, on sera satisfait si la précision de l'approximation permet de déceler un changement brutal de la valeur de m d'un moment à l'autre, changement annonciateur d'une attaque de virus : pour cela, une approximation grossière de m devrait suffire.

Voir aussi

Notes

  1. proposée par (en) Kyu-Young Whang et Ravi Krishnamurthy, « Query optimization in a memory-resident domain relational calculus database system », ACM Transactions on Database Systems (TODS), New York, NY, USA, ACM, vol. 15, no 1,‎ , p. 67–95 (ISSN 0362-5915, lire en ligne)
  2. (en) Rajeev Motwani et Prabhakar Raghavan, Randomized Algorithms, Cambridge, New York et Melbourne, Cambridge University Press, (réimpr. 1997, 2000), 1re éd., 476 p. (ISBN 978-0-521-47465-8, lire en ligne), chap. 4 (« Tail inequalities »), p. 94–95, Théorème 4.18.

Bibliographie

  • (en) N. Alon et J. Spencer, The Probabilistic Method, New York, Wiley,
  • (en) K. Azuma, « Weighted Sums of Certain Dependent Random Variables », Tôhoku Math. Journ., vol. 19,‎ , p. 357–367
  • (ru) Sergei N. Bernstein, « [traduction] On certain modifications of Chebyshev's inequality », Doklady Akademii Nauk SSSR, vol. 17, no 6,‎ , p. 275–277
  • (en) C. McDiarmid, « On the method of bounded differences », London Math. Soc. Lectures Notes, Cambridge (UK), Cambridge Univ. Press, no 141 « Surveys in Combinatorics »,‎ , p. 148–188
  • (en) W. Hoeffding, « Probability inequalities for sums of bounded random variables », J. Amer. Statist. Assoc., vol. 58,‎ , p. 13–30
  • B. Maurey, « Constructions de suites symétriques », CR Acad. Sci. Paris, Série A–B, vol. 288,‎ , p. 679–681

Pour aller plus loin

  • (en) S. Boucheron, G. Lugosi et P. Massart, « Concentration inequalities using the entropy method », Annals of Probability,‎

Pages liées

Read other articles:

Ibrahim 'Ashk'Lahir(1951-07-20)20 Juli 1951Multanpura, Mandsaur Madhya PradeshNama lainIbrahim Khan GauriPekerjaanpenyair, jurnalis, pemeran, lirikus Ibrahim Khan Gauri (20 Juli 1951 – 16 Januari 2022) adalah seorang penyair, jurnalis, pemeran, dan lirikus Urdu. Ia menulis dengan menggunakan nama pena Ashk. Pranala luar Saregama.com Mio.to Diarsipkan 2014-05-06 di Wayback Machine. Planetradiocity.com Diarsipkan 2014-05-14 di Archive.is Myswar.com Diarsipkan 2015-08-25 di...

 

Lepisma saccharinaRentang fosil: 400–0 jtyl PreЄ Є O S D C P T J K Pg N Karbon Akhir sampai sekarang Klasifikasi ilmiah Kerajaan: Hewan Filum: Arthropoda Subfilum: Hexapoda Kelas: Insecta Subkelas: Apterygota Ordo: Zygentoma Famili: Lepismatidae Genus: Lepisma Spesies: L. saccharina Nama binomial Lepisma saccharinaLinnaeus, 1758 Gegat (Lepisma saccharina) adalah serangga kecil tanpa sayap dari ordo Zygentoma. Gegat juga disebut kutu buku karena kebiasaannya memakan kertas. Nama...

 

MeuraxaKecamatanNegara IndonesiaProvinsiAcehKotaBanda AcehPemerintahan • Camat-Populasi • Total- jiwaKode pos23231-23234[1]Kode Kemendagri11.71.03 Kode BPS1171010 Desa/kelurahan16 gampong Pelabuhan Ulee Lheue Masjid Baiturrahim Kecamatan Meuraxa (ditulis juga sebagai Meuraksa) adalah salah satu kecamatan di Kota Banda Aceh. Gampong di Kecamatan Meuraksa adalah: Alue Deah Teungoh Asoe Nanggroe Baru Blang Blang Oi Cot Lamkueweuh Deah Baro Deah Glumpang Lambu...

Vora pada 1989 Motilal Vora (20 Desember 1928 – 21 Desember 2020)[1] adalah seorang politikus India yang masuk Kongres Nasional India. Ia menjabat sebagai Ketua Menteri Madhya Pradesh (1985–1988; 1989). Referensi Wikimedia Commons memiliki media mengenai Motilal Vora. ^ Dec 21, TIMESOFINDIA COM / Updated:; 2020; Ist, 16:23. Veteran Congress leader Motilal Vora passes away at 93 | India News - Times of India. The Times of India (dalam bahasa Inggris). Diakses tanggal ...

 

وحيد حامد معلومات شخصية الميلاد 1 يوليو 1944   محافظة الشرقية  الوفاة 2 يناير 2021 (76 سنة)   القاهرة[1]  سبب الوفاة نوبة قلبية  مواطنة مصر (1944–1952) مصر (1953–1958) مصر (1958–1961) مصر (1961–2021)  الزوجة زينب سويدان الأولاد مروان حامد  الحياة العملية المدرسة الأم جامعة القا...

 

United States historic placeGreen Shutter HotelU.S. National Register of Historic Places Green Shutter Hotel, B and Main Streets, with ground floor tenantsShow map of Oakland, CaliforniaShow map of CaliforniaShow map of the United StatesLocationHayward, CaliforniaCoordinates37°40′20.65″N 122°4′55.8″W / 37.6724028°N 122.082167°W / 37.6724028; -122.082167Architectural styleColonial RevivalNRHP reference No.04000594[1]Added to NRHPJune 1...

Species of bat Somali serotine Conservation status Least Concern  (IUCN 3.1)[1] Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Chordata Class: Mammalia Order: Chiroptera Family: Vespertilionidae Genus: Neoromicia Species: N. somalica Binomial name Neoromicia somalica(Thomas, 1901) Synonyms Eptesicus somalicus (Thomas, 1901) The Somali serotine (Neoromicia somalica) is a species of vesper bat. It is found in Benin, Botswana, Burkina Faso, Cameroon, Cent...

 

У этого термина существуют и другие значения, см. Чайки (значения). Чайки Доминиканская чайкаЗападная чайкаКалифорнийская чайкаМорская чайка Научная классификация Домен:ЭукариотыЦарство:ЖивотныеПодцарство:ЭуметазоиБез ранга:Двусторонне-симметричныеБез ранга:Вторич...

 

この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)出典検索?: コルク – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2017年4月) コルクを打ち抜いて作った瓶の栓 コルク(木栓、�...

坐标:43°11′38″N 71°34′21″W / 43.1938516°N 71.5723953°W / 43.1938516; -71.5723953 此條目需要补充更多来源。 (2017年5月21日)请协助補充多方面可靠来源以改善这篇条目,无法查证的内容可能會因為异议提出而被移除。致使用者:请搜索一下条目的标题(来源搜索:新罕布什尔州 — 网页、新闻、书籍、学术、图像),以检查网络上是否存在该主题的更多可靠来源...

 

وَرَمٌ وِعَائيٌّ كَرَزِيّ ورم وعائي كرزيورم وعائي كرزي معلومات عامة الاختصاص طب القلب  تعديل مصدري - تعديل   وَرَمٌ وِعَائيٌّ كَرَزِيّ [1](بالإنجليزية: Cherry hemangioma)، المَعروف أيضًا باسم بُقَع كَامبيل دي مُورْغان، أو وَرَمٌ وِعائيٌّ شَيْخوخِيّ، [2] هو حَط...

 

العلاقات المصرية المغربية   مصر   المغرب السفارات سفارة المغرب في القاهرة   السفير : محمد فرج الدكالي   العنوان : 10، شارع صلاح الدين - حي الزمالك -القاهرة سفارة مصر بالرباط   السفير : قدرى فتحى عبد المطلب   العنوان : 31 شارع الجزائر، حي ح...

  لمعانٍ أخرى، طالع مكة (توضيح). مكة المكرمة العاصمة المُقدَّسة اللقب مكة المكرمة • بكة • أم القرى • البلد الأمين • البلد • البلدة • المسجد الحرام • البيت العتيق • القرية تاريخ التأسيس +2000 سنة ق.م (على خلاف) تقسيم إداري البلد المملكة العربية السعودية[1][2] عاصم�...

 

Archival agency Department of the Air Force Historical Research AgencyMottoPreserving the Past. Informing the Present and Future.MissionThe Air Force Historical Research Agency (AFHRA) preserves Department of the Air Force (DAF) history and provides information and analyses to support official customers and the general public in a variety of venues and formats. The AFHRA administers the lineage, heritage, and emblems of DAF organizations; advises manpower and organization offices at Headquart...

 

American digital media and entertainment company Refinery29Type of siteMedia and entertainmentAvailable inEnglishFoundedNovember 2005; 18 years ago (2005-11)Headquarters225 Broadway, New York, New York, U.S.[1]OwnerSundial Media GroupFounder(s)Philippe von BorriesJustin StefanoPiera GelardiChristene Barberich[2]EmployeesOver 500 (as of October 2017)[3]URLrefinery29.comLaunchedSummer 2005Current statusActive Refinery29 (R29) is an Americ...

Queen Isabella ~ Christopher ColumbusIssue of 1893 The first Martha Washington postage stamp, issue 1902. The history of women on US stamps begins in 1893, when Queen Isabella became the first woman on a US stamp.[1] Queen Isabella helped support Christopher Columbus's 1492 voyage, and 1893 marked the end of a year-long celebration of the 400th anniversary of that voyage.[1][2] The first US stamp honoring an American woman honored Martha Washington, and it was issued i...

 

Russian composer (born 1931) Sofia GubaidulinaGubaidulina in Sortavala, 1981Born (1931-10-24) October 24, 1931 (age 92)Chistopol, TASSR, Russian SFSRNotable work Stimmen... Verstummen... Offertorium (Жертвоприношение) Music for Flute, Strings, and Percussion The Canticle of the Sun of St Francis of Assisi Fachwerk Concerto for violin, cello and bayan Sofia Asgatovna Gubaidulina (Russian: Софи́я Асгáтовна Губaйду́лина listenⓘ, Tatar: София ...

 

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Februari 2023. Ratna DillaLahirRatna Dilla9 Januari 1984 (umur 40)Kota Bogor, Jawa Barat, IndonesiaKebangsaanIndonesiaPekerjaanpenyanyipemeranTahun aktif2004–sekarangSuami/istriFirmansyah Ratna Dilla (lahir 09 Januari 1984) adalah seorang penyanyi dan pe...

محمية الملك خالد الملكية منتزه الثمامة سابقًا البلد السعودية  الموقع  السعودية سميت بأسم خالد بن عبد العزيز آل سعود  تأسَّست في سنة 2019 الجهة المسؤولة مجلس المحميات الملكية تعديل مصدري - تعديل   محمية الملك خالد الملكية ( منتزه الثمامة سابقًا) محمية طبيعية تقع في و...

 

Multi-barrel pistol Lancaster pistol Break action Lancaster pistol on display at the Royal Armouries Museum in LeedsTypeMulti-barrel pistolPlace of origin United KingdomService historyWarsAnglo-Zulu War First Boer War Mahdist War Second Boer War World War IProduction historyDesignerCharles W. Lancaster and Henry ThornDesignedc. 1860Producedmid to late 19th centurySpecificationsCartridge.38 S&W.450 Adams.455 Webley.577 SniderCalibre.380 inch.450 inch.455 inch.577 inchBarrels...