В теорії ймовірностей та статистицікатегорі́йний розпо́діл (англ.categorical distribution, що також називають «узагальненим розподілом Бернуллі», англ.multinoulli distribution[1] або, менш точно, «дискретним розподілом») — це розподіл імовірності, що описує можливі результати випадкової події, яка може мати один із K можливих наслідків, із окремим зазначенням ймовірності кожного з наслідків. Не обов'язково мається на увазі існування якогось впорядкування цих результатів, але для зручності опису цього розподілу часто додають числові мітки (наприклад, від 1 до K). Зауважте, що K-вимірний категорійний розподіл є найзагальнішим розподілом над подією з K можливими наслідками; будь-який інший дискретний розподіл над простором елементарних подій розміру K є окремим випадком. Параметри, що вказують імовірності кожного з можливих наслідків, обмежено лише тим, що кожен з них мусить бути в діапазоні від 0 до 1, і всі вони в сумі мусять давати 1.
Категорійний розподіл є узагальненням розподілу Бернуллі для категорійної випадкової змінної, тобто для дискретної змінної з понад двома можливими наслідками, такої як підкидання грального кубика.
Термінологія
Часом для позначення категорійного розподілу використовують термін «дискретний розподіл». Проте, по-правильному, він позначує не одне певне сімейство розподілів, а загальний клас розподілів.
Зауважте, що в деяких галузях, таких як машинне навчання та обробка природної мови, категорійний та поліноміальний розподіли зливаються, і є звичним говорити про «поліноміальний розподіл», коли в дійсності мається на увазі категорійний.[2] Це неточне використання походить з того факту, що іноді зручніше описувати наслідок категорійного розподілу як вектор «один із K» (вектор, один з елементів якого містить 1, а всі інші елементи містять 0), аніж як ціле число на проміжку від 1 до K; у цьому вигляді категорійний розподіл є рівнозначним поліноміальному розподілові з єдиним спостереженням (див. нижче).
Проте злиття категорійного та поліноміального розподілів може призводити до проблем. Наприклад, у поліноміальному розподілі Діріхле[en], який зазвичай з'являється в моделях обробки природної мови (хоча й не завжди під цією назвою) як результат спалої вибірки за Ґіббсом[en], де розподіли Діріхле спадають в ієрархічній баєсовій моделі, дуже важливо відрізняти категорійний від поліноміального. Спільний розподіл одних і тих же змінних з одним і тим же поліноміальним розподілом Діріхле має два різні вигляди в залежності від того, чи він характеризується як розподіл, область визначення якого є над окремими категорійними вузлами, чи над кількостями вузлів поліноміального стилю в кожній конкретній категорії (подібно до розрізнення між набором вузлів з розподілами Бернуллі та єдиним вузлом із біноміальним розподілом). Обидва вигляди мають дуже схожі функції маси ймовірності (ФМІ, англ.PMF), що обидві посилаються на кількості вузлів поліноміального стилю в категорії. Проте ФМІ поліноміального стилю має додатковий поліноміальний коефіцієнт, який у ФМІ категорійного стилю є сталою, яка дорівнює 1. Змішування цих двох може легко привести до неправильних результатів в умовах, у яких цей додатковий коефіцієнт не є сталим по відношенню до досліджуваних розподілів. Цей коефіцієнт часто є сталим у повних умовних виразах, які застосовуються у вибірці Ґіббса та оптимальних розподілах у варіаційних методах.
В одному з формулювань цього розподілу як простір елементарних подій береться скінченна послідовність цілих чисел. Конкретні цілі числа, що використовуються як мітки, не є важливими; ними можуть бути {0, 1, ..., k-1}, або {1, 2, ..., k}, або будь-який інший довільний набір значень. В наступних описах ми використовуємо для зручності {1, 2, ..., k}, хоча це й розходиться з угодою для розподілу Бернуллі, яка використовує {0, 1}. В цьому випадку функцією маси ймовірностіf є
де , представляє ймовірність побачити елемент , а .
Іншим формулюванням, яке видається складнішим, але полегшує математичні перетворення, є наступне, яке застосовує дужки Айверсона:[3]
де обчислюється як 1, якщо , а інакше як 0. В цього формулювання є деякі переваги, наприклад:
Ще одне формулювання робить явний зв'язок між категорійним та поліноміальним розподілами шляхом розгляду категорійного розподілу як окремого випадку поліноміального розподілу, в якому параметр n поліноміального розподілу (кількість елементів вибірки) зафіксовано на рівні 1. В цьому формулюванні простір елементарних подій може розглядатися як множина закодованих як 1-із-K[4] випадкових векторів x розмірності k, які мають таку властивість, що рівно один елемент кожного з них має значення 1, а всі інші мають значення 0. Конкретний елемент, який має значення 1, вказує, яку категорію було обрано. Функцією маси ймовірностіf у цьому формулюванні є
де представляє ймовірність побачити елемент , а .
Це є формулюванням, прийнятим Бішопом[en].[4][прим. 1]
Властивості
Цей розподіл повністю задається ймовірностями, пов'язаними з кожним із чисел i: , i = 1,...,k, де . Ці можливі ймовірності в точності є стандартним -вимірним симплексом; для k = 2 це вироджується до можливих імовірностей розподілу Бернуллі, що є 1-симплексом,
Цей розподіл є окремим випадком «багатовимірного розподілу Бернуллі»,[5] в якому в точності одна з k змінних 0-1 набуває значення одиниці.
Нехай буде реалізацією з категоричного розподілу. Визначмо випадковий вектор Y як складений з елементів
де I є індикаторною функцією. Тоді Y має розподіл, який є окремим випадком поліноміального розподілу з параметром . Сума таких незалежних та однаково розподілених змінних Y, побудована з категорійного розподілу з параметром , є поліноміально розподіленою з параметрами та .
Достатньою статистикою з n незалежних спостережень є набір кількостей (або, рівнозначно, пропорція) спостережень у кожній категорії, де загальна кількість спроб (=n) є фіксованою.
У баєсовій статистицірозподіл Діріхле є спряженим апріорним розподілом категорійного розподілу (а також і поліноміального розподілу). Це означає, що в моделі, яка складається з точок даних, які мають категорійний розподіл з невідомим вектором параметрів p, і (в стандартному баєсовому стилі) ми обираємо розгляд цього параметру як випадкової змінної, і даємо йому апріорний розподіл, визначений із застосуванням розподілу Діріхле, то апостеріорний розподіл цього параметру, після включення знання, отриманого зі спостережених даних, також є розподілом Діріхле. Інтуїтивно зрозуміло, що в такому випадку, виходячи з того, що ми знаємо про параметр до спостереження точки даних, ми потім можемо уточнити наше знання на основі цієї точки даних, у кінцевому підсумку з новим розподілом такого ж вигляду, як і старий. Це означає, що ми можемо послідовно уточнювати наше знання про параметр, включаючи нові спостереження по одному за раз, не впадаючи в математичні ускладнення.
Формально це може бути виражено наступним чином. Якщо задано модель
Це співвідношення використовується в баєсовій статистиці для оцінки параметру p, що лежить в основі категорійного розподілу, при заданій сукупності N зразків. Інтуїтивно зрозуміло, що ми можемо розглядати гіперапріорний[en] вектор α як псевдолічильники[en], тобто як представлення кількості спостережень у кожній з категорій, що ми вже бачили. Тоді ми просто додаємо кількості для всіх нових спостережень (вектор c), щоби вивести апостеріорний розподіл.
Це каже, що очікувана ймовірність побачити категорію i серед різних дискретних розподілів, породжених апостеріорним розподілом, просто дорівнює пропорції випадків цієї категорії, в дійсності побачених у даних, включно із псевдолічильниками в апріорному розподілі. Це підсилює інтуїтивний сенс: Якщо, наприклад, є три можливі категорії, й ми бачили категорію 1 у наших спостережених даних 40% часу, то ми також очікуватимемо в середньому бачити категорію 1 40% часу і в апостеріорному розподілі.
(Зауважте, що ця інтуїція ігнорує вплив апріорного розподілу. Крім того, важливо мати на увазі, що апостеріорне є розподілом над розподілами. Слід пам'ятати, що апостеріорний розподіл в цілому говорить нам, що ми знаємо про досліджуваний параметр, і в цьому випадку сам параметр є дискретним розподілом імовірності, тобто справжнім категорійним розподілом, який породив наші дані. Наприклад, якщо ми бачили 3 категорії у співвідношенні 40:5:55 у наших спостережуваних даних, тоді, нехтуючи впливом апріорного розподілу, ми очікуватимемо, що істинний параметр — тобто, істинний розподіл, який лежить в основі наших спостережених даних, які він породив — матиме середнє значення (0.40,0.05,0.55), яке насправді є тим, про що нам говорить апостеріорний розподіл. Проте справжнім розподілом в дійсності міг би бути (0.35,0.07,0.58), або (0.42,0.04,0.54), або багато інших близьких можливостей. Ступінь вплутаної тут невизначеності визначається дисперсією апостеріорного, яка контролюється загальним числом спостережень — що більше даних ми спостерігаємо, то менше невизначеності про істинний параметр.)
(Формально, апріорний параметр слід розглядати як такий, що представляє апріорних спостережень категорії . Тоді уточнений апостеріорний параметр представляє апостеріорних спостережень. Це відображає той факт, що розподіл Діріхле з має абсолютно пласку форму — по суті, рівномірний розподіл над симплексом можливих значень p. Логічно, що плаский розподіл такого виду представляє повне незнання, що відповідає відсутності спостережень будь-якого виду. Проте математичне уточнення апостеріорного працює добре, якщо ми ігноруємо член , і просто думаємо про вектор α як такий, що прямо представляє набір псевдолічильників. Крім того, така практика дозволяє уникати проблеми інтерпретування значень , менших за 1.)
Зверніть увагу на різні взаємозв'язки між цією формулою, та попередніми:
Передбачувана апостеріорна ймовірність побачити певну категорію є такою ж, як і відносна пропорція попередніх спостережень у цій категорії (включно із псевдо-спостереженнями в апріорному). Це має логічний сенс — інтуїтивно ми очікуватимемо побачити певну категорію відповідно до частоти, з якою її вже було спостережувано.
Передбачувана апостеріорна ймовірність є такою ж, як і математичне сподівання апостеріорного розподілу. Це пояснюється докладніше нижче.
В результаті цю формулу може бути виражено просто як «передбачувана апостеріорна ймовірність побачити категорію є пропорційною до загального спостереженого числа цієї категорії», або як «очікуване число категорії є таким самим, як і загальне спостережене число цієї категорії», де «спостережене число» включає псевдо-спостереження апріорного.
Причина рівнозначності між передбачуваною апостеріорною ймовірністю та математичним сподіванням апостеріорного розподілу p стає очевидною, щойно ми переглядаємо наведену вище формулу. Як описано в статті про передбачуваний апостеріорний розподіл[en], формула передбачуваної апостеріорної ймовірності має вигляд математичного сподівання, взятого по відношенню до апостеріорного розподілу:
Вирішальним рядком вище є третій. Другий випливає безпосередньо з визначення математичного сподівання. Третій рядок є особливим для категорійного розподілу, і випливає з того факту що, конкретно в категорійному розподілі, математичне сподівання побачити певне значення i безпосередньо вказується пов'язаним параметром pi. Четвертий рядок є просто переформулюванням третього в іншому записі, із застосуванням наведеного вище запису математичного сподівання, взятого по відношенню до апостеріорного розподілу параметрів.
Звернімо також увагу, що відбувається у сценарії, в якому ми спостережуємо точки даних одна за одною, і кожного разу розглядаємо їхню передбачувану ймовірність перед спостереженням точки даних та уточненням апостеріорного. Для будь-якої заданої точки даних ймовірність того, що ця точка набуде певної категорії, залежить від кількості точок даних, що вже є в цій категорії. Якщо категорія має високу частоту трапляння, тоді нові точки правдоподібніше приєднаються до цієї категорії — збагачуючи далі ту саму категорію. Цей тип сценарію часто називають моделлю переважного приєднання (або «багатий стає багатшим»). Це моделює багато процесів реального світу, і в таких випадках вибори, зроблені кількома першими точками даних, мають дуже великий вплив на решту точок даних.
Припустімо, що нам дано розподіл, виражений як «пропорційно до» якогось виразу, з невідомою нормувальною сталою[en]. Тоді, перш ніж брати якісь зразки, ми готуємо деякі значення в такий спосіб:
Обчислити не нормоване значення розподілу для кожної з категорій.
Підсумувати їх, і поділити кожне значення на цю суму, щоби унормувати[en] їх.
Накласти якийсь порядок на категорії (наприклад, індексом, який проходить значення від 1 до k, де k є числом категорій).
Перетворити ці значення на кумулятивну функцію розподілу (КФР) заміною кожного значення сумою всіх попередніх значень. Це може бути здійснено за час O(k). Отриманим в результаті значенням для першої категорії буде 0.
Потім, кожного разу, як потрібно вибрати значення:
Визначити найбільше число в КФР, чиє значення є меншим або рівним щойно обраному числу. Це може здійснюватися за час O(log(k)), бінарним пошуком.
Повернути категорію, яка відповідає цьому значенню КФР.
Якщо потрібно вибирати багато значень з одного й того ж категорійного розподілу, то ефективнішим може бути наступний підхід. Він вибирає n зразків за час O(n) (за припущення, що наближення O(1) використовується для вибору значень з біноміального розподілу[6]).
функція вибрати_категорійно(n) // де n є числом зразків, які потрібно вибрати з категорійного розподілу
r = 1
s = 0
для i від 1 до k // де k є числом категорій
v = вибрати з біноміального розподілу (n, p[i] / r) // де p[i] є ймовірністю категорії i
для j від 1 до v
z[s++] = i // де z є масивом, у якому зберігаються результати
n = n - v
r = r - p[i]
перемішати (випадково перевпорядкувати) елементи в z
повернути z
Вибірка через розподіл Гумбеля
В машинному навчанні є типовим параметризувати категорійний розподіл через необмежене представлення в , складові якого задаються як
де є будь-якою дійсною сталою. Маючи це представлення, можна відтворити із застосуванням нормованої експоненційної функції, з чого потім можна робити вибірку за описаних вище методик. Проте існує пряміший метод вибірки, який використовує вибірку з розподілу Гумбеля[en].[7] Нехай будуть k незалежними виборами зі стандартного розподілу Гумбеля, тоді
буде вибіркою з бажаного категорійного розподілу. (Якщо є вибіркою зі стандартного рівномірного розподілу, то є вибіркою зі стандартного розподілу Гумбеля.)
United States Army training course This article relies excessively on references to primary sources. Please improve this article by adding secondary or tertiary sources. Find sources: Sapper Leader Course – news · newspapers · books · scholar · JSTOR (January 2024) (Learn how and when to remove this template message) Sapper Leader CourseA Sapper Instructor instructs students during the boat rigging event.Active1985–presentCountry United StatesBr...
Copa Colsanitas 2008 Sport Tennis Data 18 febbraio – 24 febbraio Edizione 11a Superficie Terra rossa Campioni Singolare Nuria Llagostera Vives Doppio Iveta Benešová / Bethanie Mattek 2007 2009 Il Copa Colsanitas 2008, noto anche come Copa Colsanitas Santander 2008 per motivi di sponsorizzazione, è stato un torneo di tennis giocato sulla terra rossa. È stata l'11ª edizione del Copa Colsanitas, che fa parte della categoria Tier III nell'ambito del WTA Tour 2008. Si è giocato al Club Ca...
Adam Hložek Hložek, 2019Informasi pribadiNama lengkap Adam HložekTanggal lahir 25 Juli 2002 (umur 21)Tempat lahir Ivančice, Republik CekoTinggi 188 m (616 ft 10 in)Posisi bermain WingerInformasi klubKlub saat ini Sparta PragueNomor 20Karier junior Sparta PragueKarier senior*Tahun Tim Tampil (Gol)2018– Sparta Prague 92 (31)Tim nasional‡2017 Czech Republic U15 5 (4)2017–2018 Czech Republic U16 10 (7)2018–2019 Czech Republic U17 10 (5)2019– Czech Republic U21 8...
Stade Amédée-ProuvostVue du stade en 1927GénéralitésAdresse rue Charles Castermant, WattrelosConstruction et ouvertureConstruction 1923Ouverture 1927Fermeture 1977UtilisationClubs résidents FC Roubaix (1923-1929)Excelsior de Roubaix (1929-1945)CO Roubaix-Tourcoing (1945-1970)Propriétaire Commune de Wattrelos (d)Administration Commune de Wattrelos (d)LocalisationCoordonnées 50° 42′ 16″ N, 3° 11′ 43″ ELocalisation sur la carte de FranceLocalisatio...
Timeline of the history of Jerusalem Part of a series onJerusalem History Timeline City of David Second Temple Period Aelia Capitolina Middle Ages Early Muslim period Kingdom of Jerusalem Mutasarrifate British Mandate Israeli takeover of West Jerusalem Jordanian annexation of East Jerusalem Israeli annexation of East Jerusalem Sieges Before Common Era 701 BCE 597 BCE 587 BCE 63 BCE 37 BCE Common Era 70 614 637 1099 1187 1244 1834 1917 1948 Places East West Old City Temple Mount/Al-Aqsa Dome o...
Independent or autonomous entity whose territory consists of a city For administrative divisions that cover only cities, see Independent city. Part of the Politics seriesPolitics Outline Index Category Primary topics Outline of political science Index of politics articles Politics by country Politics by subdivision Political economy Political history Political history of the world Political philosophy Political systems Anarchy City-state Collective leadership Democracy Dictatorship Directoria...
Medical conditionLatrodectismThe southern black widow spider (Latrodectus mactans), a cause of latrodectismSpecialtyEmergency medicine Latrodectism (/lætrəˈdɛktɪzəm/) is the illness caused by the bite of Latrodectus spiders (the black widow spider and related species). Pain, muscle rigidity, vomiting, and sweating are the symptoms of latrodectism. There are several spider species all named black widow: southern black widow spider (L. mactans), the European black widow (L....
قرية بني رشيد - قرية - تقسيم إداري البلد اليمن المحافظة محافظة صنعاء المديرية مديرية أرحب العزلة عزلة زندان السكان التعداد السكاني 2004 السكان 638 • الذكور 330 • الإناث 308 • عدد الأسر 61 • عدد المساكن 55 معلومات أخرى التوقيت توقيت اليمن (+3 غرينيتش) ت...
Universalist college in Galesburg, Illinois (1853–1930) For the former Lombard College in Paris, see Irish College, Paris. This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Lombard College – news · newspapers · books · scholar · JSTOR (June 2016) (Learn how and when to remove this message)Lombard College bui...
Election in Colorado Main article: 1884 United States presidential election 1884 United States presidential election in Colorado ← 1880 November 4, 1884 1888 → Nominee James G. Blaine Grover Cleveland Party Republican Democratic Home state Maine New York Running mate John A. Logan Thomas A. Hendricks Electoral vote 3 0 Popular vote 36,084 27,723 Percentage 54.25% 41.68% County Results Blaine 50-60% 60-70% Cleveland ...
Margaret Mead Margaret Mead (16 Desember 1901 – 15 November 1978) adalah seorang antroplog budaya Amerika.[1] Mead dilahirkan di Philadelphia, Pennsylvania dan dibesarkan di kota Doylestown, Pennsylvania yang tidak jauh dari situ. Ayahnya adalah seorang profesor di sebuah universitas, sementara ibunya seorang aktivis sosial. Mead lulus dari Barnard College pada 1923 dan mendapatkan gelar Ph.D.nya dari Universitas Columbia pada 1929. Pada tahun 1925 ia berangkat untuk melakukan penel...
Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada November 2022. Christian Tybring-Gjedde Anggota Parlemen NorwegianPetahanaMulai menjabat 1 Oktober 2005Daerah pemilihanOslo Informasi pribadiLahir8 Agustus 1963 (umur 60)Oslo, NorwegiaKebangsaanNorwegiaSuami/istriIngvil Smines Tybring-GjeddeAnak4Alma materL...
Jenny from the BlockSingel oleh Jennifer Lopez featuring Jadakiss dan Styles Pdari album This Is Me... ThenDirilis26 September 2002 (2002-09-26)Genre R&B old school hip hop Durasi3:08LabelEpicPencipta Jennifer Lopez Troy Oliver Andre Deyo Samuel Barnes Jean Claude Olivier Jose Fernando Arbex Miro Lawrence Parker Scott Sterling Michael Oliver David Styles Jason Phillips Produser Troy Oliver Cory Rooney Poke and Tone Kronologi singel Jennifer Lopez Alive (2002) Jenny from the Bloc...
Peta menunjukan lokasi Caramoran Caramoran adalah munisipalitas yang terletak di provinsi Catanduanes, Filipina. Pada tahun 2007, munisipalitas ini memiliki populasi sebesar 25.618 jiwa atau 4.293 rumah tangga. Pembagian wilayah Secara politis Caramoran terbagi menjadi 27 barangay, yaitu: Barangay Penduduk(2007) Baybay (Pob.) 708 Bocon 280 Bothoan (Pob.) 982 Buenavista 462 Bulalacao 489 Camburo 625 Dario 1,776 Datag East 666 Datag West 1,017 Guiamlong 531 Hitoma 588 Icanbato (Pob.) 777 Inalma...
World War Z Título Guerra mundial ZFicha técnicaDirección Marc ForsterProducción Brad PittDede GardnerJeremy KleinerIan BryceGuion Matthew Michael CarnahanDamon LindelofDrew GoddardHistoria Matthew Michael CarnahanJ. Michael StraczynskiBasada en Guerra mundial Z, de Max BrooksMúsica Marco BeltramiFotografía Ben SeresinMontaje Roger BartonMatt ChesseVestuario Mayes C. RubeoProtagonistas Brad PittMireille EnosFana MokoenaDaniella KerteszJames Badge Dale Ver todos los créditos (IMDb)Datos...
Rockets de Houston Généralités Noms précédents Rockets de San Diego 1967–1971 Fondation 1967 Couleurs Salle Toyota Center18 300 places Siège Houston Texas États-Unis Championnat actuel NBA Propriétaire Tilman Fertitta (en) Président Gretchen Sheirr Manager Rafael Stone (en) Entraîneur Ime Udoka Palmarès principal National[1] 21994, 1995 Maillots Association Icon Statement Actualités Pour la saiso...