Математичне сподівання

Математи́чне сподіва́ння,[1] сере́днє зна́чення — одна з основних числових характеристик кожної випадкової величини. Воно є узагальненим поняттям середнього значення сукупності чисел на той випадок, коли елементи множини значень цієї сукупності мають різну «вагу», ціну, важливість, пріоритет, що є характерним для значень випадкової змінної[2]. В теорії ймовірностей, математичне сподівання випадкової величини, інтуїтивно, є середнім значенням при довгостроковому повторенні одного і того ж експеримента, який воно представляє. Наприклад, математичне сподівання при підкиданні шестигранної гральної кісточки становить 3,5, оскільки середнє значення з усіх чисел, які можуть випасти становить 3,5 із тим як кількість підкидань прямує до нескінченності. Іншими словами, закон великих чисел стверджує, що середнє арифметичне всіх значень майже певно збігається до математичного сподівання, із тим як кількість повторів даного експерименту прямує до нескінченності. Математичне сподівання також іноді називають сподіванням, середнім, середнім значенням, або першим моментом.

Оскільки, випадкова величина може бути дискретною або задана густиною розподілу ймовірностей, тому теорія ймовірностей наводить два означення математичного сподівання. У більш практичному розумінні, математичне сподівання дискретної випадкової величини є середнім зваженим по імовірності для всіх можливих значень. Іншими словами, кожне можливе значення випадкової величини фактично є помножене на його імовірність виникнення, і отриманий добуток складається у загальну суму, яка утворює математичне сподівання. Той самий принцип застосовується і для абсолютно неперервних випадкових величин, за винятком того, що сума замінюється на інтеграл для даної випадкової величини, по відношенню до її функції густини імовірностей. Формальне визначення охоплює обидва ці випадки, а також передбачає розподіли, які не є ні дискретними ні абсолютно неперервними; математичне сподівання випадкової величини є інтегралом, аргументом якого є ця випадкова величина відповідно до її міри імовірності[3][4].

Математичне сподівання не існує для випадкових величин, що мають певні розподіли імовірностей із великими "хвостами"[en], як наприклад, Розподіл Коші.[5] Для таких випадкових величин, довгий хвіст розподілу не передбачає, що сума або інтеграл будуть збіжними.

Математичне сподівання є ключовим аспектом, який характеризує розподіл ймовірностей; воно є одним із різновидів коефіцієнта зсуву. На противагу йому, дисперсія є мірою розсіяння можливих значень випадкової величини довкола математичного сподівання. Дисперсія сама по собі визначається в термінах двох математичних сподівань: це математичне сподівання квадратичного відхилення значень випадкової величини від математичного сподівання.

Означення 1

Нехай дискретна випадкова змінна може набувати значення відповідно з ймовірностями причому .

  • Означення Чебишова: Математичним сподіванням будь-якої величини називається сума всіх можливих для неї значень, помножених на їхні ймовірності:[6]
,

де

 — це середнє значення випадкової величини , областю можливих значень якої є множина ;
 — оператор математичного сподівання;
 — математичне сподівання величини .


Ілюстрація збіжності середнього для послідовності кидання грального кубика до сподівання 3.5 при постійному збільшенні кількості спроб.

Приклади

  • Нехай задає множину подій при підкиданні гральної кістки із шістьма сторонами. Результатом буде кількість точок на верхній грані після підкидання гральної кістки. Можливими значеннями, які прийматиме є 1, 2, 3, 4, 5, і 6, всі є рівноймовірними (кожне значення має ймовірність 16). Математичним сподіванням для буде
Якщо підкинути гральну кістку разів і розрахувати середнє (середнє арифметичне) всіх результатів, із збільшенням , середнє буде майже певне збігатися до значення сподівання. Цей факт відомий як закон великих чисел. Одним із прикладів послідовності десяти випадань гральної кістки є 2, 3, 1, 2, 5, 6, 2, 2, 2, 6, для якого середнє буде дорівнювати 3.1, що відрізняється від математичного сподівання 3.5 на число 0.4. Зближення є відносно повільним: ймовірність що середнє знаходитиметься в межах 3.5 ± 0.1 дорівнює 21.6 % для десяти спроб, 46.1 % для сотні спроб і 93.7 % для тисячі спроб. Див. графік на якому показані середні для довших послідовностей кидання гральної кістки на якому видно як вони збігаються до математичного сподівання із значенням в 3.5. У загальному випадку, швидкість зближення можна приблизно розрахувати за допомогою, наприклад, нерівності Чебишова і теореми Беррі-Ессіна[en].
  • При грі в рулетку невелика кулька може потрапити в одну із 38 пронумерованих секцій колеса, що розміщені по колу. Коли колесо розкручують кулька ударяється і рухається випадковим чином доки не зупиниться в одному з секторів. Нехай випадкова величина задає (грошовий) виграш при ставці в $1 на одне число («пряма» ставка). Якщо ставка виграє (що трапиться із ймовірністю 138), виграш становитиме $35; в іншому випадку гравець втрачає ставку. Очікуваним прибутком від такої ставки буде
Тобто, ставка в $1 коштуватиме втраті $0.0526, точніше її сподіванням є -$0.0526.

Означення 2

Нехай випадкова змінна задана густиною розподілу ймовірностей : , .

  • Математичним сподіванням такої числової змінної , якщо воно існує, називають інтеграл, узятий по області існування її густини розподілу, від добутку цієї випадкової змінної на її густину розподілу, тобто:
.

Математичне подівання існує, якщо цей інтеграл абсолютно збіжний.

Деякі формули для обчислення математичного сподівання

Абстрактний інтеграл, що фігурує в означенні математичного сподівання, можна замінити відповідним інтегралом Лебега-Стілтьєса. Розглянемо випадок композиції борелівської функції та випадкової величини  :

,

де  — функція розподілу випадкової величини .

Від цієї залежності приходимо до такої формули:

Основні властивості математичного сподівання

  1. Якщо та  — незалежні інтегровні випадкові величини, то .
  2. Якщо та  — інтегровні випадкові величини, то .
  3. Якщо  — інтегровна випадкова величина, то .

Нижченаведені властивості повторюють властивості інтеграла Лебега, або безпосередньо випливають із них.

Якщо є випадковою подією, тоді де це індикаторна функція для множини .

Доведення. За визначенням інтеграла Лебега для простої функції ,

Якщо X = Y тоді E[X] = E[Y]

Це твердження випливає із визначення інтеграла Лебега, якщо взяти до уваги, що , , і що заміна простої випадкової величини на множину із нульовою імовірністю не змінює математичного сподівання.

Математичне сподівання для сталої

Якщо це випадкова величина, і , де , тоді . Зокрема, для довільної випадкової величини , .

Лінійність

Оператор математичного сподівання є лінійним в тому сенсі, що

де і є (довільними) випадковими величинами, і є скаляром.

Більш суворо, нехай і  — випадкові величини, які мають визначені математичні сподівання (що відмінні від ).

  • Якщо також визначене (тобто відмінне від ), тоді
  • нехай є скінченним, а є скінченним скаляром. Тоді

E[X] існує і є скінченним тоді і тільки тоді, коли E[|X|] є скінченним

Такі твердження відносно випадкової величини  — еквівалентні:

  • існує і є скінченним.
  • Обидва і є скінченними.
  • скінченне.

Насправді, . Відповідно до властивості лінійності, . Вищенаведена рівність спирається на визначення інтегралу Лебега і вимірність .

Завдяки цьому, вирази про те що « є інтегрованою» і «математичне сподівання є скінченним» є зрештою взаємозамінними, якщо говорять про випадкову величину.

Якщо X ≥ 0 тоді E[X] ≥ 0

Монотонність

Якщо (a.s.), і обидва та існують, тоді .

Зауваження. and існую в тому розумінні, що and

Доведення випливає із властивості лінійності і попередньої властивості, якщо задати і звернути увагу на те, що (майже скрізь).

Якщо (майже скрізь) і є скінченною, тоді так само і для

Нехай і є випадковими величинами, такими що (майже скрізь) і . Тоді .

Доведення. Завдяки не від'ємності , існує, скінченне або нескінченне. Відповідно до властивості монотонності, , тож є скінченним, що в свою чергу як ми бачили буде еквівалентне тому, що є скінченним.

Якщо та тоді

Нижченаведене твердження буде використане для доведення властивості екстремальності для .

Твердження. Якщо є випадковою величиною, тоді так само буде і , для будь-якого . Якщо в додаток до того, і , тоді .

Доведення.
Аби зрозуміти чому перше твердження є справедливим, зауважимо, що є композицією із та . Оскільки це буде композицією двох вимірних функцій, то також є вимірною.

Аби довести друге твердження, визначимо

Можна перевірити, що є випадковою величиною і . Відповідно до властивості невід'ємності,

Відповідно до властивості монотонності,

Протилежний приклад для нескінченної міри

Вимога, що є суттєвою. Як протилежний приклад розглянемо вимірний простір

де це Борелівська -алгебра над інтервалом і є лінійною мірою Лебега. Можна довести, що навіть якщо ( і визначають міру над Зважаючи на неперервність для і спростивши інтеграл Рімана для кожного скінченного інтервала ), отримаємо необхідне доведення.

Властивість екстремальності

Відповідно до того, що було доведено вище, якщо це випадкова змінна, тоді так само і .

Твердження (властивість екстремальності для ). Нехай є випадковою величиною, і . Тоді і є скінченними, а найкраща апроксимація методом найменших квадратів для серед сталих. Зокрема,

  • для кожного ,
  • рівняння буде дійсним тоді і тільки тоді, коли

( позначає дисперсію величини ).

Пояснення (інтуїтивно зрозуміла інтерпретація властивості екстремальності). У простому розумінні, властивість екстремальності стверджує, що якщо існує задача передбачення результату[en] випробування для випадкової величини , тоді , в деякому практичному сенсі, є найкращим закладом (передбачення) якщо немає попередньої інформації про результат. З іншого боку, якщо в результаті отриманого результату існує деяке уточнене знання , тоді — знов, в деякому практичному сенсі — передбачення можна покращити використовуючи умовні математичні сподівання (серед яких є особливим випадком) замість .

Доведення твердження. Відповідно до попередніх властивостей, і обидва є скінченними, і

звідки випливає властивість екстремальності.

Невиродженість

Якщо , тоді (майже певно).

Якщо тоді (майже певно)

Наслідок: якщо тоді (майже певно)

Наслідок: якщо тоді (майже певно)

Для довільної випадкової величини буде вірною властивість , .

Доведення. Відповідно до визначення інтеграла Лебега,

Відмітимо, що цей самий результат можна довести за допомогою нерівності Єнсена.

Немультиплікативність

У загальному випадку, оператор математичного сподівання не є мультиплікативним, тобто не обов'язково дорівнюватиме . Насправді, нехай приймає значення 1 та -1 із імовірністю 0.5 кожне. Тоді

і

Величина, на яку відрізняється мультиплікативність називається коваріацією:

Однак, якщо випадкові величини і є незалежними, тоді , та .

Протилежний приклад: незважаючи на це поточково

Нехай задає ймовірнісний простір, де є Борелівською -алгеброю над і є лінійною мірою Лебега. Для визначимо послідовність випадкових величин

і випадкову величину

в інтервалі , і де є індикаторною функцією над множиною .

Для кожного при тому як і

тож З іншого боку, і таким чином

Зліченна неадитивність

У загальному випадку, оператор математичного сподівання не -адитивний, тобто

Розглянемо обернений приклад, нехай є ймовірнісним простором, де це Борелівська -алгебра у інтервалі і це лінійна міра Лебега. Визначимо послідовність випадкових величин у , де задає індикаторну функцію над множиною . Для поточкових сум, матимемо що

Відповідно до скінченності адитивності,

З іншого боку, і тому

Зліченна адитивність для не від'ємних випадкових величин

Нехай  — невід'ємні випадкові величини. Із теореми про монотонну збіжність випливає, що

Нерівності

Нерівність Коші — Буняковського — Шварца

Нерівність Коші — Буняковського стверджує, що

Нерівність Маркова

Для невід'ємної випадкової величини та , нерівність Маркова стверджує, що

Нерівність Чебишова

Нехай є довільною випадковою величиною із скінченним математичним сподіванням і скінченною дисперсією . Нерівність Чебишова стверджує що, для будь-якого дійсного числа ,

Нерівність Єнсена

Докладніше: Нерівність Єнсена

Нехай функція є Борелівською опуклою функцією і  — випадкова величина, для якої . Нерівність Єнсена стверджує, що

Примітка 1. Математичне сподівання є добре визначеним навіть якщо може приймати нескінченні значення. Насправді, передбачає, що (майже певно), тому випадкова величина майже певно є визначеною, і таким чином є достатньо інформації для розрахунку .

Примітка 2. Нерівність Єнсена передбачає, що оскільки, функція абсолютного значення є опуклою.

Нерівність Ляпунова

Нехай . Нерівність Ляпунова стверджує, що

Доведення. Застосувавши Нерівність Єнсена до і , отримаємо . Знайшовши -ий корінь для кожної сторони отримаємо те, що необхідно було довести.

Наслідок.

Нерівність Гельдера

Нехай та задовольняють умовам , , і . Нерівність Гельдера стверджує, що

Нерівність Мінковського

Нехай є цілим числом, що задовольняє умові . Крім того, нехай і . тоді відповідно до нерівності Мінковського, і

Розрахунок границь під знаком оператора

Теорема про монотонну збіжність

Нехай послідовність випадкових величин і випадкових величин та визначені у одному і тому ж ймовірносному просторі Припустимо, що

  • всі математичні сподівання та є визначеними (відрізняються від );
  • для кожного
  • це поточкова границя для (майже певно), тобто (майже певно).

Теорема про монотонну збіжність стверджує, що

Лема Фату

Докладніше: Лема Фату

Нехай послідовність випадкових величин і окрема випадкова величина будуть визначені в єдиному ймовірнісному просторі Припустимо, що

  • всі математичні сподівання і визначені (відрізняються від );
  • (м.п.), для кожного

Лема Фату стверджує, що

(Зауважимо, що є випадковою величиною, для кожного відповідно до властивостей нижньої границі).

Наслідок. Нехай

  • поточково (м.п.);
  • для деякої сталої (незалежної від );
  • (м.п.), для кожного

Тоді

Доведення виконують спостерігаючи за тим, що (м.п.) і застосовуючи лему Фату.

Теорема про мажоровану збіжність

Нехай є послідовністю випадкових величин. Якщо поточково (м.п.), (м.п.), та . Тоді, відповідно до теореми про мажоровану збіжність,

  • функція від є вимірною (hence a random variable);
  • ;
  • всі математичні сподівання та є визначеними (не приймають форму );
  • (обидві сторони рівняння можуть бути скінченними);

Зв'язок із характеристичною функцією

Функція густини імовірностей для скалярної випадкової величини пов'язана із її характеристичною функцією через формулу обернення:

Для математичного сподівання величини (де є функцією Бореля), ми можемо використати формулу обернення аби отримати

Якщо є скінченним, змінивши порядок інтегрування і відповідно до теореми Фубіні-Тонеллі, отримаємо

де

є перетворенням Фур'є для Вираз для випливає напряму із теореми Планшереля.

Приклад випадкової величини, що не має математичного сподівання

Нехай випадкова величина розподілена за законом Коші з параметрами та , тобто . Ця випадкова величина має щільність:

.

Знайдемо її математичне сподівання.

.

Наявність логарифма в останньому виразі робить неможливим обчислення цього інтегралу (внаслідок необмеженості логарифма при необмеженому аргументі), що і доводить відсутність математичного сподівання випадкової величини .

Застосування

Існує можливість побудувати таке математичне сподівання, яке буде дорівнювати імовірності події, якщо розраховувати його як математичне сподівання від індикаторної функції, яка приймає за одиницю факт виникнення події, і нуль у іншому випадку. Цей взаємозв'язок може використовуватися для застосування властивостей математичного сподівання і поширення їх до властивостей імовірностей, тобто, використовувати закон великих чисел, щоб обґрунтувати спосіб оцінки імовірностей за допомогою визначення частоти їх виникнення.

Математичні сподівання для різних степенів величини X називаються моментами величини X; центральний момент довкола середнього значення величини X це математичні сподівання степенів X − E[X]. Моменти деяких випадкових величин можуть використовуватися для визначення їх розподілів, через їх твірні функції моментів.

Для того, щоб імпіричним шляхом знайти оцінку математичного сподівання деякої випадкової величини, на основі неодноразово отриманих вимірах спостережень необхідно розрахувати середнє арифметичне значення для цих результатів. Якщо математичне сподівання існує, ця процедура дозволяє оцінити істинне математичне сподівання незміщеного виду і дозволяє мінімізувати суму квадратів залишків (суму квадратичних відстаней між спостереженнями і статистичними оцінками). Закон великих чисел демонструє (при досить м'яких умовах) що, із збільшенням розміру вибірки, дисперсія цієї статистичної оцінки зменшується.

Цю властивість використовують у дуже широкому колі різноманітних застосувань, включаючи загальні задачі теорії статистичного оцінювання та машинного навчання, що дозволяє оцінити (ймовірнісні) величини, що представляють інтерес, за допомогою методів Монте-Карло, оскільки більшість з цих величин можна представити у вигляді математичних сподівань, тобто , де є характеристичною функцією для множини .

Масовий розподіл імовірностей збалансований довкола математичного сподівання, тут наведено Бета-розподіл Beta(α,β) із математичним сподіванням α/(α+β).

В класичній механіці, the центр мас є поняттям, яке аналогічне математичному сподіванню. Наприклад, припустимо, що X це дискретна випадкова величина, що приймає значення xi і має відповідні імовірності pi. Розглянемо невагомий стрижень, на якому здовж цього стрижня розміщені елементи ваги, в місцях розташування xi, які мають маси pi (сума яких дорівнює одиниці). Точка, в якій цей стрижень буде збалансований буде відповідати E[X].

Математичні сподівання також можна використовувати для розрахунку дисперсії, за допомогою формули розрахунку дисперсії:

Дуже важливою областю застосування математичного сподівання є квантова механіка. Математичне сподівання для оператора квантової механіки , що виконує операцію над вектором квантового стану записується як . Невизначеність для можна розрахувати за допомогою формули .

Див. також

Джерела

Примітки

  1. Швець, В. Т. (2018). Теорія ймовірностей і математична статистика (PDF). Одеса: ВМВ. Архів оригіналу (PDF) за 2 квітня 2019. Процитовано 2 квітня 2019.
  2. Сеньо П. С. Теорія ймовірностей та математична статистика: Підручник. — 2-ге вид., перероб. і доп. — К.: Знання, 2007. — 556 с. — ISBN 966-346-284-1.
  3. Sheldon M Ross (2007). §2.4 Expectation of a random variable. Introduction to probability models (вид. 9th). Academic Press. с. 38 ff. ISBN 0-12-598062-0. Архів оригіналу за 6 січня 2017. Процитовано 17 березня 2019.
  4. Richard W Hamming (1991). §2.5 Random variables, mean and the expected value. The art of probability for scientists and engineers. Addison–Wesley. с. 64 ff. ISBN 0-201-40686-1. Архів оригіналу за 6 січня 2017. Процитовано 17 березня 2019.
  5. Richard W Hamming (1991). Example 8.7–1 The Cauchy distribution. The art of probability for scientists and engineers. Addison-Wesley. с. 290 ff. ISBN 0-201-40686-1. Архів оригіналу за 22 березня 2015. Процитовано 17 березня 2019. Sampling from the Cauchy distribution and averaging gets you nowhere — one sample has the same distribution as the average of 1000 samples!
  6. Чебышев П. Л. Полное собрание сочинений. — Математический анализ. — М.- Л., 1947. — С. 431.