Регрессия (математика)

Регре́ссия (лат. regressio — обратное движение, отход) в теории вероятностей и математической статистике — односторонняя стохастическая зависимость, устанавливающая соответствие между случайными переменными[1], то есть математическое выражение, отражающее связь между зависимой переменной у и независимыми переменными х при условии, что это выражение будет иметь статистическую значимость. В отличие от чисто функциональной зависимости y=f(x), когда каждому значению независимой переменной x соответствует одно определённое значение величины y, при регрессионной связи одному и тому же значению x могут соответствовать в зависимости от случая различные значения величины y. Если при каждом значении наблюдается значений yi1yini величины y, то зависимость средних арифметических от и является регрессией в статистическом понимании этого термина[2].

История

Этот термин в статистике впервые был использован Френсисом Гальтоном (1886) в связи с исследованием вопросов наследования физических характеристик человека. В качестве одной из характеристик был взят рост человека; при этом было обнаружено, что в целом сыновья высоких отцов, что не удивительно, оказались более высокими, чем сыновья отцов с низким ростом. Более интересным было то, что разброс в росте сыновей был меньшим, чем разброс в росте отцов. Так проявлялась тенденция возвращения роста сыновей к среднему (regression to mediocrity), то есть «регресс». Этот факт был продемонстрирован вычислением среднего роста сыновей отцов, рост которых равен 56 дюймам, вычислением среднего роста сыновей отцов, рост которых равен 58 дюймам, и т. д. После этого результаты были изображены на плоскости, по оси ординат которой откладывались значения среднего роста сыновей, а по оси абсцисс — значения среднего роста отцов. Точки (приближённо) легли на прямую с положительным углом наклона меньше 45°; важно, что регрессия была линейной.

Описание

Допустим, имеется выборка из двумерного распределения пары случайных переменных (X, Y). Прямая линия в плоскости (x, y) была выборочным аналогом функции

В теории вероятностей под термином «регрессия» и понимают эту функцию, которая есть ни что иное как условное математическое ожидание случайной переменной Y при условии, что другая случайная переменная X приняла значение x. Если, например, пара (X, Y) имеет двумерное нормальное распределение с E(X)=μ1, E(Y)=μ2, var(X)=σ12, var(Y)=σ22, cor(X, Y)=ρ, то можно показать, что условное распределение Y при X=x также будет нормальным с математическим ожиданием, равным

и дисперсией

В этом примере регрессия Y на X является линейной функцией. Если регрессия Y на X отлична от линейной, то приведённые уравнения — это линейная аппроксимация истинного уравнения регрессии.

В общем случае регрессия одной случайной переменной на другую не обязательно будет линейной. Также не обязательно ограничиваться парой случайных переменных. Статистические проблемы регрессии связаны с определением общего вида уравнения регрессии, построением оценок неизвестных параметров, входящих в уравнение регрессии, и проверкой статистических гипотез о регрессии[3]. Эти проблемы рассматриваются в рамках регрессионного анализа.

Простым примером регрессии Y по X является зависимость между Y и X, которая выражается соотношением: Y=u(X)+ε, где u(x)=E(Y | X=x), а случайные величины X и ε независимы. Это представление полезно, когда планируется эксперимент для изучения функциональной связи y=u(x) между неслучайными величинами y и x. На практике обычно коэффициенты регрессии в уравнении y=u(x) неизвестны и их оценивают по экспериментальным данным.

Линейная регрессия

Представим зависимость y от x в виде линейной модели первого порядка:

Будем считать, что значения x определяются без ошибки, β0 и β1 — параметры модели, а ε — ошибка, распределение которой подчиняется нормальному закону с нулевым средним значением и постоянным отклонением σ2. Значения параметров β заранее не известны и их нужно определить из набора экспериментальных значений (xi, yi), i=1, …, n. Таким образом мы можем записать:

где означает предсказанное моделью значение y при данном x, b0 и b1 — выборочные оценки параметров модели. Определим также  — значение ошибки аппроксимации для -го наблюдения.

Для вычисления параметров модели по экспериментальным данным зачастую используют различные программы, предназначенные для статистической обработки данных. Однако для этого простого случая не сложно выписать подробные формулы[4][5].

Метод наименьших квадратов даёт следующие формулы для вычисления параметров данной модели и их отклонений:

здесь средние значения определяются как обычно: , и se2 обозначает остаточное отклонение регрессии, которое является оценкой дисперсии σ2 в том случае, если модель верна.

Стандартные ошибки коэффициентов регрессии используются аналогично стандартной ошибке среднего — для нахождения доверительных интервалов и проверки гипотез. Используем, например, критерий Стьюдента для проверки гипотезы о равенстве коэффициента регрессии нулю, то есть о его незначимости для модели. Статистика Стьюдента: . Если вероятность для полученного значения и n−2 степеней свободы достаточно мала, например, <0,05 — гипотеза отвергается. Напротив, если нет оснований отвергнуть гипотезу о равенстве нулю, скажем,  — есть основание задуматься о существовании искомой регрессии, хотя бы в данной форме, или о сборе дополнительных наблюдений. Если же нулю равен свободный член , то прямая проходит через начало координат и оценка углового коэффициента равна

,

а её стандартной ошибки

Линия регрессии и 95%-е доверительные области для линии регрессии (пунктиром) и для значений (сплошные границы)

Обычно истинные величины коэффициентов регрессии β0 и β1 не известны. Известны только их оценки b0 и b1. Иначе говоря, истинная прямая регрессии может пройти иначе, чем построенная по выборочным данным. Можно вычислить доверительную область для линии регрессии. При любом значении x соответствующие значения y распределены нормально. Средним является значение уравнения регрессии . Неопределённость его оценки характеризуется стандартной ошибкой регрессии:

Теперь можно вычислить -процентный доверительный интервал для значения уравнения регрессии в точке x:

,

где t(1−α/2, n−2) — t-значение распределения Стьюдента. На рисунке показана линия регрессии, построенная по 10 точкам (сплошные точки), а также 95%-я доверительная область линии регрессии, которая ограничена пунктирными линиями. С 95%-й вероятностью можно утверждать, что истинная линия находится где-то внутри этой области. Или иначе, если мы соберём аналогичные наборы данных (обозначены кружками) и построим по ним линии регрессии (обозначены голубым цветом), то в 95 случаях из 100 эти прямые не покинут пределов доверительной области. (Для визуализации кликните по картинке) Обратите внимание, что некоторые точки оказались вне доверительной области. Это совершенно естественно, поскольку речь идёт о доверительной области линии регрессии, а не самих значений. Разброс значений складывается из разброса значений вокруг линии регрессии и неопределённости положения самой этой линии, а именно:

Здесь m — кратность измерения y при данном x. И -процентный доверительный интервал (интервал прогноза) для среднего из m значений y будет:

.

На рисунке эта 95%-я доверительная область при m=1 ограничена сплошными линиями. В эту область попадает 95 % всех возможных значений величины y в исследованном диапазоне значений x.

Еще немного статистики

Можно строго доказать, что, если условное матожидание некоторой двумерной случайной величины (X, Y) является линейной функцией от , то это условное матожидание обязательно представимо в виде , где E(X)=μ1, E(Y)=μ2, var(X)=σ12, var(Y)=σ22, cor(X, Y)=ρ.

Более того, для уже упомянутой ранее линейной модели , где и  — независимые случайные величины, а имеет нулевое матожидание (и произвольное распределение), можно доказать, что . Тогда с помощью указанного ранее равенства можно получить формулы для и : ,

.

Если откуда-то априори известно, что множество случайных точек на плоскости порождается линейной моделью, но с неизвестными коэффициентами и , можно получить точечные оценки этих коэффициентов по указанным формулам. Для этого в эти формулы вместо матожиданий, дисперсий и корреляции случайных величин X и Y нужно подставить их несмещенные оценки. Полученные формулы оценок в точности совпадут с формулами, выведенными на основе метода наименьших квадратов.

Примечания

  1. Фёрстер Э., Рёнц Б., Методы корреляционного и регрессионного анализа, 1983, с. 15.
  2. Регрессия // Большая советская энциклопедия : [в 30 т.] / гл. ред. А. М. Прохоров. — 3-е изд. — М. : Советская энциклопедия, 1969—1978.
  3. Справочник по прикладной статистике. В 2-х т. Т. 1: Пер. с англ. / Под ред. Э. Ллойда, У. Ледермана, Ю. Н. Тюрина. — М.: Финансы и статистика, 1989. — 510 с. — ISBN 5-279-00245-3
  4. Лаваньини И., Маньо Ф., Сералья Р., Тральди П. Количественные методы в масс-спектрометрии — М.: Техносфера, 2008. — 176 с. — ISBN 978-5-94836-190-1; ISBN 978-0-470-02516-1 (англ.)
  5. Сергиенко В. И., Бондарева И. Б. Математическая статистика в клинических исследованиях. — 2-е изд., перераб. и доп. — М.: ГЭОТАР-Медиа, 2006. — 304 с. — ISBN 5-9704-0197-8

Литература

  • Фёрстер Э., Рёнц Б. Методы корреляционного и регрессионного анализа. Руководство для экономистов. — М.: Финансы и статистика, 1983. — 304 с. — (Библиотечка иностранных книг для экономистов и статистиков).

Ссылки

Read other articles:

Pertempuran Gerbang TrajanusBagian dari Peperangan Romawi Timur-BulgariaReruntuhan benteng Gerbang TrajanusTanggal17 Agustus 986LokasiTrayanovi Vrata, Bulgaria42°21′22″N 23°55′6″E / 42.35611°N 23.91833°E / 42.35611; 23.91833Koordinat: 42°21′22″N 23°55′6″E / 42.35611°N 23.91833°E / 42.35611; 23.91833Hasil Kemenangan menentukan BulgariaPihak terlibat Kekaisaran Bulgaria Pertama Kekaisaran Romawi TimurTokoh dan pemimpin Samu...

 

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Desember 2017. AakatayiNama lainTeluguAakatayi SutradaraRom BhimanaProduserVijay Karan Kaushal Karan Anil Karan.SkenarioRom BhimanaCeritaRom BhimanaPemeranAashish Raj Bidkikar Rukshar Mir Brahmanandam Naveen NeniPenata musikMelody Brama Mani SharmaSinema...

 

Untuk penyakit pada manusia, lihat Infeksi chlamydia. Chlamydia Badan inklusi C. trachomatis (coklat) pada kultur sel McCoy. Klasifikasi ilmiah Domain: Bakteri Filum: Chlamydiae Kelas: Chlamydiae Ordo: Chlamydiales Famili: Chlamydiaceae Genus: Chlamydia Spesies Chlamydia avium Sachse dkk. 2015[1] Chlamydia felis Sachse dkk. 2015[1] Chlamydia gallinacea Sachse dkk. 2015[1] Chlamydia muridarum Everett dkk. 1999Chlamydophila pecorum Fukushi & Hirai 1992, gen. nov. Eve...

Pertempuran PlasseyBagian dari Perang Tujuh TahunLord Clive meeting with Mir Jafar after the Battle of Plassey, oleh Francis Hayman (c. 1762)Tanggal23 Juni 1757LokasiPalashi, Benggala Barat, IndiaHasil Kemenangan East India CompanyPerubahanwilayah Benggala dianeksasi East India Company BritaniaPihak terlibat East India Company Subah Benggala French East India CompanyTokoh dan pemimpin Kolonel Robert CliveMajor KilpatrickMajor GrantMajor Eyre CooteCaptain Gaupp Nawab Bengal Siraj Ud DaulahMoha...

 

صابون حلبيالنوع صابون تعديل - تعديل مصدري - تعديل ويكي بيانات قطعة صابون حلبي الصابون الحلبي أو صابون الغار أو صابون رَگ‍ي[1] هو نوع من أنواع الصابون مُصنَّع من زيت الزيتون أو من زيوت نباتية أخرى وسمي كذلك لأن مدينة حلب في سوريا هي أقدم وأشهر المدن في صناعته.[2][3]&#...

 

This article relies largely or entirely on a single source. Relevant discussion may be found on the talk page. Please help improve this article by introducing citations to additional sources.Find sources: Batasang Pambansa canvass for the 1986 Philippine presidential election – news · newspapers · books · scholar · JSTOR (July 2022) The following is the official canvassing of votes by the Batasang Pambansa for the 1986 Philippine presidential election....

Maurice AudinMaurice dan Josette AudinLahir(1932-02-14)14 Februari 1932Béja, TunisiaMeninggalsetelah 11 Juni 1957Warga negaraPrancisAlmamaterUniversitas AljazairKarier ilmiahPembimbing doktoralLaurent Schwartz Maurice Audin (14 Februari 1932 – setelah 11 Juni 1957) adalah seorang asisten matematikawan Prancis di Universitas ljazair, anggota Partai Komunis Aljazair dan penggiat antikolonialis, yang tewas saat disiksa oleh pihak Prancis pada Pertempuran Aljazair.[1] Selain universit...

 

Music award This article needs to be updated. Please help update this article to reflect recent events or newly available information. (February 2019) YouTube Music AwardsAwarded forBest in music videosCountryUnited StatesPresented byYouTubeFirst awardedNovember 3, 2013; 10 years ago (2013-11-03)Last awardedMarch 23, 2015; 9 years ago (2015-03-23)Website/YouTube/YTMA The YouTube Music Awards (commonly abbreviated as YTMA) was an awards show presented by the...

 

I. liga 1987-1988 Competizione I. liga Sport Calcio Edizione 81ª Organizzatore ČMFS Luogo  Cecoslovacchia Partecipanti 16 Risultati Vincitore  Sparta ČKD Praga(17º titolo) Retrocessioni  Žilina Tatran Prešov Statistiche Miglior marcatore Milan Luhový (24) Incontri disputati 240 Gol segnati 715 (2,98 per incontro) Cronologia della competizione 1986-1987 1988-1989 Manuale L'edizione 1987/88 del campionato cecoslovacco di calcio vide la vittoria finale dello...

Security on property or debt For other uses, see Lien (disambiguation). Property law Part of the common law series Types Personal property Community property Real property Unowned property Acquisition Gift Adverse possession Deed Conquest Discovery Accession Lost, mislaid, and abandoned property Treasure trove Bailment License Alienation Estates in land Allodial title Fee simple Fee tail Life estate Defeasible estate Future interest remainder Concurrent estate Leasehold estate Condominiums Re...

 

Japanese rock band This biography of a living person needs additional citations for verification. Please help by adding reliable sources. Contentious material about living persons that is unsourced or poorly sourced must be removed immediately from the article and its talk page, especially if potentially libelous.Find sources: Flumpool – news · newspapers · books · scholar · JSTOR (July 2010) (Learn how and when to remove this message) flumpoolflumpool...

 

Disambiguazione – Se stai cercando altri significati, vedi Gilbert White (disambigua). Questa voce sugli argomenti scienziati britannici e ornitologi è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Gilbert White Gilbert White (Selborne, 18 luglio 1720 – Selborne, 26 giugno 1793) è stato un naturalista e ornitologo britannico. Fra il 1768 e il 1793 collaborò con il naturalista William Markwick, osservando e catalogando più di 400 specie nell'Ham...

Aniello FalconeNaissance 15 novembre 1607NaplesDécès 14 juillet 1656 (à 48 ans)NaplesActivités Peintre, escrimeur ou escrimeuseLieu de travail Naples (1633-1656)modifier - modifier le code - modifier Wikidata Aniello Falcone, né le 15 novembre 1607 à Naples et mort le 14 juillet 1656 dans la même ville[1], est un peintre baroque italien de l'école napolitaine, contemporain de Diego Velázquez auquel il est comparé pour la puissance expressive de ses œuvres. Biographie Après un...

 

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Malta Aviation Museum – news · newspapers · books · scholar · JSTOR (May 2016) (Learn how and when to remove this message) Malta Aviation MuseumMalta Aviation Museum entrance (2015)Established1994LocationTa'Qali, MaltaCoordinates35°53′37″N 14°24′58″E&...

 

Political convention of the Republican Party This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: 1980 Republican National Convention – news · newspapers · books · scholar · JSTOR (January 2009) (Learn how and when to remove this message) 1980 Republican National Convention1980 presidential election NomineesReaga...

Konten dan perspektif penulisan artikel ini tidak menggambarkan wawasan global pada subjeknya. Silakan bantu mengembangkan atau bicarakan artikel ini di halaman pembicaraannya, atau buat artikel baru, bila perlu. (Pelajari cara dan kapan saatnya untuk menghapus pesan templat ini) Artikel ini sudah memiliki referensi, tetapi tidak disertai kutipan yang cukup. Anda dapat membantu mengembangkan artikel ini dengan menambahkan lebih banyak kutipan pada teks artikel. (April 2009) (Pelajari cara dan...

 

American football player (born 1992) American football player Orleans DarkwaDarkwa with the New York Giants in 2017No. 32, 43, 26Position:Running backPersonal informationBorn: (1992-02-28) February 28, 1992 (age 32)Nashville, Tennessee, U.S.Height:5 ft 11 in (1.80 m)Weight:219 lb (99 kg)Career informationHigh school:The Ensworth School(Nashville, Tennessee)College:Tulane (2010–2013)Undrafted:2014Career history Miami Dolphins (2014) New York Giants (2014–2017)...

 

Arena in Queensland, Australia Carrara Indoor StadiumThe GreenhouseFormer namesCarrara Indoor Sports CentreLocationBroadbeach-Nerang Road, Carrara, QueenslandCoordinates28°0′20″S 153°21′55″E / 28.00556°S 153.36528°E / -28.00556; 153.36528OwnerGold Coast City CouncilOperatorGold Coast City CouncilCapacityBasketball: 2,992SurfaceSprung wooden floorTenantsGold Coast Rollers (NBL) (1990–1996)Squash Australia (Headquarters) (2018–) Carrara Indoor Stadium is ...

يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (ديسمبر 2018) نظام فالانكس (CIWS) الصاروخي Phalanx CIWS إطلاق نظام فالانكس (CIWS) الصاروخي من حاملة الطائرات الأمريكيةإطلاق نظام ...

 

Mariamne IMariamne, raffigurata in un manoscritto miniato francese del XV/XVI secolo dell'opera di Giovanni Boccaccio De mulieribus clarisSovrana della GiudeaIn carica37 a.C.-29 a.C. SuccessoreMariamne II Morte29 a.C. Dinastiaasmonea ed erodiana PadreAlessandro Maccabeo MadreAlessandra Maccabeo ConsorteErode il Grande FigliAlessandro, Aristobulo, Salampsio, Cipro Mariamne (in greco antico: Μαριάμη?, Mariáme; ... – 29 a.C.) è stata una regina ebrea antica, seconda moglie di Er...