Median

In der Statistik ist der Median (Plural Mediane) – auch Zentralwert genannt – ein Mittelwert und Lageparameter. Der Median der Messwerte einer Urliste ist derjenige Messwert, der genau „in der Mitte“ steht, wenn man die Messwerte der Größe nach sortiert. Beispielsweise ist für die ungeordnete Urliste 4, 1, 37, 2, 1 der Messwert 2 der Median, der in der Mitte stehende Wert der geordneten Urliste 1, 1, 2, 4, 37.

Im Allgemeinen teilt ein Median einen Datensatz, eine Stichprobe oder eine Verteilung so in zwei gleich große Teile, dass die Werte in der einen Hälfte nicht größer als der Median sind und in der anderen nicht kleiner.

Beschreibung

Der Median teilt eine Liste von Werten in zwei Hälften. Er kann auf folgende Weise bestimmt werden:

  • Alle Werte werden (aufsteigend) geordnet.
  • Wenn die Anzahl der Werte ungerade ist, ist die mittlere Zahl der Median.
  • Wenn die Anzahl der Werte gerade ist, wird der Median meist als arithmetisches Mittel der beiden mittleren Zahlen definiert, die dann Unter- und Obermedian heißen.

Eine wichtige Eigenschaft des Medians ist die Robustheit gegenüber Ausreißern.

  • Beispiel: Sieben unsortierte Messwerte 4, 1, 15, 2, 4, 5, 4 werden nach Größe sortiert: 1, 2, 4, 4, 4, 5, 15; Der Median (auch der Ober- und der Untermedian) ist der Wert an der mittleren Stelle, also 4. Wenn im Beispiel durch einen Fehler eine 4 durch 46 ersetzt wurde, ändert sich der Median nicht: 1, 2, 4, 4, 5, 15, 46. Das arithmetische Mittel hingegen springt von 5 auf 11.

Vergleich mit anderen Maßen der zentralen Tendenz

Vergleich zwischen Modus, Median und „Mittel“ (eigentlich: Erwartungswert) zweier Log-Normalverteilungen mit Median 1

Der Median ist ein spezielles Quantil, nämlich das 12-Quantil. Andere wichtige Lagemaße sind das arithmetische Mittel und der Modus.

Im Vergleich zum arithmetischen Mittel, oft Durchschnitt genannt, ist der Median robuster gegenüber Ausreißern (extrem abweichenden Werten) und lässt sich auch auf ordinal skalierte Variablen anwenden. Der Begriff Median (von lateinisch medianus ‚in der Mitte befindlich‘, ‚der Mittlere‘) entstammt der Geometrie, wo er ebenfalls eine Grenze zwischen zwei Hälften gleicher Größe bezeichnet.

Median und arithmetisches Mittel: anschauliches Beispiel

In einer Gruppe von zehn Personen haben alle Personen Monatseinkommen in unterschiedlicher Höhe. Eine Person erhält 1.000.000 €, die übrigen neun bekommen 1.000 €, 2.000 €, 3.000 € usw. bis 9.000 €.

Das arithmetische Mittel, der „Durchschnitt“ – das Monatseinkommen jeder der zehn Personen bei gleichmäßiger Aufteilung der Summe aller Einkommen auf sie –, beträgt in diesem Falle 104.500 €. Allerdings verdient nur eine der zehn Personen mehr als diesen Betrag, die neun anderen deutlich weniger.

Der Median dagegen ist 5.500 €. Fünf Personen verdienen mehr als das, fünf Personen weniger.

Anwendungsbereiche

Der Median dieses Notenspiegels ist 3−. Etwas weniger als die Hälfte der Ergebnisse ist schlechter; durch Hinzunahme der Notenstufe 3− selbst wird die Hälfte gerade überschritten.

Im Gegensatz zum arithmetischen Mittel kann der Median auch für ordinal skalierte Variablen wie beispielsweise Notenstufen, bei denen es keinen quantitativen Abstand gibt, verwendet werden. Aber auch bei intervall- und verhältnisskalierten Daten kann der Median herangezogen werden und hat dann Nachteile und Vorteile gegenüber dem arithmetischen Mittel als Lagemaß. Für lediglich nominal skalierte Variablen, deren Ausprägungen keine natürliche Rangfolge aufweisen, wie zum Beispiel eine Variable Geburtsland, kann der Median nicht angewendet werden. Hier ist der Modalwert das einzige Lagemaß, das festgestellt werden kann.

Der Median wird in der Statistik und der Wahrscheinlichkeitstheorie in drei unterschiedlichen Bedeutungen angewendet:

  1. als Lagemaß der deskriptiven Statistik zur Beschreibung einer konkreten Liste von Stichprobenwerten.
  2. in der Wahrscheinlichkeitstheorie als Median einer Wahrscheinlichkeitsverteilung oder einer Zufallsvariablen. Hier stellt der Median eine Alternative zum Erwartungswert für die Angabe eines „mittleren Werts“ dar.
  3. in der mathematischen Statistik als Median einer Zufallsstichprobe zur robusten Schätzung unbekannter Verteilungen.

Median einer Stichprobe

Ein Wert ist Median einer Stichprobe, wenn mindestens die Hälfte der Stichprobenelemente nicht größer als und mindestens die Hälfte nicht kleiner als ist.

Sortiert man die Beobachtungswerte der Größe nach, das heißt, geht man zur nach dem Rang geordneten Stichprobe über, so ist der Median bei einer ungeraden Anzahl von Beobachtungen der Wert der in der Mitte dieser Folge liegenden Beobachtung. Bei einer geraden Anzahl von Beobachtungen gibt es kein einzelnes mittleres Element, sondern zwei. Hier sind die Werte der beiden mittleren Beobachtungen sowie alle Werte dazwischen (obwohl diese möglicherweise bei keiner Beobachtung aufgetreten sind) Mediane der Stichprobe, da für alle diese Werte obige Bedingung zutrifft.

Bei kardinal skalierten Messgrößen (wenn es also sinnvoll möglich ist, die Differenz von Messwerten zu berechnen) verwendet man im Falle einer geraden Anzahl Beobachtungen meist das arithmetische Mittel der beiden mittleren Beobachtungswerte. Der Median einer geordneten Stichprobe von Messwerten ist dann also

Diese Definition hat den Vorteil, dass bei Stichproben aus symmetrischen Verteilungen das arithmetische Mittel und der Median im Erwartungswert identisch sind.[1]

Ober- und Untermedian

Oft möchte man sicherstellen, dass der Median ein Element der Stichprobe ist. In diesem Fall wird alternativ zu obiger Definition bei einer geraden Anzahl von Elementen entweder der Untermedian oder der Obermedian als Median gewählt. Im Falle einer ungeraden Anzahl der Beobachtungen gilt natürlich wie oben .

Mithilfe von Gauß-Klammern lassen sich die Indizes auch relativ kompakt durch selbst ausdrücken:

Diese Medianbestimmung spielt beispielsweise bei Datenbanksystemen eine große Rolle, wie z. B. bei SELECT-Abfragen mittels des Medians der Mediane.

Eigenschaften

Der Median , und im Fall einer geraden Anzahl von Messwerten alle Werte mit , minimieren die Summe der absoluten Abweichungen, das heißt, für alle gilt

Der Median ist Grundlage der Methode der kleinsten absoluten Abweichungen und Verfahren der robusten Regression. Das arithmetische Mittel dagegen minimiert die Summe der Abweichungsquadrate, ist Grundlage der Methode der kleinsten Quadrate und der Regressionsanalyse und ist mathematisch leichter zu handhaben, jedoch nicht robust gegen Ausreißer.

Der Median kann, wie oben beschrieben, algorithmisch bestimmt werden, indem die Messwerte sortiert werden. Das ist im Allgemeinen mit Aufwand verbunden, nur auf speziellen Klassen von Eingabedaten ist möglich (siehe Sortieralgorithmus). Es gibt aber auch Algorithmen zur Quantilsbestimmung mit linearem Worst-Case-Aufwand sowie Algorithmen zur Abschätzung, beispielsweise die Cornish-Fisher-Methode.

Median von gruppierten Daten

Bevölkerungspyramide Tansania 2016, der Median liegt bei geschätzt 18 Jahren

Vor allem in den Sozialwissenschaften wird bei Statistiken häufig der Median geschätzt, da nicht alle Daten explizit und exakt gegeben sind, sondern nur in Intervallen gruppiert vorliegen. So wird beispielsweise bei Umfragen selten nach dem exakten Gehalt gefragt, sondern nur nach der Einkommensklasse, also dem Bereich, in dem das Gehalt liegt. Wenn nur die Häufigkeiten jeder Klasse bekannt sind, dann lässt sich der Median einer solchen Stichprobe im Allgemeinen nur näherungsweise bestimmen. Es seien die Anzahl aller Daten, die jeweilige Anzahl der Daten der -ten Gruppe und bzw. die entsprechenden unteren bzw. oberen Intervallgrenzen. Zunächst wird nun die mediane Klasse (oder mediane Gruppe) bestimmt, d. h., diejenige Gruppe, in die der Median (nach obiger, konventioneller Definition) hineinfällt, z. B. die -te Gruppe. Die Zahl ist dadurch bestimmt, dass , aber gilt. Wenn keine weiteren Angaben über die Verteilung der Daten gegeben sind, wird z. B. Gleichverteilung postuliert, sodass man sich der linearen Interpolation als Hilfsmittel bedienen kann, um eine Schätzung des Medians der gruppierten Daten zu erhalten:

Wenn keine weiteren Angaben über die Verteilung der Daten gegeben sind, kann auch jede andere Verteilung außer der Gleichverteilung vorliegen und somit kann auch jeder andere Wert im -ten Intervall der Median sein.

Im Gegensatz zur konventionellen Definition des Medians muss dieser nicht zwangsläufig ein Element aus der tatsächlichen Datenmenge sein, die in aller Regel auch gar nicht bekannt ist.

Beispiel

Einkommen:

Klasse () Bereich ( bis ) Gruppengröße ()
1 mind. 0, weniger als 1500 160
2 mind. 1500, weniger als 2500 320
3 mind. 2500, weniger als 3500 212

Man berechne

Also liegt der Median in der 2. Klasse (d. h. ), da die erste Klasse nur 160 Elemente umfasst. Somit ergibt sich als Schätzung für den Median

Da die konkrete Verteilung der Daten in den Intervallen unbekannt ist, kann auch jeder andere Wert im 2. Intervall der Median sein. Der beispielhaft errechnete Wert 2081,25 kann daher bis zu 581,25 zu groß und bis zu 418,75 zu klein sein, der Fehler der Schätzung also bis zu 28 % betragen.

Eine Veranschaulichung dieses Verfahrens zur Festlegung des Medians bei gruppierten Daten ist die grafische Ermittlung mit Hilfe der Summenkurve. Hier wird der Abszissenwert gesucht, der zum Ordinatenwert gehört. Bei kleinerem und geradem kann stattdessen auch der Ordinatenwert gewählt werden.

Andere Varianten

  • Die Wohlfahrtsfunktion ist eine Alternative zum Median bei der Ermittlung des Masseneinkommens aus einer gegebenen Einkommensverteilung.
  • Eine andere Möglichkeit als der Median, mit extremen Werten umzugehen, ist die Benutzung eines getrimmten Mittelwerts, den man ermittelt, indem man die kleinsten und größten Werte vor der Berechnung entfernt (typischerweise werden 5 % der Werte weggelassen).[2]
  • Nach Butler[3] gibt es auch eine strengere Definition von Median (die weniger gebräuchlich ist), die sagt, der Median ist der Wert, für den gilt, die Zahl der kleineren Werte in der Reihe ist gleich der Zahl der größeren Werte in der Reihe. Für Spezialfälle wie 3, 3, 3, 3, 4 oder 1, 2, 3, 3, 3 gibt es ein Verfahren, mit dem man einen eindeutigen Median unter Beibehaltung der strengeren Definition berechnen kann.[4]
Wiktionary: Median – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

  1. Eric W. Weisstein: Statistical Median. In: MathWorld (englisch).
  2. Hans Lohninger: Grundlagen der Statistik. Mittelwert.
  3. Christopher Butler: Statistics in Linguistics. 1985.
  4. Zentrale Tendenz. Archiviert vom Original (nicht mehr online verfügbar) am 16. Januar 2013; abgerufen am 9. Mai 2016.

Read other articles:

Prof. Dr.Hikmahanto JuwanaS.H., LL.M. Rektor Universitas Jenderal Achmad YaniPetahanaMulai menjabat 17 April 2020[1] PendahuluWitjaksono[2]PenggantiPetahanaDekan Fakultas Hukum Universitas IndonesiaMasa jabatan2003–2008 PendahuluAbdul Bari AzedPenggantiSafri Nugraha Informasi pribadiLahirHikmahanto Juwana23 November 1965 (umur 58)JakartaKebangsaanIndonesiaAlma materUniversitas IndonesiaUniversitas KeioUniversitas NottinghamSunting kotak info • L • B Pr...

 

 

本條目存在以下問題,請協助改善本條目或在討論頁針對議題發表看法。 此條目需要补充更多来源。 (2018年3月17日)请协助補充多方面可靠来源以改善这篇条目,无法查证的内容可能會因為异议提出而被移除。致使用者:请搜索一下条目的标题(来源搜索:羅生門 (電影) — 网页、新闻、书籍、学术、图像),以检查网络上是否存在该主题的更多可靠来源(判定指引)。 �...

 

 

USS Frank Cable, satu dari dua Kapal perawat kapal selam milik Angkatan Laut Amerika Serikat (di depan-nya merupakan kapal selam serbu cepat USS Salt Lake City (SSN-716). Kapal perawat kapal selam[1] adalah sebuah jenis kapal yang bertugas untuk menyuplai dan mendukung operasi kapal selam. Pengembangan Kapal selam berukuran lebih kecil dibandingkan dengan sebagian besar kapal-kapal laut, sehingga umumnya tidak memiliki kemampuan untuk membawa makanan, bahan bakar, torpe...

Artikel ini bukan mengenai putranya, pemeran Desi Arnaz Jr. Dalam nama Spanyol ini, nama keluarganya adalah Arnaz. Desi ArnazArnaz pada 1950LahirDesiderio Alberto Arnaz y de Acha III(1917-03-02)2 Maret 1917Santiago de Cuba, KubaMeninggal2 Desember 1986(1986-12-02) (umur 69)Solana Beach, California, Amerika SerikatPekerjaanPemeran, musisi, ketua grup musik, pelawak, produserTahun aktif1936–1982Partai politikPartai RepublikSuami/istriLucille Ball ​ ​(m. 1940...

 

 

العلاقات التشادية الجنوب سودانية تشاد جنوب السودان   تشاد   جنوب السودان تعديل مصدري - تعديل   العلاقات التشادية الجنوب سودانية هي العلاقات الثنائية التي تجمع بين تشاد وجنوب السودان.[1][2][3][4][5] مقارنة بين البلدين هذه مقارنة عامة ومرجعية للد...

 

 

ييمنون   تقسيم إداري البلد اليونان  [1] خصائص جغرافية إحداثيات 38°26′10″N 23°52′49″E / 38.436111111111°N 23.880277777778°E / 38.436111111111; 23.880277777778   الارتفاع 135 متر  السكان التعداد السكاني 1753 (إحصاء السكان) (2021)1739 (resident population of Greece) (2021)1953 (resident population of Greece) (2001)1884 (resident population of ...

Sebuah perhitungan Indeks Pembangunan Manusia (IPM) yang menggunakan metode baru dilaksanakan oleh Badan Pusat Statistik (BPS) dari tahun 2010 hingga sekarang. Berikut ini akan disajikan penjelasan, dimensi dasar, manfaat, dan metodologi perhitungan IPM, serta daftar kabupaten dan kota Jawa Barat menurut IPM tahun 2015. Penjelasan Indeks Pembangunan Manusia (IPM)/Human Development Index (HDI) adalah pengukuran perbandingan dari harapan hidup, melek huruf, pendidikan dan standar hidup untuk se...

 

 

ThauTau La Thau au pont du Gué à Saint-Florent-le-Vieil. Caractéristiques Longueur 12,7 km [1] Bassin 72 km2 Bassin collecteur Loire Régime Pluvial océanique Cours Source Mauges · Localisation Montjean-sur-Loire, Maine-et-Loire, France · Altitude 13 m · Coordonnées 47° 23′ 23″ N, 0° 51′ 47″ O Confluence Loire · Localisation Saint-Florent-le-Vieil, Maine-et-Loire, France · Altitude 8 m · Coordonnées 47° 21′ ...

 

 

Nine LivesPoster resmiSutradaraBarry SonnenfeldProduserLisa EllzeyDitulis oleh Gwyn Lurie Matt R. Allen Caleb Wilson Daniel Antoniazzi Ben Shiffrin Pemeran Kevin Spacey Jennifer Garner Robbie Amell Cheryl Hines Malina Weissman Christopher Walken Penata musik Evgueni Galperine Sacha Galperine SinematograferKarl Walter LindenlaubPenyunting Don Zimmerman David Zimmerman PerusahaanproduksiFundamental FilmsDistributorEuropaCorpTanggal rilis 5 Agustus 2016 (2016-08-05) Durasi87 Menit[...

Северный морской котик Самец Научная классификация Домен:ЭукариотыЦарство:ЖивотныеПодцарство:ЭуметазоиБез ранга:Двусторонне-симметричныеБез ранга:ВторичноротыеТип:ХордовыеПодтип:ПозвоночныеИнфратип:ЧелюстноротыеНадкласс:ЧетвероногиеКлада:АмниотыКлада:Синапси...

 

 

爱德华·谢瓦尔德纳泽ედუარდ შევარდნაძე第2任格鲁吉亚總統任期1995年11月26日—2003年11月23日前任茲維亞德·加姆薩胡爾季阿继任米哈伊尔·萨卡什维利苏联外交部部长任期1985年7月2日—1990年12月20日总书记米哈伊尔·戈尔巴乔夫前任安德烈·葛罗米柯继任亚历山大·别斯梅尔特内赫 个人资料出生(1928-01-25)1928年1月25日苏联外高加索苏维埃联邦社会主义共和国古...

 

 

Congis-sur-Thérouanne La mairie. Administration Pays France Région Île-de-France Département Seine-et-Marne Arrondissement Meaux Intercommunalité Communauté de communes du Pays de l'Ourcq Maire Mandat Philippe Mimmas 2020-2026 Code postal 77440 Code commune 77126 Démographie Gentilé Congissois Populationmunicipale 1 772 hab. (2021 ) Densité 117 hab./km2 Géographie Coordonnées 49° 00′ 28″ nord, 2° 58′ 34″ est Altitude Min. 42&#...

  هذه المقالة عن مشاركة اللاعبين في كأس العالم. لمشاركة المنتخبات، طالع مشاركة المنتخبات في كأس العالم. ليونيل ميسي هو اللاعب الأكثر خوضاً للمباريات في كأس العالم، وواحد من ست مباريات فقط إلى جانب الألماني لوتار ماتيوس والبرتغالي كريستيانو رونالدو والمكسيكيين أنتون�...

 

 

Römisches Statut desInternationalen Strafgerichtshofs Kurztitel: Römisches Statut Titel (engl.): Rome Statute of theInternational Criminal Court Datum: 17. Juli 1998 Inkrafttreten: 1. Juli 2002 Fundstelle: Chapter XVIII 10. UNTC (engl. Text) Fundstelle (deutsch): BGBl. 2000 II S. 1393BGBl. III Nr. 180/2002SR 0.312.1 Vertragstyp: Multinational Rechtsmaterie: Völkerstrafrecht, Internationale Justiz Unterzeichnung: 139 Ratifikation: 124 (Stand: 11. Juli 2016) Deutschland: Ratifikation (...

 

 

1935 ballet by Sergei Prokofiev This article is about Sergei Prokofiev's ballet. For other uses, see Romeo and Juliet (disambiguation). This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Romeo a...

Sport boycott This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: 1984 Summer Olympics boycott – news · newspapers · books · scholar · JSTOR (May 2020) (Learn how and when to remove this message) Part of a series on1984 Summer Olympics Bid process (bid details) Boycott Development Venues Torch relay (route) Mark...

 

 

خان بابا قدرتمعلومات عامةنوع المبنى خانالمكان مشهد[1][2][3] المنطقة الإدارية مقاطعة مشهد[1][3] البلد  إيرانبني بطلب من Eshaq Khan Qaraei-Torbati (en) [2][3] الاستعمال مصنع[3][4] ( – 1979)مطعم[5] (2010 – )سوق[5] (2010 – ) أبرز الأحداثالافتتاح الرسمي القرن 19 ...

 

 

American Secret Service agent (1930–2015) Jerry ParrParr in 2013Born(1930-09-16)September 16, 1930Montgomery, Alabama, U.S.DiedOctober 9, 2015(2015-10-09) (aged 85)Washington, D.C., U.S.EducationVanderbilt UniversityLoyola UniversityOccupationSecret Service agentKnown forSaving President Reagan during the 1981 assassination attemptSpouse Carolyn Parr ​(m. 1959)​Children3 Jerry S. Parr (September 16, 1930 – October 9, 2015) was a United States Secret...

Coppa Italia Primavera 2009-2010Primavera TIM Cup 2009-2010 Competizione Coppa Italia Primavera Sport Calcio Edizione 38ª Organizzatore Lega Nazionale Professionisti Date 22 agosto 2009 - 14 aprile 2010 Luogo  Italia Partecipanti 42 Risultati Vincitore  Milan(2º titolo) Secondo  Palermo Semi-finalisti  Empoli Juventus Cronologia della competizione 2008-2009 2010-2011 Manuale La Coppa Italia Primavera 2009-2010 è la trentottesima edizione del torneo riservato alle ...

 

 

French racing driver (born 1964) Jean AlesiAlesi at Geneva International Motor Show in 2019BornGiovanni Roberto Alesi (1964-06-11) 11 June 1964 (age 60)Avignon, Vaucluse, FranceFormula One World Championship careerNationality FrenchActive years1989–2001TeamsTyrrell, Ferrari, Benetton, Sauber, Prost, JordanEnginesCosworth, Ferrari, Renault, Petronas, Peugeot, Acer, HondaEntries202 (201 starts)Championships0Wins1Podiums32Career points241Pole positions2Fastest laps4First entry1989 Fr...