0 Daumen
1,6k Aufrufe

Aufgabe:

Wie bestimme ich hier unteres und oberes Quantil für ein Boxplot:

1 3 5 6 6 7 7 8 8 8 9 9 9 9 9 10 10 10 10 10 ?


Problem/Ansatz:

Ich dachte, der Median ist bei 8,5; Q1 bei 6,5 und Q3 bei 9,5.

Wikipedia sagt bei diesem Beispiel aber 7 und 9,5. Das verstehe ich nicht.

Avatar von
Wikipedia sagt bei diesem Beispiel

Die deutschsprachige Wikipedia hat etwa 3 Millionen Artikel. Verrätst Du, in welchem Du das gelesen hast?

Median der unteren 10 Werte bzw. der oberen 10 Werte. Es ist das Beispiel im Wiki Boxplot Artikel (weiß nicht ob man Links posten darf)

Du meinst also https://de.wikipedia.org/wiki/Box-Plot#Beispiel was man natürlich ungestraft erwähnen darf.

Ich halte Deine Antwort für richtig.

Ja,ganz genau

Jedermann kann den Fehler bei Wikipedia übrigens auch korrigieren ... ein kleiner Schritt für einen Menschen, ein gewaltiger Sprung für die gesamte Menschheit.

Nachtrag: Jemand, offenbar von hier, hat sich aufgerafft und es dort korrigiert. Nach 35 Minuten wurde es von einem anderen Benutzer ("Animes schaue ich für mein Leben gern") wieder zurückgesetzt auf falsch ...

Die Berechnungsmethode ist leider nicht standardisiert. Neben der ‚Median-Methode‘ wird häufig die folgende benutzt: (vgl. https://en.wikipedia.org/wiki/Quantile

Die Position des 25\%-Quantils berechnet sich dann mit \( P_{25}=0,25 \times(n+1) \) und die des \( 75 \% \)-Quantils mit \( P_{75}=0,75 \times(n+1) \) und Aufrunden falls nötig.

Das ergäbe hier 5,25 was aufgerundet den Wert an der 6. Position ergibt: 7

Für das 75% Quantil ergibt sich dann die Position 15,75 was aufgerundet die Position 16, also den Wert 10 (und nicht 9,5) ergeben sollte.

Da es aber jede Menge verschiedener Definitionen gibt (vgl. auch https://en.wikipedia.org/wiki/Percentile) könnte es eine von den dort aufgeführten sein.

Unbefriedigend bleibt, dass die Methode nicht angegeben wurde und die Wahrscheinlichkeit eines schlichten Fehlers in dem Artikel ist recht hoch.

In jedem Fall ist Dein Ansatz üblich und korrekt angewandt.

Was genau ist eine "Quartilsgrenze"?

Was genau ist eine "Quartilsgrenze"?
Grenze zwischen zwei Quartilen

Und was genau ist dann ein Quartil?

Vielen Dank an alle!

3 Antworten

0 Daumen

Die Angabe des unteren Quartils bei Wikipedia ist falsch. Tatsächlich ist es 6,5.

Siehe auch: https://de.wikipedia.org/wiki/Empirisches_Quantil

Avatar von 22 k
0 Daumen

Verwende \(p=q\cdot n\) mit

    \(n=\text{Anzahl der Datensätze}\)

und

    \(q=\begin{cases} 0{,}25&\text{für das untere Quartil}\\ 0{,}5&\text{für den Median}\\ 0{,}75&\text{für das obere Quartil}\\ \end{cases}\)

Falls \(p\) eine ganze Zahl ist, dann bilde den Durchschnitt aus der Zahl an dieser Position und der Zahl an der nächsten Position.

Falls \(p\) keine ganze Zahl ist, dann runde auf um die Position zu bestimmen, an der du den entsprechenden Wert findest.

Beispiel. 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43

Es ist \(n=14\).

Unteres Quartil: \(p_u = 0{,}25\cdot 14 = 3{,}5\) ist keine ganze Zahl, also wird aufgerundet zu \(4\). Das untere Quartil findest du an der vierten Stelle, ist also \(7\).

Median: \(p_m = 0{,}5\cdot 14 = 7\) ist eine ganze Zahl. Der Median ist also der Durchschnitt aus dem siebten und achten Wert, also \(\frac{17+19}{2}=18\).

Oberes Quartil: \(p_o = 0{,}75\cdot 14 = 10{,}5\) ist keine ganze Zahl, also wird aufgerundet zu \(11\). Das obere Quartil findest du an der elften Stelle, ist also \(31\).

Avatar von 108 k 🚀
0 Daumen

Leider hat es nur user26605 auf dieser Seite verstanden.

Die Berechnungsmethode ist leider nicht standardisiert.
Ich dachte, der Median ist bei 8,5; Q1 bei 6,5 und Q3 bei 9,5.

Auf genau diese Werte kommt man, wenn man sich an die Berechnungsmethode auf https://de.wikipedia.org/wiki/Empirisches_Quantil hält, die üblicherweise in Deutschland auch so gelehrt wird.

Auf Wikipedia kommen sie auf einen anderen Wert, der eben anders berechnet wurde. Dummerweise wird auf Wikipedia dort, wo der Wert von 7 angegeben wurde, nicht explizit erwähnt, dass es mehrere Verfahren zur Berechnung gibt. Die Angabe findest du aber auch unter dem Link, den ich hier angegeben habe. Auch ist das Verfahren nur auf der Diskussionsseite zur eigentlichen Seite von Wikipedia angegeben.

Das sollte auf der eigentlichen Seite vielleicht etwas besser kommuniziert werden. Halte dich auf jeden Fall immer daran, wie ihr es gelernt habt. Damit machst du nichts verkehrt.

Als ich bei der Erstellung von Boxplots auf eine Seite im Internet zurückgegriffen habe, wurden dort die Quartile auch anders berechnet und ich habe mich zuerst auch gewundert, warum die Werte von meinen und der Musterlösung abweichen. Bis ich es dann auch mitbekommen habe, dass es ich glaube, so um die 9 verschiedene Berechnungsmethoden gibt.

Das Lustige ist, dass jeder glaubt, die von ihm verwendete Methode ist die einzig richtige und alle anderen liegen falsch.

Avatar von 493 k 🚀

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community