+1 Punkt
522 Aufrufe

Gegeben sei die folgende Tabelle mit gruppierten Beobachtungen.

Anzahl
Patienten
absolute
Häufigkeit
Summierte
absolute Häufigkeit
10-1922
20-291820
30-342444
35-393074
40-4427101
45-4914115
50-695120

Gesucht ist jetzt der Median, das erste und das dritte Quartil.

Ich habe diese Werte schon berechnet, bin mir aber nicht sicher ob ich mit den gruppierten Daten richtig umgegangen bin. Daher würde ich mich über eine Vergleichslösung freuen.

Weil ich denke das meine Berechnung eventuell falsch ist möchte ich, dass ihr unvoreingenommen an die Aufgabe heran geht.

Vielen lieben Dank.

von 268 k

https://de.wikipedia.org/wiki/Empirisches_Quantil#Spezielle_Quantile

Der Median müsste wohl 37 sein.

Das 0.25-Quartil 32

und das

0.75-Quartil 42

Aber: Ohne Gewähr.

Wenn nichts Spezielles erwähnt ist, könnte man ja die gruppierten Werte einfach in die Intervallmitten legen. Exakt zur verlinkten Definition passen die Quartile aber nicht, wenn die Zahlen nur in Intervallen erhoben wurden. Man bräuchte ja praktisch eine analoge Erhebung der Daten.

Wenn die Daten in Klassen erhoben werden, dann nimmt man innerhalb dieser Klassen meist eine Gleichverteilung der Daten an.

Danke für die Info. Woher nimmst du sie? Hast du einen Link, der das besagt?

Worum geht es überhaupt bei der "Anzahl der Patienten? "

Warum interessiert diese Streuung?

Was wurde gemessen?

Sind das die Patienten / Arzt ? Oder in einem Monat ?

Sucht man den durchschnittlichen Arzt?

Das ist eine Aufgabe aus einem Mathebuch. Woher die Daten stammen ist daher wohl erstmal irrelevant. Das könnten z.B. die Anzahl der Patienten im Wartezimmer einer Praxis zu einer bestimmten Uhrzeit am Tag gewesen sein.

Grundsätzlich weiß man, dass die Verteilung innerhalb der Klasse wohl eher nicht gleichverteilt ist. Man nimmt dies aber aus Vereinfachungsgründen oft an.

Hier z.B. ein Lernmodul der Fernuni Hagen:

http://www.fernuni-hagen.de/ksw/neuestatistik/content/Fallstudie_Desk/Generalbeispiel/Lernmodule/01_04/html/I143f.html

2 Antworten

+2 Daumen
 
Beste Antwort

Hallo MC,

Edit:

30 + (0.25 - 0.16667)·5 / (24/120)   ≈   32.08  

35 + (0.5 - 0.36667)·5 / ( 30/120)  ≈  37.67

40 + (0.75 - 0.61667)·5 / (27/120)   ≈  42,96  

Bin mir nicht sicher, ob hier - wegen der ganzzahligen Daten - auf solche gerundet wird. Wenn ja, denke ich, xp  soll  die Grenze nicht überschreiten  (?)

Gruß Wolfgang

von 78 k

Es ist schon richtig das du xp als Dezimalzahl stehen lässt. Ich verwende 4 wesentliche Ziffern.

Meine Formel sieht so ähnlich aus. Ist laut Internet ja auch die richtige Formel.

20 + (0.25 - 0.16667)·10 / (24/120)

Ich habe nur den Bruch mit 120 erweitert stehen

20 + (30 - 20)·10 / 24

Statt der 20 am Anfang habe ich etwas anderes. Willst du den Wert korrigieren?

>Statt der 20 am Anfang habe ich etwas anderes 

Ich kann nicht ausschließen, dass mein selbst verfasstes uraltes Excelprogrämmchen da einen Fehler hat. Komme darauf zurück.

Nach meiner Rechnung liegen die summierten relativen Häufigkeiten für das Intervall [20;30[  in gerundet [0,167 ; 0,367[ ∋ 0,25.

Die 20 am Anfang sollte dann doch wohl stimmen (?)

@Wolfgang: Hast du berücksichtigt, dass 25% von 120 zu bestimmen ist?

@MC, Lu

Okay, man muss jeweils das nächsthöhere Intervall nehmen. Werde das in der Antwort ändern.

(Da mein Progrämmchen nur die Fi ausgerechnet hat, konnte es nichts dafür :-). Sein Urheber hat bei der Interpretation gepennt.)

Danke für die Hinweise.

So macht das auch Sinn. Ich hatte bei mir die Grenzen um 0.5 verändert.

Also die Klasse 30-34 war dann 29.5 bis 34.5. Das hatte ich gemacht damit die Intervallgrenzen aufeinander fallen und ich eine stetige Kurve z.B. beim zeichnen habe.

Damit war ich aber selber irgendwie nicht so richtig zufrieden. Allerdings hätte ich argumentiert, dass wenn der Median letztendlich auch eine Nachkommastelle hat warum sollten die Grenzen nicht auch Nachkommastellen haben.

Ich werde meinen Schüler bitten, das auch nochmals so zu machen und dann nächste Woche bei der Besprechung der Aufgabe genau zuzuhören.

Vielen lieben Dank Wolfgang.

Mein übliches "immer wieder gern" wäre wohl - was die Häüfigkeit angeht - in deinem Fall maßlos übertrieben :-)

+2 Daumen

Da es 120 sortierte Daten sind,  ist m.E.

der Median der Mittelwert zwischen der 60. und der 61. Date.

Da die beide aus dem Bereich 35-39 sind und zwar genau in der

Mitte davon, würde ich 37 nehmen.

Ähnlich für das 1. Quartil käme ich auf 32

und für das 3. auf 42.

von 153 k

Da die beide aus dem Bereich 35-39 sind und zwar genau in der Mitte davon, würde ich 37 nehmen.

Das würde denke ich nur Stimmen, wenn die Klasse 35-39 auch symmetrisch um die 60.5 liegt.

Man kann also nicht einfach die Klassenmitte der infrage kommenden Klasse nehmen.

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage sofort und kostenfrei

x
Made by a lovely community
...