0 Daumen
480 Aufrufe

Hallo ihr Mathecracks,

im Skript unserer Statistik-Vorlesung steht folgende Formel zur Stichprobenvarianz:

Stichprobenvarianz: S2x := \( \frac{1}{n} \) \( \sum\limits_{i=1}^{n}{} \)(xi - Mx)2 = Mx2 - (Mx)2

Ich verstehe nicht, wie man auf die Umformung ohne das Summenzeichen kommt. Nach binomischer Formel müsste das ja anders lauten. Bei meinen Recherchen bin ich auf den Wikipedia-Eintrag zum Verschiebungssatz gestoßen, aber auch der lautet ein bisschen anders.

Avatar von

2 Antworten

0 Daumen
 
Beste Antwort

Das ist eine gaaaanz gaaanz wichtige Formel in Statistik.

Im allgemeinen sieht sie so aus (und du wirst sie sicher noch sehen):

\(E(X-M_X)^2 = E(X^2)- E(X)^2 = M_{X^2}-M_X^2\)

Hier die (etwas langweilige) Berechnung:

Zunächst per Definition gilt:

\(M_{X^2}= \frac 1n\sum_{i=1}^nx_i^2\)

Ohne das hast du kaum eine Chance, deine Formel zu zeigen.

Jetzt geht's los:

\(\frac 1n \sum_{i=1}^n(x_i - M_X)^2 = \frac 1n\sum_{i=1}^n(x_i^2 -2x_iM_X+ M_X^2)\)

\(=\frac 1n\left(\sum_{i=1}^nx_i^2 -M_X\sum_{i=1}^n2x_i+ \sum_{i=1}^nM_X^2\right)\)

\(=M_{X^2} -2M_X^2 + M_X^2 = M_{X^2} -M_X^2\)

Avatar von 10 k

Danke für die Antworten, die helfen schonmal weiter! Allerdings glaube ich, dass ich da noch eine ziemliche Lücke habe. Was ist denn Mx2  überhaupt? Ist das ein wichtiger Wert, der oft bekannt ist (und bestimmt einen Namen hat?)

Falls ich den Wert immer über die Definition berechnen muss, dann bringt die Umformung ja keine große Vorteile, oder?

@coradoe
Also \(M_{X^2}\) ist nichts anderes als der Mittelwert der Quadrate der Stichprobenwerte.

Die Stichprobenvarianz mit Hilfe der Formel \(M_{X^2} - M_X^2\) zu berechnen ist vor allem numerisch interessant, da es nicht zu "Auslöschungseffekten" wie bei \(x_i-M_X\) kommen kann, wenn Stichprobenwerte sehr nah beim Mittelwert liegen.

In manchen Examen ist man gelegentlich gezwungen, die Stichprobenvarianz per Hand zu berechnen. Dafür gibt es verschiedene Rechenschemata. Eines basiert auf obiger Formel. Zum Beispiel so:





\(\Sigma\)
\(\frac 1n \Sigma\)

\(X\)
\(x_1\)
\(\ldots\)
\(x_n\)
\(\Sigma x_i\)
\(M_X\)
\(\color{blue}{M_X^2}\)
\(X^2\)
\(x_1^2\)

\(x_n^2\)
\(\Sigma x_i^2\)
\(\color{orange}{M_{X^2}}\)
\(S_X^2=\color{orange}{M_{X^2}}-\color{blue}{M_X^2}\)
Einfach
mal
selber
probieren  
:-)


Oh wow, das hat es klar gemacht, vielen Dank für deine Hilfe!

+1 Daumen

Aloha :)

Die Formel von eurem Professor ist doppelt falsch.

In der Stichproben-Varianz taucht der Mittelwert \(\overline x\) als Näherung für den Erwartungswert \(\mu\) auf. Die Abweichung des Mittelwerts zu dem Erwartungswert pflanzt sich in die Varianz fort. Als Korrektur reicht es jedoch aus, den Vorfaktor \(\frac{1}{n-1}\) anstatt \(\frac1n\) zu nehmen:$$V(X)=\frac{1}{\red{n-1}}\sum\limits_{k=1}^n\left(x_i-\red{\overline x}\right)^2$$Zur Berechnung der Varianz muss der exakte Erwartungswert \(\mu\) bekannt sein:$$V(X)=\frac{1}{\green n}\sum\limits_{i=1}^n(x_i-\green\mu)^2$$Dein Professor hat den Vorfaktor \(\frac{1}{\green n}\) der Varianz genommen, aber den Mittelwert \(\red{\overline x}\) anstelle des Erwartungswertes gewählt.

Nun zu der Aufgabe...

Anstatt \(M_X\) schreibt man gerne \(\left<X\right>\) und anstatt \(M_{X^2}\) heißt es oft \(\left<X^2\right>\). Der Erwartungswert bzw. der Mittelwert ist linear, das heißt es gelten die beiden Regeln:$$\left<X+Y\right>=\left<X\right>+\left<Y\right>\quad;\quad\left<\alpha\cdot X\right>=\alpha\cdot\left<X\right>\;\text{mit }\alpha\in\mathbb R$$Daraus kannst du den gesuchten Zusammenhang direkt herleiten:$$V(X)=\left<(X-\left<X\right>)^2\right>=\left<X^2-2X\left<X\right>+\left<X\right>^2\right>=\left<X^2\right>-\left<2X\left<X\right>\right>+\left<\left<X\right>^2\right>$$$$\phantom{V(X)}=\left<X^2\right>-2\left<X\right>\left<X\right>+\left<X\right>^2=\left<X^2\right>-2\left<X\right>^2+\left<X\right>^2=\left<X^2\right>-\left<X\right>^2$$

Avatar von 149 k 🚀

Die Formel ist nicht falsch und erst recht nicht doppelt falsch.

Es handelt sich um die klassische empirische Varianz (auch Stichprobenvarianz genannt) und eben nicht um die auf Erwartungstreue "korrigierte empirische Varianz".

Die Erklärung zur Differenzierung zwischen Erwartungswert und Mittelwert hat nochmal einiges erklärt, danke dafür!

(Ich kann leider noch keine Daumen hoch vergeben, hole das aber nach, sobald sich das ändert)

@tancelocation:

Bei der Stichprobenvarianz wird der Mittelwert \(\overline x\) der Stichprobe anstatt des exakten Erwarungswertes \(\mu\) verwendet. Die Abweichung zwischen beiden Werten pflanzt sich als Fehler in die Varianz fort. Das muss(!) bei der Stichproben-Varianz durch die \((-1)\) im Nenner korrigiert werden.

Daher ist die Formel aus dem Skript falsch.

Näheres unter

https://de.wikipedia.org/wiki/Stichprobenvarianz_(Sch%C3%A4tzfunktion)

blob.png

Etwas schöner wäre es gewesen, wenn im Skript "unkorrigierte Stichprobenvarianz" gestanden hätte. Nur, um die Abgrenzung zu wahren.

@Tschakabumba

Du hat natürlich insofern Recht, als die angegebene Formel keinen erwartungstreuen Schätzer darstellt.

Aber nur weil eine Schätzfunktion nicht erwartungstreu ist, heißt dies nicht, dass die Schätzfunktion "falsch" ist. Sie ist halt nicht optimal in Bezug auf den zu schätzenden Parameter.

Im vorliegenden Fall haben wir es mit einem asymptotisch erwartungstreuen Schätzer zu tun.

Zur zweideutigen Verwendung des Begriffes "Stichprobenvarianz" durch verschiedene Autoren inklusive Quellenangaben kannst du nochmal hier nachlesen.

Fakt ist aber dennoch, dass es die Stichprobenvarianz im Sinne des Fragestellers als Schätzer für die Varianz gibt.


p.s.: Wie ich gerade sehe, hat Der_Mathecoach einen Screenshot der von mir verlinkten Seite schon in einem Kommentar eingefügt. Sehr schön.
Vielen Dank @Der_Mathecoach.

Danke euch beiden ;)

Ich bin mir des Unterschieds durchaus bewusst. Da ich beruflich u.a. viel mit Messtechnik und Kalibirierung zu tun habe, ärgere ich mich über solche "Schlampereien" von Dozenten. Er hätte zumindest auf die Feinheiten hinweisen können.

Es gibt einen internationalen Standard für Fehlerrechnung in der Messtechnik:

https://www.bipm.org/documents/20126/2071204/JCGM_100_2008_E.pdf/cb0ef43f-baa5-11cf-3f85-4dcd86f77bd6

Daher kommt genau die Formel, die der Dozent angegeben hat, in meiner Praxis nie vor, weil die Fehler sonst falsch abgeschätzt werden.

Ich kann allerdings nicht beurteilen, wie in den Geisteswissenschaften mit dem "Problem" umgegangen wird.

Das Skript stammt aus einer Grundlagenvorlesung in Psychologie und der Prof erwähnte schon ab und zu, dass es in der Vorlesung eher um grundlegendes Prinzip-Verständnis geht und in diesem Sinn einige Vereinfachungen anzutreffen sind.

Das Skript stammt aus einer Grundlagenvorlesung in Psychologie und der Prof erwähnte schon ab und zu, dass es in der Vorlesung eher um grundlegendes Prinzip-Verständnis geht und in diesem Sinn einige Vereinfachungen anzutreffen sind.

Das ist üblich. Ich glaube, im Abitur wird auch nie die korrigierte Stichprobenvarianz genommen. Zumindest hatten wir das früher nicht gemacht. Das kann heutzutage anders gehen. Allerdings ist meiner Erfahrung nach eher viel gestrichen worden als dazugekommen ;)

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community