0 Daumen
430 Aufrufe


vorab sei gesagt, dass ich mit dem Thema "Statistik" nicht so vertraut bin und daher bitte ich Fehler zu entschuldigen.

Folgendes Problem:

Ich soll auf die gesamten Datensätze einen statistischen Hypothesentest durchführen.

zu dem Datensatz:
- dieser hat ca. 100.000 Positionen
- ich kann lediglich sagen ob sich ein Datensatz geändert hat oder nicht
(ich habe keine Informationen darüber wie viele Informationen sich in den Datensatz geändert haben)
- ich kann mir Zeiträume anzeigen lassen (Jan, Feb, Mär, ...)
- ca. 95% der Daten sind unverändert
- ca. 5% sind geändert wurden
- die Daten sind schief verteilt

Welcher statistische Hypothesentest wäre für eine schiefe Verteilung geeignet?
(T-Tests, F-Test, Gauß-Test sind leider für Normalverteilung bestimmt)

Ziel des statistischen HP-Tests:
- Unterschiede oder Gleichheit der Datensätze von Jan. und Mär. zu finden
- Gab es in dem einen Monat mehr geänderte Daten als im anderen

Ich bin über jede Hilfe froh. Leider fehlt mir jeglicher Ansatz wie ich das Problem lösen könnte.

, Hutch
Avatar von

1 Antwort

0 Daumen
Du hast recht, dass Gauß- und T-Test zumindest für einen kleinen Stichprobenumfang NV voraussetzen. Ist die Abweichung davon sehr stark, beispielsweise bei einem erheblich links schiefen Merkmal, dann kann man ihnen nicht vertrauen.

Eine Alternative sind dann sogenannten nonparametrische bzw. verteilungsfreie Tests. Der Begriff nonparametrisch bezieht sich darauf, dass nicht die Parameter der Verteilung, beispielsweise die Streuung im Vordergrund stehen, sondern generelle Charakteristika wie Median oder Quantile. Der Begriff verteilungfrei erfasst den wesentlichen Sachverhalt, dass die Verteilung der Teststatistik "unter der Hypothese H0" nicht von der Verteilung des zugrundeliegenden Merkmals abhängt. Du betrachtest also z.B. den Median und verwendest einen Vorzeichentest oder den Wilcoxon-Vorzeichen-Rang-Test.

Falls Du allerdings prüfen sollst, ob die Verteilungen der beiden Datenerhebungen gleich sind (z.B. Einkommensverteilung in Hamburg und München), dann verwendet man einen sog. Anpassungstest. Aber so, wie Du die Aufgabe geschildert hast, vermute ich, es wird nach einem verteilungsfreien Test gefragt.

Viel Erfolg!
Avatar von

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community