You are not logged in.

DickT

Professional

  • "DickT" started this thread

Posts: 799

Thanks: 218

  • Send private message

6

Wednesday, April 29th 2009, 1:48pm

@plasmapelz

Auch verbal ein Danke für Deine Beiträge.
Ich denke, dass ich mit den Angaben wieder einen Schritt weiter bin. Das Problem ist wohl, dass die Gesamtdatenerhebung für eine gültige Statistik ohnehin zu klein ist. Es wurden nur 50 Personen befragt. Daraus Untergruppen zu bilden macht die Sache sehr schwammig.
Ich habe mittlerweile festgestellt, dass sich die Irrtumswahrscheinlichkeit verringert, wenn ich die erhobenen Ergebnisse durch Multiplikation fortschreibe, was ja auch nur logisch ist. Da ich den Gesamtdatenbestand jetzt jedoch nicht mehr erhöhen kann, muss ich mich mit dem Abfinden, was ich habe. In der Gesamtgruppe gibt es im Grunde nur eine Untergruppe, die den Gesamtdurchschnitt senkt und diese wurde als solche identifiziert.

Posts: 348

Location: Hamburg

Thanks: 42

  • Send private message

5

Wednesday, April 29th 2009, 1:24pm

Wenn du wirklich nur wissen willst, wie gut/schlecht die Untergruppen abgeschnitten haben, bleibt dir nur der Mittelwert oder Median als Benchmark.


Das ist ja genau das was der T-Test macht: Vergleich der Mittelwerte zweier Stichproben. Ob man die µ einer Gruppe mit den µ seiner Untergruppen oder die µ der Untergruppen untereinander vergleicht ist dabei erstmal wurscht.
Die Nullhypothese ist µ1==µ2 und die Alternativhypothesen sind: µ1!=µ2, oder µ1<µ2 (µ1>µ2). Die Nullhypothese soll widerlegt/abgelehnt werden - indem man eine sog. Irrtumswahrscheinlichkeit berechnet und mit einem vorgegebenen Wert alpha0 vergleicht. Die Aussage ist dann: Die Mittelwerte unterscheiden sich zufällig (Nullhypothese angenommen) oder tatsächlich (Nullhypothese abgelehnt). Bei letzterem beträgt die Irrtumswahrscheinlichkeit [alpha]. Siehe auch die relevanten Wikipedia Artikel...
Glück ist nur ein anderes Wort für Zufall

1 registered user thanked already.

Users who thanked for this post:

DickT (29.04.2009)

cosmopolit

Professional

Posts: 1,634

Location: Berlin

Thanks: 272

  • Send private message

4

Wednesday, April 29th 2009, 12:54pm

Es gilt, herauszufinden, wie gut oder schlecht die einzelnen Untergruppen waren.
Du stellst hier ja keine Hypothese auf, welche Einflussgrößen signifikant für das Ergebnis der Untergruppen waren, also brauchst du auch keinen Signifikanztest. Wenn du wirklich nur wissen willst, wie gut/schlecht die Untergruppen abgeschnitten haben, bleibt dir nur der Mittelwert oder Median als Benchmark.
Ein Außreißer würdest du erkennen, wenn du dir die Quartile betrachtest. Wenn ein Wert sich mehr als (0,75 Quartil- 0,25 Quartil) * 1,5 vom unteren bzw oberen Quartil entfernt hat, ist es ein Außreißer ( jedenfalls in 99,3% der Fälle liegt man richtig).

Posts: 348

Location: Hamburg

Thanks: 42

  • Send private message

3

Tuesday, April 28th 2009, 10:59am

Es wurde in einer Gruppe X ein Wissenstest mit 25 Fragen durchgeführt. Innerhalb der Gruppe ist es möglich, die Teilnehmer zu charakterisieren, bzw. in Untergruppen aufzuteilen. Es gilt, herauszufinden, wie gut oder schlecht die einzelnen Untergruppen waren.
Zuerst musst Du rausfinden ob die Ergebnisse innerhalb der Gruppen überhaupt einer Normalverteilung folgen. Dazu gibt es eine Reihe von Signifikanz-Tests, z.B. den Lilliefors Test. Auch ein Quantile-Quantile Plot gegen eine Normalverteilte Zufallsgröße kann schon Auskunft geben.
Wenn sie normalverteilt sind, hast Du Glück und kannst Dein gesamtes Wissen über Standardabweichung, Mittelwert etc. zusammen mit entsprechender Statistik anwenden. Wenn nicht, musst Du entweder auf nichtparametrische Verfahren zurückgreifen, oder auf Verfahren die mit der ermittelten Verteilung umgehen können, oder sowas wie Bootstrap anwenden, um (bedingt durch den zentralen Grenzwertsatz) eine normalverteilte Größe aus den Daten zu "erzeugen".

1. Was sind die statistisch korrekten Vergleichsgrößen?
Wenn Du die Gruppen normalverteilter Daten hast, dann kannst Du z.B. einen multiplen T-test machen, d.h. einen signifikanten Vergleich der Mittelwerte aller Gruppen untereinander. Eine andere Möglichkeit ist der sog. F-Test (ANOVA), mit dem Du mehrere Gruppen und auch deren Interaktion miteinander vergleichen kannst. Grundlage ist dabei ein lineares Modell zur Regression der Gruppen und Ermittlung entsprechender Signifikanzparameter.
Bei nicht normalverteilten Größen gibt es eine Reihe von nichtparametrischen Tests wie Wilcoxon Rank , die aber nicht so aussagekräftig sind (aufgrund des fehlenden zugrundegelegten Modells).
2. Wie valide sind Abweichungen zwischen den Durchschnitten
Das wird in den o.g. Methoden abgedeckt...

3. Gibt es vielleicht noch einen besseren Ansatz, Vergleiche aufzubauen?

Du könntest zunächst überprüfen welche Deiner Gruppen für Änderungen in der Zielgröße überhaupt maßgeblich verantwortlich sind, z.B. durch eine sog. Hauptkomponentenanalyse (PCA). Damit kannst Du evtl. die Gruppen auf 2-3 reduzieren, die Du dann wie oben beschrieben auswertest.
Glück ist nur ein anderes Wort für Zufall

Posts: 348

Location: Hamburg

Thanks: 42

  • Send private message

2

Tuesday, April 28th 2009, 10:56am

Es wurde in einer Gruppe X ein Wissenstest mit 25 Fragen durchgeführt. Innerhalb der Gruppe ist es möglich, die Teilnehmer zu charakterisieren, bzw. in Untergruppen aufzuteilen. Es gilt, herauszufinden, wie gut oder schlecht die einzelnen Untergruppen waren.
Zuerst musst Du rausfinden ob die Ergebnisse innerhalb der Gruppen überhaupt einer Normalverteilung folgen. Dazu gibt es eine Reihe von Signifikanz-Tests, z.B. den 1. Was sind die statistisch korrekten Vergleichsgrößen?Wenn Du die Gruppen normalverteilter Daten hast, dann kannst Du z.B. einen multiplen T-test machen, d.h. einen signifikanten Vergleich der Mittelwerte aller Gruppen untereinander. Eine andere Möglichkeit ist der sog. 2. Wie valide sind Abweichungen zwischen den DurchschnittenDas wird in den o.g. Methoden abgedeckt...

[quote='DickT',index.php?page=Thread&postID=147357#post147357]3. Gibt es vielleicht noch einen besseren Ansatz, Vergleiche aufzubauen?
Du könntest zunächst überprüfen welche Deiner Gruppen für Änderungen in der Zielgröße überhaupt maßgeblich verantwortlich sind, z.B. durch eine sog. [url='http://en.wikipedia.org/wiki/Principal_component_analysis']Hauptkomponentenanalyse. Damit kannst Du evtl. die Gruppen auf 2-3 reduzieren, die Du dann wie oben beschrieben auswertest.
Glück ist nur ein anderes Wort für Zufall

DickT

Professional

  • "DickT" started this thread

Posts: 799

Thanks: 218

  • Send private message

1

Tuesday, April 28th 2009, 10:05am

Auswertung einer Statistik

Einige von Euch haben sicherlich mehr Erfahrung in der Auswertung einer Statisik als ich. Da ich in meinem persönlichen Umfeld niemanden kenne, der mir folgende Fragen beantworten kann, stelle ich das "Problem" hier zur Diskussion.

Die Ausgangslage:
Es wurde in einer Gruppe X ein Wissenstest mit 25 Fragen durchgeführt. Innerhalb der Gruppe ist es möglich, die Teilnehmer zu charakterisieren, bzw. in Untergruppen aufzuteilen. Es gilt, herauszufinden, wie gut oder schlecht die einzelnen Untergruppen waren.

Die Fragen lauten nun:

1. Was sind die statistisch korrekten Vergleichsgrößen? Also: Vergleiche ich eine Untergruppe Y mit dem Gesamtdurchschnitt von X oder vergleiche ich den Durchschnitt der Untergruppe Y mit dem Durchschnitt von der Gesamtgruppe minus Untergruppe: X-Y Was ist hier die "bessere" Benchmark?

2. Wie valide sind Abweichungen zwischen den Durchschnitten, wenn sie sich innerhalb der einfachen Standardabweichung (SD) bewegen?
Im konkreten Fall liegt der Durchschnitt der Gesamtgruppe X bei 15,28, die SD bei 2,11 und der am stärksten abweichende Durchschnitt einer Untergruppe bei 13,5. Wenn man bei der einfachen SD annimmt, dass sie +- Durchschnitt 68% aller Werte umfasst, kann man sicher nicht von "Ausreißern" sprechen. Dennoch würde ich sagen, dass hier eine Tendenz abzulesen ist, oder nicht?

3. Gibt es vielleicht noch einen besseren Ansatz, Vergleiche aufzubauen?

Vielen Dank für eine Antwort!

Edit: Es wäre schön, wenn es sich bei den Antworten nicht um einfache Meinungen aus dem Bauch heraus handelt, sondern tatsächlich um gesicherte Antworten im Sinne einer statistischen Interpretation.

Similar threads