Auswertung einer Statistik

      @plasmapelz

      Auch verbal ein Danke für Deine Beiträge.
      Ich denke, dass ich mit den Angaben wieder einen Schritt weiter bin. Das Problem ist wohl, dass die Gesamtdatenerhebung für eine gültige Statistik ohnehin zu klein ist. Es wurden nur 50 Personen befragt. Daraus Untergruppen zu bilden macht die Sache sehr schwammig.
      Ich habe mittlerweile festgestellt, dass sich die Irrtumswahrscheinlichkeit verringert, wenn ich die erhobenen Ergebnisse durch Multiplikation fortschreibe, was ja auch nur logisch ist. Da ich den Gesamtdatenbestand jetzt jedoch nicht mehr erhöhen kann, muss ich mich mit dem Abfinden, was ich habe. In der Gesamtgruppe gibt es im Grunde nur eine Untergruppe, die den Gesamtdurchschnitt senkt und diese wurde als solche identifiziert.

      cosmopolit schrieb:

      Wenn du wirklich nur wissen willst, wie gut/schlecht die Untergruppen abgeschnitten haben, bleibt dir nur der Mittelwert oder Median als Benchmark.


      Das ist ja genau das was der T-Test macht: Vergleich der Mittelwerte zweier Stichproben. Ob man die µ einer Gruppe mit den µ seiner Untergruppen oder die µ der Untergruppen untereinander vergleicht ist dabei erstmal wurscht.
      Die Nullhypothese ist µ1==µ2 und die Alternativhypothesen sind: µ1!=µ2, oder µ1<µ2 (µ1>µ2). Die Nullhypothese soll widerlegt/abgelehnt werden - indem man eine sog. Irrtumswahrscheinlichkeit berechnet und mit einem vorgegebenen Wert alpha0 vergleicht. Die Aussage ist dann: Die Mittelwerte unterscheiden sich zufällig (Nullhypothese angenommen) oder tatsächlich (Nullhypothese abgelehnt). Bei letzterem beträgt die Irrtumswahrscheinlichkeit [alpha]. Siehe auch die relevanten Wikipedia Artikel...
      Glück ist nur ein anderes Wort für Zufall

      DickT schrieb:

      Es gilt, herauszufinden, wie gut oder schlecht die einzelnen Untergruppen waren.
      Du stellst hier ja keine Hypothese auf, welche Einflussgrößen signifikant für das Ergebnis der Untergruppen waren, also brauchst du auch keinen Signifikanztest. Wenn du wirklich nur wissen willst, wie gut/schlecht die Untergruppen abgeschnitten haben, bleibt dir nur der Mittelwert oder Median als Benchmark.
      Ein Außreißer würdest du erkennen, wenn du dir die Quartile betrachtest. Wenn ein Wert sich mehr als (0,75 Quartil- 0,25 Quartil) * 1,5 vom unteren bzw oberen Quartil entfernt hat, ist es ein Außreißer ( jedenfalls in 99,3% der Fälle liegt man richtig).

      DickT schrieb:

      Es wurde in einer Gruppe X ein Wissenstest mit 25 Fragen durchgeführt. Innerhalb der Gruppe ist es möglich, die Teilnehmer zu charakterisieren, bzw. in Untergruppen aufzuteilen. Es gilt, herauszufinden, wie gut oder schlecht die einzelnen Untergruppen waren.
      Zuerst musst Du rausfinden ob die Ergebnisse innerhalb der Gruppen überhaupt einer Normalverteilung folgen. Dazu gibt es eine Reihe von Signifikanz-Tests, z.B. den Lilliefors Test. Auch ein Quantile-Quantile Plot gegen eine Normalverteilte Zufallsgröße kann schon Auskunft geben.
      Wenn sie normalverteilt sind, hast Du Glück und kannst Dein gesamtes Wissen über Standardabweichung, Mittelwert etc. zusammen mit entsprechender Statistik anwenden. Wenn nicht, musst Du entweder auf nichtparametrische Verfahren zurückgreifen, oder auf Verfahren die mit der ermittelten Verteilung umgehen können, oder sowas wie Bootstrap anwenden, um (bedingt durch den zentralen Grenzwertsatz) eine normalverteilte Größe aus den Daten zu "erzeugen".

      DickT schrieb:

      1. Was sind die statistisch korrekten Vergleichsgrößen?
      Wenn Du die Gruppen normalverteilter Daten hast, dann kannst Du z.B. einen multiplen T-test machen, d.h. einen signifikanten Vergleich der Mittelwerte aller Gruppen untereinander. Eine andere Möglichkeit ist der sog. F-Test (ANOVA), mit dem Du mehrere Gruppen und auch deren Interaktion miteinander vergleichen kannst. Grundlage ist dabei ein lineares Modell zur Regression der Gruppen und Ermittlung entsprechender Signifikanzparameter.
      Bei nicht normalverteilten Größen gibt es eine Reihe von nichtparametrischen Tests wie Wilcoxon Rank , die aber nicht so aussagekräftig sind (aufgrund des fehlenden zugrundegelegten Modells).

      DickT schrieb:

      2. Wie valide sind Abweichungen zwischen den Durchschnitten
      Das wird in den o.g. Methoden abgedeckt...

      DickT schrieb:

      3. Gibt es vielleicht noch einen besseren Ansatz, Vergleiche aufzubauen?

      Du könntest zunächst überprüfen welche Deiner Gruppen für Änderungen in der Zielgröße überhaupt maßgeblich verantwortlich sind, z.B. durch eine sog. Hauptkomponentenanalyse (PCA). Damit kannst Du evtl. die Gruppen auf 2-3 reduzieren, die Du dann wie oben beschrieben auswertest.
      Glück ist nur ein anderes Wort für Zufall

      DickT schrieb:

      Es wurde in einer Gruppe X ein Wissenstest mit 25 Fragen durchgeführt. Innerhalb der Gruppe ist es möglich, die Teilnehmer zu charakterisieren, bzw. in Untergruppen aufzuteilen. Es gilt, herauszufinden, wie gut oder schlecht die einzelnen Untergruppen waren.
      Zuerst musst Du rausfinden ob die Ergebnisse innerhalb der Gruppen überhaupt einer Normalverteilung folgen. Dazu gibt es eine Reihe von Signifikanz-Tests, z.B. den 1. Was sind die statistisch korrekten Vergleichsgrößen?Wenn Du die Gruppen normalverteilter Daten hast, dann kannst Du z.B. einen multiplen T-test machen, d.h. einen signifikanten Vergleich der Mittelwerte aller Gruppen untereinander. Eine andere Möglichkeit ist der sog. 2. Wie valide sind Abweichungen zwischen den DurchschnittenDas wird in den o.g. Methoden abgedeckt...

      [quote='DickT',index.php?page=Thread&postID=147357#post147357]3. Gibt es vielleicht noch einen besseren Ansatz, Vergleiche aufzubauen?
      Du könntest zunächst überprüfen welche Deiner Gruppen für Änderungen in der Zielgröße überhaupt maßgeblich verantwortlich sind, z.B. durch eine sog. [url='http://en.wikipedia.org/wiki/Principal_component_analysis']Hauptkomponentenanalyse. Damit kannst Du evtl. die Gruppen auf 2-3 reduzieren, die Du dann wie oben beschrieben auswertest.
      Glück ist nur ein anderes Wort für Zufall

      Auswertung einer Statistik

      Einige von Euch haben sicherlich mehr Erfahrung in der Auswertung einer Statisik als ich. Da ich in meinem persönlichen Umfeld niemanden kenne, der mir folgende Fragen beantworten kann, stelle ich das "Problem" hier zur Diskussion.

      Die Ausgangslage:
      Es wurde in einer Gruppe X ein Wissenstest mit 25 Fragen durchgeführt. Innerhalb der Gruppe ist es möglich, die Teilnehmer zu charakterisieren, bzw. in Untergruppen aufzuteilen. Es gilt, herauszufinden, wie gut oder schlecht die einzelnen Untergruppen waren.

      Die Fragen lauten nun:

      1. Was sind die statistisch korrekten Vergleichsgrößen? Also: Vergleiche ich eine Untergruppe Y mit dem Gesamtdurchschnitt von X oder vergleiche ich den Durchschnitt der Untergruppe Y mit dem Durchschnitt von der Gesamtgruppe minus Untergruppe: X-Y Was ist hier die "bessere" Benchmark?

      2. Wie valide sind Abweichungen zwischen den Durchschnitten, wenn sie sich innerhalb der einfachen Standardabweichung (SD) bewegen?
      Im konkreten Fall liegt der Durchschnitt der Gesamtgruppe X bei 15,28, die SD bei 2,11 und der am stärksten abweichende Durchschnitt einer Untergruppe bei 13,5. Wenn man bei der einfachen SD annimmt, dass sie +- Durchschnitt 68% aller Werte umfasst, kann man sicher nicht von "Ausreißern" sprechen. Dennoch würde ich sagen, dass hier eine Tendenz abzulesen ist, oder nicht?

      3. Gibt es vielleicht noch einen besseren Ansatz, Vergleiche aufzubauen?

      Vielen Dank für eine Antwort!

      Edit: Es wäre schön, wenn es sich bei den Antworten nicht um einfache Meinungen aus dem Bauch heraus handelt, sondern tatsächlich um gesicherte Antworten im Sinne einer statistischen Interpretation.