Ich wurde gefragt, wie man die Darstellung empirischer Verteilungsdichten von Renditen (und anderer Zufallsgrößen ebenso) mit Excel realisieren könnte.
Leider ist die Antwort, daß es mit den Standard-Funktionen in Excel nicht völlig korrekt geht, man kann sich nur mit den eingebauten Statistik-Funktionen, z. B. HÄUFIGKEIT(), behelfen, die aber je nach Fall-Lage mal mehr und mal weniger brauchbare Lösungen liefern.
Ursache dafür ist, daß bei empirischen Werten ja nur punktuelle Daten an den Meßpunkten eines ganz konkreten Zufallspfades vorliegen. Diese kann man mit Excel auch zählen und z. B. als Histogramm darstellen.
Um aber eine Verteilungsfunktion aus den empirischen Daten zu schätzen, muß man irgendwelche Annahmen machen, wie sehr die Wahrscheinlichkeit in der Nähe der gemessenen Punkte "verschmiert" ist. Dazu benutzt man einen sog.
Schätzkern (hier noch eine
Erklärungmit einem Beispiel für zuviel und zuwenig "verschmieren"), der eine weitgehend wählbare Funktion ist, die angibt, wie die von der durch die Beobachtung an der Stelle der Messung "konzentrierten" Wahrscheinlichkeit auf die Umgebung übertragen wird ("breit geschmiert") wird.
Wichtig ist dabei, wie breit und in welcher Form (z. B. gleichmäßig oder mehr in der Nähe und weniger in der Ferne des Punktes, schnell oder langsam abfallend) die Wahrscheinlichkeit "verschmiert" wird. Unterschiedliche Schätzkerne liefern unterschiedliche Ergebnisse, die z. B. sehr gleichmäßige Bilder liefern können oder doch recht stark von den konkret gemessenen Punkten dominiert werden können. Da gibt es verschiedene Optimierungs-Kriterien, wobei für die praktische Nutzung der reine Augenschein schon mal einen Anhaltspunkt geben kann.
Eine statistisch korrekte Auswertung in Excel müßte solche Berechnungen in einer selbst geschriebenen VBA-Funktion durchführen, die man bestimmt irgendwo im Netz finden kann und die in diversen Statistik-Add-Ons bestimmt auch vorhanden sein sollte.
Einfacher geht das in einer ausgewiesenen Statistik-Software, wie z. B.
R, wo das z. B. mit der Funktion density() funktioniert.
Wenn viele Beobachtungen vorliegen und die Intervalle eng sind, ist der Fehler mit der Excel-Lösung für praktische Zwecke vernachlässigbar, in anderen Fällen "verzackt" die Kurve ziemlich und "klebt" zu sehr an den konkreten Meßwerten und stellt damit den allgemeinen Zufallsvorgang nicht richtig dar. Eine grobe Faustregel Faustregel sagt, daß für halbwegs vernünftige Ergebnisse in jeder Klasse im Mittel mindestens sechs Beobachtungen vorliegen sollten.
Übrigens verbleibt auch bei Wahl eines vernünftigen Schätzkerns ein bestimmtes Maß an Willkür in der Parametrisierung,