Es gibt Lügen, verdammte Lügen und es gibt Statistiken - Über die 1000 Fallgruben statistischer Auswertungen an der Börse (3/2005)
Statistik hat für viele den Ruf, etwas dröge und zudem unverständlich zu sein. Ob dies wirklich so ist, ist Ansichtssache, aber unbestritten ist, daß es bei Börsenprognosen immer und ausschließlich nur um Wahrscheinlichkeiten geht und daß das Verständnis von statistischen Wahrscheinlichkeiten daher essentiell für jeden Börsenteilnehmer ist. Wer das nicht begriffen hat, sitzt im sprichwörtlichen "falschen Kino". In statistischen Kategorien zu denken ist äußerst schwierig und erfordert hartes Training und Disziplin, ist aber entscheidend für den Börsenerfolg!
Hie und da bekomme ich Anfragen von Menschen (v.a. angehenden oder Möchtegern-Finanzastrologen), die auf der Suche nach der 100%igen Methode sind. Meine Antwort ist stets dieselbe: wer zu 100% gewinnen möchte, wird fast unweigerlich 100% seines Kapitals verlieren. Der Grund dafür liegt auf der Hand: wer ausschließlich Gewinne und niemals Verluste erwartet, wird keinen Gedanken an Money Management "verschwenden", aber ohne Money Management ist es nur eine Frage der Zeit, bis das Kapital zur Gänze versenkt wurde.
Ich verfaßte diesen Artikel, weil den meisten meiner Kollegen in der Börsenwelt oft haarsträubende Fehler passieren (die auch mir ganz am Anfang auch passierten), diese möchte ich hier erklären, damit Sie sie beim nächsten Mal auf einen Blick erkennen und die tatsächlich Aussagekraft einer statistischen Auswertung verstehen. Zuletzt möchte ich noch kurz das weite Feld der statistischen Manipulationen anreißen. Ich versuche, die Erklärungen so einfach wie möglich zu halten, damit sie von möglichst vielen Lesern verstanden werden.
Das Grundproblem: die menschliche Psyche
Die absolute Notwendigkeit guter statistischer Auswertungen ergibt sich aus der Tatsache, daß die menschliche Psyche einfach nicht objektiv ist, sondern gewaltigen Verzerrungen unterliegt. Das menschliche Denken ist vor allem anekdotisch und nicht statistisch, deswegen räumt man automatisch anekdotischen Hinweisen viel mehr Aussagekraft ein, selbst wenn dies auf einer gewaltigen Verzerrung oder auf reinem Zufall basiert, dazu gibt es in der Sozialpsychologie unzählige Untersuchungen.
Beispiel: angenommen, Sie wollen sich ein Auto kaufen und haben in einer Zeitschrift gelesen, daß nach 10,000 Tests die Marke XY bei weitem der Testsieger war in jenen Kategorien, die Ihnen wichtig sind. Sie wollen das Auto schon kaufen, da erzählt Ihnen Ihre Nachbarin von Problemen mit dieser Marke. Rational wäre es nun sich zu sagen, aha, jetzt ist die Stichprobe 10,001 Fahrzeuge groß, das ändert überhaupt nichts am Ergebnis. Tatsächlich aber reagieren dann die meisten Menschen "irrational" in solchen Situationen und messen der einen Aussage aus dem persönlichen Umfeld weitaus mehr Bedeutung zu als der genannten statistischen Untersuchung (und kaufen das Auto nicht).
Einige meiner Kollegen fabrizieren recht gute und brauchbare statistische Auswertungen, bei anderen Gelegenheiten aber werden Prognosen von denselben Personen mit nicht nachgerechneten "Erfahrungen" begründet. Oft, wenn ich die Erfahrungen selbst überprüfte, kam ich zum enttäuschenden Ergebnis, daß der behauptete Zusammenhang gar nicht existierte! Ob dies im Börsen- und Astrologiebereich auftritt, spielt anscheinend keine Rolle, es handelt sich um ein tief im Menschen verwurzeltes Phänomen, daß die menschliche Wahrnehmung äußerst trügerisch ist; selbst häufiges statistisches Arbeiten ist kein Garant für das Überwinden der Grundprobleme der menschlichen Wahrnehmung.
Historische (beobachtete) und prediktive Wahrscheinlichkeiten
Oft kann man von Analysten Aussagen lesen, die ungefähr so lauten: "Der Indikator X hat 4 von 5 Mal das Ereignis Y bewirkt, dies entspricht einer Wahrscheinlichkeit von 80%." Diese Zahl wird dann fast immer unkommentiert so stehengelassen, sodaß der Leser implizit den Eindruck gewinnt, man könne sich mit einer Wahrscheinlichkeit von P=80% darauf verlassen, daß sich dieses Muster wiederholt. Nicht selten wird gar explizit behauptet, die Eintretenswahrscheinlichkeit für die Zukunft (prediktive Wahrscheinlichkeit) betrage 80%, aber das ist blanker Unsinn.
Bei einer so kleinen Stichprobe (im Beispiel N=5) muß man mit einem starken Einwirken des Zufalls rechnen und der tatsächliche prognostische Effekt ist mit an Sicherheit grenzender Wahrscheinlichkeit viel kleiner als die beobachtete Wahrscheinlichkeit. Wie groß genau, kann so pauschal nicht gesagt werden und hängt von vielen Faktoren ab, sie könnte aber durchaus so niedrig wie 40% oder 20% sein! Ob etwas mit 80%iger oder 20%iger Wahrscheinlichkeit eintrifft, macht selbstredend einen gewaltigen Unterschied für den Geldbeutel.
Daß dieser Fehler von so vielen Analysten begangen wird (selbst von führenden und von mir sehr geschätzten), ist äußerst bedenklich und sogar peinlich für die ganze Branche. Zugegeben, mit steigender Zahl (N) verringert sich die Divergenz zwischen der prediktiven und der beobachteten Wahrscheinlichkeit, wenn der Indikator X z.B. in 800 von 1000 Fällen Y prognostiziert hat, dann wird dieser Indikator tatsächlich eine prediktive Wahrscheinlichkeit von nicht wesentlich weniger als 80% sein. Allerdings: so große Stichproben sind äußerst selten in der Börsenwelt, meistens wird mit 10<100 gearbeitet und da fallen diese Divergenzen (prediktive vs. historische Wahrscheinlichkeiten) sehr wohl massiv ins Gewicht.
Ist 1+1 wirklich 2? Die Verbundenheit des Universums
Das Argument oben befindet sich ja noch in voller Übereinstimmung mit den herkömmlichen statistischen Theorien, aber der nächste Punkt ist schon wesentlich schwerer zu verdauen. Ich beginne wieder mit einem Beispiel: angenommen, ein astrologischer und ein technischer Indikator prognostizieren parallel dasselbe Ereignis mit einer prediktiven Wahrscheinlichkeit von P=70%. Da die Logik sagt, daß beide Indikatoren unabhängig sein "müssen", da sie komplett unterschiedlich hergeleitet werden (technisch bzw. astrologisch), ist in diesem Falle laut den Annahmen des Bernoulli-Experiments die Irrtumswahrscheinlichkeit P = 0.3 * 0.3 = 0.09 = 9%. In der Praxis aber, so habe ich nach 1000-2000 Stunden Forschungsarbeit festgestellt, ist empirisch beobachtete Irrtumswahrscheinlichkeit deutlich höher, vielleicht in der Größenordnung von P=20%.
Dies konnte ich lange nicht verstehen und suchte zunächst den Fehler in meinen Analysen, bis mir klar wurde, daß es die Grundannahmen unserer kausalistisch-mechanistischen Weltanschauung sind, die fehlerhaft sind! Das Musterbeispiel für das Bernoulli-Experiment ist das Werfen einer Münzen, d.h. die Wahrscheinlichkeit, Kopf zu werfen, ist laut diesen Theorien immer 50%, egal ob vorher 10 Mal Kopf oder Zahl war, Ähnliches gilt für die Zahlen im Roulette (wenn es mit richtigen Dingen zugeht). Diese Annahmen berücksichtigen nicht, daß das Universum ein einziger pulsierender Organismus ist, wo alles mit allem verbunden ist, und die Unabhängigkeit von Ereignissen eine Konstruktion ist, die es eigentlich nicht gibt.
Dies ist auch der Grund, warum beispielsweise die Astrologie und Numerologie funktionieren. Ein bekannter Astrologe hat sich ein Vermögen im Casino verdient, da er wußte bzw. lernte, daß bestimmte Konstellationen und eine bestimmte "Energie" (wenn z.B. am Roulettetisch gestritten wird) mit bestimmten Zahlen korreliert (ich selbst habe mir in meiner Studentenzeit mit ähnlichen Methoden einen kleinen Nebenverdienst erwirtschaftet).
Die Konsequenzen dieser philosophischen Einsicht sind ungewöhnlich weitreichend und bedeuten, daß man nicht einfach nach dem Lehrbuch vorgehen kann, sondern man muß wiederum versuchen, diesen "universalen Verbundenheitseffekt" zu quantifizieren; wenn man dies nicht tut, werden um unrealistisch hohe Wahrscheinlichkeiten ausgewiesen. Diese eminent wichtige Tatsache berücksichtigt anscheinend außer mir niemand, aber ich hoffe, mit diesem Artikel einen Denkanstoß in diese Richtung zu geben.
Weiche und harte statistische Manipulationen
Sehr häufig sind wir statistischen Manipulationen ausgesetzt, ich möchte hier unterscheiden, wann was noch akzeptabel ist.
Manipulationen sollten in der Wissenschaft überhaupt nicht vorkommen, weiche Manipulationen kommen aber trotzdem relativ häufig vor, in einem ökonomischen Kontext (z.B. Marketing) sind sie normal zur Untermauerung von Argumenten und manchmal sogar notwendig. Die Selektion der Datenbasis für statistische Auswertungen ist die häufigste Form der sanften Manipulation, z.B. wird niemand etwas dagegen einwenden, daß ein Werbespot nur mit den - zahlenmäßig belegbaren - Vorteilen eines Produkts wirbt und nicht mit einer "Gesamtanalyse gegenüber Konkurrenzprodukten" (so gut wie undurchführbar).
Ein Beispiel aus meiner Praxis: die Amanita-Trades starteten am 23.11.2001, was zunächst Rückmeldungen einbrachte, ob dieses Datum willkürlich gewählt wurde, um die Performance besser ausschauen zu lassen. Also setzte ich später das Datum für die Performance-Kennzahlen "seit 1.1.2002" fest, dieses Datum sieht "unverdächtig" aus und es kamen keine weiteren derartigen Rückmeldungen mehr.
Harte Manipulationen sind alle Methoden, die tw. oder vollständig Betrug sind, wie z.B. viele offizielle Wirtschaftsdaten, besonders aus den USA. Harte Manipulation, selbst wenn noch so geschickt angestellt, sind niemals akzeptabel.