EIG047 Wahrscheinlichkeitsworte

avatar
Thomas Kahle

Was bedeutet das Wort „wahrscheinlich“ in einer Aussage wie „Es ist ziemlich wahrscheinlich, dass Bayern wieder deutscher Meister wird“? Und was ist mit „Das Coronavirus ist wahrscheinlich im Labor entstanden“ ? Heute geht’s um Interpretationen von Wahrscheinlichkeiten und wie wir darüber sprechen.

Feedback gerne auf Mastodon @Eigenraum@podcasts.social, an feedback (bei) eigenpod.de oder in die Kommentarspalte auf der Episodenseite.

Verwandte Folge:

Automatisch generiertes Transkript (nicht geprüft)
Music.
So, hallo zusammen, ihr Lieben da draußen an euren Empfangsgeräten.
Willkommen zum Eigenraum.
Schön, das neue Intro zu hören. Ich hoffe, euch gefällt es auch immer noch bei
seiner zweiten Anwendung.
Ich bin mal wieder auf Sendung und wie ich es manchmal tue, habe ich neulich
mal einen Podcast gehört.
Und in diesem Fall handelte es sich um den Zeit-Führ-Ton-Podcast,
den Podcast, die sogenannte Gegenwart. Und in dieser Folge ging es um Verschwörungstheorien
und die Lab-Leak-Hypothese insbesondere.
Ihr wisst schon, Corona und die Menschen wollen immer wissen,
wer schuld war und Ijoma Mangold und Lars Weisburt, die diskutieren darüber.
Was passiert, wenn die Verschwörungstheorien doch stimmen.
Und sie haben auch eine kurze Diskussion darüber, was es bedeutet,
dass eine gewisse Wahrscheinlichkeit besteht, dass es doch ein Lab-Leak war,
also das Virus irgendwie aus diesem Labor ausgebrochen ist.
Und darüber habe ich ein Weißchen nachgedacht und möchte heute auch mal ein
bisschen darüber reden mit euch. Es wird ein bisschen fürtonistisch,
also ich warne euch schon, die Inspiration durch den Fürton-Podcast könnte durchkommen
und ich habe vielleicht auch nicht so richtig die Antworten.
Und als ich mich dann mit diesem Thema Lab League und wie wahrscheinlich ist
das eigentlich auseinandergesetzt habe, dann bin ich auf so einen Kommentar
in Spektrum der Wissenschaft gekommen, den ich euch auch mal verlinke.
Und darin heißt es dann zum Beispiel, bereits 2020 habe der BND demnach festgestellt,
dass ein Ursprung der Krankheit im Labor wahrscheinlich sei.
Also erstmal grundlegend ist es jetzt hier ein Mathe-Podcast, wie die meisten wissen.
Und ich will gar nicht über die Corona-Pandemie reden und auch schon gar nicht
über Verschwörungserzählungen oder sowas.
Dazu habe ich eigentlich wenig zu sagen oder jedenfalls nicht hier.
Aber diese Benutzung des Wortes wahrscheinlich, dass ein Ursprung der Krankheit
im Labor wahrscheinlich sei, da bin ich irgendwie dran hängen geblieben.
Das Fazit dieses Kommentars im Spektrum der Wissenschaft ist gut.
Also was macht also den Fokus auf eine geheime Verschwörung so reizvoll?
Er ist bequem, denn es tut gut aufgestauten Leid aus der Pandemiezeit auf irgendeinen
Schuldigen zu schieben, zum Beispiel den Geheimnis-Krämerischen Staat,
ein dubioses Labor oder gefährliche Experimente, Übris der Menschheit und so weiter.
Und die wahrscheinlichere Variante, oh, da war es schon wieder,
immer noch aus dem Kommentar, die wahrscheinlichere Variante ist,
dass ein natürlicher Prozess den Anstoß zur Pandemie gab und das ist offenbar
für viele schwer zu akzeptieren,
denn dann müssen sie sich mit ihren anderen Problemen befassen,
die nicht so leicht wegzuschieben sind.
Also die Kommentatorin da, die kommentiert also in diese Richtung,
dass die Lab-Leap-Kürbothese eine Art Ablenkungsmanöver ist,
mit dem wir von unseren eigentlichen Problemen ablenken wollen,
indem wir darüber diskutieren und das kann natürlich sein,
aber auch da wurde wieder das Wort wahrscheinlich verwendet,
die wahrscheinlichere Variante, dass es einen natürlichen Prozess zum Anschluss
der Pandemie gab und ich frage mich irgendwie die ganze Zeit,
was das eigentlich heißen soll.
Es gibt eigentlich zwei grundlegende Zugänge zu Wahrscheinlichkeiten,
die man so aus, ich sag mal, philosophischer Sicht betrachten kann.
Der einfachste ist der, den man intuitiv mit dem Münzwurf verbindet.
Manche Dinge sind einfach schwer vorherzusagen. Wir beobachten Dinge,
die zufällig sind und die uns wie Zufall erscheinen in der Welt,
zum Beispiel der gute alte Münzwurf, von dem wir es ja auch in der Folge über
die empirische Münzwurfforschung schon sehr lange hatten und den benutzen wir
ja, um Zufall zu erzeugen und wir können im Prinzip nicht vorhersagen,
wie das Ergebnis sein wird, ob Kopf oder Zahl oben liegt.
Und die sogenannte frequentistische Interpretation der Wahrscheinlichkeit, die sagt nun.
Dinge wie zum Beispiel diese Münze haben eine intrinsische Eigenschaft,
die wir als eine Wahrscheinlichkeit für einen bestimmten Ausgang wahrnehmen.
So wie zum Beispiel, wenn ich eine Münze immer wieder werfe,
dann beobachte ich, dass in der Hälfte der Fälle Kopf oben liegt,
in der Hälfte der Fälle Zahl oben liegt und eigentlich nie die Münze auf dem Rand stehen bleibt.
Und ich habe dann eine physikalische Erklärung dafür und da gibt es dann irgendwelche
Differenzialgleichungen vielleicht und damit komme ich eigentlich ganz gut durchs
Leben mit dieser Eigenschaft,
dass ich mit dieser einen Zahl 50-50 Wahrscheinlichkeit eine ganze Reihe von
Beobachtungen zusammenfassen kann,
ausdrücken kann und gleichzeitig, was mir diese Beobachtungen über die Zukunft sagen.
Über die Zukunft sagen sie mir, monetär ausgedrückt, dass ich nicht viel Geld
auf einen Ausgang wetten sollte, denn nichts ist sicher.
So, aber diese Eigenschaft dieser Münze, dieses 50-50, ist das jetzt eine Eigenschaft dieser Münze?
Eigentlich nicht, denn wenn man sie immer gleich wirft, landet sie immer gleich.
Der Münzwurf ist ein deterministischer Prozess, da ist nichts Stochastisches,
da ist kein Quanteneffekt, da ist kein Chaos.
Wenn man die Münze mit einer Maschine, zum Beispiel einer perfekten Münzwurfmaschine,
immer gleich wirft, kommt auch immer das gleiche Ergebnis raus.
Also hört euch auf jeden Fall nochmal diese Folge zur empirischen Münzwurfforschung
an, wenn ihr es noch nicht getan habt.
Und dieses 50-50, was wir beobachten, das ist eigentlich eine...
Nicht kontrollierbare Veränderung der Anfangsbedingungen dieses deterministischen Prozesses.
Und so ein frequentistisch argumentierender Mensch, der versteht trotzdem eine
Wahrscheinlichkeit als also eine langfristige relative Häufigkeit eines Ereignisses.
Also wenn man viele ähnliche Fälle betrachtet, was passiert denn da?
Und diese Münzenwürfe, die sind in dem Sinne alle ähnlich, dass man immer diese
Münzen wirft und dass es da kleine Veränderungen in den Anfangsbedingungen gibt,
die dann dazu führen, dass das Ergebnis nicht oder nur ganz schwer vorhersagbar ist,
dann kann man das eben so abstrahieren, dass für viele Versuche eben immer in
der Hälfte der Fälle das eine in der Hälfte der Fälle das andere rauskommt.
Aber wenn jetzt ein Geheimdienst wie der BND in diesem Spektrum-Kommentar sagt,
es wäre wahrscheinlich, dass das Virus aus dem Labor entwichen ist,
dann würde das ja in dieser Interpretation bedeuten, dass bei vergleichbaren Situationen,
also anderen Corona-Pandemien mit ähnlicher Beweislage fünf Jahre nach dem Ereignis
irgendwie mehr als 50 von 100 Fällen.
Dieses Ereignis vorliegt oder was soll das bedeuten, wenn der BND sagt,
eine Lab-Leak wäre wahrscheinlich.
Tja, was interessant ist auf jeden Fall, ist die Beobachtung,
dass in dieser Aussage nur von dem Wort wahrscheinlich gesprochen wird.
Was heißt eigentlich wahrscheinlich?
Als ich eben gerade über die Münze gesprochen habe, habe ich schon so Zahlen benutzt.
Also 50-50-Chance, eben eine 50% oder 1,5 Wahrscheinlichkeit.
Und das ist Mathematik, damit kann man rechnen.
Da hat also eigentlich schon so eine Art Modellierung stattgefunden.
Der BND sagt aber einfach nur, wahrscheinlich.
Also wenn man versucht rauszufinden, was der BND damit meint,
dann kommt man jetzt auf einen interessanten Bereich der Psychologie,
der sich damit beschäftigt, was Geheimdienstberichte eigentlich bedeuten.
Und ich habe da mal ein bisschen recherchiert. Und da sind mir sogar Paper aufgefallen.
Also ein aktuelles Paper, was ich dann auch mal gelesen habe,
das ist mir neulich auf Social Media untergekommen. Ja, Social Media ist doch
zu irgendwas gut. In diesem Fall war es Blue Sky.
Und das Paper ist erschienen in dem Journal Intelligence and National Security.
Also es ist ein Journal, das sich sozusagen Geheimdiensten und nationaler Sicherheit
widmet. Und da findet sich dann das Paper Visualizing vs.
Verbalizing Uncertainty in Intelligence Analysis, also zu Deutsch Unsicherheit
visualisieren oder verbalisieren in Geheimdienstberichten.
Und genau darum geht es in dem Paper. Die haben eben festgestellt,
und das ist auch in der Literatur gut belegt, dass Geheimdienstberichte oft diese Worte enthalten.
Also genau sowas wie wahrscheinlich, sehr wahrscheinlich, fast sicher, fast sicher nicht.
Und dass dort auf Zahlen gemeinhin verzichtet wird.
Und dafür gibt es auch einen Grund. Also erstmal grundlegend,
Wahrscheinlichkeiten können auf verschiedene Arten dargestellt werden.
Also man hat diese Worte, die wir aus unserem Sprachgebrauch haben.
Dann hat man die mathematische Modellierung als Zahlen, vielleicht Zahlen zwischen
0 und 1 oder die bekannten Prozentzahlen.
Und in dem Paper wird jetzt eben noch die Grafik, die Visualisierung als dritte
Alternative diskutiert.
Aber die Geheimdienste bevorzugen tatsächlich Worte.
Da gibt es einige juicy Zitate. The intelligence community has assumed the use
of numbers as a primary means of communicating uncertainty.
Also sie wollen das nicht, die Geheimdienste wollen das nicht.
Zum Beispiel, weil Menschen irgendwie natürliche Kommunikation über mathematische
Kommunikation stellen und ja, das verbale System, also das Sprachverarbeitungssystem
irgendwie natürlicher ist und den Menschen näher liegt.
Aber ein interessantes Argument in dem Paper fand ich auch, dass es so eine
Einstellung gibt in diesen Geheimdiensten, dass eben Geheimdienste so eine Art
Kunst sind und wie so eine Martial Arts oder so und dass es eben nicht Mathematik ist.
Also man kann nicht ausrechnen, sondern man muss immer das mit Sprache ausdrücken,
weil es eben diesen künstlerischen und mystischen Aspekt hat und keine Mathematik
ist, wo man irgendwas berechnen kann.
Okay, also die Ambiguität wird quasi bewusst in Kauf genommen.
Also das Paper schlägt dann vor, visuelle Darstellungen zu verwenden,
wo zum Beispiel mit der Strichdicke oder so in Grafiken Wahrscheinlichkeiten
dargestellt werden und analysiert das dann empirisch. Und naja,
das könnt ihr euch mal durchlesen, das verlinke ich dann.
Wie dem auch sei, wenn der BND sagt, es sei wahrscheinlich, dann ist es dem
wahrscheinlich auch egal, ob damit jetzt eine Zahl gemeint ist,
also ob das jetzt 51% bedeutet oder 71% bedeutet.
Wahrscheinlich, und ich benutze das jetzt absolut nicht so oft,
bedeutet es gar nichts davon.
Also es ist eben eine sprachliche Aussage, die man vielleicht gar nicht so an
diesen Zahlen messen soll.
Also was jedenfalls sicher ist, ist, dass so eine frequentistische Interpretation
von Einzelereignissen Quatsch ist.
Den Würfel können wir immer wieder werfen oder die Münze.
Aber ob dieser LabLeak jetzt stattgefunden hat oder nicht stattgefunden hat,
das ist eben ein einzelnes Ereignis. Und es hat entweder stattgefunden oder
es hat nicht stattgefunden.
Und wir und der BND reden dann eben eigentlich nicht über die Wahrscheinlichkeit
in einem Sinne eines zufälligen Experiments, sondern vielleicht eigentlich über
unseren aktuellen Unwissenheitsstand.
Wir verwechseln also eigentlich unsere Unwissenheit über den Ausgang eines Münzwurfs,
die wir mit Wahrscheinlichkeiten ausdrücken,
mit unserer Unwissenheit, ob ein gewisses Ereignis in der Vergangenheit stattgefunden
hat oder nicht stattgefunden hat.
In beiden Fällen haben wir eben so eine unscharfe Sicht auf die Dinge,
können uns nicht eindeutig festlegen und auch wenn die Gründe unterschiedlich
sind, sind unsere sprachlichen Konstrukte eben sehr ähnlich und deswegen benutzen
wir diese Wahrscheinlichkeitsbegriffe.
Aber das ist auch der Mathematik nicht entgangen, dass wir, wenn wir über Wahrscheinlichkeiten
reden, irgendwie auch so ein bisschen über uns selbst reden,
über unseren eigenen Wissens- und Unwissenheitsstand.
Und so kommt es eben zu der sogenannten Bayeschen Statistik,
also das ist jetzt die zweite Interpretation von Wahrscheinlichkeiten.
Oben hatten wir die frequentistische, die sozusagen von Wiederholungen von Experimenten
ausgeht und dann der Beobachtung der Statistik, was bei diesen Experimenten passiert.
Da geht die Bayesche Wahrscheinlichkeit oder die Bayesche Interpretation von
Wahrscheinlichkeit irgendwie mehr vom Menschen aus.
Und dort ist die Wahrscheinlichkeit eine Aussage über Überzeugung von Menschen.
Und die Überzeugung, die kann sich eben auch mal ändern, in Anbetracht neuer Evidenz zum Beispiel.
Und beim Münzwurf ist eben meine Überzeugung, dass ich nicht vorhersagen kann,
ob Kopf oder Zahl kommt, entstanden aus langen Beobachtungen.
Also viele von den Prinzipien, die Wahrscheinlichkeiten aus Beobachtungen herleiten,
lassen sich auch auf die Bayesche Statistik übertragen.
Naja, also Bayesche Statistik basiert auf dem sogenannten Satz von Bayes,
einer, man könnte sagen, vielleicht komplett überbewerteten kleinen Formel,
die schon sehr lange bekannt ist.
Und diese Formel drückt aus, dass man eine bestimmte bedingte Wahrscheinlichkeit
eines Ereignisses, sagen wir A, gegeben eines zweiten Ereignisses B,
ausrechnen kann, aus der bedingten Wahrscheinlichkeit von B gegeben A.
Also das, was einen irgendwie interessiert, wäre dann das Ereignis A und das,
was man beobachtet oder ein neuer Beweis wäre dann das Ereignis B.
Und man will wissen, was ist die Wahrscheinlichkeit, dass Ereignis A eintritt,
gegeben, dass ich jetzt weiß, dass Ereignis B eingetreten ist,
mein Beweis für die Läppli-Hypothese oder eben meine Beobachtung.
B wie Beobachtung, B wie Beweis passt eigentlich ganz gut.
Und die Formel ist eigentlich ganz einfach. Man kann sie sich schön in so einer
symmetrischen Version merken.
Die Wahrscheinlichkeit von B multipliziert mit der bedingten Wahrscheinlichkeit von A gegeben B,
ist das gleiche wie die Wahrscheinlichkeit von A multipliziert mit der Blinkenwahrscheinlichkeit
von B gegeben A. Also umgedreht.
Und drei von diesen Größen kann man irgendwie schätzen.
Und die Wahrscheinlichkeit von dem Ereignis, was mich interessiert,
gegeben mein Beweis oder Beobachtung, ist das, was mich interessiert.
Und das Postulat ist nun, dass das eigentlich irgendwie unser Gehirn die ganze
Zeit so eine Tabelle von irgendwelchen Wahrscheinlichkeiten mitführt und die
dann immer so aktualisiert nach dieser Regel.
Also immer wenn neue Evidenz hereinkommt, rechnet unser Gehirn und da wird es
jetzt schon so ein bisschen fishy, würde ich sagen,
rechnet unser Gehirn mithilfe von dieser Formel und Schätzungen für die einzelnen
Wahrscheinlichkeiten, wie wahrscheinlich war der Beweis gegeben,
dass das Ereignis eingetreten ist, wie wahrscheinlich war der Beweis überhaupt
und wie wahrscheinlich war das Ereignis, rechnet es irgendwie aus,
die nun bedingte Wahrscheinlichkeit für ein Ereignis gegeben,
dass ich den Beweis gesehen habe.
Also man hat dann die Wahrscheinlichkeit, die man vorher, die Schätzung für
eine Wahrscheinlichkeit, die man vorher hatte, den Prior und dann nach dem Update
erhält man den Posterior und die Theorie ist irgendwie so,
dass man jetzt die ganze Zeit diese ganzen Priors mit sich rumträgt und anhand
der vorhandenen Evidenz, der Beobachtung der Welt die ganze Zeit im Gehirn das
irgendwie alles updatet.
Aber Aber also aus theoretischer Sicht ist es vielleicht schon attraktiv oder
wenn man es auf kleine Szenarios wie so einen medizinischen Wirksamkeitstest
von irgendeinem Medikament runter bricht, dann ergibt das auch alles Sinn.
Aber ob man das jetzt benutzen kann, um zu modellieren, wie der BND zu seiner
Aussage kam, es war wahrscheinlicher, dass es ein Lab League gab,
ach, ich weiß auch nicht, ob die da wirklich mit Base-Formel rumgerechnet haben,
nachdem sie geschätzt haben, was die totale Wahrscheinlichkeit für den Beweis war.
Halte ich für eher unwahrscheinlich.
Das Bayes'che Framework erlaubt übrigens auch noch weiteren Kontext mit einzubeziehen.
Eben diese Wahrscheinlichkeit des
Beweises oder die Wahrscheinlichkeit der Beobachtung P von B erlaubt das.
Wenn ich zum Beispiel sehe, dass eine Maschine eine Münze wirft,
die Maschine ist irgendwie total clever konstruiert und genau eingestellt und
ich habe schon zehnmal gesehen, wie sie hintereinander immer Kopf geworfen hat,
dann würde ich in Anbetracht dieser Evidenz meine Meinung über die Münze vielleicht ändern.
Und ich würde diese Meinung anders ändern, als wenn ich einfach einen Schiri
beobachte, der immer irgendwie die Münze wirft.
Also ich kann über diese Wahrscheinlichkeit meiner Beobachtung,
was ist die Wahrscheinlichkeit einer Beobachtung, da noch einige Randbedingungen
einbauen. Also es ist ein sehr flexibles Framework, was einem noch mehr Modellierungen erlaubt.
Zusammenfassend kann man also sagen, eine Bayesianerin interpretiert Wahrscheinlichkeiten
also als Ausdruck eines Wissensstands oder eines Unwissenheitsstands.
Das ist zwar kompatibel mit dieser BND-Aussage wahrscheinlich,
aber ich denke irgendwie nicht, dass der BND da irgendwie so eine Bayesische Statistik gemacht hat,
dann einen Posterior ausgerechnet hat und dann in einer Tabelle nachgeguckt
hat, okay, unser Posterior war, wir haben jetzt eine 74% Wahrscheinlichkeit ausgerechnet.
Dass es in Läplig war und dafür verwenden wir jetzt das Wort wahrscheinlich.
Denn wir haben ja erst im Journalpaper gelernt, Geheimdienste wollen nicht rechnen.
Geheimdienst ist keine Mathematik, Geheimdienst ist eine Kunst.
Also sind wir da mit der Bayeschen Wahrscheinlichkeit überhaupt nicht auf dem
richtigen Dampfer, wahrscheinlich, jedenfalls wenn dieses Paper in dem Intelligence-Journal stimmt.
Und also wird hier vielleicht eigentlich nur Unsicherheit in der Sprache ausgedrückt
oder Unsicherheit in die Sprache verlagert?
Vielleicht will der BND einfach nur eine Aussage machen, die möglichst wenig
Informationsgehalt hat, die also intelligent klingt, als ob eine Analyse stattgefunden hat.
Und es hat auch bestimmt irgendeine Analyse stattgefunden, die hat nur nichts
ergeben. und dann muss man irgendwie eine Aussage machen, die klingt,
als ob sie eine sehr starke und umfangreiche Analyse stattgefunden hat und daraus
darf aber auf keinen Fall irgendwas folgen.
Denn was folgt denn daraus? Das ist wahrscheinlich ein Lab League wahr. Es folgt eben.
Wenig daraus. Man kann sagen, okay, dann sollten wir noch mal mehr nachgucken,
noch mehr Evidenz sammeln.
Aber naja, da sind wir schon wieder beim Elefanten im Raum, der jetzt hier auch
noch so rumsteht, hier direkt neben mir steht einer.
Menschen und Wahrscheinlichkeiten. Ja, Menschen sind generell schlecht,
wenn man sie mit Wahrscheinlichkeiten konfrontiert.
Also Menschen sind sowieso schlecht mit Mathe, aber mit Wahrscheinlichkeiten
noch mehr, also noch schlechter.
Wenn man so die Literatur zur Wahrnehmung von Wahrscheinlichkeiten liest,
da wird es einem so ein bisschen kalt und heiß. Fragt sich, wie die Menschheit
überhaupt so weit kommen konnte.
Oder vielleicht ist es auch der Grund, warum die Menschheit da ist,
wo sie ist. Also Menschen, wenn sie sich nicht konzentrieren und genau präzise
algorithmisch arbeiten, machen sie eigentlich ziemlich viel falsch.
Also es gibt unzählige Studien, wie irrational Menschen sind,
insbesondere bezüglich Zufall.
Menschen haben unterschiedliche Interpretationen von Worten wie wahrscheinlich.
Wenn man sie zum Beispiel nach dem numerischen Wert fragt, was würdest du denken
bei einer wahrscheinlichen Aussage, wie wahrscheinlich ist sie denn dann als
numerische Wahrscheinlichkeit, dann kriegt man ein großes Spektrum an verschiedenen Antworten.
Und es kommt noch schlimmer. Menschen haben auch eine unterschiedliche Interpretation
von wirklichen numerischen Werten, je nachdem wie diese formatiert sind.
Also es gibt Studien, die zeigen, dass Menschen systematisch eine 10% Wahrscheinlichkeit
anders interpretieren als eine 10 von 100 Wahrscheinlichkeit.
Obwohl es mathematisch das Gleiche bedeuten sollte.
Unterschiedliche Kulturen sind unterschiedlich risikofreudig und interpretieren
deswegen Wahrscheinlichkeiten unterschiedlich.
Die Sprache unterliegt natürlich Trends, das heißt die genannten Dinge sind
zeitlich veränderlich.
Menschen können nicht gut im Kopf rechnen und Menschen können schon gar nicht
das Ziegenproblem im Kopf analysieren.
Unsere Gehirne sind irgendwie keine Computer. Man hat immer so diese Vorstellung,
man macht irgendwie eine Analyse mit Logik und arbeitet da rein formal.
Aber wenn man sich die Fehlerkultur der Menschen anschaut, dann sind wir eher
sowas wie so SLMs, so Small Language Models.
Am Ende produzieren wir am Ende auch nur Sprache und ja.
In dieser Sprache versuchen wir Logik abzubilden, aber ist diese Logik auf einem
logischen Weg entstanden?
Eher nicht eben dieses neuronale Netz, was wir da in unserem Gehirn haben.
Wir haben es nicht so richtig verstanden, wie das Logik macht,
aber es macht jedenfalls Fehler. Dann gibt es natürlich die ganzen Probleme
mit der Selbsteinschätzung.
80% der Autofahrer denken, sie sind besser als 80% der Autofahrer und so weiter.
Und es gibt die ganzen Biases, die Base Rate Fallacy, also das Ignorieren der
bisherigen Statistik mit Fokus auf aktuelle Ereignisse.
Also wenn man zum Beispiel so einen Test auf eine sehr seltene Krankheit macht
und in 5% der Fälle bei einem negativen Patienten gibt der Test trotzdem positiv,
dann bedeutet so ein positiver Test eben noch nicht sehr viel.
Also wenn man eine Krankheit hat, die nur in einem tausendstel aller Fälle auftritt,
aber diese False Positive Rate von 5% hat, dann braucht man sich eigentlich
noch nicht so viel Sorgen machen nach einem positiven Test.
Und naja, es gibt auf jeden Fall jede Menge solche Fallacies.
Das erinnert mich jetzt gerade an diese coole Wikipedia-Übersichtsgrafik der
hunderten von verschiedenen Denkfedern, die Menschen machen.
Die verlinke ich euch mal. Das ist so echtes Wikipedia-Gold.
Und dann könnt ihr da starten und euch dann durch die Literatur lesen.
Angefangen von Kahnemann und Tversky natürlich.
Ihr wisst schon, Judgment Under Uncertainty, Thinking Fast and Slow und so weiter.
Habe ich auch schon öfter hier erwähnt.
Also insgesamt zeigen Studien irgendwie Menschen ohne Fachkenntnisse,
neigen intuitiv zu einer zwar fehlerbehafteten, aber basen oder subjektiven
Interpretation von Wahrscheinlichkeiten.
Und oft machen sie eben systematische, gravierende Fehler.
Jetzt kann man versuchen, irgendwie diese Fehlerrate nach unten zu kriegen,
indem man die Stakes erhöht, also die Menschen irgendwie versucht dazu zu bringen,
doch mal nachzudenken, also ihr System 2 zu benutzen, wenn man jetzt mal mit Kahnemann spricht.
Gibt es da zum Beispiel diese Prediction Markets, also wo Leute auf irgendwelche
unsicherlichen Ausgänge wetten können und der Preis für die Wette,
der wird dann immer so adaptiv verändert und passt sich eben an die Anzahl von
Menschen an, die eine bestimmte Überzeugung haben und wie viel Geld sie bereit sind,
darauf zu setzen, auf diese Überzeugung.
Und dadurch, dass man irgendwie das Geld reinbringt, hofft man,
dass sie auch alle ihre geheimsten Informationen, die die Menschen haben und
ihre beste Analyse, die sie mit ihrem Gehirn davon machen können, einbringen.
Und naja, da gibt es auch interessante Studien dazu, also zum Beispiel die bekannten
Bookies, das hört man ja manchmal,
dass in England irgendwelche Buchmacher irgendwelche Wahlen irgendwo auf der
anderen Seite der Welt vorhersagen können mit hoher Sicherheit,
weil sie eben den Leuten die Möglichkeit eröffnen, durch Abgeben der korrekten
Vorhersage Geld zu verdienen.
Und dadurch, dass das Geld im Spiel ist, strengen die Leute sich richtig an, könnte man so sagen.
Ja, aber selbst das kann auch oft schief gehen, wie man halt bei Sportwetten zum Beispiel sieht.
Ja, und dann hat natürlich diese ganze Sprachrepräsentation noch allerlei Interpretationen.
Also die Sprache, die wir verwenden, ist eben auch kein wirkliches Abbild von Logik.
Also ich kann euch ja hier nochmal ein Beispiel geben, wo man sieht,
dass es noch ganz viele andere Kontexte gibt, die in der Sprache immer mitschwingen.
Das Beispiel hier habe ich von einem Artikel aus der Seite LesserWrong genommen.
LesserWrong ist so eine Community, die sich mit rationalem Argumentieren beschäftigt.
Ich verlinke euch das auch mal.
Und das Beispiel geht ungefähr so. Also Alice und Bob unterhalten sich,
stehen glaube ich in der Küche und Alice sagt, uns geht morgen wahrscheinlich
die Milch aus, ich gehe nochmal schnell zum Supermarkt.
Okay. Sie hat wieder das Wort wahrscheinlich verwendet. Und Bob sagt.
Deine Analyse ist kompletter Unsinn.
Hast du überhaupt unseren täglichen Milchverbrauch in den letzten Wochen aufgezeichnet?
Hast du überhaupt Daten?
Hast du überhaupt ein erprobtes statistisches Modell, das unseren Milchkonsum modelliert?
Und hängt das von der Art der zubereiteten Getränke und Gerichte ab?
Außerdem haben wir jetzt eine neue Kaffeemaschine.
Dein bisheriges Modell, selbst wenn du eins hättest, wäre jetzt ohnehin nicht mehr gültig.
Und wie willst du überhaupt wissen, was wir heute noch essen und trinken?
Und außerdem habe ich dir noch gar nicht gesagt, worauf ich heute Lust habe.
Und deine Behauptung ist auf so vielen Ebenen unerhaltbar, du kannst unmöglich
wissen, wie wahrscheinlich es ist, dass die Milch ausgeht.
Okay, nehmen wir das mal auseinander, analysieren wir mal kurz diese Situation.
Also wenn wir, wie Bob, hier versuchen, mathematische Modellierung und Analyse
auf die Realität anzuwenden, Da kommt einfach kompletter Quatsch heraus.
Denn bei dieser Entscheidung handelt es sich einfach um eine Low-Stakes-Entscheidung.
Man kann einfach raten, so wie Alice es hier tut.
Ich meine, sie haben offensichtlich einen Kühlschrank und es ist egal,
wie wahrscheinlich es ist, dass die Milch morgen alle ist.
Also das Statement, die Milch geht wahrscheinlich morgen aus,
ist eigentlich nur ein Statement, ja,
es ist vielleicht mal an der Zeit, die Vorräte wieder etwas aufzufrischen,
wenn wir es nicht tun, dann gibt es eine gewisse Wahrscheinlichkeit,
abhängig davon, was wir kochen und wie viel Milch wir so verbrauchen,
dass wir irgendwann keine mehr haben, also ganz leer sind.
Und dann kommt darüber natürlich der ganze Subkontext. Ich weiß nicht,
ob ihr auch diesen kleinen Wutmoment oder diese Beziehungskontext da schon erfüllt habt.
Also es ist ja wohl völlig klar, dass Bob sich komplett daneben benommen hat
und zwischen den beiden irgendwie auf der Beziehungsebene was schief geht, oder?
Ja, also solche Kontexte schwingen dann immer noch mit in der Sprache.
Ich habe noch ein anderes Beispiel. Wenn Menschen zum Beispiel genauere Zahlen
sagen, dann schwingt damit ein Kontext mit.
Also, wir kennen ja das Prinzip der Rundung und durch die Verwendung von Rundung
und die Genauigkeit einer Rundung, wenn wir eine Zahl sagen.
Transportieren wir schon etwas.
Also, neben einer Zahl, die wir sagen, transportieren wir auch durch die Genauigkeit,
mit der wir diese Zahl angeben, weitere Informationen.
Nämlich eine Sicherheitsinformation.
Wenn ich zum Beispiel sage, ich denke, es ist ungefähr 20% Chance,
dass Punkt, Punkt, Punkt passiert, dass Bayern morgen gewinnt,
dann ist es ein Unterschied in der Wahrnehmung, ich hoffe, das ist bei euch
auch so, zu einer Aussage, ich denke, die Wahrscheinlichkeit,
dass Bayern München morgen gewinnt, ist 22,51%.
Irgendwie hat man durch diese Kommazahlen, durch diese 22,51,
hat man sofort den Effekt, dass man an ein mathematisches Modell denkt.
Da ist irgendwas gerechnet worden und die Zahlen, die angegeben wurden,
die scheinen alle irgendwie signifikant zu sein.
Das schwingt eben in dem Subkontext der Sprache mit.
Ja, da muss doch was dahinter stecken, wenn die Zahl so genau angegeben ist,
da ist bestimmt was gerechnet worden.
Und das kann man natürlich auch wieder ausnutzen. Das erinnert mich irgendwie
an diesen XKCD mit den Fehlerbalken an den Fehlerbalken an den Fehlerbalken.
Kennt ihr den noch? Ich suche den mal raus und verlinke den nochmal.
Also hier hat man jetzt diese einzelne Wahrscheinlichkeit, die ja schon eine
Unsicherheit angebt, also nach der Bayesian Analyse oder Bayesian Interpretation.
Wenn ich eine Wahrscheinlichkeit angebe oder sage, dass irgendwas wahrscheinlich
oder unwahrscheinlich ist, dann
drücke ich schon einen Grad meiner inneren Unsicherheit mit Sprache aus.
Und wenn ich jetzt ein Wahrscheinlichkeitsintervall angebe oder durch die Genauigkeit
meiner Aussage sage, wie sicher oder unsicher ich bei meiner Aussage bin,
dann habe ich schon so ein Netz mit doppeltem Boden.
Also dann transportiere ich in meiner Sprache noch die Unsicherheit meiner Unsicherheit.
Es ist unglaublich, wie die Sprachverarbeitung im Gehirn, wie viele Kontexte
die gleichzeitig beachten kann, oder?
Also irgendwie sind wir wieder am Anfang angekommen. Worte haben irgendwie so
viel Unsicherheit, dass wir mathematische Modellierung brauchen,
um vernünftig, also rational zu handeln.
Aber in Worten ist dann wieder so viel Unsicherheit, dass wir die Nutzung der
Mathematik oft gar nicht rechtfertigen können.
Also wir haben ein mathematisches Modell und es braucht eben genaue Eingaben.
Aber die Eingaben kommen irgendwie aus Sprache.
Und Sprache hat einen Kontext. Und wir werden mit der mathematischen Analyse,
selbst wenn Sie sie korrekt richtig ausführen,
oft daneben liegen, weil wir die Eingabedaten unsicherheitsbehaftet aus der Sprache bekommen.
Wir machen uns immer gern darüber lustig, wenn ChatGBT keine Mathematik kann,
sondern nur so Sprache verarbeitet.
Aber vielleicht machen wir uns darüber lustig, weil wir merken, dass wir auch so sind.
Wir können auch keine Mathematik, die über grundlegende Arithmetik hinausgeht.
Also Base-Theoremen im Kopf auswerten machen wir eben nicht.
Alles ist irgendwie subjektiv und wenn ich sage, es ist warm draußen,
dann packt meine Frau immer noch eine Jacke extra ein. Und wenn ich nun sage,
wahrscheinlich haben wir noch Milch im Kühlschrank, was dann?
Ja, wenn man das alles so sieht, fragt man sich doch irgendwie,
wie die Menschheit überhaupt so weit gekommen ist in diesem Spiel des Lebens.
Allerdings, wahrscheinlich ist es so ein In-App-Kauf gewesen,
irgendwie so Pay-to-Win.
Wir haben einfach an der richtigen Stelle irgendwie Geld eingeworfen oder Glück
gehabt und dafür sind wir aber jetzt irgendwie so in einem Schwierigkeitslevel,
das weit über unsere natürlichen Skills hinausgeht und müssen immer mehr Geld
ausgeben für die In-Game-Rubine.
Ah ja, also mein Fazit ist irgendwie vielleicht wie bei dieser 50-50-Münze.
Eigentlich ist es ein deterministischer Prozess, aber mit dem Determinismus
können wir nichts anfangen, weil wir die Anfangsbedingungen nicht kennen und
weil alles sehr sensitiv gegenüber diesen Anfangsbedingungen ist.
Deswegen benutzen wir irgendwie einen anderen Formalismus, den von Wahrscheinlichkeiten.
Und es ist ja auch gut, irgendwie einen Plan A und einen Plan B zu haben.
Irgendwas wird immer schief gehen. Die Wahrscheinlichkeitstheorie hilft uns
dann, Und dann, nachdem wir beschlossen haben, dass wir diesen Wahrscheinlichkeitsformalismus
benutzen, hilft die uns dann damit zu rechnen. Und das ist die Stärke der Mathematik.
Wir formalisieren, was Menschen eigentlich machen, welchen logischen Gesetzen
das unterliegt und wie man darüber Vorhersagen machen kann.
Aber ich glaube, diese BND-Aussage vom Anfang, da steckt eigentlich gar keine Mathematik drin.
Das ist die Benutzung von Sprache, die über Unsicherheit spricht, in der Zukunft,
die aus einer frequentistischen Sicht abgeleitet worden ist und verwendet die
gleiche Sprache, weil die gleichen logischen Muster dahinter stecken oder sehr
ähnliche logische Muster, verwendet die auch bei Blicken in die Vergangenheit
oder anderen unsicheren Situationen.
So, das war also, was mir so durch den Kopf ging und leider jetzt auch immer
wieder durch den Kopf geht,
wenn ich das Wort wahrscheinlich höre oder sage und ich werde noch ein bisschen
darüber nachdenken und ihr tut es vielleicht auch und dann hoffe ich,
dass ihr aber auch beim nächsten Mal wieder einschaltet,
wenn es hier Eigenraum heißt und es vielleicht wieder etwas konkreter und etwas mathematischer wird.
Bis dahin, eine gute Zeit, tschüss.

1 Anmerkung zu “EIG047 Wahrscheinlichkeitsworte

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

This site uses Akismet to reduce spam. Learn how your comment data is processed.