Ich kenne die Lösung, aber ich sage sie dir nicht. Mathematik ist ja eigentlich für ihre Offenheit bekannt. Wenn man etwas bewiesen hat, will man es sofort mit der Welt teilen und trötet es heraus im Internet, auf dem arXiv, usw. 11 Autor*innen haben sich nun dagegen entschieden und sagen uns in einem Paper nur, welche Probleme sie gelöst haben, aber nicht wie. Das Ganze hat natürlich wieder mal mit KI zu tun. Wir erinnern in dieser Folge an die Tradition der verschlossenen Briefe und erzählen die Geschichte dieses kuriosen Papers, welches bereits morgen seine Auflösung erfahren wird.
- First Proof (Paper auf dem arXiv)
- First Proof Codeberg Repository
- Plis Cachetés Anweisungen
- Pli Cacheté auf der Webseite der Französischen Akademie der Wissenschaften
- Berlin Alexanderplatz
- Wolfang Döblin
- Frontier Math Symposium
- Tamara Kolda auf Mastodon
- Taos Beobachtung zu Erdös Problems
- NY Times Artikel und Interview mit den Autor*innen
- Erdös Problems
Feedback gerne auf Mastodon @Eigenraum@podcasts.social, an feedback (bei) eigenpod.de oder in die Kommentarspalte auf der Episodenseite.
Automatisch generiertes Transkript (nicht geprüft)
Hallo ihr Lieben, ich begrüße euch zu einer neuen Folge Eigenraum.
Wir sind wieder auf Sendung.
Schön, dass ihr diese Folge auf eure digitalen Endgeräte kopiert habt und sie jetzt abspielt.
Ich will euch heute über was berichten, was sich jetzt gerade abspielt.
Also quasi Live-Berichterstattung über Mathematik im Eigenraum.
Also Mathematik ist zwar zeitlos, aber es passieren auch Dinge.
Heute am Tag meiner Aufnahme ist Donnerstag, der 12.
Februar 2026 und morgen ist demnach danach Freitag, der 13.
Februar, also ein Freitag der 13., aber das ist jetzt hier nicht so wichtig.
Und da wird was passieren, was mit einem neuen Paper zu tun hat,
was kürzlich auf dem Archive erschienen ist.
Und das Paper, das ich meine, hat den Titel First Proof.
First Proof, so wie erster Beweis.
Das hat elf Autorinnen, wenn ich richtig gezählt habe.
Das sind alles ausgewiesene Mathematikerinnen, recht berühmt.
Zum Beispiel Tamara Kolder ist dabei, die so bekannt ist für Tensoren und ihre
frühen Forschungen zu KI.
Lauren Williams kennt man, Martin Heirer, der hat 2014 die Fields-Medaille gewonnen
und noch andere bekannte Leute.
Das Paper ist auch nicht sehr lang und es erzählt von zehn Problemen,
die in der Forschungsmathematik dieser AutorInnen aufgetreten sind und aus recht
unterschiedlichen Gebieten der Mathematik kommen.
Also dieses Team hat sich auch so zusammengefunden, dass es eine große Breite
der Mathematik abdeckt.
Und der Witz an der Sache ist, dass in diesem Paper mal nicht die Aussagen mit
ihren Beweisen stehen, sondern stehen nur die Aussagen drin. Okay.
Die Autoren haben die Probleme, die sie da beschreiben in ihrem Paper,
aber gelöst. Das heißt, sie haben Beweise gefunden.
Sie haben diese Beweise auch aufgeschrieben, aber sie geben sie uns nicht.
Sie haben diese Beweise verschlüsselt publiziert.
Also, veröffentlicht, aber verschlüsselt und später, nämlich morgen,
am Freitag, den 13., wollen sie die Schlüssel veröffentlichen.
Okay, was hat es damit auf sich?
Also, sie haben so diese Tech-Datei, die wir lesen können, auch auf dem Archive,
auf ein Codeberg-Repository hochgeladen und dazu eine verschlüsselte Datei,
in der die Tech-Datei mit den Beweisen drin ist.
Und dadurch, dass es eben schon alles
hochgeladen wurde, können wir dann nachvollziehen, dass sie auch am 6.
Februar, als das Paper erschienen ist, schon die Beweise hatten.
Also es ist jetzt eine ziemlich hektische Timeline hier, das musste ich auch
mit meiner Podcast-Folge schnell zu Rande kommen. Also am 6.
Februar oder 7. Februar sollte das veröffentlicht werden und dann eine Woche später, am 13.
Februar, sollten schon die Beweise publik werden.
Also nach Angabe des Autorenteams sollte der Release am Euler Day am 7.
Februar stattfinden. Also das ist, warum ist das jetzt der Euler Day?
Weil es gibt ja diese Eulersche Zahl, die mit 2.7 irgendwas anfängt und deswegen
ist der 7. Februar der Euler Day.
Naja, okay, diese Datumswitze werden auch nie alt. Aber anscheinend ist das
der Older Day. Manche kennen das.
Also haben sie das veröffentlicht und die eine Woche läuft. Und morgen ist sie
vorbei und wir werden sehen, was passiert.
Ihre Repository liegt übrigens auf Codeberg. Das ist mal ganz witzig,
weil in Deutschland feiern wir jetzt hier jeden Monat den Digital Independence Day.
Und Codeberg ist so eine Instanz von einem Open-Source-Klon von GitHub.
Also finde ich ganz super, dass diese MathematikerInnen aus den USA hier auch
die Open-Source-Community und die digitale Unabhängigkeit von den großen Tech-Konzernen
unterstützen und das nicht einfach auf GitHub packen,
sondern das in Berlin von einem Not-for-Profit-Verein getragene Code-Berg.
Okay, also Links sind natürlich in den Shownotes oder ihr findet sie auch leicht,
wenn ihr First-Proof-Paper irgendwo in eine Suchmaschine eures Vertrauens anzieht.
So, diese verschlüsselten Beweise, das kommt einem irgendwie so ein bisschen archaisch vor, oder?
Also, so, ich kenne den Beweis, aber ich sag ihn dir nicht, das steht ja so
richtig im Gegensatz zu Open Science, ja, und die Mathematik hat ja so eine
Kultur der Open Science, das heißt, wenn wir was wissen, dann veröffentlichen wir es auch.
Und das ist also jetzt ein ganz anderer Zugang, aber vielleicht erfordern diese
Zeiten, in denen wir leben, in denen die LLMs uns alles ausdehnen,
Tasten saugen, was wir da auch nur reinschreiben und das sofort in ihre Trainingsdaten aufnehmen.
Vielleicht erfordert es eben auch solche neuen Methoden.
So, also, das ist aber historisch eigentlich schon recht verbreitet.
Also solche, ich kenne den Beweis, aber ich sag ihn dir nicht,
Geschichten gibt es in der Mathematik eigentlich häufiger.
Der erste und wichtigste Zweck, der mir sofort einfällt, ist natürlich die Ausbildung.
Jede Übungsaufgabe funktioniert eigentlich so. Es gibt immer Übungen und Tests
und da ist es irgendwie didaktisch sinnvoll, die Lösung erstmal zurückzuhalten.
Damit man erstmal selber probieren kann, damit man ins Tun reinkommt,
statt immer nur zu konsumieren.
Es gibt auch eine historische Tradition von verschlüsselten Beweisen oder sogar
verschlüsselten Forschungsergebnissen.
Die sogenannten Pli Casté, bitte entschuldigen Sie mal in Französisch.
Das ist französisch und steht für versiegelter Umschlag.
Das war eine Tradition oder ist vielleicht sogar eine Tradition in Frankreich,
speziell an der Französischen Akademie der Wissenschaften und schon seit dem Beginn des 18.
Jahrhunderts gibt es da eine Tradition, Forscherinnen und Erfindern zu ermöglichen,
mit so einem verschlüsselten Umschlag zu etablieren, dass sie ein Forschungsergebnis
zu einem bestimmten Zeitpunkt bereits kannten.
Also sie würden dann das aufschreiben und dort diesen Brief hinschicken,
vielleicht wenn es noch nicht bereit ist für eine Veröffentlichung oder irgendwas
anderes gegen eine Veröffentlichung spricht und die Akademie der Wissenschaften
schreibt auf ihrer Webseite aber,
dass dieses Verfahren gewährt keinerlei kommerzielle oder finanzielle Rechte
und unterscheidet sich sehr von Anmeldung eines Patents.
Okay, also es gibt diese Möglichkeit, diesen Umschlag dahin zu schicken und
diese Französische Akademie der Wissenschaft hebt ihn dann einfach auf.
Und irgendwann später kann er geöffnet werden, wenn es mal einen Streit darum gibt oder so.
Und dann kann man vielleicht nachweisen, dass man einen Beweis schon zu einem
bestimmten Zeitpunkt kannte und ihn nicht aufs Archive hochgeladen hat.
Oder man verschützt es einfach mit PGP und lädt es auf Codeberg hoch.
Das wäre vielleicht so die moderne Variante davon. Okay, dann gibt es natürlich
historische Geschichten, wo diese Plie Castel mal so eine Rolle gespielt haben.
Eine traurige Geschichte und interessante Geschichte ist die Geschichte von
Wolfgang Döblin, einem Wahrscheinlichkeitstheoretiker.
Der wurde so 1915 geboren in Berlin. Es ist der Sohn von dem Schriftsteller
Alfred Döblin, kennt man vielleicht von diesem Buch Berlin Alexanderplatz.
Und das ist der Sohn des Schriftstellers, der das Buch geschrieben hat.
Und der war Mathematiker und Antifaschist und musste 1933 ins Exil nach Paris,
wo er dann Mathematik studiert hat. Und er war besonders bewandert und gut in
Wahrscheinlichkeitstheorie, Theorie der Markov-Ketten und so weiter.
Und nun gut, ihr kennt die Geschichte, Deutschland überfüllt Frankreich und
Dublin musste in der Armee dienen.
Und im Winter 1939-40 ist er auch an der Front und im Schützengraben liegend,
schrieb er in ein Schulheft weiter seine mathematischen Forschungen.
Für mich ist das so ein bisschen schwer vorstellbar. Ich bin irgendwie so eine
Art Mathematiker, die, ich weiß nicht, ich habe das im Podcast,
glaube ich, auch schon öfter erzählt, mich trifft nie die Inspiration.
Es ist nie so, dass ich irgendwas tue und die mathematische Inspiration kommt zu mir.
Ich muss mich immer ganz doll anstrengen. Ich brauche meine Ruhe.
Ich brauche einen schönen Kaffee. Ich muss vor meinem Computer sitzen.
Es muss alles funktionieren. Ich muss innerlich ruhig sein. Und dann kann ich vielleicht,
Etwas Mathematisches herausfinden. Aber bei anderen Leuten ist das auch anders.
Manchmal wünschte ich, die Mathematik würde auch so durch mich strömen und aus
mir raus wollen, aber das ist nicht so. Aber bei Wolfgang Döblin war es so.
Und selbst in dieser Extremsituation Krieg im Schützengraben hat er seine mathematischen
Forschungen weitergeführt und aufgeschrieben in einem Schulheft.
Und naja, die Situation wird immer furchtbarer. Wir wissen, dass Deutschland Frankreich besetzt.
Und jedenfalls, wohin sollte er mit seinem Schulheft? Und er schickt es Anfang
1940 als Sohn Plie Castee an die Wissenschaftsakademie in Paris.
Und ja, es kommt, wie es kommen muss. Er verliert sein Leben.
Am 21. Juni 1940 hat er sich selbst erschossen, aber auf der Flucht,
um eben nicht in Gefangenschaft der Nazis zu geraten.
Und ich glaube, dieser Aspekt der Geheimhaltung spielt jetzt hier eine kleine
Rolle, vielleicht gar keine Rolle.
In diesem Fall handelt es sich einfach um Ergebnisse, die er sichern wollte.
Und ja, er wollte eben darlegen, dass er die Beweise kennt, zu Einsichten gelangt ist.
Und es war vielleicht nicht die Situation, in der er irgendwie einen normalen
Publikationsprozess durchlaufen konnte.
Und hat eben diese Einsendung des Briefs an die Akademie gewählt.
So, was passiert nun mit diesem Brief? Ja.
Dieser Brief geht als Nummer 11.668 in das Archiv der Akademie,
überlebt dort auch den Krieg und noch weitere 60 Jahre und lag dort einfach
nur rum und erst im Mai 2000 wurde er geöffnet.
Wie es zu dieser Öffnung kam, habe ich jetzt nicht recherchiert,
aber da gibt es Vorträge und Berichte darüber und das war eine kleine wissenschaftliche Sensation.
Denn das Manuskript, was in dem Brief enthalten war, enthält Ergebnisse,
die eigentlich später veröffentlicht wurden, insbesondere,
also es geht um diese Theorie der Markov-Prozesse und Fragen von Kolmogorov
und da gibt es eine wichtige Formel, die kennt man heutzutage als Ito-Formel.
Und diese Ito-Formel ist nach einem japanischen Mathematiker Ito Kiyoshi benannt,
der sie 1951 veröffentlicht hat, also deutlich später, als dieser Brief von Dublin verfasst wurde.
Und der Brief enthält die gleiche Formel.
Also heutzutage würde man sie vielleicht die Dublin-Ito-Formel nennen oder so.
Und die Öffnung war deswegen eine wissenschaftshistorische Sensation.
Also in diesem versiegelten Brief lag der Beweis, dass ein bestimmtes mathematisches
Ergebnis schon vorher bekannt war.
Ja, und ich meine, es lag jetzt an dieser historischen Begebenheit an dem 20.
Jahrhundert, dem Zweiten Weltkrieg und dem Faschismus, dass es zu diesen Ereignissen kam.
Also heutzutage würde es wahrscheinlich anders ablaufen, weil eben dieser Publikationsweg
viel schneller ist, aber ein interessanter historischer Abzweig hier zum Thema
verschlüsselte Beweise.
So, eigentlich wollte ich aber jetzt ja über dieses First Proof Paper reden.
Okay, also kommen wir zurück zum First Proof Paper, was ja jetzt drängt,
denn morgen, morgen werden wir schon den verschlüsselten Brief öffnen und für
mich als Hobbybäcker ist übrigens der erste Satz in dem Paper auch gut.
Und da habe ich auch noch was über englische Backsprache gelernt,
denn der erste Satz lautet, in baking,
the first proof or bulk fermentation process is a crucial step in which one
lets the entire batch of dough ferment as one mass before dividing and shaping it into loaves.
Also first proof ist anscheinend, das habe ich jetzt neu gelernt,
ist das, was man bei uns Stockgare nennt, also macht man erst einen großen Klumpen
Teig und dann lässt man den erstmal gehen und dann macht man später Brotlaibe draus.
Und das heißt also First Proof, Stockgare heißt First Proof und jetzt eröffnet
sich für mich eine komplett neue Welt für Mathe, Back, Wort, Witze.
Okay, aber dazu kommen wir dann später.
Warum? Was hat das Ganze jetzt hier überhaupt in unserer heutigen Zeit zu tun
mit diesem Paper? Natürlich geht es irgendwie immer wieder um LLMs und KI.
Heutzutage geht ja alles immer nur noch um KI. Und diese zehn Probleme in dem
Paper, die sollen nämlich die KI-Tools und ihre Macher und Macherinnen herausfordern
oder testen oder eben zeigen, was sie können und nicht können.
Die Autorinnen machen den Punkt, dass niemand von ihnen irgendwas mit den KI-Firmen
zu tun hat. Also sie machen das von außerhalb.
Niemand hat jemals für eine von diesen KI-Firmen gearbeitet.
Und das ist schon so ein bisschen bemerkenswert, denn was man so hört,
ist es jedenfalls in diesem Bereich so,
dass wenn man irgendwie öffentlich auftritt und eine Meinung zu dem KI-Thema
äußert und da was zu sagen hat, dann treten die Firmen schon relativ zeitnah
an einen heran und bieten dann recht schnell irgendeine Art von Zusammenarbeit an,
bei der dann eben auch irgendwelche Geld- oder Vergünstigungen fließen können.
Ich meine jetzt keine Bestechungsgelder, also eher im Sinne von Gehalt oder Bezahlung oder so.
Also da gab es ja zum Beispiel dieses Frontier Math Symposium,
bei dem wurden eben MathematikerInnen nach Berkeley eingeflogen,
um so herausfordernde Probleme für die KI zu erstellen, weil eben klar ist,
dass es anstrengend ist,
Zeit erfordert und letztendlich ist dann der einfachste Weg,
Leute dafür zu bezahlen und ihnen Reisekosten zu erstatten und so weiter.
Und das geht aber dann natürlich auch, naja, das Ganze geht dann immer seinen Gang, den es immer geht.
Es gibt dann auch Leute, die die Seiten wechseln und jetzt als Consultants arbeiten
oder als Mathematiker, Research Scientist oder so für die KI-Firmen arbeiten.
Also ich meine ein Beispiel, das ist ja jetzt öffentliche Information,
das ist ja nichts geheim, zum Beispiel der Zahlentheoretiker Ken Ono,
der sich nach diesem Frontier Math Symposium wirklich sehr positiv über die KI gezeigt hat,
arbeitet jetzt bei einem KI Startup, Axiom Math.
Und tja, was soll ich sagen?
Ich weiß nicht, ob sein Gehalt Research-Ausgaben oder PR-Ausgaben sind,
aber ein paar schöne Fotos für die ganzen Zeitungen waren natürlich auch dabei.
Bei diesem ganzen KI-Zeug bewegt
man sich ja immer irgendwie in diesem PR-Umfeld. Also die KI-Firmen.
Sind immer knapp an Kohle, weil das, was sie machen,
ist extrem teuer und auf der Einnahmenseite sieht es gar nicht mal so gut aus
und deswegen müssen sie immer die Story weiterlaufen lassen und deswegen müssen
immer KI-Erfolge kommen und das habe ich ja an verschiedener Stelle schon erklärt,
dass meiner Meinung nach Mathematik sich dafür sehr gut eignet,
weil es eben diesen Nimbus der Intelligenz und des schwer zu verstehenden Gebiets
hat und gleichzeitig eben als Sprache sehr formalisiert ist und deswegen den LLMs sehr zufrieden.
Deswegen ist Mathematik prädestiniert, um dort KI-Erfolge hervorzuheben.
Aber was bei diesen KI-Erfolgen ja nicht immer klar ist, ist,
was die KI wirklich gemacht hat und was der Mensch.
Die Anreizstrukturen sind ja so, dass ein KI-Erfolg sich sehr einfach auszahlen kann.
Also wenn eine Firma sagen kann, ja, hier unsere KI hat autonom dies und jedes Problem gelöst,
dann bringt das einfach immer direkt PR, Sichtbarkeit, Schlagzeilen und ja,
mittelbar für die Leute, die das dann gemacht haben, natürlich auch Geld für
den schönen Beraterjob bei Axiom Math oder so.
Und deswegen ist es wichtig, da objektiv dran zu kommen und sozusagen keeping
the practitioners honest, sagt man auf Englisch.
Und ich glaube, das ist das, was dieses Autorenteam hier auch antreibt,
also aus der Forschungsperspektive, ohne die monetären Anreize.
Da kritisch drauf zu schauen.
Okay, das Bautorenteam beschreibt erstmal ganz klar in dem Paper,
was Mathematik für sie ist.
Das ist auch noch ein Teil, also wenn man in einer Pressemitteilung liest,
KI kann dies und jenes Mathematikproblem lösen, dann ist es,
wenn man genau hinschaut, immer nur ein sehr kleiner Teil der mathematischen Forschung.
Und in dem Paper wird es irgendwie so beschrieben, die experimentelle Forschung,
also jetzt nicht Mathematik, die läuft vielleicht immer so ab,
man findet eine Frage, man entwirft ein Experiment und dann analysiert man das Ergebnis.
Was sagt das Experiment über die Fragen? Das ist naturwissenschaftliche Forschung.
Mathematische Forschung ersetzt das Experiment eigentlich durch das Entwickeln
einer Sprache oder durch die Formalisierung oder Entwickeln eines Frameworks,
in dem eine Frage beantwortet werden kann.
Man findet also ein Thema oder eine Frage, entwickelt eine Sprache,
um über dieses Thema zu reden, um Aussagen darüber machen zu können.
Und dann kann man schließlich die Frage beantworten. Und jetzt wollen natürlich
alle wissen, ob KI mathematische Forschung machen kann.
Und der Punkt, den die Autorinnen machen, ist, dass es eigentlich nur um das
Beantworten der Frage geht.
Also die KI ist in keiner Weise in der Lage, die interessanten Themen neu zu
identifizieren, was sollten wir überhaupt erforschen,
ist jedenfalls nichts bekannt dazu und auch dieses Entwickeln der mathematischen
Sprache, das Weiterentwickeln der Ausdrucksweise in Definitionen und so ist etwas,
wo jetzt LLMs noch nicht über große Erfolge sprechen können.
Aber tatsächlich das Beantworten, wenn es einmal ein Framework gibt,
das Beantworten von Fragen, ich meine, daher kommen die Schlagzeilen.
So, und deswegen will das Team fair sein zur KI und testet jetzt auch wirklich
in diesem Fall nur diesen letzten Teil, nur das Beantworten der Fragen und sie
wollen auch auf visuelle Argumente verzichten und keine Beweise machen,
die länger als das Kontext-Window sind.
Also sie haben sie jetzt hier auf fünf Seiten eingeschränkt,
weil das irgendwie so die maximale Ausgabelänge von typischen KI-Tools ist.
Und es sollen eben echte Forschungsfragen sein und keine angefertigten Benchmarks
für die KI, um möglichst nah dran zu sein an dem, was wir Menschen wirklich
tun, wenn wir Mathematik machen.
Deswegen haben sie Teile aus ihrer eigenen Arbeit genommen,
die sie dann auch beweisen konnten mit mehr oder weniger Arbeit,
aber wohl signifikanter Arbeit und die dann aber zurückgehalten oder noch nicht
publiziert, um dieses First Proof Paper schreiben zu können.
Man muss jetzt aber auch sagen, dass es nicht jede einzelne Antwort auf eine
von diesen zehn Fragen eine eigene Veröffentlichung wäre.
Es sind eher so von der Größe her etwas, was Teil einer Veröffentlichung sein
könnte, ein Zwischenschritt zu einem in einem Paper veröffentlichtbaren Resultat.
Sie hatten auch noch einige Tests gemacht mit den öffentlich zugelenklichen
Tools, also ChatGPT, Gemini und so weiter, aber nur so vorsichtig,
um zu testen, ob die LLMs eventuell fertige Lösungen in der Literatur finden können.
Also, ja, wenn ich sowas mache, ich hab da immer Fragezeichen,
also die dokumentieren Sie auch, also Sie haben auch diese Fragezeichen.
Alles, was man in so ein LLM-Prompt reingebt, wird ja irgendwann gegenein verwendet, könnte man so sagen.
Selbst wenn man da irgendwie so eine Einstellung gibt, nutze meine Eingaben
nicht für Training, bewegt man sich ja doch irgendwie in so einer Umgebung,
in der es null Vertrauen gibt, ja.
Es ist einfach super schwer nachzuweisen, wenn meine Daten, die ich da eingebe,
für Training benutzt werden, kann ich das jemals später nachweisen?
Also das müsste ja schon ein ziemliches Glück sein oder irgendwie sehr viel
Aufwand irgendwie dann rauszukriegen,
dass genau meine Eingaben in diesen Trainingsdaten waren, weil die ja in so
einem gemischten Matschibrei drin sind und ich das nie lückenlos nachweisen kann.
Und letztendlich gibt es dann kein Enforcement, also wird auch diese,
ja, warum wird sich unter finanziellem Druck eine KI-Firma an irgendeine von
ihren Versprechungen oder AGBs halten,
wenn es nicht entforst werden kann und sie eine Gazillion Dollar am Tag verbrauchen
und selbst wenn ich das irgendwie nachweisen könnte,
dann haben die ja die Gazillion Dollar und kaufen sich damit Anwälte,
mit denen sie mich vor irgendwelchen US-Gerichten in den Boden hämmern.
So, also bewegen Sie sich in diesem Zero-Trust-Umfeld.
Wo wir aber trotzdem uns irgendwie damit auseinandersetzen müssen.
Vielleicht ist es ja die Maschine,
die alle unsere Hoffnungen erfüllt und die Welt revolutioniert und das ist ein
schwieriges Problem, in dem sich die Mathematik-Community befindet,
in dem wir sozusagen zusammenarbeiten müssen mit den Herstellern von Maschinen,
denen wir aber eigentlich überhaupt nicht vertrauen können.
Also man hat eben diese Aufstellung der KI-Firmen gleichzeitig als Gegner und als Lieferanten.
Und es wird auch so ein bisschen die Intention der AutorInnen auch noch in einem
Interview und Bericht in der New York Times erklärt, die ich euch auch verlinke.
Also sie hoffen, dass ihre Untersuchung irgendwie diese übertriebenen Erzählungen
über KI-Löst-Mathematik abmildern kann oder dem etwas entgegensetzen kann.
Und das ist eben auch gefährlich, weil diese ganzen Narrative, KI löst Mathe,
Mathe wird überflüssig, Mathematikerinnen wird überflüssig, das ist natürlich
uns einen großen Abschreckungseffekt auf unsere Studierenden und auch auf vielleicht
Funding Agencies, wie die DFG haben kann,
deswegen sollte man da auch auf jeden Fall drauf gucken und die ein bisschen
faktenbasierter argumentieren lassen.
Also um das nochmal zusammenzufassen, schreibt Tamara Kolder auf Mastodon,
Our goal is to understand the capabilities of AI systems on problems that come up in math research.
We have a collection of research problems for which solutions have not yet been posted on Also.
Wir wollen die Fähigkeiten der KI-Systeme verstehen und zwar genau bei den echten
Problemen, die in unserer mathematischen Forschung auftauchen.
Und für diese Forschungsprobleme haben wir die Lösung, sie sind aber noch nicht
online, also ist das ein guter Testbedarf.
So, ich finde es generell immer ein bisschen seltsam, wenn man sozusagen als
Forschung eine Maschine erforscht,
die auch von einem Menschen gebaut wurde, weil nach der einfachen Logik hätte
man den ja eigentlich auch dann fragen können, der die Maschine gebaut hat und
mit denen zusammenarbeiten, aber eben wir sind jetzt in diesem Adversarial-Szenario,
wo wir eben nur begrenzt Zugang dazu haben, zu dem Engineering,
was dazu führt und außerdem ist es ja auch so, dass die Leute,
die die Maschinen bauen, die Maschinen auch nicht verstehen.
Also es ist ja jetzt eine neue Fragestellung, die darüber hinaus geht,
wie funktioniert ein LLM intern zu,
wie kann ich das, den Output vorhersagen, wie kann ich den Output beeinflussen,
ja, also natürlich jede KI-Firma würde gerne die Halluzinationen loswerden, aber niemand weiß.
Woher die Halluzinationen aus einem theoretischen Grund kommen und kann sie
daher auch nicht einfach so beseitigen. Na gut, das jetzt auch wieder.
Also wir wissen, woher die Halluzinationen kommen, weil es eben nur Wortvervollständigungsmaschinen
sind, aber in dem Sinne, es gibt keine einheitliche Theorie der LLMs,
die so eine fast schon physikalische Erklärkraft hätte, so wie die Theorie der
Thermodynamik die Dampfmaschine erklärt.
Ist übrigens historisch natürlich auch so, dass die ganze Eisenbahn schon gebaut
wurde, die Strecken lagen schon und die Züge hatten schon Speisewagen,
bevor die Thermodynamik in dem Sinne die Dampfmaschine erklärt hatte.
Und ein bisschen sind wir auch in so einem Zeitraum, wo wir jetzt die Maschine
bereits bauen können, ohne so eine Theorie dahinter zu haben,
die uns alles erklärt und hilft, sinnvolle oder bessere Maschinen zu bauen.
Okay, jetzt ist natürlich die Frage, wir hatten diese ganzen schönen Ziele,
wird es denn funktionieren?
Also schauen sich die KI-Firmen das jetzt an oder was passiert jetzt?
Also ich habe bisher, jetzt ist ja ein Tag vor dem Release der Lösung,
ich habe jetzt noch keine...
Keine Pressemitteilung von irgendeiner KI-Firma gesehen. Also vielleicht habe
ich sie auch übersehen, aber wenn ExoMaths jetzt alle Lösungen hätte,
dann würden sie, vermute ich, eine Pressemitteilung dazu machen.
Ich würde auch vermuten, wenn sie sie jetzt schon haben, würden sie sie vor
dem Release der Lösung machen.
Aber wir müssen auch mal überlegen, was wenn nicht?
Also angenommen, die beißen sich jetzt gerade die ganze Zeit die Zähne da aus,
dann würde ich sagen, wäre es ja die klügste PR-Strategie für die Firmen,
einfach so zu tun, als ob sie davon überhaupt nichts mitbekommen hätten.
Also never apologize, never explain. Also sozusagen, ach ja,
diese Probleme hat auch schade, dass die Lösungen jetzt schon bekannt sind oder so.
Wir können es ja mal probieren, danke für den interessanten Input.
Und weil das so plausibel ist, würde ich jetzt davon ausgehen,
also ich meine, diese Firmen sind immer gut informiert, natürlich haben die
davon mitbekommen, also wenn wir jetzt nichts hören, bis morgen,
dann ist das für mich, für mich jedenfalls, die Bestätigung,
dass es keine signifikanten Durchbrüche gab von so autonom agierenden KI-Agenten,
die sich an diesen Problemen,
Erfolgserlebnisse produziert hätten.
Und ja, also Territau hat übrigens auch auf Mastodon beobachtet,
dass die Erdösch-Probleme, über die ja auch viel diskutiert wurde in den letzten Monaten,
eine Liste von Problemen, die auf den Mathematiker Paul Erdösch zurückgehen,
die eben sehr schön visualisiert und durchnummeriert mit so Status,
was ist gelöst, was ist nicht gelöst, auf so einer Webseite präsentiert werden.
Und das ist sozusagen das KI-Testspielzeug immer gewesen, also das,
wo alle KI-EntwicklerInnen sich dran austoben.
Und er hat jedenfalls bemerkt, dass bei den Erdisch-Problems auf einmal nichts mehr los ist.
Und ein Erklärungsansatz, den er dafür hat, ist, dass die jetzt alle bei diesen
First-Proof-Problems dran sind und diese Woche eben was anderes zu tun hatten.
Gut, naja, wir werden in den nächsten Tagen dazu was hören oder wir werden nichts
dazu hören und beides gibt uns Informationen.
Ich tippe eigentlich, dass wir nicht so viel hören werden, aber vielleicht,
wenn ich morgen früh aufwache, werde ich dann eines Besseren belehrt.
Also, Mathematik war noch nie spannender, wir verfolgen die Geschichte natürlich weiter.
Für alle aktuellen Ereignisse und Kommentare und Hot Takes aus dem Eigenraum
empfehle ich euch natürlich wie immer unseren Mastodon-Kanal at eigenraum.podcasts.social.
Dort äußere ich mich zu den weiteren Geschehnissen und ihr könnt up to date
bleiben. und ansonsten freue ich mich einfach, dass ihr bis hierhin gehört habt.
Schreibt doch gerne einen Kommentar oder gebt fünf Sterne auf der Podcast-Plattform eurer Wahl.
Dann fällt es anderen Hörerinnen und Hörern leichter, uns zu finden.
Irgendwie kommt mir das bekannt vor. Ich glaube, ich war gerade so ein bisschen im LLM-Modus.
Also ich habe diese Phrase so oft gehört, dass ich sie jetzt einfach sagen konnte,
ohne vorher darüber nachzudenken.
Ja, okay, nein, ihr müsst das nicht machen. Es ist mir eigentlich,
also ich freue mich, wenn ihr das hört.
Ich freue mich, wenn euch das irgendwie was gibt, wenn ihr auf eine Idee kommt
oder wenn ihr irgendwelche Neuigkeiten erfahrt.
Und wenn ihr den Podcast unterstützen wollt, dann erzählt es einfach einem Menschen.
Erzählt einfach einem anderen Menschen, dem es vielleicht gefallen könnte oder
der es vielleicht gefallen könnte davon.
Und dann ist das auch schon gut. Okay, dann bis bald und tschüss.

Tolle Episode! Besonders gut gefallen haben mir der Geschichtsunterricht und das Wissen über Wolfgang Döblin. Anscheinend gibt es einen Film über sein Leben: https://web.archive.org/web/20081028115611/http://www.wolfgang-doeblin-video.org/
Persi Diaconis sagte „A spellbinding film, a really moving story and a beautiful part of modern mathematics, suitable for non mathematicians and really well done. Make sure you see this.“ 🙂
Ein frühes Beispiel für eine solche verdeckte Veröffentlichung ist Galileis Beobachtung der Phasen der Venus, die er zunächst in Form eines Anagramms (in lateinischer Sprache) publizierte, wobei der verschlüsselte Text ebenfalls einen sinnvollen lateinischen Satz darstellte (sinngemäß: meine Ergebnisse sind noch vorläufiger Natur)!