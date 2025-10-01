Im letzten Artikel meiner hier auf Ansage! veröffentlichten Reihe über die KI-Entwicklung habe ich dargelegt, warum es unwahrscheinlich ist, dass der Fortschritt in absehbarer Zeit stoppen wird. In diesem Teil werde ich eine ganz andere Argumentation entwickeln. Es spricht viel dafür, dass sich die Entwicklung nicht verlangsamen, sondern noch enorm beschleunigen wird. Viele Experten sprechen von der Take-off-Phase (wie beim Start eines Flugzeugs) oder von einer Intelligenzexplosion, bei der die Leistungsfähigkeit einer KI sprungartig ansteigt. Wahrscheinlich wird es nicht nur eine solche Explosion, sondern viele solcher Explosionen geben. Sobald die KI in der Lage ist, sich selbst zu verbessern, gibt es für den Menschen nur noch wenig zu tun. Denn wenn die KI sich selbst verbessert hat, wird die neue Version besser darin sein, sich zu verbessern. Ab dann wird der Fortschritt geradezu zur Lawine.

Ist die KI dazu schon in der Lage? Nein. Jedenfalls nicht, wenn man fragt, ob sie sich vollständig autonom verbessern kann. Wenn es aber nur darum geht, jeweils Details zu verbessern, dann lautet die Antwort tatsächlich: Ja! Die meisten aktuellen KI-Versionen können programmieren, also einen fertigen Code ausspucken. Ebenso können sie auch Fehler im Code aufspüren. Ein Programmierer kennt das Problem: Man hat nur an einer falschen Stelle kein Komma gesetzt oder eine eckige statt einer runden Klammer gesetzt – und nichts geht mehr. Die KI kann in diesem Fall den gesamten Code nach Fehlern durchforsten und augenblicklich beheben. Allein dadurch, dass den menschlichen Programmierern viel Zeit erspart wird, haben sie mehr Zeit, sich auf ihre eigentliche Arbeit zu konzentrieren.

Weiteres Puzzlestück auf dem Weg zur menschenähnlichen KI

Die großen Firmen haben auch interne Modelle, die deutlich stärker sind als die Versionen, die wir Normalsterbliche daheim in unseren Browsern verwenden. Unter anderem werden sie dafür genutzt, leistungsfähigere Chips zu entwickeln, mit denen dann die nächste Version der KI verbessert werden kann. KI-Modelle werden mit Texten trainiert und können selbst Texte schreiben. Warum also schreibt die KI nicht einfach Texte, die dann selbst wieder für das Training genutzt werden? Tatsächlich geschieht mittlerweile genau das. Die Zugewinne durch solche synthetischen Daten sind nicht so gut wie Zugewinne durch reale Daten, aber sie sind zumindest ein weiteres Puzzlestück auf dem Weg hin zur menschenähnlichen KI.

Man kann an diesem Punkt nur spekulieren, ab wann eine KI dazu in der Lage sein wird, sich eigenständig zu verbessern; ab wann sie also nicht mehr nur ein Werkzeug ist, das den menschlichen Entwicklern hilft. Ein KI-System müsste schon ein Selbstbewusstsein haben, um sich völlig frei von äußerer Hilfe weiterzuentwickeln. Vielleicht wird dann ab einem gewissen Punkt ein Meta-Selbstbewusstsein, also ein Selbst-Selbstbewusstsein entstehen. Was bedeutet das? Menschen sind sich über ihre Empfindungen bewusst, aber nicht über das Wesen einer Empfindung selbst. Wir Menschen wissen zwar, was wir denken, aber nicht, wie wir denken. Von allein wird man die Funktionsweise des Gehirns nicht verstehen. Selbst heutige Hirnforscher verstehen die Abläufe im Gehirn nur grob. Für eine KI, die nicht nur denken kann, sondern gleichzeitig auch den Programmiercode hinter jedem Gedanken versteht, wäre die Selbstoptimierung keine große Herausforderung. Weitere Fortschritte in der KI-Entwicklung werden vermutlich von ganz allein zu einem Zuwachs der Trainingsdaten führen.

Bald schon flüssige Gespräche möglich

Wir alle haben vermutlich schon den Sprachmodus von GPT ausprobiert. Und dieser kann bereits beeindrucken, auch wenn er noch lange nicht perfekt ist – doch er wird rasend schnell immer besser. Vor zwei Jahren gab es noch eine erhebliche Verzögerung. Man hatte weniger den Eindruck einer echten Unterhaltung wie etwa bei einem flüssigen Telefongespräch, sondern eher, sich einem WhatsApp-Chatverlauf zu befinden, bei dem man sich abwechselnd Sprachnachrichten hin- und herschickt. Mittlerweile ist die Verzögerung minimal; man hat beinahe das Gefühl mit einem Menschen zu sprechen. Und wir wissen selbst, dass wir in einer Sprachnachricht oft konzentrierter, also etwas weniger natürlich, als in einer normalen Unterhaltung sprechen. Mittlerweile ist gut denkbar, dass bereits in einem Jahr ein völlig flüssiges Gespräch möglich ist.

Und das würde alles ändern. Denn dann würde sich die Zahl der Leute, die den Sprachmodus nutzen, schlagartig erhöhen. Die KI wäre dann nicht mehr bloß ein nützliches Werkzeug, sondern ein (fast) gleichberechtigter Gesprächspartner. In kürzester Zeit könnte sich die Zahl der Gesprächsminuten, die die KI berechnet, verhundert- oder gar vertausendfachen. Derart große Zahlen können das logarithmische Gesetz schlagen. Vor allem wäre qualitativ neues Datenmaterial verfügbar. Denn bislang wurden die großen KI-Modelle vor allem mit eingescannten Büchern oder mit Zeitungsartikeln gefüttert, aber weniger stark mit gesprochener Sprache – die sich ja von geschriebener Sprache unterscheidet. Zum einen, weil die gesprochene Sprache einerseits etwas weniger komplexe Sätze, dafür aber mehr Emotionen durch Betonungen enthält.

Immer mehr Trainingsdaten

Die KI müsste dann aber auch zusätzliche Parameter wie verschiedenen Betonungen, Sprachmelodien und Metasignale erfassen. Bislang wandelt sie nur stumpf Wörter in Text um. Sprechen zwei verschiedene Personen gleichzeitig mit der KI, kann sie deren Stimmen nicht unterscheiden, weil im System nur der transkribierte Text ankommt; dies geschieht natürlich, um Rechenleistung zu sparen. Hebt man diese Beschränkung auf, wäre es möglich, verschiedene Stimmen zu unterscheiden und auch Nuancen in der Betonung, die auf Emotionen hindeuten, zu erfassen. Eine KI, die auf einen Schlag einen derart großen Datenschatz zur Verfügung hat, dürfte vermutlich innerhalb weniger Jahre in der Lage sein, den Turing-Test zu bestehen.

Gibt es bei diesem Ansatz vielleicht ein Problem? Ja, sogar zwei. Erstens bräuchte es mehr Rechenleistung, um alle Facetten der menschlichen Sprache zu erfassen; und zweitens ist allein durch die Laufzeit des Signals eine verzögerungsfreie Kommunikation nicht möglich. Beides wäre jedoch lösbar, wenn nicht jede Anfrage an den Server in den USA geschickt, sondern direkt auf dem Endgerät (Handy, Computer) berechnet wird. Der Nachteil wäre, dass man das System auslagert und damit anfällig für Industriespionage machen würde. Läuft auf dem Endgerät jedoch nur eine abgespeckte Version, sollte dieses Argument nicht allzu stark ins Gewicht fallen. Auch würde es reichen, lediglich einen Teil der Berechnung auf dem Endgerät durchzuführen. Das Handy würde vielleicht die ersten drei Sekunden des Gesprächs berechnen, bis dann der Rest der Konversation aus den USA ankommt. Sicher wäre das ein großer Aufwand für die Entwickler, der es aber wert wäre. In gewisser Weise würden die Kunden dann dafür bezahlen, dass sie dem Unternehmen Trainingsdaten bereitstellen. Und vielleicht würde sich bei manchem Nutzer das Gefühl einstellen, dass die KI sich im Gespräch jeweils so verhält, wie es für die besten Trainingsdaten gerade erforderlich ist.

Von der kleinen zur riesigen Leistungssteigerung

Aktuell fahren auf Kaliforniens Straßen einige tausend Autos wie von Geisterhand gesteuert. Ihre Zahl erhöht sich jedoch exponentiell. Was im Umkehrschluss bedeutet, dass sich auch die gewonnene Datenmenge exponentiell erhöht. Vermutlich werden nur noch wenige Jahre bis zur Serienreife autonomer Autos vergehen. Ebenso gibt es mittlerweile Roboter, die einfache Aufgaben im Haushalt übernehmen können. Auch hier gilt: Sobald das Produkt einmal auf dem Markt ist, wird in Windeseile mehr Trainingsmaterial bereitstehen, als während des gesamten Entwicklungsprozesses nötig war. Doch es gibt noch eine weitere Möglichkeit einer Intelligenzexplosion: Man spricht in diesem Zusammenhang von einem emergenten Phänomen. Damit ist gemeint, dass etwas größer ist als die Summe seiner Einzelteile. Eine kleine Leistungssteigerung kann so zu einer enormen Steigerung im Ergebnis führen.

Dazu etwas Anekdotisches aus eigenem Erleben: Ich halte mich für einen guten Journalisten, auch wenn der geneigte Leser dazu natürlich eine andere Meinung haben kann. Aber wie dem auch sei: Während meines Geschichtsstudiums bewunderte ich andere Historiker und Journalisten, denen es gelang, das „große Ganze“ zu erklären – also äußerst facettenreiche Analysen zu verfassen, die ein Thema aus mehr als nur einer Perspektive beleuchteten und Querverbindungen aufzeigten. Ich hatte nur eine gute Handvoll Themengebiete, mit denen ich mich auskannte, und konnte dazu jeweils auch kurze, prägnante Artikel verfassen. Der große Wurf blieb jedoch aus. Dann aber bot sich der Anlass, einen Text zu verfassen, in dem sich all meine Themengebiete berührten. Zusätzlich gab es nahezu einen fließenden Übergang von aktueller Tagespolitik hin zu längst vergangenen Zeiten. Meine Fähigkeit, das „große Ganze“ zu beschreiben, war über Jahre nicht vorhanden gewesen, während meine Kenntnisse in vielen einzelnen Themenbereichen stetig anwuchsen. Dann aber konnte ich es urplötzlich von einem Moment auf den anderen.

Spielerisches Austesten von Limits

Außerdem bin ich ein Nerd und als solcher mag ich Nerd-Themen. Manche davon haben mit Brettspielen zu tun, bei denen man Würfel werfen muss. Wie wahrscheinlich ist es, bei einem Ergebnis von 4, 5 oder 6 zu treffen? Das ist noch einfach: Es sind 50 Prozent. Also könnte man den Würfel eigentlich auch durch eine Münze ersetzen. Aber was, wenn die 4 und 5 einen Treffer bedeuten und die 6 einen Volltreffer? Und wie wahrscheinlich ist es, mit drei Würfeln dreimal die 6 zu würfeln, und im Vergleich dazu dreimal die 6 mit 20 Würfeln zu würfeln? Noch dazu gibt es Regeln, die es erlauben, bei einem Fehlschlag einen Wiederholungswurf zu würfeln. Und was, wenn zwei Würfel in der Summe nicht den Wert von 10 überschreiten dürfen? Alles verstanden? Wahrscheinlich nicht. Genau deswegen sollte die KI mir ja diese Berechnungen abnehmen.

Im vergangenen Jahr hatte die KI kein Problem damit, jeweils für eines dieser Szenarien die Wahrscheinlichkeiten korrekt zu berechnen. Folgt man aber der Logik dieser Brettspiele, ist es nötig, mehrere Würfe hintereinander zu kombinieren. Und dort fing das Problem an. Je weiter ich vom einzelnen Wurf hin zu einer komplexeren Spielsituation ging, desto unzuverlässiger wurden die Ergebnisse. Zunächst wollte ich rein aus Spaß am Spiel, dass die KI für mich die Berechnungen erledigt. Aber mit jedem misslungenen Versuch wurde mir klarer, dass ich unfreiwillig einen Benchmark geschaffen hatte, mit dem sich die Leistungsfähigkeit einer KI messen lässt. Ich entwarf vier verschiedene Fragen und erwartete, dass alle in einer einzelnen Antwort beantwortet würden. Ein Teilerfolg wäre es gewesen, wenn die KI in der Lage gewesen wäre, jede einzelne Frage einzeln zu beantworten. Noch vor einem Jahr bestand keines der Modelle, egal ob GPT, Claude, Gemini oder Grok den Test. Lediglich die erste der vier Fragen, die bewusst einfach gehalten war, wurde korrekt beantwortet.

Verbesserungsversuche bis zum Durchbruch

Wenn ich dann eine falsche Antwort auf eine der schwierigeren Fragen erhielt, versuchte ich die KI zu verbessern. Korrigierte ich sie das erste Mal wurde die Antwort ein bisschen besser. Korrigierte ich sie das zweite Mal wurde sie noch ein bisschen besser. Korrigierte ich sie das dritte Mal, war die Antwort schon beinahe richtig. Korrigierte ich sie das vierte Mal, war die Antwort… falsch! Offensichtlich konnte die KI höchstens drei Verbesserungen gleichzeitig im Kurzzeitgedächtnis behalten, mit der vierten Verbesserung wurde die erste Verbesserung wieder vergessen. So oft ich es auch versuchte, die KI schaffte es nicht, die Fragen richtig zu beantworten. Vor lauter Frust hätte ich meinen Laptop am liebsten an die Wand geknallt.

Gegen Ende des letzten Jahres war ich davon überzeugt, dass die KI es auch 2025 nicht hinbekommen würde, alle Fragen gleichzeitig und im ersten Versuch richtig zu beantworten. Die oben genannten Modelle erfuhren in der ersten Jahreshälfte immer wieder Updates, und tatsächlich wurden die Antworten einfach nicht besser. Ich hatte allerhöchstens die Hoffnung, dass es bis zum Ende des Jahres möglich sein würde, mit beliebig vielen Korrekturen zum gewünschten Ergebnis zu kommen. Dass es ohne Korrekturen und mit allen vier Fragen gleichzeitig gehen würde, sah ich erst für 2026 kommen.

Vom Teilbeweis zum Vollbeweis?

Doch dann erschien GPT 5 – und auf Anhieb wurden alle vier Fragen korrekt beantwortet. Dabei ist GPT 5 eigentlich nur ein kleines bisschen leistungsstärker als GPT 4. Manche Dinge kann auch die neueste Version immer noch nicht und viele Dinge kann sie nur ein Stückchen besser als die Vorgängerversionen – aber in manchen Aspekten ist die neue Fassung radikal besser. Aktuell sorgt die neue GPT-Version für Aufsehen, weil sie erstmals ein kompliziertes, bislang ungelöstes mathematisches Problem lösen konnte. Soweit man sagen kann, ist die Lösung tatsächlich korrekt. Aber hat die KI den Beweis auch wirklich allein geführt?

Es ist schwierig, den Denkprozess, der in einer KI abläuft, nachzuvollziehen. Daher weiß man nicht, wie sehr dieser Beweis komplett eigenständig durchgeführt wurde, oder wie sehr er sich auf bestehende Arbeiten stützt. Beispielsweise werden manchmal unvollständige Beweise eines mathematischen Problems in Fachzeitschriften veröffentlicht, die dann aber für kein großes Aufsehen sorgen – schließlich wurde das Problem ja nicht vollständig gelöst. Vielleicht gab es einen solchen Teilbeweis, auf dem die KI aufbauen konnte. Oder aber die KI hat in anderen wissenschaftlichen Aufsätzen Parallelen entdeckt, auf denen sie aufbauen konnte. Solche Parallelen zu entdecken, ist aber äußerst schwierig. Beispielsweise beschreiben diese beiden Formeln die Eulersche Zahl e:

Ein Mathematiker mag in diesem Fall noch schnell die Ähnlichkeit bemerken, doch hierbei handelt es sich noch um vergleichsweise einfache Mathematik. In der Spitzenforschung würden selbst Experten lange brauchen um weit komplexere Ähnlichkeiten zu erkennen. Vielleicht hat GPT also wirklich komplett eigenständig einen Beweis geführt, vielleicht aber nur geschickt bereits bestehendes Wissen neu kombiniert. Allerdings: In der Geschichte der Mathematik wurden neue Erkenntnisse oft genug nur durch eine Kombination bisherigen Wissens gewonnen, statt wirklich von Grund auf neu erdacht zu werden. Und auch dafür wurden schon Auszeichnungen verliehen. So oder so ist GPT für Mathematiker relevant geworden. Und auch hier gilt: Selbst wenn die KI aktuell noch keine eigenständigen Beweise führen kann, sondern nur gut im „Recycling“ ist, ließen sich damit viele wissenschaftliche Aufsätze verfassen, die dann wiederum neue Trainingsdaten darstellen.

Auch aus der klassischen (das heißt menschlichen) Intelligenzforschung gibt es Indizien, die auf eine Intelligenzexplosion hindeuten. Dazu muss man allerdings ein wenig ausholen. In den USA wurde die Study of Mathematically Precocious Youth (“Studie der mathematisch hochbegabten Jugendlichen”) durchgeführt. Zu diesem Zweck ließ man eine große Gruppe 13-jähriger Schüler den mathematisch-naturwissenschaftlichen SAT-Test (entspricht grob vereinfacht dem deutschen Zentralabitur) absolvieren. Dieser stimmt grob mit den Ergebnissen eines IQ-Tests überein. Anhand dieser Versuchsgruppe ließ sich ermitteln, wie viele Punkte man erzielen musste, um zu obersten Prozent der Intelligenzverteilung (im mathematischen Teilaspekt) zu gehören. Dann wurden in vielen Schulen im ganzen Land die klügsten Schüler aufgespürt, um zu ermitteln, ob sie zur Elite gehören. Das oberste eine Prozent entspricht einem IQ-Wert von etwa 135.

Parallelen zur IQ-Verteilung

Wer die IQ-Verteilung von klug nach dumm durchschreitet, wird feststellen, dass die mathematischen Möglichkeiten stetig zunehmen. Aber je nach Schwierigkeit wird sich ein anderes Muster zeigen: Zum Beispiel, wenn man Personen 50 Euro in die Hand drückt und in den nächsten Supermarkt schickt. Natürlich werden klügere Personen deutlich besser abschneiden als dumme Personen. Aber vermutlich gibt es einen Grenzwert, über den hinaus sich die Aufgabe nicht besser bewältigen lässt. Egal ob IQ 110 oder 130 – vermutlich wird man in beiden Fällen gleich gut mit dem Geld auskommen. Zwischen IQ 70 (Grenze zur geistigen Behinderung) und 90 (schlechter Durchschnitt) dürfte man jedoch sehr wohl einen Unterschied sehen. Das Bild dreht sich allerdings um, wenn man sehr schwierige Mathematikaufgaben bewältigen muss: Dann wird auch jemand mit einem IQ von 110 (guter Durchschnitt) nicht besser abschneiden als ein geistig Behinderter, weil beide an der Aufgabe scheitern. Umgekehrt ist das Feld aber nun nach oben offen. Im Supermarktbeispiel würde man keinen Unterschied zwischen IQ 130 und 150 feststellen, im Bereich der Hochschulmathematik hingegen schon.

Und das ist einer der Befunde, die sich aus der genannten Studie ableiten lassen. Diese erfasst nur das oberste eine Prozent, daher muss man ein wenig raten, wie die Zusammenhänge im Bereich darunter aussehen. Grundsätzlich falsch werden meine Schätzungen jedoch nicht sein. Geht es darum, im Bereich der Hochschulmathematik zu brillieren, gilt vermutlich folgendes: Durchschreitet man die IQ-Verteilung (jeweils die mathematische Teilkomponente) von ganz unten bis nach oben, wird man in den ersten 90 Prozent (alles unterhalb IQ 120) niemanden finden, der an der Universität besteht. Im Bereich von 120 bis 135 (die nächsten 9 Prozent) finden sich die ersten Absolventen und ihre Zahl nimmt mit höherer Intelligenz weiter zu. Oberhalb von 135 (also im obersten Prozent) finden man dann geradezu eine Explosion von Beispielen.

Der Heilige Gral der Mathematik zum Greifen nahe

Dies konnte gezeigt werden, weil insgesamt mehrere tausend Schüler an der Studie teilnahmen und über Jahrzehnte hinweg begleitet wurden. Im Gegensatz zu anderen Studien, bei denen Hochbegabte mit Normalbegabten verglichen wurden, waren so Vergleiche innerhalb der Gruppe der Hochbegabten möglich. Zu diesem Zwecke wurde das oberste Prozent in Quartile (Viertel) eingeteilt. Die jeweiligen Durchschnittswerte der Quartile liegen etwa bei 137, 140, 143 und 150. Und für jedes der Quartile ließ sich angeben, wie erfolgreich die jeweiligen Hochbegabten waren, etwa in Bezug auf das Einkommen, die angemeldeten Patente, die veröffentlichten Fachaufsätze und so weiter. Der deutlichste Unterschied zwischen Q (Quartil) 1 und Q4 trat bei den Doktortiteln im Bereich MINT – Mathematik, Informatik (manchmal auch Ingenieurwissenschaften), Naturwissenschaften und Technik (hierin könnten Ingenieure ebenso enthalten sein) zutage. In Q4 fanden sich etwa 18 Mal mehr MINT-Doktortitel als in Q1. Ein Zuwachs von rund 10 Prozent im IQ (137 bis 150) bedeutete also einen Zuwachs von 1.800 Prozent im Ergebnis. Ist also erst einmal eine kritische Masse überschritten, wirkt sich die Intelligenz exponentiell stark aus.

Übertragen wir die obigen Ausführungen über KI-gestützte mathematische Beweise auf unsere Ergebnisse aus der Hochbegabtenforschung, lässt sich vermuten, dass die KI-Systeme jetzt den Schritt von „geht gar nicht“ hin zu „klappt so halbwegs“ überschritten haben. Wenn die Analogie hält, dürfte es nun etwa ein bis zwei Jahre lang einen linearen Zuwachs in der mathematischen Leistungsfähigkeit geben, bis dann geradezu eine Explosion einsetzt. Dann wäre auch der Heilige Gral der Mathematik zum Greifen nah: Im Jahr 1900 benannte der Mathematiker David Hilbert 24 ungelöste Probleme der Mathematik, die als besonders schwierig galten. Von diesen sind mittlerweile zehn gelöst. Bei einigen anderen gibt es Teilerfolge, manche sind derart schwierig, dass die besten Mathematiker der Welt nicht einmal den Hauch einer Ahnung haben, in welche Richtung sie überhaupt forschen sollen.

Vom logarithmischen zum exponentiellen Gesetz

Auch der Vergleich von Menschen und Menschenaffen könnte die Intelligenzexplosion als emergentes Phänomen bestätigen. Im Vergleich mit unseren nächsten Verwandten haben wir etwa die drei- bis vierfache Hirnkapazität (in Bezug auf Volumen, Gewicht, Neuronenzahl et cetera). Dennoch ist klar, dass Menschen nicht bloß drei- bis viermal mehr zum technologischen Fortschritt auf diesem Planeten beigetragen haben. Aktuell zeigt sich bei der Entwicklung der KI-Modelle noch ein logarithmischer Zusammenhang. Soll heißen: eine Verzehnfachung des Inputs (der Rechenleistung, Arbeitsstunden, Datenmenge) entspricht einer Verdoppelung des Outputs (der Intelligenzleistung) Eine Verhundertfachung entspricht einer Verdreifachung, einer Vertausendfachung einer Vervierfachung und so weiter (die exakten Zahlen variieren dabei je nach Quelle und weichen von diesen Beispielzahlen natürlich stark ab, hier handelt es sich um eine grobe Vereinfachung, um das Verständnis zu erleichtern.) Ab einer gewissen kritischen Masse scheint dann der emergente Effekt einzusetzen und das logarithmische Gesetz verwandelt sich in ein exponentielles: Eine Verdoppelung des Inputs wird zu einer Verzehnfachung des Outputs, eine Verdreifachung des Inputs wird zu einer Verhundertfachung des Outputs und so weiter.

Doch ist der Einfluss der Hardware – egal ob Computerchips oder Nervenzellen – wirklich so stark? Vielleicht haben Menschen ja schlicht bessere Software in ihren Gehirnen installiert!? Bis zu einem gewissen Punkt wird das stimmen. Schließlich lernen wir unser ganzes Leben lang hinzu. Aber diese Lernfähigkeit ist biologisch und wurde uns nicht extern von einem höheren Programmierer einprogrammiert. Kann die Evolution es geschafft haben, uns nicht nur mit besserer Hardware, sondern auch mit besserer Software auszustatten? Das ist in vielerlei Hinsicht unwahrscheinlich. Denn wie genau soll der Mechanismus aussehen, mit dem die Evolution ein Computerprogramm erstellt? Auch die verfügbare Datenmenge in unserem Erbgut reicht dafür bei Weitem nicht aus. Von vielen Genen ist gut bekannt, was sie bei der Entwicklung des Körpers bewirken und die meisten von ihnen sind für die Regionen abseits des Gehirns verantwortlich. Aber selbst wenn man die gesamte Informationsdichte der DNS (in Bits und Bytes) komplett ausreizen könnte, käme man nicht einmal in die Nähe des erforderlichen Umfangs für ein komplexes Computerprogramm.

Großer Entwicklungssprung steht bevor

Die Menschen haben die Evolution in die eigene Hand genommen, etwa in der Tierzucht. Das beste Beispiel dafür ist die Domestikation des Wolfs hin zum Hund. Dieser Prozess begann zunächst ungesteuert: Wölfe, die etwas zahmer waren, trauten sich näher an die menschlichen Siedlungen heran und konnten von deren Essensresten profitieren. Doch die Menschen begriffen früh, dass sie die Fortpflanzung gezielt steuern konnten, und sorgten dafür, dass die jeweils zahmsten Tiere verpaart wurden und so die meisten Nachkommen bekamen. Resultat dieser Domestikation war, dass das Gehirn des Wolfs schrumpfte. Klar: Wer gefüttert wird, braucht kein Gehirn zur Koordination der Jagd. Aber anteilig schrumpften die Gehirnareale, die für aggressives Verhalten zuständig sind, ebenso weiter. Auch bestimmte Verhaltensweisen sind also vermutlich durch die Größe der Gehirnareale und nicht durch eine genetisch programmierte Software bestimmt. Ein anderes Indiz ist eine Studie mit Londoner Taxifahrern: Je länger diese in ihrem Job arbeiteten, desto stärker wuchs ihr Gehirnareal, das für räumliches Vorstellungsvermögen zuständig ist.

Diese Hinweise deuten darauf hin, dass die reine Skalierung – also Vergrößerung der bisherigen Methoden – der KI-Modelle zu immer höherer Intelligenz führt, ohne dass dafür eine grundlegend neue geniale Programmiermethode erforderlich wäre. Und darauf hin, dass der Intelligenzzuwachs nach dem Überschreiten einer kritischen Masse umso stärker ausfällt. Die Tatsache, dass sich alle großen Entwicklerfirmen (OpenAI, DeepMind, Anthropic, xAI) überzeugt zeigen, schon bald die Artificial General Intelligence (AGI) zu erreichen, spricht dafür, dass ein großer Entwicklungssprung kurz bevorsteht. Natürlich ist denkbar, dass es sich hierbei nur um Publicity handelt, denn jedes Unternehmen möchte möglichst viele Fördergelder kassieren. Aber sollte sich abzeichnen, dass ein Ende der Entwicklung bevorsteht, würde das eine Unternehmen, das diesen Umstand offen bekennt, die meisten Fördergelder einstreichen können, weil es sich als das einzig ehrliche erwiesen hätte.

An der Schw

Auch dass Meta (Facebook, Instagram, WhatsApp) nun ins Rennen einsteigt, zeigt dass die Lage ernst ist. Mark Zuckerberg versucht im großen Stil die Top-Talente der anderen Firmen abzuwerben, um mit seinem eigenen KI-Modell dagegenhalten zu können. Er stellte dafür einem einzelnen Angestellten von OpenAI sogar eine Milliarde Dollar für den Wechsel in Aussicht. Meta ist bereit, seine eigenen Reserven aufzubrauchen. Nun ist davon auszugehen, dass Zuckerberg die Möglichkeit einer AGI gut einschätzen kann. Angenommen, BMW würde ankündigen, ein Auto auf den Markt zu bringen, das nur einen Liter Benzin auf 100 Kilometer verbraucht, könnte Mercedes ziemlich genau einschätzen, ob diese Meldung real oder nur heiße Luft ist – selbst dann, wenn Mercedes nicht in der Lage wäre, dieses Auto zu bauen. Würde Zuckerberg wissen, dass die KI-Entwicklung bald stoppt, würde er entspannt zusehen, wie alle anderen Firmen ihr Geld verpulvern und selbst in gewinnträchtigere Technologien investieren. Auch wenn Meta aktuell im Wettrennen weit hinten liegt, dürfte es unter allen relevanten Entwicklern doch den größten Datenschatz haben, was Chatnachrichten angeht.

Der Fortschritt der letzten Jahre und die hier dargelegten Argumente machen es plausibel, dass schon in einigen Jahren die sogenannte Singularität erreicht wird. Der Zeitpunkt, ab dem die KI sich in so rasantem Tempo verbessert, dass der menschliche Verstand nicht mehr Schritt halten kann.