Wenn die KI wahnsinnig wird
Wenn die KI wahnsinnig wird
Immer mehr KI-generierte Trainingsdaten machen die KI-Modelle krank. Fällt der erhoffte Produktivitätsschub nun schwächer aus?
Von Stephan Lorz, Frankfurt
Jede neue bahnbrechende Technologie hat bislang solche Zyklen durchgemacht: Anfangs zeigen sich die Menschen überrascht, Märkte und Gesellschaft reagieren mit Faszination und Euphorie, Prognosen werden immer höher geschraubt. Die Erwartungen steigen ins Maßlose, bis sich Ernüchterung und Enttäuschung breitmachen und die Marktbewertungen wieder in sich zusammenfallen. Aber erst dann zeigt sich das wahre Potenzial einer Technologie. Das ist dann immer noch gewaltig und verschiebt ökonomische Strukturen, doch aus Hype wird Betriebsamkeit.
All das geschieht aktuell mit der künstlichen Intelligenz (KI): Damit in Verbindung gebrachte Unternehmenswerte wurden zunächst nach oben katapultiert und hohe Erwartungen geweckt. Ein regelrechtes Wirtschaftswunder mit enormen Produktivitätsgewinnen wurde versprochen. Doch inzwischen scheint die KI etwas von ihrer Wunderkraft verloren zu haben – an den Märkten, aber auch in der Einschätzung ihrer ökonomischen Gestaltungskraft.
Probleme bei der Datenbasis
Noch vor wenigen Monaten wurden Produktivitätsgewinne von 3% oder gar 7% (McKinsey/Goldman Sachs) vorhergesagt. Dann sprach MIT-Ökonom Daron Acemoglu von zu optimistischen Einschätzungen. Insgesamt sieht er den Produktivitätsgewinn irgendwo zwischen 0,9 bis 1,56% liegen, bei komplexen Tätigkeiten sogar nur bei 0,53% auf zehn Jahre betrachtet. Immer noch enorm, aber in einer ähnlichen Größenordnung wie bei der Elektrifizierung und diversen Automatisierungswellen.
Erst seit kurzem werden nun auch die inhärenten Probleme der KI debattiert, was ihre praktische Anwendung bremsen dürfte. Neben den bekannten „Halluzinationen“ generativer Modelle machen es hohe Fehlerquoten schwer, sie tatsächlich autonom einzusetzen. Denn das Grundproblem kann man nicht so schnell aus der Welt schaffen: Die Modelle werden mit Daten trainiert, die fehlerhaft sind, nur einen Teil der Realität abbilden und inzwischen oftmals selbst durch KI generiert sind.
KI trainiert KI
Die Probleme fehlerhafter Daten lassen sich kaum aus der Welt schaffen, nur ein Teil kann weggefiltert werden. Noch schwieriger ist der grundlegende „Bias“ zu korrigieren, weil die im Internet abgebildete „Welt“ nicht den realen Verhältnissen entspricht, von Stereotypen durchsetzt ist und oft kulturell einseitig geprägt ist. In der Regel finden sich im Internet Bilder etwa von Blumen signifikant häufiger als Bilder von anderen Pflanzen. Also werden Blumen zu stark gewichtet.
Noch problematischer ist aber das KI-Training durch KI-generierte Inhalte. Schon jetzt ist „das Internet“ weitgehend ausgewertet, so dass manche Tech-Konzerne heimlich sogar urheberrechtlich geschützte Werke durchpflügen. Aber auch das hilft nicht gegen die Gefahr einer zunehmenden Selbstreferenzialität. Denn immer mehr Texte, Bilder und Videos im Netz sind von einer KI erstellt worden. KI-Bilder werden mit Dall-E, Midjourney oder anderen Tools komponiert, geteilt, kommentiert, erneut verändert. KI-Tools fassen Nachrichten zusammen, generieren ganze Romane, Berichte, Kommentare. Die europäische Polizeibehörde Europol erwartet, dass 2026 bereits 90% aller Online-Inhalte synthetisch generiert sein könnten.
Höhere Fehlerquoten
Das aber macht die KI „krank“ im wahrsten Sinne des Wortes. Wissenschaftler der Rice University haben festgestellt, dass die Modelle von den synthetischen Daten infiziert werden, die Fehlerquoten steigen, Fotos an Details verarmen, Texte einander immer ähnlicher werden. Dies könne sogar zu einem „Modellkollaps“ führen, warnt Richard Baraniuk von der Rice University. Er bezeichnet die „Krankheit“ als „Model Autophagy Disorder“, abgekürzt MAD – mit Ähnlichkeiten zum Rinderwahnsinn.
Insofern dürfte den generativen KI-Modellen klare Grenzen gesetzt sein. Demgegenüber werden nun in KI-Technologien abgegrenzter Wissensbereiche in Industrie, Medizin und Technik wieder mehr Chancen gesehen. Und hier könnte Deutschland seine Chancen wieder ausspielen, weil die hierfür nötigen Trainingsdaten ohnehin unternehmenseigen sind und die Wissenschaftler von vornherein auf diesen engen KI-Sektor gesetzt haben. Künftige Produktivitätsgewinne sind also vor allem durch spezialisierte KI-Modelle zu realisieren. Folgt daher nun der nächste Hype?