Wenn KI sich täuscht: Halluzinationen bei generativen Sprachmodellen

Warum KI halluziniert und wie Benutzer:innen die Wahrheit von der Fiktion unterscheiden können

Wie kommt es zu diesem Phänomen? Was bedeutet das für die Nutzung von KI im Alltag? Und wie können Nutzer:innen solche Halluzinationen erkennen oder bestenfalls sogar vermeiden? In diesem Artikel gehen wir auf die Mechanismen ein, die hinter den Halluzinationen stecken. Außerdem beleuchten wir die Unterschiede zwischen großen und kleinen Sprachmodellen in Bezug auf ihre Anfälligkeit für Halluzinationen und diskutieren, wie die Technologie verbessert werden kann, um diese Herausforderungen zu minimieren.

Halluzinationen bei GenAI

Was sind Halluzinationen bei generativer KI? 

Generative KI, wie sie in Systemen wie GPT-4 von OpenAI verwendet wird, hat in den letzten Jahren beeindruckende Fortschritte gemacht. Sie kann Texte verfassen, Fragen beantworten und kreative Inhalte erstellen, die oft kaum von menschlichen Arbeiten zu unterscheiden sind. Doch trotz dieser Fortschritte gibt es ein Phänomen, das immer wieder für Verwirrung und auch Besorgnis sorgt: Halluzinationen bei generativer KI. 

In der Welt von Künstlicher Intelligenz bezieht sich der Begriff “Halluzination” auf die Tatsache, dass ein KI-Modell plausible, jedoch falsche oder unsinnige Informationen erzeugt. Die generierten Antworten erscheinen also logisch und formell korrekt, sind inhaltlich aber ungenau oder sogar frei erfunden. Das ist vor allem dann problematisch, wenn sich die Nutzer:innen auf die Richtigkeit der Antworten verlassen, beispielsweise bei der Recherche oder bei der Content-Erstellung. 

Wie kommt es zu Halluzinationen bei generativer KI? 

Halluzinationen sind das Ergebnis komplexer Wechselwirkungen zwischen den Trainingsdaten, der Architektur des Modells und den Anfragen der Benutzer. Die Hauptursachen sind: 

1. Datenverzerrung (Bias) 

Ungenauigkeiten in den Trainingsdaten: Die Trainingsdaten eines Modells sind entscheidend für seine Leistung. Wenn diese Daten veraltet sind oder Fehler, Vorurteile oder Unwahrheiten enthalten, kann das Modell diese Fehler lernen und reproduzieren. 

Unvollständigkeit der Daten: Selbst wenn die Daten korrekt sind, kann es Lücken geben, die das Modell zu unsinnigen Schlussfolgerungen führen. 

2. Modellarchitektur und Wahrscheinlichkeitsbasierte Generierung 

Wahrscheinlichkeitsmodellierung: Sprachmodelle wie GPT-4 arbeiten, indem sie Wahrscheinlichkeiten berechnen, um vorherzusagen, welches Wort oder welcher Satz als nächstes kommen sollte. Diese Methode ist jedoch nicht perfekt und kann dazu führen, dass plausible, aber falsche Informationen generiert werden. 

Kontextualität und Kohärenz: Während Modelle gut darin sind, kohärente Texte zu generieren, überprüfen sie nicht die Richtigkeit oder den Realitätsgehalt der Informationen, die sie erzeugen. 

3. Fehlende Echtzeitvalidierung 

Keine Echtzeit-Korrektur: Im Gegensatz zu menschlichen Autoren, die ihre Informationen überprüfen und korrigieren können, haben KI-Basismodelle wie GPT keine Möglichkeit, ihre generierten Inhalte in Echtzeit zu validieren. 

4. Komplexität und Mehrdeutigkeit der Anfragen 

Unklare oder zu komplexe Fragen: Wenn Benutzer komplexe oder mehrdeutige Fragen stellen, versucht das Modell oft, diese mit erfundenen oder unsicheren Informationen zu beantworten, um eine kohärente Antwort zu liefern.

Wie können Benutzer:innen Halluzinationen erkennen?

Zunächst einmal sollten sich Nutzer:innen der Möglichkeit von Halluzinationen bei generativer KI bewusst sein, um diese mit verschiedenen Strategien erkennen zu können: 

Fact-Checking: Können die generierten Antworten von verlässlichen und unabhängigen Quellen bestätigt werden? 

Quellennachweise: Kann die KI selbst glaubwürdige und nachvollziehbare Quellen angeben? 

Konsistenz: Gibt die KI unterschiedliche Antworten auf ähnliche Fragen oder widerspricht sie sich in ihren Aussagen? 

Wie können Halluzinationen bei KI vermieden werden?

Aufgetretene Halluzinationen erkennen ist das eine, ihr Risiko von vornherein zu minimieren das andere. Ein sehr wirksamer Hebel ist es, die Anfragen (Prompts) an die KI so genau wie möglich zu formulieren. Ein präziser Prompt liefert der KI klare Anweisungen und minimiert so den Interpretationsspielraum. Aber was macht einen guten Prompt aus?

Nehmen wir dafür ein konkretes Beispiel für einen unpräzisen Prompt mit hohem Risiko für Halluzinationen bei der Antwort:

“Erzähle mir die Geschichte von Michael Collins.”

1. Zentrales Objekt der Anfrage genau identifizieren

Problem: Der Name „Michael Collins“ kann auf mehrere bekannte Personen zutreffen, beispielsweise den irischen Freiheitskämpfer oder den Astronauten der Apollo-11-Mission. 

Tipp: Fügen Sie eindeutige Informationen wie Berufsbezeichnung, bekannte Ereignisse oder spezifische Zeiträume hinzu, um Mehrdeutigkeiten zu vermeiden. 

Präziser Prompt: „Beschreibe die Karriere von Michael Collins, dem Astronauten der Apollo-11-Mission.“ 

2. Kontext spezifizieren

Problem: Allgemeine Fragen können zu weit gefassten oder falschen Antworten führen. 

Tipp: Geben Sie an, welche spezifischen Aspekte oder Details der Antwort enthalten sein sollten. 

Präziser Prompt: „Beschreibe die Rolle von Michael Collins während der Apollo-11-Mission und seine Beiträge zur NASA nach der Mission.“ 

3. Vage Formulierungen vermeiden

Problem: Vage Aufforderungen wie „erzähle mir die Geschichte“ lassen zu viel Interpretationsspielraum. 

Tipp: Nutzen Sie spezifische Verben und bezeichnen Sie klar, welche Art von Information oder Darstellung Sie erwarten (z. B. „beschreibe“, „analysiere“, „erkläre“).  

Präziser Prompt: „Erkläre die wichtigsten Stationen in der Laufbahn von Michael Collins als Astronaut, einschließlich seiner Vorbereitung auf die Apollo-11-Mission und seiner Rolle während des Fluges.“ 

4. Klare thematische Schwerpunkte festlegen

Problem: Ohne thematische Schwerpunkte kann die Antwort zu allgemein oder irrelevant sein. 

Tipp: Definieren Sie den Schwerpunkt der Antwort, um sicherzustellen, dass die generierte Information relevant und genau ist. 

Präziser Prompt: „Fokussiere dich auf die Rolle von Michael Collins als Pilot des Kommandomoduls der Apollo-11-Mission und seine Erfahrungen während dieser historischen Mission.“ 

5. Erwartete Detailtiefe definieren und Umfang begrenzen

Problem: Die KI kann zu oberflächlichen oder übermäßig detaillierten Antworten neigen. 

Tipp: Geben Sie an, welche Tiefe und welcher Umfang erwartet wird. Definieren Sie, ob eine kurze Übersicht oder eine ausführliche Analyse gewünscht wird. 

Präziser Prompt: „Gib eine kurze Zusammenfassung der militärischen Karriere von Michael Collins vor seiner Zeit bei der NASA und erläutere seine wichtigsten Aufgaben als Astronaut der Apollo-11-Mission.“ 

Der finale Prompt

Angenommen, Sie möchten spezifische Informationen über Michael Collins, den Astronauten, erhalten. Ein gut formulierter, präziser Prompt könnte sein: 

"Erkläre die wichtigsten Meilensteine in der Karriere von Michael Collins, dem Astronauten der Apollo-11-Mission. Beschreibe seine Rolle und Aufgaben während der Apollo-11-Mission sowie seine Beiträge zur NASA in den Jahren nach der Mission. Nenne auch kurz seine militärische Laufbahn vor seinem Eintritt bei der NASA."

Wie können generative KI-Systeme verbessert werden, um das Risiko für Halluzinationen zu verringern?

Um das Risiko von Halluzinationen in generativen KI-Systemen effektiv zu verringern, sind mehrere technische und methodische Ansätze erforderlich. Diese Ansätze zielen darauf ab, die Genauigkeit der Antworten zu erhöhen und die Neigung der Modelle, erfundene oder ungenaue Informationen zu generieren, zu minimieren. 

Verbesserte Modellarchitektur und Trainingstechniken 

Faktenorientiertes Training: Generative Modelle sollten intensiver auf zuverlässigen und geprüften Datensätzen trainiert werden. Dazu können beispielsweise Knowledge Graphs in den Trainingsprozess einbezogen werden. Knowledge Graphs sind strukturierte Darstellungen von Wissen, die Entitäten und deren Beziehungen in einer Art Netzwerk abbilden. Sie helfen der KI, kontextbezogene und verlässliche Informationen bereitzustellen, indem sie Wissen aus verschiedenen Quellen aggregieren und verknüpfen. Durch das Einbeziehen von Knowledge Graphs in den Trainingsprozess kann die KI ein tieferes Verständnis für die Verbindungen zwischen Fakten entwickeln und somit präzisere und kohärentere Antworten generieren. Das beinhaltet die Nutzung von sogenannten Fact-Checking-Datenbanken und Knowledge Graphs, die die KI mit einer strukturierten und validierten Wissensbasis versorgen. Solche Datenquellen bieten einen verlässlichen Rahmen, um faktisch korrekte Informationen zu extrahieren. 

Einsatz von Retrieval-Augmented Generation (RAG): Diese Technik kombiniert die Fähigkeiten eines Sprachmodells mit einer Datenbank- oder Suchfunktion, um gezielt auf aktuelle und überprüfte Informationen zuzugreifen. Durch RAG kann die KI relevante Fakten aus externen Quellen beziehen, anstatt sich nur auf ihre internen „Erinnerungen“ zu verlassen. 

Feinabstimmung und Regularisierung 

Regelmäßige Updates und Feinabstimmungen: Sprachmodelle benötigen regelmäßige Updates und Feinabstimmungen, um sicherzustellen, dass sie auf dem neuesten Stand sind und keine veralteten oder falschen Informationen enthalten. Dies kann durch fortlaufende Integration neuer und verifizierter Daten erreicht werden. 

Kontextualisiertes Training: Die Modelle sollten auf kontextbezogene Daten trainiert werden, die spezifische Anwendungsfälle und Fragestellungen abdecken. Dadurch können sie besser lernen, welche Informationen wann relevant sind. Durch diesen verbesserten Fokus werden Halluzinationen reduziert. 

Implementierung von Validierungs- und Kontrollmechanismen

Faktenprüfung und Feedback-Mechanismen: Die Integration von Post-Processing-Schichten zur Faktenprüfung, die generierte Inhalte auf ihre Richtigkeit hin überprüfen, kann Halluzinationen weiter reduzieren. Solche Systeme können automatisch generierte Inhalte mit bekannten Fakten abgleichen und auf Abweichungen hinweisen. 

Erklärung und Transparenz: Durch die Entwicklung von Systemen, die in der Lage sind, ihre Antworten zu erklären oder ihre Quellen anzugeben, können Benutzer:innen besser einschätzen, wie zuverlässig eine generierte Information ist. Dies fördert das Vertrauen in die KI und ermöglicht es den Benutzer:innen, die Antworten kritischer zu hinterfragen. 

Erweiterte Nutzung von Benutzerfeedback 

Aktive Lernmethoden: Systeme, die kontinuierlich aus Userfeedback lernen, können besser erkennen, wann sie halluzinieren. Indem Benutzer:innen darauf hingewiesen werden, falsche oder irreführende Antworten zu markieren, können die Modelle besser aus ihren Fehlern lernen und diese künftig vermeiden. 

Human-in-the-Loop: Die Einbindung von menschlichen Überprüfer:innen in den Trainingsprozess kann dazu beitragen, die Qualität und Genauigkeit der generierten Inhalte zu verbessern. Menschliche Prüfer:innen können schwierige oder mehrdeutige Fälle bewerten und auf deren Basis das Modell weiter verfeinern. 

Size matters: Halluzinations-Risiken bei Large Language Models und Small Language Models

Der Unterschied zwischen Large Language Models (LLMs) wie GPT-4 und Small Language Models (SLMs) manifestiert sich deutlich im Umgang mit Halluzinationen. LLMs, die über Milliarden von Parametern verfügen und mit enormen Datenmengen trainiert werden, haben in der Regel eine größere Kapazität, um komplexe sprachliche Muster zu erkennen und kohärente, flüssige Texte zu generieren. Diese Modelle sind jedoch auch anfälliger für Halluzinationen, da ihre Größe und Komplexität es ihnen ermöglicht, plausibel klingende, aber inhaltlich falsche oder erfundene Details zu erzeugen. Ihre Fähigkeit, sich scheinbar überzeugend auszudrücken, kann dazu führen, dass Benutzer:innen die Genauigkeit der Antworten überschätzen und die Halluzinationen schwerer zu erkennen sind. 

Im Gegensatz dazu neigen SLMs aufgrund ihrer begrenzteren Kapazität und einfacheren Architektur dazu, weniger komplexe, manchmal auch weniger flüssige Antworten zu geben. Da sie in der Regel mit weniger umfangreichen Datensätzen und einer geringeren Parameteranzahl arbeiten, haben sie auch weniger Spielraum, um komplexe, aber ungenaue Informationen zu erzeugen. Gleichzeitig eröffnet eben jene geringere Parameterzahl ein einfacheres Feintunen der Modelle auf zusätzlichen Daten und für spezifische Aufgaben, wodurch Halluzination in diesen Bereichen zusätzlich reduziert werden kann. Das bedeutet jedoch nicht, dass sie frei von Halluzinationen sind; ihre Einschränkungen können sich in anderen Formen von Fehlern manifestieren, wie z. B. einer mangelnden Tiefe in den Antworten oder einer eingeschränkten Fähigkeit, aus komplexen Kontexten genaue Informationen abzuleiten. 

Das unterstreicht die Notwendigkeit, je nach Anwendungsfall sorgfältig zwischen LLMs und SLMs zu wählen und ihre spezifischen Stärken und Schwächen zu berücksichtigen. 

Generative KI: Zwischen Fortschritt und Vorsicht

Generative KI-Modelle bieten erstaunliche Möglichkeiten, aber die Gefahr von Halluzinationen stellt eine erhebliche Herausforderung dar. Diese Modelle können beeindruckend realistische und kohärente Texte erstellen, doch wenn sie ungenaue oder erfundene Informationen generieren, können die Konsequenzen schwerwiegend sein. Die Reduktion von Halluzinationen erfordert einen vielschichtigen Ansatz: präzisere Prompts, robustere Trainingsmethoden, effektive Validierungsmechanismen und kontinuierliche Benutzeraufklärung. Durch die Verbesserung der Architektur und die Integration von Faktenprüfungen können wir die Genauigkeit dieser Systeme erhöhen. Dennoch bleiben die menschliche Überprüfung und kritisches Hinterfragen essenziell. Während KI-Modelle immer besser werden, ist es entscheidend, sie als Werkzeuge zu betrachten, die sorgfältige Kontrolle und Anleitung benötigen, um ihr volles Potenzial sicher zu entfalten.

Ansprechpartner

Robin Rabe

Director CCaaS and Generative AI
Nach seinem Bachelor in Computer Engineering hat Robin als Entwickler E-Commerce Projekte betreut und sich danach in diesem Bereich selbstständig...

E-Mail: robin.rabe@muuuh.de

Mehr über Robin Rabe
Robin Rabe
Wir schaffen digitale Interaktionen mit innovativen Technologien.
Mehr MUUUH! Next