45
Prozent der Antworten von KI-Agenten zu aktuellen Ereignissen sind fehlerhaft. Dies ergab eine Studie der Europäischen Rundfunkunion (E-BU), bei der 22 öffentlich-rechtliche Medienanstalten aus 18 Ländern und in 14 Sprachen führende KI-Assistenten wie ChatGPT, Copilot, Perplexity und Gemini bewerteten. Insgesamt enthielten laut der Untersuchung 45 Prozent aller über 3.000 Antworten auf die 30 Kernfragen zu aktuellen Ereignissen mindestens ein signifikantes Problem. Beim Einbezug von Antworten mit gewissen Mängeln wiesen sogar 81 Prozent der Ergebnisse eine fehlerhafte Darstellung auf. Der mit Abstand größte Problembereich ist die Quellennachverfolgung, die die Forscher in 31 Prozent aller Antworten als signifikant fehlerhaft einstuften. Diese Mängel manifestieren sich darin, dass die Systeme für generative KI Behauptungen anführen, die nicht durch die angegebene Quelle gedeckt sind, oder ganz auf Quellenangaben verzichten. Insbesondere Google Gemini sticht in diesem Bereich, der Untersuchung zufolge, negativ hervor: 72 Prozent der Ausgaben wiesen signifikante Mängel bei den Quellen auf. Das übertrifft den Fehlerquotienten der anderen Assistenten von unter 25 Prozent in diesem Sachzusammenhang bei Weitem. Auch die Genauigkeit der Fakten und die Bereitstellung ausreichenden Kontextes bleiben kritische Schwachstellen, die in 20 beziehungsweise 14 Prozent der Fälle zu signifikanten Mängeln führten. Gemini, Copilot und ChatGPT erfanden zudem häufiger Links, die zwar glaubwürdig erschienen, aber gar nicht existierten, so die Studie.
Digital-Abo
- Unbegrenzter Zugang - alle Inhalte auf wohwi.online lesen
- Aktuellste Informationen und Hintergründe aus Wohnungspolitik
- Exklusive Newsletter
Bereits Abonnent? Einloggen