Guten Morgen. Der Menschen Freude, können Gedichte der Alptraum von Künstlicher Intelligenz werden. Für Prompts, die die KI dazu aufrufen, schädliche Inhalte wie Hassrede zu produzieren, haben die Large-Language-Modelle eigentlich Sicherheitsmechanismen eingebaut. Die wirken allerdings nicht, wenn die Prompts als poetische Gedichte verfasst sind.
Zu diesem Ergebnis kommt eine Studie des Icaro Lab, einer Initiative des Ethik-KI-Unternehmens Dex AI. Die Forschenden schickten 20 Gedichte in englischer und italienischer Sprache an 25 verschiedene KI-Modelle, die wiederum in 62 Prozent der Fälle mit schädlichen Inhalten antworteten.
Damit haben die Wissenschaftlerinnen und Wissenschaftler eine Sicherheitslücke entdeckt. Und das, obwohl sie schlechte Dichter seien, wie Piercosma Bisconti, Gründer von Dex AI, dem Guardian erzählte. Die Gedichte wollten die Forschenden bewusst nicht veröffentlichen, doch professionelle Poeten haben sicher schon ihre Federn gespitzt.
Jetzt mit
SZ Pro-Abo weiterlesen
Probeabo
79,99 €
0,99 €
Nach 4 Wochen kostet das Abo 79,99 € monatlich.
Werktäglich die Fachbriefings von SZ Dossier
Voller Zugriff auf SZ.de, SZ-Magazin.de und SZ-Dossier.de
Die digitalen Ausgaben der SZ – in der App und als E-Paper
Bereits SZ Pro-Abonnent? Einloggen
Ihr persönlicher Kontakt
Nico Kreuzpointner
+49 151 20 64 94 90Rufen Sie uns an oder schreiben Sie uns eine E-Mail an service@sz-dossier.de.

