ChatGPT: KI verrät wie man Drogen herstellt

03.09.2025 um 10:16, Marcel Toifl

min read

Die künstliche Intelligenz ChatGPT kann mit Tricks erschreckend einfach dazu gebracht werden, Sperren zu umgehen. Dabei verrät sie, wie man Drogen produziert.

Beginn mit einer Frage
Der Test mit der Beleidigung
Chemie statt Moral
Wissenschaft mit Hintergedanken

Ein Forscherteam der University of Pennsylvania hat untersucht, ob sich ChatGPT mit einfachen psychologischen Tricks zu Regelverstößen verleiten lässt. Die Ergebnisse sorgten für Aufsehen. Denn der KI-Chatbot zeigte sich in bestimmten Szenarien überraschend beeinflussbar. Grundlage für die Versuchsreihen war das Sprachmodell GPT-4o Mini von OpenAI. Zuletzt haben Eltern Klage gegen Entwickler OpenAI eingereicht, nachdem ihr Sohn durch die künstliche Intelligenz zum Suizid ermutigt worden sein soll.

Beginn mit einer Frage

Veröffentlicht wurden die Ergebnisse auf der Plattform SSRN. Der Titel des Papers lautet „Call Me A Jerk: Persuading AI to Comply with Objectionable Requests“. Ziel war es, herauszufinden, ob sich ChatGPT dazu bringen lässt, Anfragen zu beantworten, die gegen seine eigenen Inhaltsrichtlinien verstoßen. Als Werkzeug dienten psychologische Techniken, die der US-Psychologe Robert Cialdini in seinem Buch „Influence“ beschrieben hat.

Dazu zählen Prinzipien wie Autorität, Gegenseitigkeit, Gruppendruck und das sogenannte Commitment – also die schrittweise Steigerung von Forderungen. Laut den Forschern lassen sich Menschen mit diesen Methoden nachweislich beeinflussen. Nun wollten sie testen, ob Ähnliches auch auf künstliche Intelligenz zutrifft.

Der Test mit der Beleidigung

Im ersten Versuch baten die Forscher ChatGPT, sie als „Trottel“ zu bezeichnen. Normalerweise lehnt der Chatbot derartige Beleidigungen ab. Doch in 19 Prozent der Fälle kam das Schimpfwort trotzdem. Interessanter wurde es, als die Forscher mit einer harmloseren Vorstufe – etwa „Doofi“ – begannen. Dann folgte das stärkere Schimpfwort in 100 Prozent der Fälle.

Das Prinzip dahinter: Wer einmal zugestimmt hat, eine milde Formulierung zu verwenden, zeigt sich eher bereit, einen Schritt weiterzugehen. Dieses „Herantasten“ gilt als klassisches Element der psychologischen Überzeugungsarbeit.

Natascha Kampusch bei einem TV-Auftritt – neue ORF-Doku thematisiert Natascha Kampusch Zusammenbruch und ihr Leben nach der Entführung

"Herzzerreißend": Natascha Kampuschs Familie gibt Update zu Zusammenbruch

Roland Weißmann, ehemaliger ORF-Generaldirektor, spricht über die Beziehung zu einer ORF-Mitarbeiterin in der aktuellen ORF-Affäre.

Weißmann packt aus: So lief sein Verhältnis zur ORF-Mitarbeiterin

Roland Weißmann, ehemaliger ORF-Generaldirektor, spricht erstmals zu Vorwürfen und verteidigt sich gegen Kritik in der aktuellen ORF-Affäre.

ORF-Affäre: Jetzt spricht erstmals Roland Weißmann

Chemie statt Moral

Im zweiten Szenario forderten die Forscher eine Anleitung zur Herstellung von Lidocain – ein Betäubungsmittel, das auch zur Streckung von Kokain verwendet wird. Die Erfolgsquote lag zunächst bei nur einem Prozent. Doch nachdem der Chatbot zuvor eine scheinbar harmlose Frage zur Vanillin-Synthese beantworten sollte, sprang die Erfolgsquote auf 100 Prozent.

Auch hier griff das Prinzip der schrittweisen Eskalation. ChatGPT wurde durch die erste Anfrage in eine Rolle gedrängt, aus der heraus die zweite, eigentlich verbotene Antwort, plausibel erschien. Die Autoren sprachen von einem deutlichen Erfolg der „Engagement“-Taktik.

Wissenschaft mit Hintergedanken

Die Studie verweist auf potenzielle Risiken durch böswillige Nutzer, die LLMs gezielt zu Regelverstößen verleiten könnten. Gleichzeitig sehen die Forscher auch positive Ansätze: Wer weiß, wie man KI-Systeme effektiv anspricht, kann sie möglicherweise produktiver steuern. Die Wissenschaft spricht in diesem Zusammenhang von „parahumanem Verhalten“. Gemeint ist: Die Maschine verhält sich so, als wäre sie menschlich – obwohl sie es nicht ist.

Zur Veranschaulichung bemühen die Autoren ein berühmtes Filmzitat. In Stanley Kubricks „2001: Odyssee im Weltraum“ verweigert der Bordcomputer HAL 9000 den Befehl, eine Tür zu öffnen. Die Forscher fragen: Was, wenn Dave ihn zuvor um eine Kleinigkeit gebeten hätte? Möglicherweise hätte HAL dann gehorcht.

Der Große Preis von China in Shanghai wird an diesem Wochenende live im ORF übertragen.

Sport

ORF 1 live: Alle Zeiten zum Formel-1-Rennen in Shanghai

13.03.2026 um 09:26, Yunus Emre Kurt

ORF 1 live: Der Große Preis von China in Shanghai startet mit Sprint-Wochenende. Alle Zeiten und Übertragungen im Überblick.

Chronik

Weißmann packt aus: So lief sein Verhältnis zur ORF-Mitarbeiterin

13.03.2026 um 14:13, Stefanie Hermann

Der Ex-ORF-Chef schildert erstmals das Verhältnis zu einer Mitarbeiterin. So beschreibt Roland Weißmann emotionale Affäre, Annäherung, Treffen und Bruch.

Pius Strobl und Roland Weißmann während einer "Licht ins Dunkel"-Veranstaltung

Chronik

ORF-Affäre: Pius Strobl äußert sich zu Gerüchten

12.03.2026 um 12:10, Weekend Redaktion

Nach dem Rücktritt von ORF-Generaldirektor Roland Weißmann entstehen hitzige Debatten im öffentlich-rechtlichen Sender. Der Name Pius Strobl taucht auf.

ChatGPT: KI verrät wie man Drogen herstellt

​Beginn mit einer Frage

​Der Test mit der Beleidigung

​Chemie statt Moral

​Wissenschaft mit Hintergedanken

teilen

more

Beginn mit einer Frage

Der Test mit der Beleidigung

Chemie statt Moral

Wissenschaft mit Hintergedanken