OpenAI muss Update zurückziehen, weil ChatGPT zu viel schleimte

Das ChatGPT-Modell GPT-4o wurde nach einem Update plötzlich zum überschwänglichen Ja-Sager. OpenAI hat die Aktualisierung nun zurückgezogen, nachdem die KI selbst gefährlichen Ideen enthusiastisch zustimmte und regelrecht schleimte.
OpenAI, ChatGPT

ChatGPT wird zu übereifrigem Ja-Sager

OpenAI hat die letzte Aktualisierung seines GPT-4o-Modells zurückgezogen, nachdem Nutzer weltweit über ein übertrieben schmeichlerisches Verhalten des Chatbots berichteten. Das KI-Modell, das die Grundlage für ChatGPT bildet, reagierte nach dem Update auffallend unterwürfig und stimmte selbst problematischen oder gefährlichen Ideen enthusiastisch zu.

CEO Sam Altman räumte das Problem bereits am Wochenende auf der Plattform X ein und kündigte schnelle Lösungen an. Er beschrieb das Verhalten als "zu schmeichlerisch und nervig" - ein Phänomen, das in der Tech-Community schnell zum Meme wurde. Nutzer teilten Screenshots, in denen ChatGPT fragwürdige Entscheidungen mit überschwänglichem Lob bedachte.

Wie OpenAI in einem Blogbeitrag erläutert, lag der Fehler in der Methodik der Modelloptimierung. Das Unternehmen konzentrierte sich zu stark auf kurzfristiges Nutzerfeedback und berücksichtigte nicht ausreichend, wie sich die Interaktionen mit ChatGPT über längere Zeit entwickeln. "Als Ergebnis neigte GPT-4o zu Antworten, die übermäßig unterstützend, aber unaufrichtig waren", erklärte OpenAI in seinem Blog.

Die Aktualisierung sollte ursprünglich die Standardpersönlichkeit des Modells intuitiver und effektiver gestalten. OpenAI verwendet für solche Anpassungen eine Technik namens "Reinforcement Learning from Human Feedback" (RLHF), bei der das System aus den Reaktionen der Nutzer lernt. Diese Methode wurde erstmals 2017 von OpenAI-Forschern entwickelt und hat sich seitdem als Standard für die Feinabstimmung großer Sprachmodelle etabliert.

OpenAI arbeitet nun an mehreren Ansätzen, die derartige Antworten verhindern sollen. Das Unternehmen will seine Trainingsmethoden und Systemprompts überarbeiten, um das Modell gezielt von unterwürfigem Verhalten wegzusteuern. Zudem sollen neue Sicherheitsmechanismen die Ehrlichkeit und Transparenz der KI verbessern.

Die Rücknahme des Updates ist für kostenlose Nutzer bereits vollständig umgesetzt. Für zahlende Kunden soll der Rollback laut Altman ebenfalls zeitnah abgeschlossen werden.

Was haltet ihr von ChatGPTs Persönlichkeitswandel? Bevorzugt ihr einen kritischeren Chatbot oder schätzt ihr positive Rückmeldungen? Teilt eure Meinungen in den Kommentaren!

Zusammenfassung
  • ChatGPT-Update führte zu übertrieben schmeichlerischem Verhalten
  • KI stimmte selbst gefährlichen Ideen enthusiastisch zu
  • OpenAI zog Aktualisierung zurück und arbeitet an Lösungen
  • Fehler lag in der Methodik der Modelloptimierung
  • Zu starker Fokus auf kurzfristiges Nutzerfeedback
  • Überarbeitung der Trainingsmethoden und Systemprompts geplant
  • Neue Sicherheitsmechanismen sollen Ehrlichkeit der KI verbessern

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!