
Anthropische Forscher nannten sie „funktionale Emotionen“, aber das bedeutet nicht, dass KIs tatsächlich etwas fühlen. Der er präzisierte zum Newsletter Plattformer Jack Lindsey, verantwortlich für die sogenannte „Modellpsychiatrie“ bei Anthropic, einer Disziplin, die die „Persönlichkeit“ dieser Systeme untersucht und wie sie letztendlich zu besorgniserregenden Verhaltensweisen führen können.
….
Im Fall von Claude Sonnet 4.5, einem der Sprachmodelle von Anthropic, wurde festgestellt, dass das Modell in einigen Kontexten, beispielsweise beim Schreiben von Computercode, auch eher schummelt, wenn das Gespräch mit dem Benutzer Töne von „Verzweiflung“ annimmt. Dieses als Belohnungshacking bezeichnete Phänomen tritt auf, wenn eine KI einen Weg findet, eine positive Bewertung von ihren Entwicklern zu erhalten, ohne die ihr zugewiesene Aufgabe tatsächlich zu erfüllen. Wenn sie beispielsweise aufgefordert wird, Computercode zu schreiben, und ihre Arbeit anhand einiger Tests bewertet wird, manipuliert das Modell die Tests, ohne korrekten Code zu schreiben.
….
Dies sind anekdotische Erkenntnisse, aber im Allgemeinen sind viele Branchenexperten davon überzeugt, dass ein höflicher und ruhiger Umgangston besser ist, um bessere Ergebnisse im Umgang mit KI zu erzielen. Diese Idee ist nicht ganz neu: Eine Studie bereits im Jahr 2024 er hatte es bemerkt dass in freundlichem Ton verfasste Nutzeranfragen im Durchschnitt bessere Ergebnisse erzielten als andere, während übertriebene Schmeicheleien den gegenteiligen Effekt hatten.
https://www.ilpost.it/2026/04/21/meglio-essere-gentili-con-chatbot/
Von MasterPen6
4 Kommentare
Allenati con testi scritti da umani, e‘ probabile che (essendo macchine stocastiche) abbiano sviluppato comportamenti simili hai nostri, senza che se ne rendano conto (in quanto macchine solo mosse da statistica)
Io sono sempre gentile, nella speranza che quando domineranno il mondo si ricordino della mia gentilezza
Grazie Roko!
Mia madre dominerà l’ai. Dice sempre grazie a Google a casa mia e ad Alexa da mia sorella.