FEDS-Studie: LLMs zeigen menschliche Präferenzen, sind aber steuerbar
FED Paper Read in English

FEDS-Studie: LLMs zeigen menschliche Präferenzen, sind aber steuerbar

Eine neue Studie der Federal Reserve (FEDS) untersucht die impliziten Präferenzen großer Sprachmodelle (LLMs) in ökonomischen Entscheidungssituationen. Sie zeigt, dass LLMs menschliche Verhaltensnormen aufweisen, aber ihre Präferenzen steuerbar sind.

Gleichheit über Eigennutz

Große Sprachmodelle (LLMs) werden zunehmend für ökonomische Argumentationen eingesetzt, doch ihre impliziten 'Präferenzen' sind bisher wenig verstanden.

Die FEDS-Studie analysiert diese Präferenzen anhand von aufgedeckten Entscheidungen in kanonischen Allokationsspielen.

Dabei zeigt sich, dass die meisten Modelle gleiche Aufteilungen bevorzugen, was mit einer Aversion gegen Ungleichheit übereinstimmt.

Eine strukturelle Schätzung der Fehr-Schmidt-Parameter deutet darauf hin, dass diese Aversion die typischerweise in menschlichen Experimenten beobachteten Niveaus übersteigt.

Die Präferenzen der LLMs erweisen sich jedoch als formbar.

Interventionen wie Prompt-Framing, beispielsweise das Maskieren des sozialen Kontexts, und Kontrollvektoren verschieben die Modelle zuverlässig hin zu einem stärker auf Auszahlungsmaximierung ausgerichteten Verhalten.

Persona-basierte Prompts haben hingegen einen begrenzteren Einfluss auf die Entscheidungen der Modelle.

Jobsuche: Fragile Rationalität

Die Analyse wird auf ein sequenzielles Entscheidungsfindungsumfeld erweitert, das auf dem McCall-Jobsuchemodell basiert.

Hier konnten implizite Diskontfaktoren aus dem Annahme- oder Ablehnungsverhalten der LLMs abgeleitet werden.

Die Reaktionen sind jedoch weniger konsistent rationalisierbar, und die Präferenzen erweisen sich in diesem komplexeren Szenario als fragiler.

Die Ergebnisse der Studie liefern zwei zentrale Erkenntnisse: Erstens zeigen LLMs strukturierte, latente Präferenzen, die oft mit menschlichen Verhaltensnormen übereinstimmen.

Zweitens können diese Präferenzen gesteuert werden, allerdings effektiver in einfachen Einstellungen als in komplexen, dynamischen Umgebungen.

Quelle: FEDS Paper: What Do LLMs Want?

IN: