LLMs als Datenquelle: Verborgene Wirtschaftsstatistiken in Sprachmodellen
LLMs: Mehr Wirtschaftsdaten als gedacht
Das Papier "Revealing economic facts: LLMs know more than they say" von Buckmann, Nguyen und Hill (BOE Staff Working Paper No. 1,150) untersucht das Potenzial versteckter Zustände in großen Sprachmodellen (LLMs) zur Schätzung und Imputation von Wirtschafts- und Finanzstatistiken.
Die Autoren zeigen, dass eine lineare Regression, die auf internen Repräsentationen von Open-Source-LLMs trainiert wird, die direkten Textausgaben der Modelle bei der Vorhersage von Variablen wie Arbeitslosigkeit auf Kreisebene oder Gesamtvermögen von Unternehmen übertrifft.
Dies deutet darauf hin, dass LLMs intern reichhaltigere ökonomische Informationen kodieren, als direkt in generierten Antworten offenbart wird.
Eine Lernkurvenanalyse zeigt, dass oft nur wenige Dutzend gelabelte Beispiele für das Training ausreichen.
Zudem wird eine Transfer-Learning-Methode vorgestellt, die die Schätzgenauigkeit ohne gelabelte Daten für die Zielvariable verbessert.
Praktische Anwendungen der versteckten Zustände in Datenimputation und Super-Resolution-Aufgaben werden ebenfalls demonstriert.
LLMs als neues Analysewerkzeug
Dieses BOE-Arbeitspapier ist im Kontext der zunehmenden Integration von Künstlicher Intelligenz in die Wirtschafts- und Finanzanalyse zu sehen.
Es beleuchtet innovative Methoden, wie Zentralbanken und andere Institutionen ungenutzte Informationspotenziale in großen Sprachmodellen (LLMs) erschließen können.
Die Fähigkeit, Wirtschaftsstatistiken aus internen LLM-Zuständen zu extrahieren und zu imputieren, bietet neue Perspektiven für die Datenanalyse, insbesondere bei der Bewältigung von Datenlücken oder der Verbesserung der Genauigkeit bestehender Schätzungen.
Dies könnte die Effizienz der Datenerhebung und -verarbeitung erheblich steigern und neue Wege für die ökonometrische Modellierung eröffnen.
Potenzial für Datenanalyse und -qualität
Das Papier ist für Zentralbanken von hoher Relevanz (4), da es innovative Wege zur Nutzung von LLMs für die Schätzung und Imputation von Wirtschafts- und Finanzstatistiken aufzeigt.
Dies kann die Datenqualität verbessern, Lücken schließen und neue analytische Möglichkeiten eröffnen.
Die Signalstärke ist jedoch gering (1), da es sich um eine rein technische und methodologische Untersuchung handelt, die keine direkten Implikationen für die Geldpolitik oder Forward Guidance enthält.
Es ist Grundlagenforschung zur Verbesserung von Analysewerkzeugen.
Original: Revealing economic facts: LLMs know more than they say
IN: