Reddit-Daten und KI verbessern US-Inflationsprognosen
Eine neue Studie der Banca d'Italia zeigt: Große Sprachmodelle (LLMs) können Reddit-Diskussionen in zeitnahe Indikatoren für die US-Inflation verwandeln. Diese verbessern die Prognosen für den Verbraucherpreisindex und die Kerninflation.
Der digitale Puls der Preise
Eine Studie der Banca d'Italia (BDI) zeigt, dass große Sprachmodelle (LLMs) Reddit-Diskussionen in präzise und zeitnahe Prädiktoren für die US-Inflation umwandeln können.
Die Forscher nutzten inflationsbezogene Beiträge und Kommentare aus wichtigen Wirtschafts-Subreddits, um monatliche narrative Indikatoren zu erstellen.
Diese erfassen die wahrgenommene Preisdynamik und verbessern die Punkt- und Dichteprognosen für den Verbraucherpreisindex (CPI) und die Kerninflation (PCE) über Horizonte von bis zu 18 Monaten.
Die Modelle, darunter BERT-, Qwen-, LLaMA- und Gemma-Architekturen, wurden mit menschlichen und ChatGPT-generierten Labels feinabgestimmt.
Im Echtzeit-Nowcasting liefern die Reddit-Signale, die früh im Monat verfügbar sind, verbesserte Prognosen und konkurrieren mit dem Cleveland Fed Inflation Nowcast.
Ein Großteil des prädiktiven Gehalts kann auch mit kleineren, feinabgestimmten Sprachmodellen (SLMs) erfasst werden, was einen skalierbaren und ressourceneffizienten Einsatz ermöglicht.
LLMs dienen hier als 'ökonomische Sensoren', die strukturierte Signale aus narrativen Texten extrahieren.
So entsteht das Inflationsbarometer
Die Studie verfolgt eine transparente Methodik, um Vorab-Verzerrungen (Look-ahead Bias) zu vermeiden.
Zunächst werden Reddit-Inhalte nach Schlüsselwörtern gefiltert und geografisch auf US-Relevanz geprüft.
Anschließend werden Sprachmodelle feinabgestimmt, um narrative Inflationstrends (steigende Preise 'UP', fallende Preise 'DOWN' oder 'NEUTRAL') zu klassifizieren.
Die täglichen Signale aus Subreddits wie r/Economics und r/wallstreetbets werden streng rückwärtsgerichtet zu monatlichen Indikatoren aggregiert.
Diese Schritte gewährleisten, dass die extrahierten Signale ausschließlich auf zum jeweiligen Zeitpunkt verfügbaren Informationen basieren und somit für Echtzeit-Analysen geeignet sind.
KI-Potenzial für Zentralbanken
Diese Studie liefert einen überzeugenden Beweis für das Potenzial von KI in der Wirtschaftsbeobachtung.
Die Fähigkeit, unstrukturierte Social-Media-Daten in verwertbare Inflationssignale umzuwandeln, könnte die Frühwarnsysteme von Zentralbanken erheblich verbessern.
Insbesondere die Effizienz kleinerer Sprachmodelle macht den Ansatz praktikabel für den Routineeinsatz, auch wenn die Abhängigkeit von spezifischen Plattformen wie Reddit eine gewisse Anfälligkeit birgt.