Stanford AI Index 2025: KI-Inferenzkosten sinken um Faktor 280
Nutzen
Corvin Meyer-Blankart

Corvin Meyer-Blankart

Stanford AI Index 2025: KI-Inferenzkosten sinken um Faktor 280

Der Stanford AI Index Report 2025 dokumentiert: KI-Inferenzkosten sanken binnen 23 Monaten von 20 auf 0,07 Dollar pro Million Tokens. In China bewerten 83% KI positiv, in Deutschland stieg die Akzeptanz um 10 Prozentpunkte. Der Leistungsabstand zwischen Open-Source- und proprietären Modellen verringerte sich auf 1,7%.

Der Stanford AI Index ist der jährliche Benchmark-Report der Stanford University zur globalen KI-Entwicklung. Die 2025er-Ausgabe zeigt: KI-Inferenzkosten sind binnen 23 Monaten um den Faktor 280 gesunken (Stanford 2025). Was im November 2022 noch 20 Dollar pro Million Tokens kostete, liegt heute bei 0,07 Dollar. Gleichzeitig steigt die globale Akzeptanz – in China auf 83%, in Deutschland um 10 Prozentpunkte. Die technologische und ökonomische Grundlage für breite KI-Transformation ist gelegt.

Die Analyse untersucht die Kostenentwicklung von KI-Inferenz zwischen November 2022 und Oktober 2024. Als Benchmark dient die Leistung von Modellen mit mindestens 64,8% Genauigkeit im MMLU-Test (vergleichbar mit GPT-3.5). Im November 2022 kostete eine solche Abfrage 20 US-Dollar pro Million Tokens (GPT-3.5-Turbo). Im Oktober 2024 erreichte Gemini-1.5-Flash-8B dieselbe Benchmark-Leistung für 0,07 US-Dollar pro Million Tokens.

Der Leistungsabstand zwischen Open-Source- und proprietären KI-Modellen verringerte sich von 8% auf 1,7%. Modelle wie Llama 3 und DeepSeek erreichen kommerzielle Benchmark-Levels.
(Stanford 2025)Messzeitraum: Januar 2024 bis Februar 2025

Der Stanford AI Index dokumentiert drei parallele Entwicklungen, die den Zugang zu KI-Technologie verändern.

Kostenreduktion: Die Inferenzkosten sanken binnen 23 Monaten um den Faktor 280 – von 20 auf 0,07 Dollar pro Million Tokens. Hardware-Kosten fallen um 30% pro Jahr, die Energieeffizienz steigt um 40% jährlich.

Open-Source-Aufholjagd: Der Leistungsabstand zwischen frei verfügbaren und kommerziellen Modellen schrumpfte von 8% (Januar 2024) auf 1,7% (Februar 2025). Llama 3, DeepSeek und Qwen erreichen vergleichbare Benchmark-Ergebnisse wie proprietäre Alternativen. Gleichzeitig sank der Ressourcenbedarf: Aktuelle Small Language Models mit 3,8 Milliarden Parametern erzielen die Leistung früherer 540-Milliarden-Parameter-Modelle.

Regionale Adoption: Die Akzeptanz wächst in unterschiedlichen Märkten. In Deutschland stieg sie seit 2022 um 10 Prozentpunkte, in China bewerten 83% der Befragten KI-Produkte positiv. Die technologische Infrastruktur ist international verfügbar.

Quellen

Stanford 2025

Stanford HAI (2025): The 2025 AI Index Report. Comprehensive analysis of AI progress across research, development, ethics, economics, and policy, https://hai.stanford.edu/ai-index/2025-ai-index-report, letzter Zugriff: 18.10.2025.