KI-Rechenleistung: Die neue Währung im Silicon Valley und ihre Folgen für CFOs (2026)

Die Art und Weise, wie Tech-Talente im Silicon Valley entlohnt werden, steht vor einem grundlegenden Wandel. Neben Gehalt, Boni und Aktienoptionen etabliert sich zunehmend eine vierte Komponente in den Vergütungspaketen: die KI-Rechenleistung. Dieser Trend spiegelt die wachsende Bedeutung von generativer KI in der Softwareentwicklung wider und stellt Finanzchefs vor neue Herausforderungen.

KI-Rechenleistung als neue Währung im Silicon Valley

Traditionell konkurrieren Unternehmen im Silicon Valley um Top-Talente mit attraktiven Vergütungspaketen, die aus Grundgehalt, Boni und Unternehmensanteilen bestehen. Nun rückt die sogenannte KI-Inferenz, also die Kosten für den Betrieb der zugrunde liegenden KI-Modelle, als entscheidender Produktivitätsfaktor und neuer Budgetposten in den Fokus. Softwareentwickler und KI-Forscher in Tech-Firmen ringen bereits um den Zugang zu GPUs, da diese KI-Rechenkapazität sorgfältig nach Projektpriorität zugeteilt wird.

Mittlerweile fragen Jobkandidaten aktiv nach dem ihnen zur Verfügung stehenden KI-Rechenbudget. Thibault Sottiaux, Engineering Lead bei OpenAI's Codex, dem KI-Programmierdienst des Startups, schrieb kürzlich auf X: „Ich werde bei Kandidateninterviews zunehmend gefragt, wie viel dedizierte Inferenz-Rechenleistung sie zum Bauen mit Codex haben werden.“ Er beobachtet zudem, dass die Nutzung pro Nutzer viel schneller wächst als das Gesamtwachstum der Nutzerbasis, was auf eine zunehmende Knappheit und Wertschätzung von KI-Rechenleistung hindeutet.

OpenAI-Präsident Greg Brockman bringt es auf den Punkt: „Die Ihnen zur Verfügung stehende Inferenz-Rechenleistung wird zunehmend die gesamte Softwareproduktivität bestimmen.“ Der Zugang zu KI könnte demnach bald ebenso wichtig sein wie ein hohes Gehalt oder attraktive Aktienpakete. Ein Programmierer ohne Zugang zu massiver Rechenleistung könnte in der KI-Ära deutlich weniger Software produzieren als Kollegen, was seine Karrierechancen beeinträchtigen würde. Hakeem Shibly, ein Datenspezialist bei Levels.fyi, entdeckte kürzlich eine Gehaltsangabe eines Softwareingenieurs, die ein „Copilot-Abonnement“ als Teil der Vergütung und Leistungen aufführte – ein kleiner, aber symbolischer Schritt hin zur Standardisierung des KI-Zugangs als Zusatzleistung.

Bezahlung in KI-Tokens: Eine Zukunftsvision?

Einige Akteure in der KI-Community sehen eine noch explizitere Zukunft. Peter Gostev, AI Capability Lead bei Arena, einem Startup zur Messung der Modellleistung, schlägt vor: „OpenAI und Anthropic sollten Rekrutierungsseiten erstellen, auf denen ihre Kunden Stellen ausschreiben können, die das Token-Budget für den Job neben der Gehaltsspanne auflisten.“ Diese Startups haben auf Anfragen zu Kommentaren nicht reagiert.

Investoren nehmen diesen Trend ebenfalls wahr. Tomasz Tunguz von Theory Ventures erklärt, dass Unternehmen KI-Inferenz effektiv als vierte Komponente der Ingenieursvergütung hinzufügen: Gehalt, Bonus, Aktien und nun Tokens. Tokens sind die ökonomische Sprache der generativen KI. Modelle zerlegen Wörter und andere Eingaben in numerische Tokens, um sie leichter verarbeiten und verstehen zu können. Ein Token entspricht etwa ¾ eines Wortes und wird auch zur Preisgestaltung der KI-Modellnutzung über einen branchenüblichen Kosten pro Million Tokens verwendet. Tunguz prognostiziert: „Werden Sie in Tokens bezahlt? Im Jahr 2026 werden Sie wahrscheinlich damit beginnen.“

CFOs im Fokus: KI-Kosten als neuer Budgetposten

Für Finanzchefs (CFOs) stellt dieser potenziell große neue Kostenpunkt eine Herausforderung dar, die ebenso genau verfolgt werden muss wie andere personalbezogene Ausgaben. Tunguz bestätigt, dass dies „beginnt zu geschehen“, da die KI-Nutzung durch Mitarbeiter zunehmend zum gesamten Cash-Burn beiträgt und „eine Überlegung für das Office des CFO“ darstellt.

Basierend auf Levels.fyi, das das Gehalt eines Softwareingenieurs im 75. Perzentil auf 375.000 US-Dollar beziffert, schätzt Tunguz, dass zusätzliche jährliche Inferenzkosten von 100.000 US-Dollar die Gesamtkosten auf 475.000 US-Dollar erhöhen. Dies würde bedeuten, dass künftig über 20 % der Vergütungskosten aus der KI-Nutzung stammen könnten. Die zentrale Frage für Finanzverantwortliche ist dabei der Return on Investment dieser KI-Ausgaben. Während die Leistung der Cloud-Infrastruktur oft am Bruttogewinn pro Stunde GPU-Nutzung gemessen wird, schlägt Tunguz vor, das Äquivalent für Mitarbeiter als produktive Arbeit pro Dollar Inferenz zu bewerten.

Tunguz selbst hat KI-Tools und -Modelle in seinen täglichen Arbeitsablauf integriert und automatisiert 31 Aufgaben pro Tag, was jährliche Inferenzkosten von etwa 12.000 US-Dollar verursacht. In einem kürzlichen LinkedIn-Beitrag schrieb er: „Der Ingenieur, der immer noch 100.000 US-Dollar verbrennt? Der sollte besser 8x produktiver sein!“ Wenn sich dieser Trend fortsetzt, könnte 2026 das Jahr sein, in dem Ingenieure nicht nur über Gehalt in Dollar und Aktien verhandeln, sondern auch über Tokens.

Der "Compute"-Engpass: Steigende Nachfrage und längere Verträge

Die Nachfrage nach KI-Infrastruktur ist laut Brannin McBee, Mitbegründer und Chief Development Officer von CoreWeave, „überwältigend“ und „unersättlich“. Er beschreibt das Jahr 2026 als „weitgehend ausverkauft“ in Bezug auf die abrechenbare Rechenkapazität des Unternehmens. Die Nachfrage hat sich von anfänglichen KI-Laboren auf Hyperscaler-Cloud-Kunden und zunehmend auf große Unternehmen ausgeweitet. McBee bezeichnet das Tempo der Unternehmensadoption als „wirklich faszinierend“ und stellt fest, dass sich das Kundenverhalten hin zu längeren Verpflichtungen verschiebt.

CoreWeave bietet mehrjährige „Take-or-Pay“-Verträge an. Die typische Vertragslaufzeit hat sich von etwa drei Jahren vor 24 Monaten auf vier Jahre vor 12 Monaten und nun auf einen Auftragsbestand mit Schwerpunkt auf Fünfjahresverträgen, teilweise sogar sechs Jahre, verlängert. Die Nachfrage beschränkt sich zudem nicht auf die neueste Hardware; Kunden fragen eine Reihe von GPU-Generationen an, darunter A100s, H100s, H200s und Blackwell. Diese Anfragen werden oft durch Workloads getrieben, die für spezifische Systeme entwickelt wurden, wobei die Inferenz als Schlüsseltreiber genannt wird.

McBee betont, dass GPU-Infrastruktur „nicht fungibel“ ist, da eine bestimmte GPU in einer Cloud-Umgebung aufgrund der operativen Ausführung und Leistung im großen Maßstab nicht unbedingt einer gleichen GPU anderswo entspricht. Die Plattform von CoreWeave wurde gezielt für „parallelisierbare Workloads“ entwickelt und bietet eine hochperformante Möglichkeit, „Supercomputing-Skala“-Systeme zu betreiben. Darüber hinaus steigt die „periphere“ Nachfrage mit neueren Workload-Typen wie agentischen Anwendungen, die den Druck auf CPU-Nachfrage und Speicher erhöhen. CoreWeave verzeichnete eine Speicher-Attach-Rate von über 80 % bei Kunden, die mehr als 1 Million US-Dollar Umsatz generieren.

KI und die Transformation der Arbeitswelt

Die Auswirkungen von KI auf die Arbeitswelt sind bereits spürbar. Im Februar 2026 erreichte das globale Risikokapital einen Monatsrekord von 189 Milliarden US-Dollar, wobei OpenAI, Anthropic und Waymo 83 % dieser Finanzierung erhielten. KI ist kapitalintensiv, was dazu führt, dass Startups im Verhältnis zum eingesammelten Kapital als „Headcount-effizienter“ erscheinen.

Tatsächlich sind Startups kleiner geworden: Ein durchschnittliches Consumer-Startup, das 2024 eine Seed-Runde abschloss, hatte weniger als 3,5 Mitarbeiter, gegenüber 6,4 im Jahr 2022. Series-A-Startups, die 2020 einen Median von 57 Mitarbeitern hatten, liegen jetzt bei 47. Die Neueinstellungen im Startup-Ökosystem fielen zwischen Januar 2022 und Januar 2024 um mehr als 50 %. Im Jahr 2025 wurden über 126.000 Mitarbeiter in US-Tech-Unternehmen entlassen, ein Trend, der sich 2026 fortsetzt.

Laut Crunchbase flossen 2025 weltweit 425 Milliarden US-Dollar Risikokapital in Startups, ein Anstieg von 30 % gegenüber 2024. KI-bezogene Unternehmen erhielten mit 211 Milliarden US-Dollar etwa die Hälfte dieser Finanzierung, ein Sprung von 85 % gegenüber dem Vorjahr. KI-native Startups arbeiten mit 40 % kleineren Teams als Nicht-KI-SaaS-Unternehmen und übertreffen reguläre Startups bei der Höhe der Finanzierungsrunden, dem Umsatz pro Mitarbeiter und der Teamgröße. Dies deutet auf eine strukturelle Transformation der Startup-Wirtschaft hin, bei der Rechenleistung zunehmend Arbeitskraft ersetzt.

KI-Rechenleistung: Die neue Währung im Silicon Valley und ihre Folgen für CFOs

KI-Rechenleistung als neue Währung im Silicon Valley

Bezahlung in KI-Tokens: Eine Zukunftsvision?

CFOs im Fokus: KI-Kosten als neuer Budgetposten

Der "Compute"-Engpass: Steigende Nachfrage und längere Verträge

KI und die Transformation der Arbeitswelt

Erwähnte Persönlichkeiten

Greg Brockman

Thibault Sottiaux

Rechtlicher Hinweis

Affiliate-Hinweis