
Chinas KI-Giganten: Neue Modelle in Robotik und Video trotzen Herausforderungen
ℹKeine Anlageberatung • Nur zu Informationszwecken
Chinas führende Technologieunternehmen haben in den letzten Wochen eine Reihe neuer KI-Modelle vorgestellt, die signifikante Fortschritte in Bereichen wie Robotik und Videogenerierung demonstrieren. Diese Entwicklungen unterstreichen den intensiven Wettbewerb mit westlichen Anbietern und zeigen, wie chinesische Firmen ihre Position im globalen KI-Rennen festigen wollen, auch wenn sie dabei auf erhebliche Hürden stoßen.
Chinas Tech-Giganten präsentieren neue KI-Modelle
Während sich die US-Märkte auf die Auswirkungen von Tools wie Anthropic und Altruist konzentrierten, haben chinesische Tech-Giganten wie Alibaba, der TikTok-Entwickler ByteDance und die Kurzvideo-Plattform Kuaishou neue KI-Modelle veröffentlicht. Diese Innovationen zeigen, dass chinesische Unternehmen mit ihren US-Pendants mithalten können. Demis Hassabis, Chef von Google DeepMind, äußerte gegenüber CNBC, dass chinesische KI-Modelle nur "Monate" hinter westlichen Rivalen liegen.
Die vorgestellten Modelle treten in direkte Konkurrenz zu Video-Generierungsmodellen wie OpenAIs Sora sowie Robotik-Modellen von Nvidia und Google. Die jüngsten Veröffentlichungen umfassen Alibabas RynnBrain, ByteDances Seedance 2.0 und Kuaishous Kling 3.0, die jeweils spezifische Anwendungsbereiche adressieren.
Alibaba RynnBrain: KI für die Robotik
Die DAMO Academy von Alibaba hat diese Woche RynnBrain vorgestellt, ein KI-Modell, das Robotern helfen soll, die physische Welt zu verstehen und Objekte zu identifizieren. In einer Videodemo zeigte Alibaba einen Roboter mit Greifzangen, der Orangen zählen, aufheben und in einen Korb legen konnte. Auch das Entnehmen von Milch aus einem Kühlschrank wurde demonstriert.
Solche Aufgaben sind in der Robotik anspruchsvoll, da Modelle umfangreiches Training benötigen, um alltägliche Objekte zu erkennen und mit ihnen zu interagieren. RynnBrain positioniert Alibaba nun im Wettbewerb mit Unternehmen wie Nvidia und Google, die ebenfalls KI-Modelle für Roboter entwickeln. Adina Yakefu, eine Forscherin bei Hugging Face, hob gegenüber CNBC hervor, dass eine der Schlüssel-Innovationen von RynnBrain das "eingebaute Zeit- und Raum-Bewusstsein" sei. Dies ermögliche dem Roboter, sich an Ereignisse zu erinnern, den Aufgabenfortschritt zu verfolgen und über mehrere Schritte hinweg kohärent zu agieren, was ihn in komplexen realen Umgebungen zuverlässiger mache. Yakefu ergänzte, Alibabas "größeres Ziel" sei es, "eine grundlegende Intelligenzschicht für verkörperte Systeme zu etablieren."
ByteDance Seedance 2.0: Fortschritte in der Video-Generierung
Seedance 2.0 ist ein KI-Modell zur Videogenerierung, das in der Lage ist, realistische Videos aus einem einfachen Text-Prompt oder auch aus anderen Videos und Bildern zu erstellen. Von CNBC überprüfte Videos, die mit Seedance 2.0 erstellt wurden, zeigten sehr realistische Bilder und vollständig KI-generierte Videos. Billy Boman, der in Stockholm eine Kreativagentur für KI-generierte Inhalte betreibt, hat Seedance 2.0 genutzt und die rasanten Fortschritte in der KI-Videogenerierung der letzten zwei Jahre hervorgehoben.
Boman erklärte gegenüber CNBC: "Noch 2023... war es schwierig, jemanden rennen oder gehen zu lassen. Jede Art von Realismus war auf sehr kurze Clips beschränkt, alles war sehr langsam, schlechte Texturen, keine Hauttexturen, mangelnde Details. Jetzt hat sich das Blatt gewendet. Jetzt kann ich alles machen. Die technologischen Fortschritte waren nichts weniger als außergewöhnlich." Adina Yakefu von Hugging Face ergänzte, dass Seedance 2.0 Fortschritte in "Kontrollierbarkeit, Geschwindigkeit und Produktionseffizienz" zeige. Sie bezeichnete Seedance 2.0 als "eines der am besten abgerundeten Videogenerierungsmodelle", das sie bisher getestet habe, und lobte die "polierten" Ergebnisse. Allerdings geriet Seedance in Schwierigkeiten: Lokale chinesische Medien berichteten, dass eine Funktion zur Stimmgenerierung basierend auf hochgeladenen Bildern ausgesetzt wurde, nachdem Bedenken wegen fehlender Zustimmung geäußert wurden. ByteDance war für eine Stellungnahme nicht sofort erreichbar.
Kuaishou Kling 3.0: Ein weiterer Akteur im Video-Bereich
Kuaishous Kling 3.0, das letzte Woche veröffentlicht wurde, ist ein weiteres Videogenerierungsmodell, das mit ByteDances Angebot konkurriert. Kling 3.0 bietet "wesentliche Upgrades in Konsistenz, fotorealistischer Ausgabe, einer erweiterten Videodauer von bis zu 15 Sekunden und nativer Audiogenerierung in mehreren Sprachen, Dialekten und Akzenten." Das Modell ist derzeit nur für zahlende Abonnenten verfügbar, soll aber laut Kuaishou bald der Öffentlichkeit zugänglich gemacht werden.
Der Erfolg von Kuaishou mit seinen Kling-Modellen war ein wesentlicher Faktor für den über 50-prozentigen Kursanstieg der Aktie im letzten Jahr. Dies unterstreicht das kommerzielle Potenzial, das in fortschrittlichen KI-Modellen gesehen wird.
Zhipu AI GLM-5: Sprung in der Code-Generierung
Das chinesische KI-Unternehmen Zhipu AI, international bekannt als Z.ai, hat sein neuestes Flaggschiff-Modell, den GLM-5, vorgestellt. Dieses Modell zeigt einen deutlichen Sprung in den Coding-Fähigkeiten und markiert einen Wandel in der KI-Entwicklung von "Vibe Coding" zu "Agentic Engineering" – einer KI-automatisierten Codierung in größerem Maßstab.
Die Veröffentlichung des Modells ließ die Hongkonger Aktien von Zhipu, offiziell als Knowledge Atlas Technology gelistet, am Donnerstag um 28,7 Prozent auf 402 HK$ steigen. Zhipu AI gab an, dass GLM-5 in internen Tests branchenführende Werte für offene Modelle in Schlüsselbereichen wie Codierung und Agentenleistung erzielte und sogar Google DeepMinds leistungsstärkstes Modell, Gemini 3 Pro, übertraf. Allerdings hinkte das Modell laut den selbstberichteten Ergebnissen in den Coding-Benchmarks Anthropics Claude, einem proprietären Modell und weithin als das weltweit beste Coding-Modell angesehen, noch hinterher.
Herausforderungen und der globale KI-Wettlauf
Das chinesische KI-Ökosystem wurde im vergangenen Jahr durch DeepSeeks Chatbot gestärkt, der überraschend die Fähigkeiten US-amerikanischer Konkurrenten wie ChatGPT erreichte, jedoch zu geringeren Kosten und mit weniger leistungsstarken Chips. Die Euphorie im Sektor zeigte sich Anfang Januar, als Zhipu AI und MiniMax an der Hongkonger Börse einen großen Auftritt hatten. Zhipu AI-Mitbegründer Tang Jie warnte jedoch, dass sich die Lücke zu den Vereinigten Staaten trotz chinesischer Fortschritte bei großen Open-Source-KI-Modellen "tatsächlich vergrößern könnte".
Tang Jie betonte in einer Konferenz in Peking: "Großskalige Modelle in den Vereinigten Staaten sind größtenteils geschlossen. Wir müssen die Herausforderungen und Lücken erkennen, denen wir gegenüberstehen." DeepSeek und seine chinesischen Rivalen setzen auf kostenlose Open-Source-Technologie, eine Strategie, die schnell Nutzer anzieht, aber weniger Einnahmen generiert als private, geschlossene Systeme. Innerhalb von nur zwei Wochen stiegen die Aktien von Zhipu AI, das Chatbots für Unternehmen anbietet, um 80 Prozent, während MiniMax, das den Verbrauchermarkt mit Multimedia-KI-Tools anspricht, um 150 Prozent zulegte.
Im Gegensatz dazu sind die US-Giganten OpenAI (ChatGPT) und Anthropic (Claude) noch nicht an der Börse gelistet. OpenAI, dessen Bewertung 500 Milliarden US-Dollar übersteigt, erwartet aufgrund der kolossalen Kosten für den Aufbau seiner IT-Infrastruktur erst 2029 profitabel zu sein. Ähnlich verzeichnen Zhipu AI und MiniMax wachsende Verluste, da die Kosten, insbesondere für das Training neuer Modelle, steigen. Poe Zhao, Experte und Gründer von Hello China Tech, zitierte die Agence France-Presse mit den Worten, beide Unternehmen "verbrennen Geld schneller, als sie nachhaltige Einnahmequellen generieren können."
Für Zhao wird 2026 ein entscheidendes Jahr für die KI in China sein, in dem Unternehmen beweisen müssen, ob sie "über den Code hinausgehen und echten kommerziellen Wert generieren können", was für ihr Überleben entscheidend ist. Nick Patience von der Beratungsfirma Futurum erklärte gegenüber AFP, die Herausforderung sei nicht nur technologischer Natur. Sie umfasse auch die hohen Verarbeitungskosten im Kontext von Sanktionen und das schwierige Gleichgewicht zwischen Innovation innerhalb eines strengen regulatorischen Rahmens. Geopolitische Spannungen könnten die chinesische KI verlangsamen, da Washington den Export fortschrittlicher Mikroprozessoren, insbesondere der von Nvidia, und Präzisions-Chipfertigungsanlagen nach China einschränkt. Bei der Verwendung in China produzierter Chips benötigen chinesische KI-Programmierer laut Lian Jye Su, einem Analysten bei Omdia, zwei- bis viermal mehr Rechenleistung, um ihre Modelle zu trainieren. Obwohl Peking großzügige Subventionen zur Innovationsförderung verteilt, fordert es auch konkrete Anwendungen der KI. Im Januar kündigte China das Ziel an, bis 2027 drei bis fünf große generalistische KI-Modelle in der Fertigungsindustrie zu implementieren und gleichzeitig die verfügbare Rechenkapazität zu erhöhen.