Künstliche Intelligenz
Deepseek-R1: KI-Training hat sogar weniger als 300.000 US-Dollar gekostet
Das Training des Reasoning-Modells R1 des chinesischen KI-Unternehmens Deepseek hat nur 294.000 US-Dollar gekostet und erfolgte auf 512 H800-Chips von Nvidia. Diese Kosten, die noch einmal deutlich unter den bisherigen Schätzungen liegen, stehen in einem unabhängig überprüften Forschungsartikel zur Erschaffung der KI-Technik, der jetzt im Fachmagazin Nature erschienen ist. Der dürfte die Debatten um die immensen Kosten für das KI-Training bei der US-Konkurrenz noch einmal neu entfachen. Als Deepseek R1 und ein weiteres KI-Modell Anfang des Jahres veröffentlichte, hat dessen Konkurrenzfähigkeit für Krisentreffen bei der Konkurrenz und einen Absturz des Aktienkurses von Nvidia gesorgt.
Längst ein Vorbild für die Konkurrenz
Ein erster Fachartikel zum Training von Deepseek-R1 im Januar hat die Zahlen zu den Kosten und der eingesetzten Hardware noch nicht enthalten. Die hat das Unternehmen nun im Rahmen einer Peer Review nachgereicht, die von Nature durchgeführt wurde. Das Forschungsmagazin wirbt nun bei anderen KI-Unternehmen dafür, ihre KI-Systeme und die Entwicklung in gleicher Weise unabhängig überprüfen zu lassen. In dem jetzt veröffentlichten Artikel zu Deepseek-R1 werde deutlich, wie das chinesische Unternehmen ein automatisiertes Ausprobieren („trial and error“) eingeführt habe. Dadurch sei die Technik belohnt worden, wenn sie korrekte Antworten ermittelt. Mit dieser Innovation habe Deepseek alle anderen KI-Firmen inspiriert, heißt es bei Nature.
Die Modelle von Deepseek haben im Januar deshalb zu einem Kursrutsch bei den Aktien aller KI-Firmen gesorgt, weil sie viel kostengünstiger waren und viel effizienter funktionierten als die Konkurrenz. Deshalb gab es Zweifel, ob die teils hunderte Milliarden US-Dollar teure Infrastruktur, die vor allem von US-Firmen derzeit aufgebaut wird, für die KI-Branche überhaupt notwendig ist. Die Aufregung hat sich längst gelegt und die Aktienkurse steigen immer weiter. Laut Nature hat Deepseek nun auch publik gemacht, dass die KI-Technik, die R1 zugrunde liegt, insgesamt sechs Millionen US-Dollar gekostet hat. Auch zusammen liegen die Ausgaben für das zumindest damals konkurrenzfähige KI-Modell damit weit unter denen von OpenAI & Co.
(mho)