Apps & Mobile Entwicklung
Modellunabhängige Strategie: Microsoft prüft diverse offene Modelle für Cowork

Microsoft soll für seine Copilot-Anwendung Cowork deutlich mehr offene und Open-Weight-Modelle testen als der Konzern bislang erkennen ließ. Das Unternehmen verfolgt den Ansatz, dass sich unterschiedliche Modelle je nach Aufgabe, Kosten, Latenz und Qualitätsanforderungen flexibel austauschen lassen.
Mit dieser flexiblen Strategie könnte Microsoft seine Abhängigkeit von externen Anbietern deutlich verringern. Gleichzeitig würde jedoch der Druck auf die eigenen MAI-Modelle, eine Familie hauseigener, spezialisierter KI-Modelle des Unternehmens, steigen. Dies will die für ihre zuverlässigen Aussagen bekannte KI-Plattform TestingCatalog erfahren haben.
Selbst gehostete DeepSeek-Variante als Alternative
Das zuständige Microsoft-Team soll verschiedene offene und Open-Weight-Modelle evaluieren. Bereits vor wenigen Tagen berichtete Axios (Paywall) darüber, dass das Unternehmen eine selbst gehostete DeepSeek-Variante als kostengünstige Alternative für Copilot Cowork in Betracht ziehe. Ausschlaggebend seien dabei, wie derzeit auch bei vielen anderen KI-Anbietern, die hohen Kosten. Laut Charles Lamanna, Executive Vice President für Copilot, Agents and Platform, erledigen viele Nutzer Hunderte Aufgaben pro Woche. Das steigere zwar die Produktivität, lasse jedoch auch die Kosten „sehr hoch“ werden. Microsoft hatte deshalb – ähnlich wie zuvor Google bei Gemini – aufgrund der hohen Aufwendungen die Abrechnung von einem unbegrenzten Nutzungsmodell auf ein „nutzungsbasiertes Preismodell“ umgestellt. Unternehmen sollen damit künftig entsprechend der tatsächlich genutzten Rechenleistung zahlen. Sollte der Softwarekonzern diesen Schritt gehen, dürften sich angesichts der Herkunft von DeepSeek aus China politische und sicherheitsrelevante Diskussionen kaum vermeiden lassen.
Flexibler Ansatz soll Kosten sparen
Laut TestingCatalog gehen die angedachten Evaluierungen jedoch offenbar weit über eine reine Kostensenkung hinaus. Im Mittelpunkt steht demnach auch die Trennung zwischen dem eigentlichen Modell und der Orchestrierungsebene. Dadurch könnte die bestehende Infrastruktur unverändert bleiben, während je nach Anwendungsfall unterschiedliche Modelle zum Einsatz kommen. Ein solcher Ansatz würde erhebliche Einsparungen ermöglichen: Anspruchsvolle Aufgaben könnten weiterhin von den Frontier-Modellen übernommen werden, während weniger komplexe Prozesse auf selbst gehosteten KI-Modellen in Azure ausgeführt würden. Auch das lokale Ausführen kleinerer KI-Modelle gilt als denkbar.
Darüber hinaus würde eine solche Aufteilung Microsoft in die Lage versetzen, die Kosten langfristiger agentischer Arbeitsabläufe zu senken und Kunden mehr Auswahl bei Preisgestaltung und Modelltyp zu bieten. Gleichzeitig erhielte das Unternehmen mehr Planungssicherheit. Auf der anderen Seite würde sich Microsoft damit allerdings Konkurrenz aus den eigenen Reihen schaffen.
Noch nichts konkret
Laut mit den Tests vertrauten Quellen sollen sich die verschiedenen Ansätze bislang nicht im produktiven Einsatz, sondern noch in der Evaluierungsphase befinden. Entscheidend dürfte letztlich sein, welches Modell die Anforderungen von Unternehmenskunden hinsichtlich Kosten, Compliance, Sicherheit und Qualität am besten erfüllt.