Auf der Build-Konferenz (2.–3. Juni 2026) hat Microsoft ein Programm abgeliefert, das sich gewaschen hat: sieben eigene KI-Modelle — darunter das erste eigene Reasoning-Modell —, eine neue Developer-Hardware für lokale Milliarden-Parameter-Modelle und eine Neupositionierung von Windows als Laufzeitumgebung für KI-Agenten. Das ist mehr als die übliche Build-Agenda.
MAI-Thinking-1 — Microsoft schreibt jetzt eigene Modelle
Lange war Microsoft bei KI-Modellen vor allem Distributor: OpenAI-Modelle hinter Azure, Copilot darüber, fertig. Das „Microsoft AI Superintelligence“-Team ändert diese Konstellation. Auf der Build 2026 kommen sieben neue Modelle aus eigener Entwicklung, angeführt von MAI-Thinking-1 — dem ersten eigenen Reasoning-Modell des Konzerns. Sechs weitere folgen:
- MAI-Image-2.5 (Text-zu-Bild, plus eine leichtere Flash-Variante)
- MAI-Transcribe-1.5 (Sprache zu Text, 43 Sprachen, Streaming in Vorbereitung)
- MAI-Voice-2 (Sprachsynthese, 15 Sprachen, ebenfalls mit Flash-Variante)
- MAI-Code-1 (Code-Assistance mit GitHub-Integration)
Wie gut MAI-Thinking-1 im direkten Vergleich mit OpenAI o3, Googles Gemini Thinking oder Anthropics Claude 3.7 abschneidet, hat Microsoft noch nicht mit unabhängig nachvollziehbaren Benchmarks unterlegt. Die Ansage ist trotzdem strategisch relevant: Wer Microsofts Ökosystem baut, bekommt künftig nicht mehr zwingend OpenAI-Modelle unter der Haube.
Surface RTX Spark Dev Box — 128 GB, 1 Petaflop, noch kein Preis
Parallel zur Modellpalette kommt Hardware: die Surface RTX Spark, eine kompakte Developer-Box auf Basis von Nvidias gleichnamigem Chip. 128 GB Unified Memory, bis zu 1 Petaflop KI-Rechenleistung laut Hersteller, 100 Watt TDP — und die Fähigkeit, Modelle mit bis zu 120 Milliarden Parametern lokal auszuführen, ohne Cloud-Anbindung. WSL2 mit nativem GPU-Passthrough, CUDA-Support, VS Code und GitHub Copilot kommen vorinstalliert.
Für Entwicklungsumgebungen, bei denen Datenschutz- oder Compliance-Anforderungen gegen Cloud-Inference sprechen, klingt das auf dem Papier interessant — wobei ich bei meinen KMU-Kunden regelmäßig merke, dass der Weg von „interessant auf dem Papier“ zu „läuft produktiv im Einsatz“ oft länger ist als erwartet. Preis und Support-Weg fehlen noch komplett, der US-Start „später in 2026″ ist keine Planungsgrundlage, und wer beim Mac Studio mit M4 Ultra (128 GB, ab rund 4.000 Euro) nachgeschaut hat, weiß, wo die Preisklasse liegt.
Windows als nativer Agent-Host
Konzeptionell folgenreicher als die Hardware: Microsoft will Windows zu einer sicheren Laufzeitumgebung für lokale KI-Agenten machen. Microsoft Execution Containers (MXC) sollen Agenten voneinander und vom System trennen — Sandboxes mit Audit-Trails und Policy-Kontrolle, aktuell in der Vorschau. Ebenfalls in der Vorschau: die neue GitHub Copilot App, bei der Entwickler ein Problem beschreiben und der Agent in parallelen, git-separaten Sessions Lösungsansätze erarbeitet. Dazu kommt Project Rayfin, ein Backend-as-a-Service-Ansatz, der Infrastruktur-Management abnehmen soll — ebenfalls Preview.
Das Zielbild ist klar: Windows nicht nur als Fenster zu KI-Diensten in der Cloud, sondern als Plattform, die Agenten nativ ausführt, trennt und beaufsichtigt.
Sieben eigene Modelle, ein Dev-Rechner für lokale 120-Milliarden-Parameter-Inference und Windows als Agent-Runtime — das ist kein Build-Agenda-Füller. Microsoft zeigt klarer als je zuvor, wo es hinwill: weg vom reinen OpenAI-Distributor, hin zu einer Plattform mit eigenen Modellen, die agentische KI direkt ins Betriebssystem einbaut. Ob das Tempo hält, wenn MAI-Thinking-1 auf benchmarkierten Wettbewerb trifft und die MXC-Sandboxes in produktiven Umgebungen landen müssen — das ist eine andere Frage. Preview-Ankündigungen und reale Rollouts liegen bei Microsoft traditionell nicht ganz so nah zusammen, wie die Konferenz-Folien suggerieren.



