95 % der KI-Piloten in Unternehmen liefern keinen messbaren Wertbeitrag. Diese Zahl einer MIT-Studie aus dem Sommer 2025 hat die Boardrooms erreicht – und wird seitdem rauf und runter zitiert. Manchmal als Beleg für den großen AI-Bubble, manchmal als Weckruf, manchmal einfach als Aufhänger für das nächste Beratungsangebot.
Die Zahl ist griffig. Aber wie bei vielen griffigen Zahlen liegt der eigentliche Erkenntnisgewinn nicht in der Schlagzeile. Er liegt in der Frage, die sie aufwirft: Warum scheitern diese Piloten – und was sagt uns das über den Zustand digitaler Transformation in Organisationen?
Was die Studie eigentlich gefunden hat
Die Untersuchung der MIT NANDA-Initiative basiert auf 150 Interviews, 350 Mitarbeitendenbefragungen und 300 öffentlichen Deployments. Die Hauptaussage: Nur 5 % der Piloten führen zu messbaren Umsatz- oder Effizienzeffekten. Die restlichen 95 % bleiben in einer Art Dauerpilotierung hängen.
Interessanter als die Quote ist das „Warum". Der leitende Autor Aditya Challapally formuliert es klar: Es sei nicht die Qualität der KI-Modelle, die den Unterschied mache, sondern die Lernlücke zwischen Werkzeug und Organisation.
Das ist eine bemerkenswerte Aussage. Sie verschiebt den Fokus von einem Technologieproblem zu einem Organisationsproblem. Und sie passt exakt zu dem, was Transformationsverantwortliche seit Jahren wissen – aber oft genug ignoriert wird.
Piloten sterben nicht am Modell
Wer schon einmal einen KI-Piloten in einem größeren Unternehmen begleitet hat, kennt das Muster: Die technische Machbarkeit wird demonstriert, erste Use-Cases funktionieren, eine PowerPoint bekommt stehende Ovationen. Und dann passiert – nichts. Oder besser: der Pilot wird wiederholt, erweitert, umgetauft, aber nie skaliert.
Das liegt selten am Modell. Es liegt an den Dingen, die niemand in die Roadmap geschrieben hat:
- Prozessintegration – der Output der KI muss irgendwo in einen bestehenden Workflow einfließen. Wird dieser Workflow nicht angepasst, verpufft der Mehrwert.
- Datenbasis – die Qualität der Antworten hängt an der Qualität der Eingaben. Organisationen, die ihre Daten nicht im Griff haben, bekommen auch mit dem nächsten Modell keine belastbaren Ergebnisse.
- Rollenverständnis – wer entscheidet noch, wer bereitet nur vor, wer kontrolliert? Diese Fragen sind meistens nicht geklärt.
- Befähigung – Mitarbeitende werden mit dem Tool allein gelassen. Schulungen finden statt, aber sie vermitteln selten die kritische Kompetenz: zu erkennen, wann der Output der KI falsch ist.
Die MIT-Studie bestätigt das an einer pointierten Stelle: Extern eingekaufte Tools haben eine Erfolgsquote von rund zwei Dritteln, intern entwickelte Lösungen nur etwa die Hälfte davon. Nicht weil interne Teams schlechter wären – sondern weil der interne Bau meist mit Unterschätzung des Organisationsteils einhergeht.
Der eigentliche Engpass: Transformation statt Technik
Hier schließt sich der Kreis zu einem Thema, das ich in anderer Form schon beleuchtet habe: Digitalisierung ist nicht Transformation. KI-Piloten sind häufig Digitalisierungsprojekte im neuen Gewand. Ein bestehender Prozess wird mit einem neuen Werkzeug ausgestattet – die zugrunde liegende Logik bleibt unberührt.
Wirksame KI-Nutzung beginnt aber dort, wo Organisationen bereit sind, die Fragen eine Ebene höher zu stellen:
- Warum gibt es diesen Prozess überhaupt in seiner heutigen Form?
- Welche Entscheidungen wollen wir an ein System delegieren – und welche bewusst nicht?
- Wo liegt unser echter Engpass: im Tun, im Entscheiden, oder im Verstehen?
- Was verändert sich an Führung, wenn Routineentscheidungen automatisiert werden?
Diese Fragen lassen sich nicht in einem Pilotprojekt beantworten. Sie sind Change-Management-Fragen. Und sie entscheiden darüber, ob aus dem Piloten ein Produktivsystem wird oder eben nicht.
Vorsicht vor der Gegenthese
Es gibt eine laute Gegenbewegung, die der MIT-Studie methodische Schwächen vorwirft. Einige Kritiker argumentieren, die 95 % seien zu pauschal und messen den tatsächlichen Nutzen nicht ab. Das stimmt teilweise – die Studie erfasst vorwiegend kurzfristige P&L-Effekte und unterschätzt womöglich den qualitativen Nutzen mancher Piloten.
Aber genau deshalb ist die eigentliche Kritik nicht „die Zahl ist zu hoch", sondern: „die Zahl fängt das Problem nur teilweise ein". Auch die 5 % erfolgreichen Piloten sind in vielen Fällen nur kleine Effizienzgewinne – weit entfernt von der Transformation, die der Begriff „AI" in Vorstandspräsentationen verspricht.
Was Transformationsverantwortliche mitnehmen sollten
Drei praktische Konsequenzen stehen aus meiner Sicht im Vordergrund:
Erstens: Den Piloten nicht als Ziel behandeln. Ein erfolgreicher Pilot ist nur dann etwas wert, wenn zum Zeitpunkt des Starts bereits geplant ist, wie die Skalierung aussehen soll. Wer das nicht tut, produziert Showcases ohne Anschluss – Momentaufnahmen ohne Tragfähigkeit.
Zweitens: Back-Office ernst nehmen. Die MIT-Studie zeigt, dass die höchste ROI-Quote nicht in Marketing und Vertrieb liegt, wo die meisten Budgets landen, sondern in Backoffice-Automatisierung. Das ist nicht glamourös. Es ist wirksam.
Drittens: Change Management vom ersten Tag mitdenken. Nicht als flankierende Maßnahme nach dem Kick-off, sondern als integralen Bestandteil des Designs. Welche Rollen ändern sich? Welche Ängste entstehen? Welche neuen Kompetenzen braucht es? Diese Fragen parallel zur Technik zu stellen ist der einzige zuverlässige Weg, aus einem Piloten ein System zu machen.
Fazit
Die 95 % sind nicht das eigentliche Problem. Das Problem ist, dass diese Zahl als Skandal gelesen wird und nicht als Diagnose. KI wird an Organisationen getestet, die für die Veränderung, die KI ermöglicht, gar nicht bereit sind. Technologie ohne organisatorische Transformation ist nicht nachhaltig – egal wie leistungsfähig das Modell ist.
Die Qualität der KI entscheidet nicht über den Erfolg des Piloten. Die Qualität der Organisation tut es.
Wer sich das bewusst macht, wird nicht 5 % Erfolgsquote anstreben, sondern die Rahmenbedingungen schaffen, unter denen die Frage nach der Quote gar nicht mehr wichtig ist.