Uncategorized

Midjourney Medical und die Lücke bei der KI-Validierung: Was Entscheider in regulierten Branchen daraus mitnehmen sollten

Anja Prosch 24. Juni 2026 7 Min. Lesezeit

Midjourney Medical and the AI Validation Gap: What Regulated Buyers Should Take From It

Ein KI-Bildunternehmen baute einen medizinischen Scanner, und der Markt reagierte, bevor die Belege da waren

Am 17. Juni 2026 kündigte Midjourney — ein Unternehmen, das für die Erzeugung von Bildern aus Text bekannt ist — einen Ganzkörper-Scanner an, den es “Ultrasonic CT” nennt. Innerhalb weniger Tage stieg die Aktie seines Hardware-Partners Butterfly Network um 33%. Kein Teil des Geräts hatte eine FDA-Zulassung. Und Gründer David Holz sagte in der Bloomberg-Berichterstattung ganz offen: “Wir setzen hier noch gar keine KI ein.”

Zum Zeitpunkt der Ankündigung waren rund 12 Personen gescannt worden. Das erklärte Ziel sind 50’000 Scanner weltweit bis 2031, mit einer Kapazität von 1 Milliarde Scans pro Monat. Genau dieser Abstand — zwischen dem, was gezeigt wurde, und dem, was behauptet wird — ist der Teil, der sich lohnt, genauer anzusehen.

Was tatsächlich passiert ist

Midjourney gründete eine neue Sparte, Midjourney Medical, und stellte ein Ganzkörper-Ultraschallgerät vor, das in etwa 60 Sekunden eine 3D-Karte des Körpers erzeugt — mit Schallwellen und Wasser statt Strahlung oder Magneten. Die Bildgebung ist nicht Midjourneys eigene Arbeit. Sie basiert auf der Ultrasound-on-Chip-Technologie von Butterfly Network, im Rahmen einer Lizenzvereinbarung von bis zu 74 Mio. USD über 5 Jahre, unterzeichnet im November 2025. Der Prototyp nutzt 40 Butterfly-Module pro System, laut Butterflys Filing.

Das Signal für alle, die KI für Unternehmen in einem regulierten Bereich einkaufen, ist dieses. Eine KI-Consumer-Marke trat in eine evidenzgesteuerte Domäne ein, stellte ihr Produkt gegen einen etablierten Goldstandard (MRT), gab ihm einen Namen, der mehr verspricht als das Gerät leistet, und schob den regulatorischen Weg auf. Der Markt reagierte auf die Marke und die Demo, nicht auf validierte Ergebnisse.

Warum das ein Problem ist und nicht nur ein Produktstart

Heads of Compliance, DPOs, COOs und CFOs in regulierten Firmen bekommen fast täglich KI-Systeme angeboten. Der Fall Midjourney verdichtet ein bekanntes Muster in eine einzige Ankündigung, und genau das macht ihn zu einem sauberen Lehrbeispiel.

Der Name “Ultrasonic CT” legt eine Computertomografie nahe. Das ist es nicht. Es gibt keine Röntgenstrahlung und keine ionisierende Strahlung — es ist Ultraschall, wie die eigenen Materialien des Unternehmens bestätigen und wie unabhängige Erklärungen festhalten. Die Leistungsaussage — Bildqualität “vergleichbar mit” oder “in mancher Hinsicht besser als” MRT — stammt von einem Launch-Event, nicht aus begutachteten Tests. Radiologen widersprachen rasch. Eine Professorin an der NYU Langone Health merkte an, dass das Gerät auf Basis der gezeigten Belege modernen Ultraschall, CT oder MRT derzeit nicht übertrifft, auch wenn sie die Richtung als vielversprechend bezeichnete, wie Radiology Business berichtet.

Nichts davon macht das Projekt unseriös. Es macht die Lücke sichtbar. Aussagen über Fähigkeiten, Markenstärke und Marktbegeisterung sind nicht dasselbe wie validierte Leistung. In einer Domäne, in der ein Irrtum klinische, finanzielle oder rechtliche Folgen hat, besteht die Aufgabe des Käufers darin, das Gezeigte vom Behaupteten zu trennen.

Hier ist derselbe Launch auf zwei Arten gelesen:

Punkt	Midjourneys Darstellung	Unabhängiger Stand, Juni 2026
Bildqualität	Vergleichbar mit oder in mancher Hinsicht besser als MRT	Nicht unabhängig validiert; Fachleute sagen, es übertrifft modernen Ultraschall, CT oder MRT noch nicht
Scan-Geschwindigkeit	Etwa 60 Sekunden, rund 100x schneller als MRT	An einem Prototyp gezeigt; bei Ankündigung rund 12 Personen gescannt
Regulatorischer Status	FDA-Zulassungen sollen schrittweise folgen	Keine FDA-Zulassung; Start als Body-Composition-“Wellness”, nicht als Diagnose
Rolle der KI	KI rekonstruiert eine 3D-Karte des Körpers	Gründer: “Wir setzen hier noch gar keine KI ein”; Bildgebung nutzt Butterflys Ultrasound-on-Chip
Skalierung	50’000 Scanner, 1 Milliarde Scans pro Monat bis 2031	Erklärtes Ziel; erster Standort für Ende 2027 geplant

So bewertet ihr ein KI-System, bevor es einen regulierten Workflow berührt

Die folgende Disziplin gilt, egal ob das System ein medizinischer Scanner ist oder ein kundenorientierter Agent in Finanzen, Versicherung oder Pharma. Jeder Punkt ist eine konkrete Prüfung, die ihr durchführen könnt.

Gezeigte Fähigkeit von behaupteter Fähigkeit trennen

Fragt, was tatsächlich getestet wurde, an wie grosser Stichprobe und mit welchem Ergebnis. Die ehrliche Version der Midjourney-Zahl lautet “rund 12 Personen gescannt”, nicht “1 Milliarde Scans pro Monat”. Verlangt für jedes KI-System ein definiertes Benchmark-Set und das gemessene Ergebnis dagegen, bevor ihr eine Aussage über Fähigkeiten akzeptiert. Eine Demo beantwortet “kann es das einmal”. Ein Benchmark beantwortet “wie oft liegt es richtig”.

Den regulatorischen Geltungsbereich zuerst kartieren, nicht danach

Midjourney beginnt mit Body-Composition-Karten, die keine Zulassung erfordern, und schiebt die diagnostische FDA-Zulassung auf. Das ist eine legitime Reihenfolge, doch ein “Wellness-first”-Framing kann verschleiern, wo die regulierte Linie verläuft. Für Firmen im DACH-Raum sind die entsprechenden Fragen konkret: Welche Funktionen verarbeiten Personendaten nach revDSG, wo liegen die Daten, und welche Entscheidungen fallen unter Branchenregeln oder den EU AI Act für eure EU-Tätigkeit. Wer DSGVO-konform und nach Datenschutz Schweiz arbeiten muss, sollte wissen, welche Teile des Systems im regulierten Bereich liegen — vorher, nicht hinterher.

Prüfen, wo die KI tatsächlich arbeitet

Das Branding suggerierte, KI übernehme die Bildgebung. Der Gründer sagte, dem sei nicht so. Das lohnt sich bei jedem System, das ihr bewertet: Wo laufen Modelle wirklich, was entscheiden sie, und was ist deterministisch oder regelbasiert. Eine klare Karte von “Modell hier, Retrieval da, feste Logik dort” zeigt euch, wo Fehler entstehen können und wo nicht. Das gilt für jede KI-Integration im Unternehmen.

Quellengestützte Antworten verlangen, nicht Modell-Selbstsicherheit

Ein KI-System in einem regulierten Workflow sollte aus einer geprüften Knowledge Base abrufen, die Quelle jeder Antwort nennen und sich weigern, darüber hinaus etwas zu behaupten. Das ist der Unterschied zwischen einem System, das aus euren freigegebenen Daten argumentiert, und einem, das flüssigen, nicht überprüfbaren Text produziert. Lab51 baut individuelle KI-Agenten aus den eigenen Daten eines Kunden, mit gestütztem Retrieval, das Antworten aus einer kontrollierten Knowledge Base zieht, und einer Blacklist von Aussagen, die der Agent nie treffen darf. Dieselbe Architektur, die einen Agenten daran hindert, einen Wettbewerbsvorteil zu erfinden, hindert ihn daran, in einer Compliance-sensiblen Antwort eine Tatsache zu erfinden.

Einen Accuracy Report gegen ein “Must-get-right”-Set verlangen

Einigt euch vor der Skalierung auf ein Set von 20 bis 50 Fragen, die das System korrekt beantworten muss, mit von eurem Team freigegebenen Antworten. Testet gegen erwartete Anfragen und gegen bewusst adversariale und zufällige Eingaben. Das Ergebnis ist ein Accuracy Report mit einer Schwelle, die ihr festlegt — keine Folie, die behauptet, das System funktioniere gut. Kann ein Anbieter so etwas nicht liefern, ist dieses Fehlen selbst eine Information.

Namensgebung und Marktsignal kritisch lesen

“Ultrasonic CT” beschreibt Ultraschall mit einem CT-Etikett. Wenn die Terminologie die Funktion überzeichnet, behandelt das als Anlass, genauer hinzusehen. Und trennt die Marktreaktion von der Produktvalidierung: Ein Kursanstieg von 33% ist ein Signal über Erwartungen, kein Zulassungsereignis. Beides kann zugleich wahr sein — ein Projekt kann wirklich interessant und trotzdem unbewiesen sein.

Warum das jetzt wichtig ist

Markenerweiterungen von KI in regulierte Domänen nehmen zu, und Consumer-Selbstsicherheit wird zunehmend auf Entscheidungen angewendet, die echtes Risiko tragen. Die Zahl der KI-Anbieter-Pitches, die Schweizer und DACH-Firmen erreichen, steigt — zur gleichen Zeit, in der sich das regulatorische Umfeld verschärft, mit revDSG-Pflichten und EU-AI-Act-Pflichten, die für Firmen mit EU-Tätigkeit greifen. Die Kosten, ein nicht validiertes System in einen regulierten Prozess zu bringen, sind nicht mehr theoretisch. Die praktische Antwort ist, die obige Bewertungsdisziplin zur stehenden Anforderung zu machen, angewendet auf jedes KI-System, bevor es einen regulierten Workflow erreicht — und nicht als einmalige Prüfung im Einkauf. Das gehört zu jeder ernsthaften KI-Strategie.

Die Frage, die ihr weiter stellen solltet

Der Midjourney-Launch ist ein nützlicher Spiegel, weil er zeigt, wie weit eine selbstsichere Demo und eine starke Marke reisen können, bevor die Belege eintreffen. Für jeden Käufer in einer regulierten Branche ist der Test derselbe, den die Radiologen anlegten: Wo ist die Validierung, wer hat sie erstellt, und hält sie stand, wenn man sie losgelöst vom Marketing liest. Ein System, das das sauber beantworten kann, ist eines, das ihr intern verteidigen könnt. Ein System, das das nicht kann, ist ein Risiko, das ihr auf das Wort eines anderen hin akzeptiert.