Künstliche Intelligenz bei Brustkrebs-Früherkennung zu ungenau

4. Oktober 2021

Systeme mit Künstlicher Intelligenz (Artificial Intelligence/AI) sind derzeit noch zu ungenau im Erkennen von Brustkrebs auf der Basis von Mammografien, um breit eingesetzt zu werden. Das hat jetzt eine Übersichtsarbeit britischer Wissenschafter zur vorliegenden wissenschaftlichen Literatur ergeben. Erfahrene Radiologen können durch EDV-Systeme nicht substituiert werden.

Das Urteil von Karoline Freeman und ihren Co-Autoren von der Abteilung für Gesundheitswissenschaften der Universität Warwick (Coventry/Großbritannien) im angesehenen British Medical Journal (2. Oktober) ist jedenfalls eindeutig: „Die derzeitige Evidenz für den Einsatz von AI-Systemen in der Brustkrebsvorsorge ist weit davon entfernt, die Qualität und Quantität zu erreichen, die für die Einführung in die klinische Praxis erforderlich ist. (…) Es ist unklar, was der Stellenwert von AI-Systemen in der klinischen Verwendung (an Patientinnen; Anm.) ist. AI-Systeme sind nicht spezifisch genug, um eine Doppel-Begutachtung durch Radiologen in Brustkrebs-Screening-Programmen zu ersetzen.“

Im Grunde genommen geht es um mehrere Themenbereiche. Brustkrebs gehört zu den größten Herausforderungen für das Gesundheitswesen im Bereich der bösartigen Erkrankungen. Weltweit erkrankten im vergangenen Jahr rund 2,3 Millionen Frauen an einem Mammakarzinom. 685.000 Betroffene erlagen dieser Krankheit laut den Zahlen der Weltgesundheitsorganisation (WHO). Brustkrebs-Screening-Programme können die Todesrate senken. Dazu bedarf es aber regelmäßiger – zumeist alle zwei Jahre vorgenommener – Mammografie-Untersuchungen. In Österreich werden alle Frauen zwischen 45 und 69 Jahren regelmäßig dazu eingeladen. Das Programm ist aber auch offen für Frauen ab 40 und über 70 Jahre hinaus. Die Befundung erfolgt nach dem Vier-Augen-Prinzip durch zwei Radiologen. Auch zusätzliche Ultraschalluntersuchungen sind bei Bedarf möglich, genauso wie weitere bildgebende Verfahren.

Um in einem Land aber breit wirksam sein zu können, ist eine hohe Beteiligung der Frauen notwendig. Österreich kam laut Radiologen aufgrund der Einladungen 2018/2019 nur auf eine Beteiligung von etwas mehr als 40 Prozent. Für die Reduktion der Mammakarzinom-Todesfälle um 25 bis 30 Prozent wäre eine Beteiligung von 70 Prozent der infrage kommenden Frauen notwendig.

Für die Auswertung der Mammografien wurden in den vergangenen Jahren immer öfter auch Systeme mit Künstlicher Intelligenz ins Spiel gebracht. Die in der Entwicklung selbst lernenden EDV-Algorithmen sollten verdächtige Veränderungen genauer identifizieren als Radiologen (höhere Sensitivität) und falsche Diagnosen mit nachfolgenden unnötigen Untersuchungen besser ausschließen (höhere Spezifität). Immer wieder kommt es zu öffentlichen Diskussionen über die Häufigkeit von falschen Überdiagnosen. Auf der anderen Seite, so die Autoren der wissenschaftlichen Arbeit: „Krebs wird mit einer Häufigkeit zwischen 0,6 und 0,8 Prozent der Frauen beim Screening entdeckt. Brustkrebs-Screening-Programme übersehen aber auch 15 bis 35 Prozent der Fälle – durch Fehler oder weil der Tumor für den Radiologen nicht sichtbar oder nicht erkennbar ist.“

Die britischen Wissenschafter hoben in ihrer systematischen Übersichtsarbeit die wissensschaftlichen Studien zum Wert von AI-Systemen beim Brustkrebs-Screening aus. Verwertet und neuerlich analysiert werden konnten zwölf wissenschaftliche Studien mit 131.822 Screening-Teilnehmerinnen. Die Studien ab dem Jahr 2010 stammten aus den USA, Deutschland, den Niederlanden und Spanien. Zum Teil handelte es sich auch um internationale Untersuchungen.

Die Ergebnisse waren schlecht, wie es jetzt auch im Deutschen Ärzteblatt hieß: „In drei großen Studien, an denen 79.910 Frauen teilnahmen, wurden KI-Systeme mit den klinischen Entscheidungen von Radiologen verglichen. Die meisten der in diesen drei Studien bewerteten KI-Systeme waren weniger genau als ein einzelner Radiologe oder eine Radiologin, und alle waren weniger genau als der Konsens von zwei oder mehr Radiologen, der in Europa die Standardpraxis ist.“ Fünf kleinere Studien mit positiven Resultaten für Künstliche Intelligenz & Co. seien in größeren Untersuchungen nicht nachvollziehbar gewesen.

Damit bleiben Wissen und Erfahrung der Radiologen derzeit entscheidend für Mammakarzinom-Screening-Programme. Sie können durch AI-Systeme nicht ersetzt werden. In einer schwedischen Studie mit 68.008 Befundungen zeigte beispielsweise das beste Computerprogramm eine Spezifität (bei negativem Befund wirklich kein Krebs) von 81 Prozent. Der erstbegutachtende Radiologe brachte es auf eine Spezifität von 98,5 Prozent. Auch die Frage, ob man die KI-Systeme benützen könnte, um auf jeden Fall unverdächtige Befunde wegzufiltern, ist laut den Studienautoren noch ungeklärt.