Studie: KI bei Diagnosen schlechter als gedacht

n-tv

Wednesday, February 11, 2026 10:22:12 AM UTC

Eine Oxford-Studie zeigt: KI-Chatbots wie GPT-4o liefern bei echten Akutfällen häufig fehlerhafte medizinische Ratschläge.

Bei akuten Beschwerden vertrauen viele auf KI-Chatbots als medizinische Ratgeber. Eine Untersuchung der Universität Oxford offenbart nun deren erstaunlich schlechte Leistung. Die Systeme schneiden dabei nicht besser ab als eine herkömmliche Internet-Suche.

Ein stechender Schmerz, eine schlaflose Nacht - erst einmal abwarten oder lieber zum Arzt, vielleicht sogar in die Notaufnahme? KI-Chatbots sind erstaunlich schlecht darin, Menschen mit akuten Beschwerden akkurate medizinische Ratschläge zu geben. Das fand ein Forscherteam der Universität Oxford in Kooperation mit weiteren Institutionen mit einem Experiment heraus, über das die Gruppe im Fachjournal "Nature Medicine" berichtet.

Die rund 1300 Studienteilnehmer bekamen zufällig verschiedene, von Ärzten ausgewählte, fiktive Krankheitssymptome zugeteilt, zu denen sie sich informieren und Ratschläge einholen sollten, was in der Situation medizinisch angeraten ist. Zu den Fallbeispielen zählte etwa eine junge Mutter, die unter starken Erschöpfungssymptomen leidet, sowie ein 47 Jahre alter Mann mit Leistenschmerzen und Blut im Urin.

Im Austausch mit den Studienteilnehmern sollten die untersuchten KI-Tools eine Diagnose stellen und den nächsten Schritt empfehlen – also etwa zum schnellstmöglichen Ruf des Krankenwagens oder zu einem Routinetermin beim Hausarzt raten. Für jedes Szenario definierten die beteiligten Mediziner zuvor die richtige Lösung.

Die Teilnehmenden interagierten in dem Experiment entweder mit einem der untersuchten KI-Sprachmodelle (GPT-4o, Llama 3 oder Command R+) oder waren Teil der Kontrollgruppe, die auf konventionelleren Wegen daheim Informationen und Rat suchten, darunter normale Suchmaschinen.

Read full story on n-tv

Share this story on:-

Primary Country (Mandatory)

Other Country (Optional)

Set News Language for United States

Set News Language for World

Set News Source for United States

Set News Source for World

Studie: KI bei Diagnosen schlechter als gedacht

n-tv

Vogelkot verhalf Königreich zu Macht und Wohlstand

Warum wir uns nicht besser gegen Erkältungen schützen

Was Elefantenrüssel so feinfühlig macht

Warum trifft Alzheimer vor allem Frauen?

Möglicher Ursprung des Affenpockenvirus entdeckt

Wie Grippe das Herz in Mitleidenschaft zieht

Forscher warnen vor nahen Klima-Kipppunkten

Sind Kinder bestechlich?

Studie: KI bei Diagnosen schlechter als gedacht

Klimawandel bedroht die Hälfte aller Weideflächen

Januar war global der fünftwärmste der Geschichte

Große Mengen riskanter Substanz bereits in der Umwelt

Anstieg von Psychosen durch Cannabis?

Frieren trotz Fieber? Forscher lösen Paradoxon

Neues Alzheimer-Medikament hat laut Experten keinen Zusatznutzen

Leiden durch Qualzucht - diese Hunderassen trifft es

Schränkt Fasten das Denkvermögen ein?

Tollwut-Virus bei totem Hund in Rheinland-Pfalz entdeckt

Fast alle Urin-Proben von Heranwachsenden sind belastet

5000 Jahre eingefrorenes Bakterium entpuppt sich als "Superkeim"

Chinas Jugend lässt sich von KI therapieren

Epibatidin - Was ist das für ein Gift, das Nawalny tötete?

Stern wird ohne Supernova zum Schwarzen Loch

Der deutsche Panzerjäger Nashorn war eine Fehlkonstruktion

"Wasserfasten ist weniger gefährlich als Tabletten nehmen"