Vier Augen sehen mehr als zwei – diese Regel gilt schon lange für schwerwiegende medizinische Diagnosen. Aber wann ist es tatsächlich besser, mehrere Meinungen einzuholen und wie viele sollten es gegebenenfalls sein?
Diesen Fragen sind Forscher des Max-Planck-Instituts für Bildungsforschung und des Leibniz-Instituts für Gewässerökologie und Binnenfischerei nachgegangen. „Wir erforschen, wie soziale Systeme in der Natur, etwa Fischschwärme, Informationen verarbeiten und wie dies genutzt werden kann, um menschliche Entscheidungsprozesse zu verbessern“, erläutert Max Wolf vom Leibniz-Institut für Gewässerökologie und Binnenfischerei die Methode.
Diagnosegenauigkeit – ein wesentlicher Faktor
In einer früheren, schon publizierten Studie fanden die Wissenschaftler anhand von Computersimulationen heraus, dass drei unabhängige ärztliche Meinungen zu Hautkrebsdiagnosen die Diagnosegenauigkeit gegenüber der Bewertung des durchschnittlichen Hautarztes in der Gruppe erhöhen könnten. Mit steigender Anzahl der Bewertungen ließe sich die Genauigkeit sogar noch weiter steigern. Mehr als zehn Bewertungen brachten jedoch keinen Zusatznutzen.
In der aktuellen Studie untersuchten die Wissenschaftler nun anhand von Computersimulationen, wie die Diagnosegenauigkeit der einzelnen Ärztinnen und Ärzte das kollektive Ergebnis beeinflusst. Tatsächlich stellte diese sich als wesentlicher Faktor heraus: Nur wenn sich die Ärzte hinsichtlich ihrer Diagnosegenauigkeit ähnlich waren, könnten die kombinierten Entscheidungen mehrerer Ärzte die Entscheidung des besten Arztes der Gruppe überflügeln.
Das funktioniert nicht, wenn die Diagnosegenauigkeit der Ärzte zu unterschiedlich ist. Dieser Effekt zeigte sich auch bei verschiedenen Gruppengrößen oder unterschiedlichen Leistungsniveaus des jeweils besten Arztes innerhalb der Gruppe.
Einheitliches Niveau der Gruppe wichtig
„Es ist nicht so, dass Gruppen immer zu besseren Entscheidungen gelangen“, sagt der Erstautor der Studie, Ralf Kurvers vom Forschungsbereich „Adaptive Rationalität“ am Max-Planck-Institut für Bildungsforschung. „Sind die individuellen Fähigkeiten innerhalb der Gruppe zu unterschiedlich, sollte man der Diagnose des besten Arztes innerhalb der Gruppe vertrauen.“ Für ihre Studie nutzten die Wissenschaftler bereits vorhandene große Datensätze aus zwei früheren Studien zur Brust- und Hautkrebsdiagnose. So konnten sie auf über 20 000 Bewertungen von mehr als 140 Ärzten zurückgreifen und die Diagnosegenauigkeit der einzelnen Ärzte berechnen.
Mit diesen Informationen simulierten sie, unter welchen Bedingungen die mittels Regeln der kollektiven Intelligenz kombinierten Diagnosen treffsicherer sind als Einzeldiagnosen. Angewendet wurden dabei die Konfidenz- und Mehrheitsregel. Während bei der Konfidenzregel pro Fall die Diagnose desjenigen Arztes gilt, der sich seiner Einschätzung am sichersten ist, gilt bei der Mehrheitsregel pro Fall diejenige Diagnose, welche am häufigsten von den Ärzten genannt wurde.
„Das Studienergebnis ist ein weiterer wichtiger Baustein zum Verständnis, wie kollektive Intelligenz entstehen kann“, sagt Mitautor Max Wolf vom Leibniz-Institut für Gewässerökologie und Binnenfischerei. Das Ergebnis unterstreiche die Bedeutung der Diagnosegenauigkeit der einzelnen Entscheider für das Gesamtergebnis. Dies sollte auch in der Praxis berücksichtigt werden, beispielsweise bei der unabhängigen Doppelbefundung einer Mammographie-Aufnahme durch zwei Ärzte. Zukünftig möchten die Wissenschaftler herausfinden, welche Informationen notwendig sind, um möglichst schnell etwas über die Diagnosegenauigkeit eines Arztes herauszufinden.
Quelle: Max-Planck-Gesellschaft
Originalpublikationen:
- Wolf, M. et al.; Boosting medical diagnostics by pooling independent judgments; PNAS, 2016; doi: 10.1073/pnas.1601827113
- Wolf, M et al.; Detection accuracy of collective intelligence assessments for skin cancer diagnosis; JAMA Dermatology, 2015; doi:10.1001/jamadermatol.2015.3149