Branche
on
Grafik zur Datenverarbeitung.

Datenanalyse mithilfe von maschinellem Lernen soll das Profiling von Zellen ermöglichen. © monsitj / iStock / Getty Images Plus

| |

Künstliche Intelligenz: Zellmodelle mithilfe computergestützter Methoden erstellen

Einzelzellanalysen liefern eine Fülle molekularer und genetischer Informationen. Mit Hilfe des maschinellen Lernens führt ein Team um den Forscher Prof. Dr. Uwe Ohler, Leiter der Arbeitsgruppe „Bioinformatik der Genregulation“, am Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft (MDC) diese Daten zusammen und erstellt aussagekräftige Profile der Zellen.

Trotz ihrer winzigen Größe ist jede einzelne Zelle ausgesprochen komplex. So liest sie etwa aus riesigen DNA-Bibliotheken im Zellkern die Erbinformationen aus, die sie gerade benötigt, übersetzt sie in RNA und schließlich in eine große Vielfalt an Proteinen.

Mit unterschiedlichen Techniken lassen sich heute die Eigenschaften und Zustände von Zellen in einem nie dagewesenem Detailreichtum charakterisieren. So können Wissenschaftler*innen etwa die DNA und ihre zugehörigen Genschalter auslesen, die RNA analysieren oder die unterschiedlichen Proteine und ihre Formen ermitteln.

Das Problem dabei: man hat am Ende riesige Datenmengen, die vollkommen unterschiedliche Aspekte der Zelle beschreiben. Und selbst wenn es sich eigentlich um die gleichen Informationen vom gleichen Zelltyp handelt, unterscheiden sich die Daten voneinander – abhängig davon, in welchem Labor, zu welchem Zeitpunkt und mit welcher Technik sie gewonnen wurden.

Auf dem Weg zu detailreichen molekulare Zellprofilen

Die Arbeitsgruppe „Computational Regulatory Genomics“ von Professor Uwe Ohler am Berliner Institut für Medizinische Systembiologie (BIMSB), das zum Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft (MDC) gehört, will Abhilfe schaffen. Das Team arbeitet an computergestützten Methoden, die diese Daten automatisch in ein Modell der Zelle zusammenführen und analysieren, ohne dass man diese im Vorfeld entsprechend aufbereiten muss.

Dazu nutzen die Forscher*innen Methoden des maschinellen Lernens, eines Bereiches der künstlichen Intelligenz. Die Entwicklung der Datenaufbereitung und -analyse wird nun von der Chan Zuckerberg Initiative (CZI) gefördert. Mit der CZI finanzieren der Facebook-Gründer Marc Zuckerberg und Priscilla Chan seit 2015 Projekte in Wissenschaft und Forschung, Bildung sowie in sozialer Gerechtigkeit und Inklusion.

Das Zusammenführen der unterschiedlichen Daten soll detailreiche molekulare Profile von einzelnen Zellen und Zelltypen ermöglichen und so konkrete Fragen beantworten, zum Beispiel: Welche Merkmale charakterisieren einen bestimmten Zelltyp? Ist die Zelle gesund oder krank? Wie kann ich aus den abgelesenen Genen, also der Genexpression, auf die Menge von bestimmten Oberflächenproteinen schließen? Welche regulatorischen DNA-Abschnitte spielen bei Erbkrankheiten eine Rolle?

Biologisch relevante Daten filtern

Wenn es um die Charakterisierung der Zelltypen geht, hat die Gruppe schon einige Antworten parat. So gelang es etwa Pia Rautenstrauch aus der AG Ohler, drei verschiedene Datentypen zur Genregulation derartig miteinander zu kombinieren, dass sie die biologisch relevanten Daten der jeweiligen Zellen herausfiltern konnte.

Das Rauschen – also Unterschiede, die zum Beispiel allein auf der Messtechnik beruhten und die Interpretation der Daten erschweren – vernachlässigte ihr Deep-Learning-Modell dagegen. Mit dem Modell war Rautenstrauch im Winter 2021 auf dem NeurIPS-Wettbewerb erfolgreich.

In einem anderen Projekt kategorisierten die Wissenschaftler*innen um Ohler mit selbstlernenden Algorithmen die Datensätze von Genschaltern im Zebrafisch. Sie wollten herausfinden, welche Schalter es bei welchem Zelltyp gibt.

Ökosystem für die Datenanalyse

„Die CZI hat großes Interesse an solchen Methoden zur automatisierten Datenintegration. Sie fördert ja ein umfangreiches Netzwerk biomedizinischer Labore“, sagt Ohler. Programme wie die von Ohlers Arbeitsgruppe sollen die vielschichtigen Daten der Forschungsgruppen zusammenführen und deren gemeinsame Analyse ermöglichen.

Das Ziel sei letztlich „ein großes Ökosystem für Analyseplattformen, das dann allen Interessierten zur Verfügung gestellt wird“, sagt Ohler. Schließlich könnten die entwickelten Methoden und Prinzipien auf ganz andere Forschungsfelder übertragen werden, sagt Ohler.

Denkbar sei zum Beispiel die Integration von unterschiedlichen Satellitenmessdaten, die verschiedene Wellenlängen abdecken. Auch in solchen Fällen müsse man die Informationen sinnvoll zusammenführen, um ein aussagekräftiges Gesamtbild zu erhalten.

Quelle: Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft (MDC)

Newsletter abonnieren

Newsletter Icon MTA Blau 250x250px

Erhalten Sie die wichtigsten MT-News und Top-Jobs bequem und kostenlos per E-Mail.

Mehr zum Thema

Bakterien
Wissenschaftler mit Mikroskop

Das könnte Sie auch interessieren

Bakterien
Petrischale mit Blutmedium
Wissenschaftler mit Mikroskop