Forschung 20.02.2017, 15:55 Uhr

ETH-Forscher bringen Computern das Kategorisieren bei

Theoretische Physiker der ETH Zürich führten intelligente Maschinen bewusst in die Irre und entwickelten damit das maschinelle Lernen weiter: Sie schufen eine neue Methode, dank der Computer Daten kategorisieren können – und zwar auch dann, wenn kein Mensch eine Ahnung hat, wie eine solche Kategorieneinteilung sinnvollerweise aussehen könnte.
Wenn Computer selbstständig auf Satellitenbildern Gewässer und ihre Umrisse erkennen oder beim fernöstlichen Brettspiel Go einen der weltbesten professionellen Spieler schlagen, dann arbeiten im Hintergrund lernfähige Algorithmen. Programmierer haben diese zuvor während einer Trainingsphase mit bekannten Beispielen gefüttert: Bilder von Gewässern und von Land beziehungsweise bekannte Go-Spielverläufe, die in Turnieren zum Erfolg oder Misserfolg geführt haben. Ähnlich wie sich die Nervenzellen in unserem Gehirn während Lernprozessen neu vernetzen, sind auch die speziellen Algorithmen in der Lage, sich während der Lernphase anhand der ihnen präsentierten Beispiele anzupassen. Bis sie schliesslich selbständig auch auf unbekannten Fotos Gewässer von Land unterscheiden können sowie erfolgreiche von erfolglosen Spielverläufen. 
Solche sogenannte künstliche neuronale Netzwerke kamen beim maschinellen Lernen bisher dann zum Einsatz, wenn das Unterscheidungskriterium bekannt ist: Man weiss, was ein Gewässer ist und welches in vergangenen Go-Turnieren die erfolgreichen Spielverläufe waren. 

Den Weizen vom Spreu trennen

Nun haben Wissenschaftler aus der Gruppe von Sebastian Huber, Professor für theoretische Festkörperphysik und Quantenoptik an der ETH Zürich, die Anwendungen solcher neuronaler Netzwerke erweitert: Sie entwickelten eine Methode, mit der sich beliebige Daten nicht nur kategorisieren lassen, sondern die auch erkennt, ob es in komplexen Datensätzen überhaupt Kategorien gibt.
Solche Fragestellungen gibt es in der Wissenschaft zuhauf: Die Methode könnte für die Auswertung von Messungen an Teilchenbeschleunigern oder von astronomischen Beobachtungen interessant werden. Physiker können damit aus ihren oft unüberschaubaren Messdaten die vielversprechendsten Messungen herausfiltern. Pharmakologen könnten aus umfangreichen Moleküldatenbanken jene Moleküle aussieben, die mit einer gewissen Wahrscheinlichkeit eine bestimmte pharmazeutische Wirkung oder Nebenwirkung haben. Und Datenwissenschaftler könnten damit riesige ungeordnete Datenwulste ordnen und daraus verwertbare Informationen gewinnen (Data-Mining). 




Das könnte Sie auch interessieren