WHA­LE - Web-Sca­le Hy­brid Ex­plaina­ble Ma­chi­ne Lear­ning

 |  Heinz Nixdorf InstitutData Science

Die zunehmende Integration von KI-Systemen in alltägliche Anwendungen macht die Erklärbarkeit und Transparenz maschineller Lernverfahren zu einer zentralen Herausforderung der aktuellen Forschung. Insbesondere im Web - der größten Informationsinfrastruktur der Menschheitsgeschichte - beeinflussen Entscheidungen von KI-Systemen täglich Milliarden von Nutzer*innen. Das Vertrauen in diese Systeme hängt maßgeblich davon ab, ob ihr Verhalten nachvollziehbar und erklärbar ist. 

WHALE (Web-Scale Hybrid Explainable Machine Learning) ist ein Forschungsprojekt unter der Leitung von Prof. Dr. Axel-Cyrille Ngonga Ngomo. Es wird im Rahmen des Lamarr Fellow Network vom Ministerium für Kultur und Wissenschaft des Landes Nordrhein-Westfalen (MKW NRW) gefördert und läuft von Oktober 2023 bis September 2027. Ziel des Projekts ist es, skalierbare und erklärbare maschinelle Lernmethoden für Wissensgraphen im Web zu entwickeln.

Im Mittelpunkt steht das sogenannte Class Expression Learning (CEL) – ein ante-hoc und global interpretierbarer Ansatz zur Konzeptinduktion auf Basis von RDF-Wissensbasen. Obwohl CEL in stark begrenzten Szenarien bereits überzeugende Ergebnisse erzielt hat, stoßen bestehende Verfahren bei der Anwendung auf großskalige und komplexe Web-Daten schnell an ihre Grenzen.

WHALE setzt deshalb auf zeiteffiziente, hybride CEL-Ansätze für ausdrucksstarke Beschreibungslogiken (z. B. SROIQ(D)). Da RDF-Wissensbasen häufig eine T-Box-Struktur aufweisen, die sich mit Beschreibungslogiken modellieren lässt, bieten sie eine geeignete Grundlage für solche Ansätze. Ziel des Projekts ist es, das Äquivalent von Large Language Models (LLMs) für Wissensgraphen zu entwickeln – also wiederverwendbare, leistungsfähige und erklärbare Modelle, die sich auch im Web-Maßstab effizient einsetzen lassen. Die im Projekt entstehenden Werkzeuge und Modelle werden so gestaltet, dass sie (i) den nachhaltigen Impact von WHALE in Forschung und Praxis sichern, (ii) die Prinzipien offener und reproduzierbarer Wissenschaft fördern und (iii) künftige Forschung zu erklärbarer KI im Web zum Wohl der Gesellschaft unterstützen.