Startseite > Fachgruppen > Algorithmen und Komplexität > Projekte > Entwicklung einer praxisnahen Theorie für Clusteringalgorithmen durch datengetriebene Modellierung und Analyse

Entwicklung einer praxisnahen Theorie für Clusteringalgorithmen durch datengetriebene Modellierung und Analyse

Ziele

Unter Clusteranalyse oder einfach Clustering versteht man die Partitionierung einer Menge von Objekten in Teilmengen von einander ähnlichen Objekten. Clusteringalgorithmen haben Anwendungen in der Datenkompression, Mustererkennung, Biologie, Analyse von Netzwerken, Stochastik, Textklassifikation und dem maschinellen Lernen, um nur einige Beispiele zu nennen. Die unterschiedlichen Anwendungen bestimmen auch, was unter ähnlichen Objekten zu verstehen ist. Einerseits existieren viele unterschiedliche in der Praxis erfolgreich eingesetzte Clusteringalgorithmen. Andererseits gibt es auch eine Vielzahl theoretischer Ergebnisse aus dem Bereich der theoretischen Informatik zum Clustering. Fast alle praktisch eingesetzten Algorithmen können jedoch nur unzureichend analysiert werden und die aus der Theorie stammenden Algorithmen sind nicht effizient genug für die Praxis. Wir wollen in diesem Projekt versuchen, diese Kluft zwischen Theorie und Praxis durch eine praxisorientierte Theorie für Clusteringalgorithmen zu schließen. Schwerpunkt soll dabei eine Modellierung und die hierauf aufbauende Algorithmenanalyse sein, die die Besonderheiten von Eingaben durch geeignete Parametrisierungen berücksichtigt.

Das Projekt ist ein Teilprojekt im Schwerpunktprogramm "Algorithm Engineering", gefördert von der Deutschen Forschungsgemeinschaft (DFG). Das Projekt begann mit Christian Sohler und Johannes Blömer gemeinsam in Paderborn und wird jetzt von Christian Sohler an der Universität Dortmund und mit Johannes Blömer in Paderborn durchgeführt.

Personen

  • Johannes Blömer (Projektleiter)
  • Christian Sohler (Projektleiter, ehemals Universität Paderborn, jetzt Universität Dortmund)
  • Daniel Kuntze