23. Januar 2018

Wissensbasiertes Feature Engineering bei Jobware

Juniorprofessorin Michaela Geierhos (Fachgruppe „Wirtschaftsinformatik, insb. Semantische Informationsverarbeitung“) entwickelt zusammen mit der Jobware Online-Service GmbH Ansätze zur automatischen Klassifikation von Stellenanzeigen und deren semantischen Suche im Job-Portal.

Jobware ist ein Online-Stellenmarkt, der sich auf Fach- und Führungskräfte spezialisiert hat und Stellenangebote auf über 400 Partner-Plattformen veröffentlicht. Bisher wurden den über Jobware zu veröffentlichenden Stellenanzeigen händisch Merkmals­ausprägungen zugewiesen. Dabei wird unter anderem festgelegt, welchen Berufsfeldern die Stellenanzeige zuzuordnen ist, und es werden Kontextinformationen identifiziert, um später im Text den Einsatzort der ausgeschriebenen Stelle zu finden. Ein Ziel des gemeinsamen Forschungsvorhabens ist die Automatisierung dieser Arbeit, ohne dass es zu Qualitätseinbußen kommt. Darüber hinaus bietet Jobware Stellensuchenden eine Freitextsuche an, um passende Stellenanzeigen zu finden. Deshalb ist ein weiteres Projektziel, die Nutzereingaben in der Freitextsuche besser interpretieren zu können. Hierfür sollen Synonyme automatisch mitgesucht werden oder im Hintergrund muss die Zerlegung von zusammengesetzten Substantiven durchgeführt werden, um mit allgemeineren Suchbegriffen bessere oder überhaupt relevante Stellenanzeigen zu finden. Auf diese Weise können alle passenden Vorschläge adäquat präsentiert werden und die Suche bei fehlenden Ergebnissen kann sinnvoll ausgeweitet werden.

Als Trainingsdaten steht ein Pool von über 200.000 Stellenanzeigen zur Verfügung, die bereits händisch kategorisiert sind und sämtliche zu extrahierenden Informationen beinhalten. Dies bietet die Möglichkeit, einerseits regelbasierte Ansätze zur Informationsextraktion mittels Bootstrapping und andererseits maschinelle Lernverfahren zu implementierten und damit ein hybrides Verfahren zu schaffen, das sowohl wissensbasiert als auch datengetrieben arbeitet. Insbesondere die Unterscheidung zwischen Firmenstandort und Einsatzort für den jeweils ausgeschriebenen Beruf stellt bestehende Ansätze vor große Herausforderungen. „Um dieses Problem anzugehen, wurden Muster aus den Anzeigentexten abgeleitet, anhand derer charakteristische Wortkonstellationen identifiziert werden konnten, die eine zuverlässige Unterscheidung ermöglichen“, erläutert Nicolai Grote. „Um dem Qualitätsanspruch gerecht zu werden, verfolgen wir einen interaktiven Lernansatz bei der Klassifikation von Stellenanzeigen, der eine hohe Transparenz vorsieht. Auf diese Weise ist zu jeder Zeit nachvollziehbar, auf Basis welcher Merkmale im Text (sogenannter Features) eine Klassifikationsentscheidung getroffen wurde, sodass diese bei Bedarf auch noch korrigiert werden kann und das Feedback zur Optimierung des Algorithmus beiträgt“, ergänzt Juniorprofessorin Geierhos. Künftig sollen die Kategorisierungsvorschläge von unserer Software durch eine Jobware-Mitarbeiterin oder einen -Mitarbeiter verifiziert werden. Sollte der vom Algorithmus generierte Vorschlag nicht korrekt sein, besteht die Möglichkeit, eine andere (korrekte) Kategorie auszuwählen, in die die Anzeige besser passt. Die neuen Informationen dienen dann der Verbesserung des Maschinellen Lernens.

zurück zur Übersicht