Integration and Lifting of Question Answering Datasets
Derzeit gibt es mehr als 30 Datensätze aus über 20 Jahren Forschung. Alle diese Datensätze haben unterschiedliche Formate und Formen, und ihre Frage-Antwort-Paare können nur auf bestimmten zugrunde liegenden Datensätzen beantwortet werden.
In dieser Arbeit wird der Student die Merkmale all dieser Datensätze analysieren und eine Lösung vorschlagen, um diese Benchmark-Daten auf 5-Sterne-Niveau zu heben und darauf zuzugreifen. Die Antworten werden mit Hilfe von Methoden des maschinellen Lernens in Wissensdatenbanken verankert. Schließlich werden die erhobenen Datensätze in das bekannte Framework GERBIL QA integriert.
Quellcode: https://github.com/dice-group/NLIWOD/tree/master/qa.datasets