Aktuelle Projekte
WestAI - AI Service Center West
Förderprogramm KI7_Aufbau von KI-Servicezentren
Laufzeit: 11/2022 - 12/2025
Gefördert durch: BMBF
Kontakt: Dr.-Ing. Jörg Schmalenströer
SAIL - Nachhaltiger Lebenszyklus von intelligenten soziotechnischen Systemen
Durch SAIL wird das bestehende Forschungsnetzwerk aus Uni Bielefeld, Uni Paderborn, TH OWL und FH Bielefeld im Bereich der künstlichen Intelligenz (KI) vertieft und weiterentwickelt. SAIL adressiert die nächste Stufe der KI-Entwicklung, indem der gesamte Lebenszyklus von KI-Systemen und deren technologische und gesellschaftliche Auswirkungen in den ...
Laufzeit: 08/2022 - 07/2026
Gefördert durch: MKW NRW
TRR 318 - Erklärbarkeit konstruieren
In unserer digitalen Gesellschaft nehmen die algorithmischen Ansätze (wie das maschinelle Lernen) rasant an Komplexität zu. Diese erschwert es den Bürger:innen, die Assistenz nachzuvollziehen und die von Algorithmen vorgeschlagenen Entscheidungen zu akzeptieren. Als Antwort auf diese gesellschaftliche Herausforderung hat die Forschung begonnen, ...
Laufzeit: 07/2021 - 06/2025
Gefördert durch: DFG
TRR 318 - Technisch unterstütztes Erklären von Stimmcharakteristika (Teilprojekt C06)
Im Projekt C6 wird ein spezieller Fall von soziotechnischer Assistenz betrachtet, bei dem Expert:innen durch maschinelle Lernausgabe unterstützt werden, die es ihnen ermöglicht, ein Sprachsignal besser zu verstehen und damit interpretierbar zu machen. Weiterhin wird untersucht, wie dieser Output von Phonetik-Expert:innen genutzt werden kann, um ihr ...
Laufzeit: 07/2021 - 06/2025
Gefördert durch: DFG
Automatische Transkription von Gesprächssituationen
Das Projekt befasst sich mit der maschinenlesbaren Verschriftung von Gesprächssituationen unter Verwendung von Raummikrofonen, seien es professionelle Besprechungen oder lockere Treffen unter Freunden. Derzeitige technische Lösungen erreichen bei weitem nicht die Erkennungsleistung eines Menschen. Dies hat vornehmlich drei Gründe: Zum einen ist die ...
Laufzeit: 05/2021 - 12/2024
Gefördert durch: DFG
Lernen tiefer Sprachrepräsentationen für die Phonetikforschung
Neben dem linguistischen Inhalt enthält ein Sprachsignal weitere, extra/paralinguistische Informationen, wie beispielsweise Geschlecht, emotionaler Zustand, Alter, sozialer Status oder die Identität von Sprecherinnen oder Sprechern. Diese Charakteristika sind jedoch in komplexen, nicht unmittelbar transparenten Variationen des Sprachsignals ...
Laufzeit: 04/2021 - 12/2024
Gefördert durch: DFG
Explainable Feature Importance: Interpretierbare maschinelles Lernen durch spieltheoretische Analyse von Einflussgrößen und Interaktionseffekten
Methoden des maschinellen Lernens (ML) unterstützen die Suche nach Mustern in Daten und Zusammenhängen zwischen Variablen, z.B. in komplexen bio-medizinischen Systemen. Auf diese Weise können sie neue Einsichten vermitteln und Entscheidungen in Handlungsfeldern wie der medizinischen Diagnostik verbessern. Neben der Güte der aus den Daten gelernten ...
Laufzeit: 01/2021 - 12/2024
Gefördert durch: MKW NRW
Technisch ermöglichte Erläuterung der Sprecher Eigenschaften
Das Sprachsignal ist eine reichhaltige Informationsquelle, die nicht nur linguistische, sondern auch so genannte para- oder außersprachliche Inhalte vermittelt, die die Identität, das Geschlecht, den emotionalen oder kognitiven Zustand, das Alter und die Gesundheit eines Sprechers offenbaren. Diese Merkmale sind Gegenstand zahlreicher ...
Laufzeit: 01/2021 - 12/2025
Gefördert durch: DFG
Abgeschlossene Projekte
Akustische Sensornetze Acoustic Sensor Networks Research Group
Diese Forschergruppe untersucht Lösungen und Grenzen für die Verarbeitung und Klassifizierung akustischer Signale über gekoppelte Sensornetzwerke. Unser Ziel ist es, die derzeitigen Unzulänglichkeiten zu beseitigen und eine gemeinsame Plattform zu entwickeln, die ASNs anpassungsfähiger an die Variabilität akustischer Umgebungen und ...
Laufzeit: 01/2017 - 12/2023
Gefördert durch: DFG
Geräuscherkennung mit begrenzter Überwachung über Sensornetzwerke
Eine Diskrepanz zwischen der Statistik der Trainings- und der Testdaten kann zu einer erheblichen Verschlechterung der Leistung von Systemen für maschinelles Lernen führen. Bei der Erkennung von Geräuschen in akustischen Sensornetzen (ASN) ist dies aufgrund der großen Anzahl und Variabilität von Geräuschen und akustischen Umgebungen sowie aufgrund ...
Laufzeit: 01/2017 - 12/2023
Gefördert durch: DFG
Verteilte akustische Signalverarbeitung über drahtlose Sensornetzwerke
Wir betrachten ein akustisches Sensornetz, in dem verschiedene Anwendungen, wie z. B. Quellentrennung und -extraktion, ausgeführt werden sollen. Eine einfache Lösung könnte darin bestehen, alle Daten an einen Gateway-Knoten zu übertragen und sie dort zu verarbeiten. Dies ist jedoch nicht unbedingt die beste Lösung (Engpässe bei der Datenrate, große ...
Laufzeit: 01/2017 - 12/2023
Gefördert durch: DFG
FOR 2457 – Koordinationsfonds (Teilprojekt)
Wir sind tagtäglich von einer Vielzahl von Geräuschen und anderen akustischen Ereignissen umgeben, und doch können wir uns mühelos in einer solchen Umgebung unterhalten, und die wahrgenommenen akustischen Eindrücke geben uns eine Vorstellung darüber, in welcher Umgebung wir uns gerade befinden. Ein technisches System mit ähnlichen Fähigkeiten hätte ...
Laufzeit: 10/2016 - 06/2021
Gefördert durch: DFG
FOR 2457 – Unüberwachte akustische Ereignisdetektion und Szenenklassifikation auf Sensornetzwerken (Teilprojekt)
Ein grundsätzliches Problem für viele maschinelle Lernverfahren ist eine Diskrepanz zwischen den Trainingsdaten und den Testdaten in einer späteren Anwendung, welche zu einem signifikanten Einbruch der Klassifikationsrate führen kann. Bei der akustische Ereignisdetektion und Szenenklassifikation in akustischen Sensornetzen tritt dieses Problem ...
Laufzeit: 10/2016 - 12/2021
Gefördert durch: DFG
Kontakt: Janek Ebbers
Quellentrennung und Störreduktion für die automatische Spracherkennung in dynamischen akustischen Szenarien
In diesem Projekt soll die Robustheit eines Spracherkennungssystems für Sprachbedienung im Freisprechmodus mit Anwendungen im Smart Home Bereich verbessert werden. Aufbauend auf den Ergebnissen aus dem DFG-Vorgängerprojekt sollen die dort entwickelten mehrkanaligen Quellentrennungs- und Störreduktionsverfahren unter realistischen Randbedingungen ...
Laufzeit: 08/2016 - 12/2021
Gefördert durch: DFG
FOR 2457 : Akustische Sensornetze
Diese Forschergruppe adressiert Schlüsselthemen der akustischen Signalverar-beitung der nächsten Generation, die auf der Infrastruktur eines akustischen Sensornetzes basieren. Im Zentrum stehen dabei grundsätzliche Fragestellungen, die vielen Anwendungen gemeinsam sind.Die Ziele können wir folgt zusammengefasst werden:• Kommunikation und ...
Laufzeit: 01/2016 - 12/2021
Gefördert durch: DFG
FOR 2457 – Privatsphäre-erhaltende Audiomerkmale für die Gruppierung und Klassifikation in akustischen Sensornetzen (Teilprojekt)
Die allgegenwärtige Verwendung von tragbaren intelligenten Geräten hat zu einer weiten Verbreitung von akustischen Sensoren geführt. Offensichtlich führen die Anwesenheit dieser Sensoren und die in diesem Zusammenhang eingesetzten Algorithmen des maschinellen Lernens zu einem hohem Risiko für die Privatsphäre, insbesondere wenndie Geräte über ein ...
Laufzeit: 01/2016 - 12/2021
Gefördert durch: DFG
Kontakt: Alexandru Nelus
SPP 1527 - Bayessches Lernen einer hierarchischen Repräsentation von Sprache aus gesprochener Eingabe (Teilprojekt)
Das Ziel dieses Projekts ist das Erlernen einer hierarchischen Repräsentation von Sprache alleine aus dem akustischen Sprachsignal. Auf der untersten Ebene werden die akustischen Elementareinheiten, d.h. Phoneme oder ähnliche Wortuntereinheiten, entdeckt und Modelle dafür trainiert, während auf der nächsten Ebene die lexikalischen Einheiten, d.h. ...
Laufzeit: 01/2014 - 12/2018
Gefördert durch: DFG
Bayes'sche Merkmalsverbesserung zur Erkennung verhallter und verrauschter Sprache bei großem Vokabular
In diesem Vorhaben sollen Verfahren zur automatischen Spracherkennung für komplexe Erkennungsaufgaben mit großem Vokabular entwickelt werden für den Fall, dass die aufgenommene Sprache durch Raumhall und additives Rauschen gestört ist. Um eine möglichst breite Einsetzbarkeit zu gewährleisten, wird dabei von lediglich einkanalig vorliegenden ...
Laufzeit: 01/2013 - 12/2019
Gefördert durch: DFG