Séparation aveugle de sources: mélanges convolutifs sous-déterminés

Retour à la liste des thèses
Ajouté le: 20/02/2014
Directeur : KOWALSKI Matthieu - kowalski@lss.supelec.fr
Titre : Séparation aveugle de sources: mélanges convolutifs sous-déterminés
Thèmes : Automatique, Signal, Télécoms, Systèmes embarqués
Laboratoires : L2S Laboratoire des Signaux et Systèmes UMR 8506
Description :

Contexte Scientifique

Le problème de séparation de sources audio consiste à estimer les signaux de plusieurs sources sonores enregistrées simultanément par plusieurs microphones. Ce problème est classiquement connu comme le "cocktail party problem".

Plusieurs difficultés apparaissent dans ce problème. Dans le cas le plus général, on ne connait que les enregistrements des diverses sources, sans même savoir "comment", elles ont été enregistrées: c'est le cas aveugle. De plus, un effet d'écho s'ajoute naturellement, qui doit être pris en compte dans les cas les plus réalistes: on à affaire à un problème de déconvolution. Enfin, suivant le nombre de microphone et le nombre de sources enregistrées, on peut être dans un cas dit sur-déterminé, où il y a plus d'observations que de sources, ou inversement dans un cas sous-déterminés.
Si le problème de la séparation aveugle des mélanges instantanés, c'est-à-dire sans écho, dans le cas sur-déterminé peut se traiter dans le cadre de l'analyse en composantes indépendantes (ICA), les cas sous-déterminés et les mélanges convolutifs posent encore de sérieux challenges.

Pour les signaux audio, il est naturel d'exploiter la notion de parcimonie dans le domaine temps-fréquence. C'est le but de la transformée de Fourier à court terme. Grâce à cette représentation, on peut approcher les mélange convolutifs sur-déterminé comme plusieurs problèmes instantanées dans chaque bande fréquentielles, et exploiter les techniques d'ICA auxquels s’ajoute le problème de permutation des sources estimées.

Dans le cadre sous-déterminés, la séparation se fait généralement en deux étapes: une étape d'estimation du système de mélange, et une étape de séparation de source proprement-dite. Ici encore, ces deux étapes peuvent bénéficier de l'utilisation de la parcimonie dans le domaine temps-fréquence. Cependant, lorsque le mélange est réverbérant, l'estimation du système de mélange reste un enjeux majeur. D'autant que, même lorsque celui-ci est connu, l'estimation des sources reste un problème inverse mal posé. Les approches basées sur la parcimonie permettent ici d'obtenir des résultats de références en terme de mesures de performances objectives, tels que les rapports signal à distortion, ou signal à interférence.

 

Objectifs

Le candidat travaillera sur le problème de séparation des mélanges convolutifs. Ce travaille devra aborder le problème de déconvolution aveugle d'une part, qui va bien au-dela du problème de séparation de sources audio. Plus précisément, on s'intéressera aux cas où le filtre est supposé parcimonieux dans le domaine temporelle, hypothèse raisonnable dans le cas des mélanges audios. Des résultats récents montrent que la formulation de la déconvolution aveugle par un approche d'optimisation alternée avec une pénalité $\ell_1$ sur le filtre, et une pénalité invariante par translation sur la source, aboutit à un minimum global évident: le filtre estimé est un dirac, et la source le signal observé. Le candidat s'attachera à trouver une formulation réaliste, dont cette solution trivial ne peut être un minimum. Ce problème de déconvolution pourra, par ailleur, trouver d'autres applications en imagerie physique.

D'autre part, une étude du problème de séparation de sources plus spécifiques à l'audio sera abordée. En particulier, on s'intéressera aux mélanges stéréos, et comment adapter les algorithmes itératifs exploitant la parcimonie aux mélanges convolutifs sous-déterminés, pour une estimation conjointe du système de mélange et des sources.

 

Encadrement

Matthieu Kowalski, MCF Univ. Paris-Sud, L2S, kowalski@lss.supelec.fr, 01 69 85 17 47