L'exploitation de documents multimédia est en plein essor. Nous savons maintenant bien exploiter de très grandes bases d'images photographiques et y faire des recherches par le contenu efficaces. L'étape suivante consiste à se tourner vers des documents plus complexes, comme le sont les vidéos et les bandes sonores. Une des principales difficultés afférentes au traitement de tels documents vient de leur caractère temporel. Décrire de l'audio et de la vidéo revient ainsi à fabriquer des séquences de descriptions dont il est important de préserver l'ordre et l'enchaînement. Cette thèse propose deux méthodes d'indexation de documents multimédia séquentiels. La première se base sur l'utilisation de l'alignement dynamique (DTW) pour la comparaison de séquences et propose une méthode présentant des gains significatifs en termes de coût de calcul par rapport aux méthodes existantes. La seconde méthode est appliquée spécifiquement à la recherche de reprises musicales. Il s'agit d'effectuer un premier filtrage des régions temporelles susceptibles d'être mises en correspondance avec la requête, avant d'appliquer une robustification temporelle.
Identifer | oai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00639225 |
Date | 04 July 2011 |
Creators | Tavenard, Romain |
Publisher | Université Rennes 1 |
Source Sets | CCSD theses-EN-ligne, France |
Language | French |
Detected Language | French |
Type | PhD thesis |
Page generated in 0.0051 seconds