Return to search

Scénarios temporels pour l'interprétation automatique de séquences vidéos

Cette thèse traite de la reconnaissance de scénarios temporels pour l'interprétation automatique de sé-quences vidéos : l'objectif est de reconnaître à cadence vidéo les comportements d'individus évoluant dans des scènes décrites par des séquences vidéos (acquises par des caméras). Le processus de reconnaissance prend en en-trée (1) les modèles de comportements humains (i.e. scénarios temporels) pré-définis par des experts, (2) les infor-mations sémantiques et géometriques-3D de l'environnement observé et (3) les individus suivis par un module de vision.<br />Pour résoudre ce problème, premièrement, nous avons proposé un modèle générique de scénarios temporels et un langage de description pour la représentation de connaissances décrivant des comportements humains. La repré-sentation de ces connaissances doit être claire, riche, intuitive et flexible pour être compris par les experts du do-maine d'application. Le modèle proposé d'un scénario temporel M se compose de cinq parties : (1) un ensemble de variables correspondant aux acteurs impliqués dans M, (2) un ensemble de variables temporelles correspondant aux sous-scénarios qui composent M, (3) un ensemble de variables interdites correspondant aux scénarios qui ne doivent pas être reconnus pendant la reconnaissance de M, (4) un ensemble de contraintes (symboliques, logiques, spatiales et contraintes temporelles comprenant les opérateurs de l'algèbre d'intervalles d'Allen) portant sur ces variables et (5) un ensemble de décisions correspondant aux tâches pré-définies par les experts pour être exécutées quand M est reconnu.<br />Deuxièmement, nous avons proposé une technique originale de résolution de contraintes temporelles pour la re-connaissance à cadence vidéo de modèles de scénarios temporels pré-définis par des experts. En général, l'algorithme proposé est efficace car il propage les contraintes temporelles et combine seulement les objets physi-ques définis dans le scénario donné M. Par efficace, nous voulons dire que le processus de reconnaissance est li-néaire en fonction du nombre de sous-scénarios et, dans quasiment tous les cas, en fonction du nombre d'objets physiques définis dans M.<br />Pour valider l'algorithme proposé en termes d'exactitude, de robustesse et du temps de traitement en fonction de la complexité des scénarios et de la scène (e.g. nombre de sous-scénarios, nombre de personnes dans la scène), nous avons testé l'algorithme en appuyant sur un grand nombre de vidéos provenant de différentes applications sur des données simulées et également réelles en modes hors-ligne/en-ligne.<br />Les expérimentations réalisées dans différentes applications montrent la capacité du langage de description de scénarios à représenter facilement les scénarios temporels correspondant aux comportements humains d'intérêt. De plus, ces expérimentations montrent également la capacité de l'algorithme proposé à reconnaître à cadence vidéo des modèles de scénarios sophistiqués (jusqu'à 10 acteurs et 10 sous-scénarios par scénario) dans des sé-quences vidéos complexes (jusqu'à 240 personnes/frame dans la scène).

Identiferoai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00327919
Date14 October 2004
CreatorsVu, Van-Thinh
PublisherUniversité de Nice Sophia-Antipolis
Source SetsCCSD theses-EN-ligne, France
LanguageFrench
Detected LanguageFrench
TypePhD thesis

Page generated in 0.0019 seconds