31 |
Reconnaissance de symboles sans connaissance a priori / Symbol recognitiion without prior knowledgeZuwala, Daniel 06 November 2006 (has links)
Nous proposons un système complet capable de retrouver des symboles dans des documents graphiques sans connaissance a priori. Nous nous basons sur une méthode de description structurelle qui permet de mettre en avant des régions pouvant contenir un symbole. A partir d'un découpage du document en chaînes de points, nous fusionnons successivement les régions entre elles en fonction d'un critère de densité et de convexité permettant la reconstruction de symboles potentiellement intéressant pour l'utilisateur. Un descripteur est ensuite calculé pour chacun de ses symboles, ce qui permet de faire une reconnaissance quand l'utilisateur soumet une requête. Afin de réduire le temps de réponse d'une requête nous avons développé une méthode d'indexation qui se base sur l'algorithme BIRCH en utilisant un descripteur robuste et discriminant. Puis nous montrons comment réduire davantage ce temps de réponse en combinant différentes règles de filtrage basées sur des descripteurs basiques. / A complete system able to find symbols in graphical document without a priori knowledge is proposed here. In a first place, this system is based on a structural method able to put in stress regions that may contain symbols. The document is represented by chain points that will be merged following a defined criteria. These merges allow potential symbols to be reconstructed. A descriptor is then calculated for each potential symbols, and the recognition can take place when the user submit a request. In order to speed up the retrieval, an indexing method based on BIRCH has been proposed by using a robust descriptor. Then we show that by combining filtering rules based on simple descriptors, we can rise the speed of the retrieval.
|
32 |
Améliorer la recherche par similarité dans une grande base d'images fixes par des techniques de fouille de donnéesKouomou Choupo, Anicet Morin, Annie. January 2006 (has links) (PDF)
Thèse doctorat : Informatique : Rennes 1 : 2006. / Bibliogr. p. 109-118.
|
33 |
Indexation de vidéos et de maillages 3D dans le contexte MPEG-7Zaharia, Titus 01 December 2001 (has links) (PDF)
Cette thèse relève de l'indexation et de la représentation par le contenu des données multimédias, dans le contexte spécifique de la normalisationinternationale de l'image et notamment dans le cadre du processus de standardisation MPEG-7.<br /><br />Nous proposons tout d'abord de nouvelles mesures de similarité pour les descriptions de mouvement par modèles paramétriques 2D, fondées sur une famille de fonctions distance entre les champs de vitesses. Les problèmes d'optimisation en temps de calcul, d'alignement spatio-temporel et de pondération des composantes translationnelle et homogène de mouvement sont analysés et une solution mathématique proposée, mise en oeuvre et évaluée objectivement sur les bases de test naturelle et synthétique avec vérité terrain, que nous avons constituées et qui ont été retenues pour l'évaluation des descripteurs de mouvement MPEG-7.<br /><br />Deux descripteurs de forme pour indexer des modèles 3D maillés sont ensuite proposés. Partant des propriétés d'invariance géométrique et topologique que doit satisfaire naturellement un descripteur de forme d'objet 3D maillé, nous avons tout d'abord défini le spectre de forme 3D, que nous avons proposé et promu dans le standard MPEG-7. Celui-ci exploite uniquement la structure géométrique locale d'une surface 3D, fournit une représentation très compacte, mais présente une grande sensibilité aux descriptions topologiques des maillages. En considérant la transformée de Hough 3D d'un maillage, nous avons ensuite construit le descripteur de Hough 3D optimisé, intrinsèquement invariant aux changements de connexité, rendu indépendant aux transformations géométriques et optimisé en terme de compacité de représentation, via une partition invariante aux changements de repère canonique de la sphère unité.<br /><br />Enfin, nous proposons une plate-forme d'indexation compatible MPEG-7, intégrant des outils d'annotation, de navigation, de visualisation et de requêtes par similarité, et supportant des applications comme l'archivage vidéo, la vidéo cliquable ou l'indexation MPEG-7 de la langue des signes française. L'ensemble logiciel ainsi réalisé démontre pour la première fois en grandeur réelle, pour les applications d'indexation multimédia considérées, le caractère effectivement opérationnel des schémas de description génériques, normalisés MPEG7.
|
34 |
Continuous memories for representing sets of vectors and image collections / Mémoires continues représentant des ensembles de vecteurs et des collections d’imagesIscen, Ahmet 25 September 2017 (has links)
Cette thèse étudie l'indexation et le mécanisme d'expansion de requête en recherche d'image. L'indexation sacrifie la qualité de la recherche pour une plus grande efficacité; l'expansion de requête prend ce compromis dans l'autre sens : il améliore la qualité de la recherche avec un coût en complexité additionnel. Nous proposons des solutions pour les deux approches qui utilisent une représentation continue d'un ensemble de vecteurs. Pour l'indexation, notre solution est basée sur le test par groupe. Chaque vecteur image est assigné à un groupe, et chaque groupe est représenté par un seul vecteur. C'est la représentation continue de l'ensemble des vecteur du groupe. L'optimisation de cette représentation pour produire un bon test d'appartenance donne une solution basée sur la pseudo-inverse de Moore-Penrose. Elle montre des performances supérieures à celles d'une somme basique des vecteurs du groupe. Nous proposons aussi une alternative suivant au plus près les vecteurs-images de la base. Elle optimise conjointement l'assignation des vecteurs images à des groupes ainsi que la représentation vectorielle de ces groupes. La deuxième partie de la thèse étudie le mécanisme d'expansion de requête au moyen d'un graphe pondéré représentant les vecteurs images. Cela permet de retrouver des images similaires le long d'une même variété géométrique, mais éloignées en distance Euclidienne. Nous donnons une implémentation ultra-rapide de ce mécanisme en créant des représentations vectorielles incorporant la diffusion. Ainsi, le mécanisme d'expansion se réduit à un simple produit scalaire entre les représentations vectorielles lors de la requête. Les deux parties de la thèse fournissent une analyse théorique et un travail expérimental approfondi utilisant les protocoles et les jeux de données standards en recherche d'images. Les méthodes proposées ont des performances supérieures à l'état de l'art. / In this thesis, we study the indexing and query expansion problems in image retrieval. The former sacrifices the accuracy for efficiency, whereas the latter takes the opposite perspective and improves accuracy with additional cost. Our proposed solutions to both problems consist of utilizing continuous representations of a set of vectors. We turn our attention to indexing first, and follow the group testing scheme. We assign each dataset vector to a group, and represent each group with a single vector representation. We propose memory vectors, whose solution is optimized under the membership test hypothesis. The optimal solution for this problem is based on Moore-Penrose pseudo-inverse, and shows superior performance compared to basic sum pooling. We also provide a data-driven approach optimizing the assignment and representation jointly. The second half of the transcript focuses on the query expansion problem, representing a set of vectors with weighted graphs. This allows us to retrieve objects that lie on the same manifold, but further away in Euclidean space. We improve the efficiency of our technique even further, creating high-dimensional diffusion embeddings offline, so that they can be compared with a simple dot product in the query time. For both problems, we provide thorough experiments and analysis in well-known image retrieval benchmarks and show the improvements achieved by proposed methods.
|
35 |
Indexation de séquences de descripteursTavenard, Romain 04 July 2011 (has links) (PDF)
L'exploitation de documents multimédia est en plein essor. Nous savons maintenant bien exploiter de très grandes bases d'images photographiques et y faire des recherches par le contenu efficaces. L'étape suivante consiste à se tourner vers des documents plus complexes, comme le sont les vidéos et les bandes sonores. Une des principales difficultés afférentes au traitement de tels documents vient de leur caractère temporel. Décrire de l'audio et de la vidéo revient ainsi à fabriquer des séquences de descriptions dont il est important de préserver l'ordre et l'enchaînement. Cette thèse propose deux méthodes d'indexation de documents multimédia séquentiels. La première se base sur l'utilisation de l'alignement dynamique (DTW) pour la comparaison de séquences et propose une méthode présentant des gains significatifs en termes de coût de calcul par rapport aux méthodes existantes. La seconde méthode est appliquée spécifiquement à la recherche de reprises musicales. Il s'agit d'effectuer un premier filtrage des régions temporelles susceptibles d'être mises en correspondance avec la requête, avant d'appliquer une robustification temporelle.
|
36 |
Assistance à l'indexation vidéo par analyse du mouvementEtievent, Emmanuel Jolion, Jean-Michel January 2004 (has links)
Thèse de doctorat : Documents Multimédia, Images et Systèmes d'Information Communicants : Villeurbanne, INSA : 2002. / Titre provenant de l'écran-titre. Bibliogr. p.136-141.
|
37 |
Représentation du temps et de l'espace dans les bibliothèquesGrzesiak, Isabel January 2002 (has links) (PDF)
Rapport de recherche bibliographique diplôme d'études supérieures spécialisées : Réseaux d'information et document électronique : Villeurbanne, ENSSIB : 2002.
|
38 |
Étude d'un analyseur de surface de la langue naturelle application à l'indexation automatique de textes /Palmer, Patrick. Chiaramella, Yves. Boitet, Christian. January 2008 (has links)
Reproduction de : Thèse de doctorat : Informatique : Grenoble 1 : 1990. / Titre provenant de l'écran-titre. Bibliogr. p. 261-274.
|
39 |
Un environnement informatique pour l'interrogation et l'accès intelligent aux bases de données complexesHacid, Hakim Zighed, Djamel Abdelkader January 2008 (has links)
Reproduction de : Thèse de doctorat : Informatique : Lyon 2 : 2008. / Titre provenant de l'écran-titre. Bibliogr.
|
40 |
Structuration multimodale des vidéos de tennis en utilisant des modèles segmentauxDelakis, Emmanouil Gros, Patrick Gravier, Guillaume January 2006 (has links) (PDF)
Thèse doctorat : Informatique : Rennes 1 : 2006. / La première partie est en français, le reste en anglais. Bibliogr. p. 123-133.
|
Page generated in 0.0969 seconds