Global ETD Search

Return to search

Extraction d'information `a partir de documents Web multilingues : une approche d'analyses structurelles

Les ressources d'information multilingues sur le Web sont devenues de plus en plus des objets d'études importantes pour différents domaines intervenant au traitement de l'information. Néanmoins, nous constatons que la structure des ressources multilingues est très peu explorée par rapport à l'abondance des méthodes de traitement automatique des langues naturelles. Dans cette thèse, nous abordons l'aspect multilinguisme dans un contexte de catégorisation des sites Web multilingues. Nous apportons quelques connaissances expérimentales portant sur la représentation de documents multilingues, la modélisation des données en une structure homogène, la qualité de la recherche d'information dans un contexte multilingues et enfin sur les notions de frontière et de centre de gravité pour départager des langues dominantes sans puiser dans des connaissances linguistiques.

[INFO:INFO_OH] Computer Science/Other

Apprentissage automatique

Catégorisation

Classication

Extraction<br />d'information

Fouille de textes

Fouille de Web

Multilinguisme

Identifer	oai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00258948
Date	25 September 2006
Creators	Nguyen, Tuan Dang
Publisher	Université de Caen
Source Sets	CCSD theses-EN-ligne, France
Language	French
Detected Language	French
Type	PhD thesis

Page generated in 0.0022 seconds

Extraction d'information `a partir de documents Web multilingues : une approche d'analyses structurelles

Description

Links & Downloads

Tags

Additional Fields