• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 32
  • 6
  • 5
  • 1
  • 1
  • Tagged with
  • 45
  • 19
  • 13
  • 11
  • 11
  • 11
  • 8
  • 8
  • 8
  • 7
  • 7
  • 7
  • 7
  • 7
  • 7
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

Systèmes de compréhension et de traduction de la parole : vers une approche unifiée dans le cadre de la portabilité multilingue des systèmes de dialogue / Spoken language understanding and translation systems : a unified approach in a multilingual dialogue systems portability context

Jabaian, Bassam 04 December 2012 (has links)
La généralisation de l’usage des systèmes de dialogue homme-machine accroît la nécessité du développement rapide des différents composants de ces systèmes. Les systèmes de dialogue peuvent être conçus pour différents domaines d’application et dans des langues différentes. La nécessité d’une production rapide pour de nouvelles langues reste un problème ouvert et crucial auquel il est nécessaire d’apporter des solutions efficaces.Nos travaux s’intéressent particulièrement au module de compréhension de la parole et proposent des approches pour la portabilité rapide peu coûteuse de ce module.Les méthodes statistiques ont montré de bonnes performances pour concevoir les modules de compréhension de la parole pour l’étiquetage sémantique de tours de dialogue.Cependant ces méthodes nécessitent de larges corpus pour être apprises. La collecte de ces corpus est aussi coûteuse en temps et en expertise humaine.Dans cette thèse, nous proposons plusieurs approches pour porter un système de compréhension d’une langue vers une autre en utilisant les techniques de la traduction automatique. Les premiers travaux consistent à appliquer la traduction automatique à plusieurs niveaux du processus de portabilité du système de compréhension afin de réduire le coût lié à production de nouvelles données d’apprentissage. Les résultats expérimentaux montrent que l’utilisation de la traduction automatique permet d’obtenir des systèmes performant avec un minimum de contribution humaine.Cette thèse traite donc à la fois de la traduction automatique et de la compréhension de la parole. Nous avons effectué une comparaison approfondie entre les méthodes utilisées pour chacune des tâches et nous avons proposé un décodage conjoint basé sur une méthode discriminante qui à la fois traduit une phrase et lui attribue ses étiquettes sémantiques. Ce décodage est obtenu par une approche à base de graphe qui permet de composer un graphe de traduction avec un graphe de compréhension. Cette représentation peut être généralisée pour permettre des transmissions d’informations riches entre les composants du système de dialogue / The generalisation of human-machine dialogue system increases the need for a rapid development of the various components of these systems. Dialogue systems can be designed for different applications and in different languages. The need for a fast production of systems for new languages ​​is still an open and crucial issue which requires effective solutions. Our work is particularly interested in speech understanding module and propose approaches for language portability of this module. The statistical methods showed good performance to design modules for speech understanding. However, these methods require large corpora to be trained. The collection of these corpora is expensive in time and human expertise. In this thesis, we propose several approaches to port an understanding system from one language to another using machine translation techniques. The experimental results show that the use of machine translation allows to produce efficient systems with minimal human effort. This thesis addresses both machine translation and speech understanding domain. We conducted a comparison between the methods used for each task and we have proposed a joint decoding between translation and understanding based on a discriminant method. This decoding is achieved by a graph-based approach which allows to compose a translation graph with an understanding graph. This representation can be generalized to allow a rich transmission of information between the components of the dialogue system
22

Didactique du français langue seconde au Sénégal : le cas du français dans les établissements moyen et secondaire / Teaching French as a second language in Senegal : teaching and learning of French in college and secondary schools

Thiam, Ousseynou 13 June 2014 (has links)
Les réflexions sur le français au Sénégal sont souvent envisagées dans une perspective historique, sociolinguistique ou pédagogique. L'orientation de cette thèse est plutôt didactique. Son objectif est d'analyser l'enseignement /apprentissage du français dans les établissements moyen et secondaire. La recherche porte sur une problématique spécifique à un système institutionnel qui vise la maîtrise du français comme en situation de LM dans un cadre où cet idiome est LS. Cette attente de l'institution permet-elle une activité enseignante et une appropriation convenables de la langue, des cultures? La réponse a nécessité l'élucidation des concepts de savoir, de savoir-faire, de compétence, de langue, de culture. Nous avons caractérisé les objets, les outils, les contenus et les méthodes fondamentales. Cela dans un contexte où les biographies langagières et culturelles des apprenants se définissent par des statuts plurilingues et pluriculturels. La transposition didactique et l'action conjointe sont étudiées pour décrire les activités de classe et la circulation des savoirs. Ce travail a privilégié une approche ethnographique avec des vidéographies, des entretiens, des autoconfrontations et un recueil de productions écrites. L'analyse des résultats de cette étude empirique est présentée suivant les savoirs, les enseignants et les apprenants. Elle a vérifié l'idée que la didactique du français langue seconde permet d'élaborer des savoirs linguistiques et culturels adaptés au contexte sénégalais, de pallier les difficultés dans l'activité enseignante et de faire des apprenants les acteurs de leur apprentissage. Cette analyse est complétée par des propositions didactiques. / Reflexions on French language in Senegal are often considered from a historical, sociolinguistical or educational perspective. The orientation of this thesis is rather didactic. Its aim is to analyze the Teaching/Learning of French in college and secondary schools. The research deals with a specific problematic for an institutional system which aims at the mastery of French as a native language when this idiom is a second language. Does this expectation from the institution allow for an effective teaching activity an appropriation of the language, of the school culture and of the anthropological culture? The answer to this question has required the elucidation of the concepts of knowledge, know-how, skill, language, culture. We have characterized objects, tools, contents, and fundamental methods for teaching and learning. That, in a context where the language biographies and cultural identities of the learners are defined by multilingual and multicultural status. Didactic transposition and joint action are studied to describe teaching activities and the circulation of knowledge. This work has priviledged an ethnographical approach with videographs of classes, interviews, selfconfrontations, and a collection of written productions. The analysis of the results from this empirical study is presented around three poles: skills, teachers and learners. Eventually, it has confirmed the idea that the didactics of french as a second language helps to elaborate linguistic and cultural skills adapted to the Senegalese context, to overcome difficulties in teaching activity, to make learners the actors of their learning. This analysis is completed with didactic suggestions.
23

Contribution au catalogage dynamique des manuscrits arabes anciens numérisés / Contribution to dynamic cataloguing of the old Arabic digitized-manuscripts

Soualah, Mohamed 27 November 2015 (has links)
Les manuscrits arabes sont une source d'information inestimable. Trois millions de ces œuvres se trouvent éparpillées à travers le monde. Une prise de conscience réelle sur la préservation de ces œuvres s'est vue naître, ces dernières années, à travers le monde. Beaucoup de projets de numérisation de manuscrits arabes anciens ont été mis en œuvre. Mais, la numérisation est-elle suffisante ? Le véritable but recherché est une diffusion de masse, car rien n'est mieux préservé qu'une ressource partagée. Toutefois, il faut y trouver un moyen d'y accéder facilement. Les bibliothèques sont les lieux de prédilection de sauvegarde et de rangement de manuscrits. Elles ont développé un outil d'accès aux manuscrits qu'elles ont toujours maîtrisé et convenablement mis en œuvre ; il s'agit du catalogue, un support d'utilisation simple et intuitif. Toutes ces œuvres se voient répertoriées selon des protocoles de catalogage non uniformisés, différents d'une institution à une autre, mais pour l'essentiel, utilisant des entrées standards (Auteur, titre de l'œuvre, Sujet). L'idée est de venir au secours du catalogueur qui peine à lui seul à cataloguer autant d'œuvres, sans oublier les différentes difficultés rencontrées tels que le type de calligraphie et l'état du manuscrit. Par conséquent, une autre question se pose à savoir, comment faudrait-il s'y prendre ? A ce niveau se dresse une problématique cruciale, qui consiste à trouver le meilleur moyen d'accès aux images des manuscrits numérisés. En effet, trois solutions d'accessibilité aux manuscrits numérisés sont possibles :• La première consiste en un accès aux manuscrits numérisés en mode image ; cela signifie l'exploitation directe de l'image du manuscrit numérisé par des outils d'indexation appropriés.• La seconde se donne pour objectif de convertir intégralement le manuscrit en texte, ce qui reviendrait à traiter le manuscrit numérisé comme un document texte ordinaire. Par conséquent, l'usage de la recherche d'information deviendra un outil incontournable.• La troisième solution fait appel à un outil efficace utilisé dans les bibliothèques. Il s'agit du catalogue. Le principe de cette solution est élémentaire. Il repose sur l'interrogation du catalogue. L'affichage du manuscrit répondant favorablement à une requête se fait suite au choix de l'utilisateur. Notre travail de recherche ne se positionne pas dans le choix de la meilleure solution parmi les trois sus-citées, nous nous donnons pour objectif de procéder à l'étude des trois modèles de solutions et de procéder à l'évaluation de chaque modèle pour l'optimisation de l'accès en ligne aux manuscrits arabes anciens numérisés... / Arabic manuscripts are a very important source of information. Three million of them are scattered throughout the world. Nowadays, a real awareness rises throughout the world to preserve the old manuscripts.Many digitization projects of old Arabic manuscripts were implemented. But, is this sufficient for the manuscripts preservation? The main goal is the massive diffusion of these resources, because nothing is better preserved than a shared resource. However, it is necessary to make them accessible.Libraries are the most suitable places for storing manuscripts. They have developed an interesting tool for the manuscripts online access: It is about a catalogue, a simple and intuitive user support.the whole of the manuscripts are listed throughout a non-standardized cataloging protocol, which differ from an institution to another, but most of them use standard entries like the "Author", "title" and "subject".The problematic is about finding a way how to help a cataloguer who struggle alone to catalog the manuscripts, which present several problems concerning their state and their calligraphy? Therefore, the answer will be about how to make it.Thus, first we are asked to find a best way to access images of the digitized Arabic manuscripts. Indeed, we can quote three methods to access digitized manuscripts:• The first one consists of accessing to manuscripts in image mode. This is done by images processing with using of suitable indexing tools.• The second one aim to fully convert the manuscript into a text mode, then the manuscript will be processed as textual document. Thus, the information retrieval will be used.• The third solution uses an effective library tool which is the catalogue. The principle of this solution is basic. First, the user makes his query to the catalogue. The latter displays the results, and then the user selects the suitable one.The goal of our research is not to make choice between these three methods to access to digitized manuscripts. Our objective is to use these methods, evaluate them in order to optimize the online access to digitized Arabic manuscripts......
24

Méthode et outils pour la création et l'évaluation automatiques de structures de bases lexicales multilingues (symétriques) à lexies et axies

Teeraparbseree, Aree 27 September 2005 (has links) (PDF)
Cette thèse aborde le problème de la structuration de bases lexicales multilingues (BDLM) en lexies et axies, à partir de ressources existantes. Ce travail est motivé par l'inadéquation des techniques existantes utilisées isolément, pour la structuration de BDLM.<br />Pour résoudre ce problème, la stratégie proposée est de composer des techniques existantes de désambiguïsation pour structurer semi-automatiquement des bases lexicales multilingues à lexies et acceptions interlingues. De plus, cette thèse propose une catégorisation des critères d'évaluation de la qualité des BDLM, ainsi que les mesures correspondantes.<br />Cette stratégie a été implémentée dans Jeminie, un système logiciel adaptable qui permet d'implémenter à la fois des méthodes de structuration de BDLM et des mesures de qualité, sous la forme de modules logiciels réutilisables.<br />Des compositions arbitraires de ces modules peuvent être définies par un lexicologue dans un langage de haut niveau d'abstraction, ce qui permet d'adapter facilement la structuration et l'évaluation de qualité en fonction des objectifs du lexicologue et des ressources disponibles sans nécessiter de connaissances en programmation.<br />L'intérêt de cette approche a été validé expérimentalement : la qualité des BDLM obtenues est meilleure par combinaison de techniques qu'avec chaque technique antérieure utilisée seule.
25

Etude de cas sociolinguistique et ethnographique de quatre familles indiennes immigrantes en Europe : pratiques lagagières et politiques linguistiques nationales et familiales

Haque, Shahzaman 03 July 2012 (has links) (PDF)
Ce travail de recherche s'inscrit dans une approche pluridisciplinaire - monographique, ethnographique et sociolinguistique avec une dimension longitudinale. Il tente de décrire de manière approfondie les pratiques linguistiques familiales de quatre familles indiennes immigrantes installées dans quatre pays européens : la France, la Suède, la Norvège et la Finlande. Cette étude cherche également à cerner les enjeux des politiques linguistiques familiales, domaine dans lequel peu de recherches ont été entreprises et qui, de ce fait, reste à développer. Par ailleurs, les idéologies et attitudes concernant les langues se traduisent dans les décisions prises par les chefs de la famille, les parents, qui privilégient l'apprentissage de telle ou telle langue, pour eux-mêmes et surtout pour les enfants. Au plan macro, la politique linguistique nationale de chacun des pays concernés par notre étude est évoquée, y compris celle de l'Inde, avec un centrage sur la politique linguistique éducative et les modalités d'enseignement des langues migrantes. Le plurilinguisme des participants est analysé avec la notion de répertoire multilingue au sein duquel les compétences langagières sont segmentées par domaine. Les notions d'espace, de contexte, de mobilité, d'échelle, de polycentralité et d'ordres d'indexicalité ont été convoquées pour pouvoir appréhender ces compétences. La transmission linguistique intergénérationnelle est abordée par le biais d'une analyse critique de la politique linguistique familiale et nationale ainsi que la question de l'incidence du legs des valeurs culturelles et linguistiques du pays d'origine (ou de son absence) sur la construction de l'identité de la deuxième génération.
26

Analyse contrastive français-japonais du discours en langue de spécialité - modalité et définition phrastique

Nakao, Yukie 02 July 2010 (has links) (PDF)
La langue de spécialité (LS) représentative des sciences et des techniques est la langue employée par les spécialistes d'un domaine. Son lexique, ses syntaxes et ses sémantiques sont souvent étudiés, contrairement au discours. Nous nous intéressons aux différents niveaux de spécialisation du discours qui caractérisent les utilisateurs de la LS : spécialistes et non-initiés, reflétés par la modalité et la définition terminologique. Notre analyse se porte sur le discours médical d'un corpus comparable français et japonais, contenant deux types de discours, scientifique et vulgarisé. Une analyse de la modalité permet d'examiner les variations de la spécialisation du point de vue de l'attitude du locuteur. Nous adaptons un modèle élaboré sur le français courant à la LS et le confrontons à la langue japonaise. Nous en tirons une typologie composée de groupes locutifs qui permet de caractériser les modalités dans le corpus. La définition terminologique joue un rôle central, lorsque les utilisateurs de la LS ne partagent pas le même niveau de connaissances. Nous déterminons une nouvelle typologie à partir des définitions dictionnairiques et phrastiques. Pour chaque catégorie, nous listons des marqueurs avant de mener une analyse qualitative et quantitative. Les deux langues et les deux types de discours sont différentiés au niveau des modalités en fonction de la fréquence et le contenu de celles-ci, et au niveau des définitions selon la distribution des catégories définitoires. Cette typologie pourra être utilisée pour constituer des ressources terminologiques ou mettre à jour des ressources existantes dans le cadre de travaux de veille scientifique.
27

Alignement lexical en corpus comparables : le cas des composés savants et des adjectifs relationnels

Harastani, Rima 10 February 2014 (has links) (PDF)
Notre travail concerne l'extraction automatique d'une liste de termes alignés avec leurs traductions (c'est-à-dire un lexique bilingue spécialisé) à partir d'un corpus comparable dans un domaine de spécialité. Un corpus comparable comprend des textes écrits dans deux langues différentes sans aucune relation de traduction entre eux mais dont les textes appartiennent à un même domaine. Les contributions de cette thèse portent sur l'amélioration de la qualité d'un lexique bilingue spécialisé extrait à partir d'un corpus comparable. Nous proposons des méthodes consacrées à la traduction de deux types de termes, qui ont des caractéristiques en commun entre plusieurs langues ou qui posent par leur nature des problèmes pour la traduction : les composés savants (termes contenant au moins une racine gréco-latine) et les termes composés d'un nom et un adjectif relationnel. Nous développons également une méthode, qui exploite des contextes riches en termes spécifiques au domaine du corpus, pour réordonner dans un lexique bilingue spécialisé des traductions candidates fournies pour un terme. Les expériences sont réalisées en utilisant deux corpus comparables spécialisés (dans les domaines du cancer du sein et des énergies renouvelables), sur les langues français, anglais, allemand et espagnol.
28

Les gestes professionnels d’adaptation linguistique en contexte multilingue : le cas des professeurs des écoles dans leur gestion de l’hétérogénéité des élèves en langue de scolarisation / Professional skills of linguistic adaptation in a multilingual context : the case of primary school teachers in their management of the heterogeneity of students in the language of instruction

Zougs, Muriel 01 December 2017 (has links)
Notre recherche porte sur l’analyse comparative de ce que nous appelons les Gestes Professionnels d’Adaptation Linguistique (GPAL), dans l'Enseignement d'une Matière Intégré à une Langue Étrangère (EMILE), à l’œuvre en France, notamment dans les sections internationales du primaire. Son but est de comprendre comment les professeurs des écoles exerçant en contexte multilingue s’adaptent à l’hétérogénéité des élèves en Langue de Scolarisation (LSco). Le terrain de notre étude est constitué de classes ordinaires (enseignement en français et section anglaise) et de groupes de français langue étrangère et d’anglais langue seconde, des écoles maternelle et élémentaire d’un établissement international public de la région PACA. À travers une approche comparative, nous cherchons à comprendre dans quelle mesure le statut de la LSco (vernaculaire ou véhiculaire), l'âge des élèves et le degré d’hétérogénéité linguistique, influencent les GPAL utilisés par les enseignants. Pour chacun de ces trois facteurs nous comparons deux séances de classe ordinaire et deux séances des dispositifs d’aide à l'apprentissage des LSco, pour dégager également l’impact du type d’enseignement (ordinaire ou spécialisé) sur le recours des professeurs aux GPAL. Nous comparons le nombre, les catégories et les types de GPAL utilisés par les enseignants, mais aussi les formes qu’ils prennent à travers les ‘préoccupations des enseignants structurant le milieu didactique’ (Bucheton, 2011), les moments où les professeurs y ont recours via ‘le quadruplet de la structure de l’action de l’enseignant’ (Sensevy & Mercier, 2007) et les buts qu’ils poursuivent en y faisant appel en fonction des ‘4 Cs’ (Coyle, 2002). / Our research is based on a comparative analysis of what we call the Professional Skills of Linguistic Adaptation (PSLA) in Content and Language Integrated Learning (CLIL) employed in France, and in particular, in international sections at primary school. It is aimed at understanding how primary school teachers, working in a multilingual context, adapt themselves to pupils’ heterogeneity in the language of instruction. Our study focuses on ordinary classes (classes taught in French and English section classes) and groups of French as a foreign language and English as a second language, in the nursery and elementary schools of a state-run International School in PACA. Through a comparative approach, we wish to understand how the status of the language of instruction (vernacular or vehicular), the pupils’ ages and the level of linguistic heterogeneity influence the PSLA teachers use. For each of these three factors, we compare two sessions in ordinary classes and two sessions conducted in support schemes aimed at facilitating pupils’ integration to the language of instruction, in order to illustrate also the impact of the type of teaching (ordinary or specialised) on the primary school teachers’ use of PSLA. We compare the number, category and type of PSLA used by teachers and also the forms they take through “the teachers’ concerns structuring the didactic environment” (Bucheton, 2011), the instances when teachers employ them through “the quadruplet of the structure of the teacher's action” (Sensevy & Mercier, 2007), and for what purposes through the “4 Cs” (Coyle, 2002).
29

Identidade, língua e cultura: usos sociais e políticos do Nheengatu na comunidade indígena do Cartucho, no Médio Rio Negro AM

Pinheiro, Aquiles Santos 25 October 2011 (has links)
Made available in DSpace on 2015-04-11T13:59:44Z (GMT). No. of bitstreams: 1 Aquiles.pdf: 2865786 bytes, checksum: bfa275e310f2a56655c0188f135cedd3 (MD5) Previous issue date: 2011-10-25 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Taking language as a cultural diacritic and as mark of ethnic identity, I develop in this text, an argument that seeks to establish a relationship between identity, language and culture. The focus of the approach is oriented for the empirical context of the emergence of new collective identities indigenous. The objective is to demonstrate the processes of reconstruction of ethnic identity from the handling and/or mobilization of the diacritic signs that can be used to demarcate the "ethnic boundaries" of a culture. The analysis covers the empirical context of the middle Rio Negro region, more specifically the Cartucho indigenous community, located on the island of Wabada in the Middle Rio Negro Indigenous Lands II - AM. From this perspective, the object of study the research present are the social and political uses of language General Amazon (the Nheengatu) that derives historically the Tupinamba and was adopted as the franca language during the colonial period establishing the communication and social interaction between indigenous and non-indigenous. Currently, this language is still spoken in the entire region of Rio Negro and is used by many people as an instrument of ethnic identity affirmation, as observed among The Bare, whose original language is no longer spoken. The choice of the Indigenous Land Middle Rio Negro - II is due to cultural and linguistic diversity existing in this region. The main reason given in the anthropological literature for the maintenance of this multiethnic complex is the persistence of linguistic exogamy and patrilocal residence, i.e. in this region men usually marry women who speak a language different from yours. In such circumstances, children grow up speaking two languages. However, the language that identifies the person, the village and the ethnic group is mainly the language of the father and not the language of the linguistic group of the mother. Indeed, they are speakers that dominate three or more languages which are spoken in daily life and in the family. These native language speakers are still to able understand other indigenous languages spoken in the community, as well as Portuguese, but between them they speak predominantly Nheengatu. This scenario presents itself as the ideal for the study of social and political uses of Nheengatu due to be a context of bi-and multilingualism. The initial question is to know the reasons why certain languages are spoken or not, depending on the social context or situations of collective communication and social interaction, circumstantial or otherwise, in that speakers are in concrete achievements in domains social of language. The hypothesis that guiding this research is a that the Nheengatu was consolidated as a franca language, and for this reason, became the instrument that enables communication and social interaction, serving as a inter-ethnics mediator in the region of and even more, has established itself as the native language or traditional language, that has been adopted by various ethnic groups who have lost their native tongues, as is the case the Bare people. The method adopted for carrying out the fieldwork research was participant observation. Data collection was performed by authorized recordings of individual interviews and collective, that is, in speech in public meetings of the Association of Indigenous Communities and Riparian - ACIR, as well as social events, sports and cultural community. / Tomando a linguagem como um diacrítico cultural e como marca da identidade étnica, desenvolvo neste texto, um argumento que busca estabelecer uma relação entre linguagem, identidade e cultura. O foco da abordagem é orientada para o contexto empírico da emergência de novas identidades coletivas indígenas. O objetivo é demonstrar os processos de reconstrução da identidade étnica a partir da manipulação e/ou mobilização dos sinais diacríticos que podem ser usados para demarcar as fronteiras étnicas de uma cultura. A análise abrange o contexto empírico da região do Médio do Rio Negro, mais especificamente a comunidade indígena do Cartucho, localizada na ilha de Wabada nas Terras Indígenas Médio Rio Negro II - AM. A partir desta perspectiva, o objeto de estudo do presente pesquisa são os usos sociais e políticos da Língua Geral Amazônica (o Nheengatu) que deriva historicamente o Tupinambá e foi adotado como a língua franca durante o período colonial que institui a comunicação ea interação social entre indígenas e não-indígenas. Atualmente, essa língua ainda é falada em toda a região do Rio Negro e é usado por muitas pessoas como um instrumento de afirmação da identidade étnica, como observado entre os Baré, cuja língua original não é mais falada. A escolha da Terra Indígena Médio Rio Negro - II é devido à diversidade cultural e linguística existente nesta região. A principal razão apontada na literatura antropológica para a manutenção deste complexo multi-étnico é a persistência da exogamia linguística e residência patrilocal, ou seja, nesta região os homens geralmente se casam com mulheres que falam uma língua diferente da sua. Em tais circunstâncias, as crianças crescem falando dois idiomas. No entanto, a linguagem que identifica a pessoa, a aldeia e o grupo étnico é, principalmente, a linguagem do pai e não o idioma do grupo linguístico da mãe. Na verdade, eles são falantes que dominam três ou mais línguas que são faladas na vida diária e na família. Estes falantes nativos ainda são capazes de compreender outras línguas indígenas faladas na comunidade, bem como o Português, mas entre eles, falam predominantemente o Nheengatu. Este cenário apresenta-se como a ideal para o estudo dos usos sociais e políticos do Nheengatu, devido a ser um contexto de bi-e multilinguismo. A pergunta inicial é conhecer as razões pelas quais certas línguas são faladas ou não, dependendo do contexto social ou situações de comunicação coletiva e a interação social, circunstancial ou não, em que os falantes estão em realizações concretas nos domínios sociais da linguagem. A hipótese que norteiam esta pesquisa é que o Nheengatu consolidou-se como uma língua franca, e por esta razão, tornou-se o instrumento que permite a comunicação e interação social, servindo como mediador inter-étnico na região e, mais que isso, estabeleceu -se como a língua materna ou tradicional, e tem sido adotada por vários grupos étnicos que perderam suas línguas nativas, como é o caso do povo Baré. O método adotado para a realização da pesquisa de campo foi a observação participante. A coleta de dados foi realizada por gravações autorizadas de entrevistas individuais e coletivas, isto é, em discurso em reuniões públicas da Associação das Comunidades Indígenas e Ribeirinhas - ACIR, bem como eventos sociais, desportivos e da comunidade cultural.
30

Approche de recherche intelligente fondée sur le modèle des Topic Maps : application au domaine de la construction durable / An Intelligent Research Approach based on Topic Map Model

Ellouze, Nebrasse 03 December 2010 (has links)
Cette thèse aborde les problématiques liées à la construction de Topic Maps et à leur utilisation pour la recherche d’information dans le cadre défini par le Web sémantique (WS). Le WS a pour objectif de structurer les informations disponibles sur le Web. Pour cela, les ressources doivent être sémantiquement étiquetées par des métadonnées afin de permettre d'optimiser l'accès à ces ressources. Ces métadonnées sont actuellement spécifiées à l'aide des deux standards qui utilisent le langage XML : RDF et les Topic Maps. Un contenu à organiser étant très souvent volumineux et sujet à enrichissement perpétuel, il est pratiquement impossible d’envisager une création et gestion d’une Topic Map, le décrivant, de façon manuelle. Plusieurs travaux de recherche ont concerné la construction de Topic Maps à partir de documents textuels [Ellouze et al. 2008a]. Cependant, aucune d’elles ne permet de traiter un contenu multilingue. De plus, bien que les Topic Maps soient, par définition, orientées utilisation (recherche d’information), peu d’entre elles prennent en compte les requêtes des utilisateurs.Dans le cadre de cette thèse, nous avons donc conçu une approche que nous avons nommée ACTOM pour « Approche de Construction d’une TOpic Map Multilingue ». Cette dernière sert à organiser un contenu multilingue composé de documents textuels. Elle a pour avantage de faciliter la recherche d’information dans ce contenu. Notre approche est incrémentale et évolutive, elle est basée sur un processus automatisé, qui prend en compte des documents multilingues et l’évolution de la Topic Map selon le changement du contenu en entrée et l’usage de la Topic Map. Elle prend comme entrée un référentiel de documents que nous construisons suite à la segmentation thématique et à l’indexation sémantique de ces documents et un thésaurus du domaine pour l’ajout de liens ontologiques. Pour enrichir la Topic Map, nous nous basons sur deux ontologies générales et nous explorons toutes les questions potentielles relatives aux documents sources. Dans ACTOM, en plus des liens d’occurrences reliant un Topic à ses ressources, nous catégorisons les liens en deux catégories: (a) les liens ontologiques et (b) les liens d’usage. Nous proposons également d’étendre le modèle des Topic Maps défini par l’ISO en rajoutant aux caractéristiques d’un Topic des méta-propriétés servant à mesurer la pertinence des Topics plus précisément pour l’évaluation de la qualité et l’élagage dynamique de la Topic Map. / The research work in this thesis is related to Topic Map construction and their use in semantic annotation of web resources in order to help users find relevant information in these resources. The amount of information sources available today is very huge and continuously increasing, for that, it is impossible to create and maintain manually a Topic Map to represent and organize all these information. Many Topic Maps building approaches can be found in the literature [Ellouze et al. 2008a]. However, none of these approaches takes as input multilingual document content. In addition, although Topic Maps are basically dedicated to users navigation and information search, no one approach takes into consideration users requests in the Topic Map building process. In this context, we have proposed ACTOM, a Topic Map building approach based on an automated process taking into account multilingual documents and Topic Map evolution according to content and usage changes. To enrich the Topic Map, we are based on a domain thesaurus and we propose also to explore all potential questions related to source documents in order to represent usage in the Topic Map. In our approach, we extend the Topic Map model that already exists by defining the usage links and a list of meta-properties associated to each Topic, these meta-properties are used in the Topic Map pruning process. In our approach ACTOM, we propose also to precise and enrich semantics of Topic Map links so, except occurrences links between Topics and resources, we classify Topic Map links in two different classes, those that we have called “ontological links” and those that we have named “usage links”.

Page generated in 0.0535 seconds