• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 3
  • 1
  • Tagged with
  • 4
  • 4
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Spécification et réalisation d'un formalisme générique pour la segmentation multiple de documents textuels multilingues

Quint, Julien 18 November 2002 (has links) (PDF)
Le problème de la segmentation en mots, ou itémisation, est souvent considéré comme trivial grâce à la présence de séparateurs dans l'écriture. L'essor de l'Internet et surtout du Web a rendu disponibles des millions de documents dans une multitude de langues et généré un intérêt pour les applications multilingues, qui ont rapidement montré les limites des approches simplistes en vigueur jusqu'à présent. L'étude, d'une part, des systèmes d'analyse morphologiques (en particulier les formalismes fondés sur les états finis), et d'autre part, des applications spécialisées pour l'itémisation dans différentes langues réputées difficiles (japonais, chinois, thaï) mène à des observations contrastées. La notion même de mot, et donc le processus d'itémisation, varie grandement d'une langue à l'autre ; et s'il n'existe pas de méthode générique, surtout en l'absence de séparateurs entre les mots, des approches similaires sont employées par différents systèmes pour différentes langues. On propose de se placer au dessus de l'itémisation et de parler de segmentation de texte en général. On introduit un langage spécialisé pour la segmentation nommé Sumo (Segmentation Universelle Multiple par Ordinateur) dont la principale caractéristique est d'offrir une séparation claire entre le processus de segmentation et la ou les langues considérées. On a donc d'une part une structure de donnée dédiée, qui représente un document simultanément à différents niveaux de segmentation (en mots, en phrases, etc.) À chaque niveau correspond un graphe d'items, les unités de segmentation à ce niveau. Cette structure à étages est fondée sur les automates d'états finis pondérés. D'autre part, on définit une algèbre pour la manipulation de ces structures, comme il en existe une pour la manipulation d'automates d'états finis. En plus de cette algèbre, on dispose également d'un langage de contrôle permettant de construire des applications de segmentation sophistiquées. Un prototype expérimental de calcul à états finis pondéré réalisé en Perl est présenté, et la réalisation d'un système complet, efficace et robuste est discuté. Les applications actuelles et potentielles de Sumo sont présentées, ainsi que les perspectives de développements à venir.
2

Norme(s) et usage(s) langagiers : le cas des communications pilote-contrôleur en anglais

Lopez, Stéphanie 20 September 2013 (has links) (PDF)
Dans cette thèse, nous menons une réflexion sur les notions de norme(s) et d'usage(s) langagiers dans le cadre du domaine du contrôle aérien. Ce domaine offre l'exemple parfait de la mise en œuvre d'une norme langagière : la "phraséologie" aéronautique, le langage opératif censé permettre des communications sûres et efficaces entre pilotes et contrôleurs, lors des situations les plus courantes. Lorsque la phraséologie ne suffit pas, ces derniers ont recours à une forme langagière plus naturelle, le "plain language". De nombreux problèmes relatifs à la mise en œuvre de ce dernier ont rapidement vu le jour et ont suscité des interrogations, notamment chez les professionnels de l'enseignement de l'anglais de l'aviation. Pour répondre aux besoins spécifiques de l'ENAC, cette thèse dresse un panorama des usages faits de la langue anglaise par les contrôleurs français et les pilotes étrangers lors de leurs communications radiotéléphoniques. Notre méthode d'analyse consiste en une étude comparative entre un corpus de référence, représentant la norme, et un corpus de communications réelles, représentant les usages. Cette analyse comparative nous permet de repérer, de décrire et de catégoriser les formes langagières employées lors de situations routinières de la navigation aérienne. Certaines différences sont ainsi repérées entre les deux corpus. En fonction de la situation, les pilotes et les contrôleurs peuvent procéder à des variations d'ordre lexical, sémantique, syntaxique et discursif. Alors que certains semblent subir l'influence de la langue naturelle, d'autres semblent mettre en œuvre une stratégie communicationnelle pour tenter d'"humaniser" ou de modaliser le contenu de leurs messages.
3

Norme(s) et usage(s) langagiers : le cas des communications pilote-contrôleur en anglais / Linguistic norm(s) and use : a case study of pilot-controller communications

Lopez, Stéphanie 20 September 2013 (has links)
Dans cette thèse, nous menons une réflexion sur les notions de norme(s) et d’usage(s) langagiers dans le cadre du domaine du contrôle aérien. Ce domaine offre l’exemple parfait de la mise en œuvre d’une norme langagière : la "phraséologie" aéronautique, le langage opératif censé permettre des communications sûres et efficaces entre pilotes et contrôleurs, lors des situations les plus courantes. Lorsque la phraséologie ne suffit pas, ces derniers ont recours à une forme langagière plus naturelle, le "plain language". De nombreux problèmes relatifs à la mise en œuvre de ce dernier ont rapidement vu le jour et ont suscité des interrogations, notamment chez les professionnels de l’enseignement de l’anglais de l’aviation. Pour répondre aux besoins spécifiques de l’ENAC, cette thèse dresse un panorama des usages faits de la langue anglaise par les contrôleurs français et les pilotes étrangers lors de leurs communications radiotéléphoniques. Notre méthode d’analyse consiste en une étude comparative entre un corpus de référence, représentant la norme, et un corpus de communications réelles, représentant les usages. Cette analyse comparative nous permet de repérer, de décrire et de catégoriser les formes langagières employées lors de situations routinières de la navigation aérienne. Certaines différences sont ainsi repérées entre les deux corpus. En fonction de la situation, les pilotes et les contrôleurs peuvent procéder à des variations d’ordre lexical, sémantique, syntaxique et discursif. Alors que certains semblent subir l’influence de la langue naturelle, d’autres semblent mettre en œuvre une stratégie communicationnelle pour tenter d’"humaniser" ou de modaliser le contenu de leurs messages. / This thesis is a reflection upon the notions of linguistic norm(s) and usage(s) within the domain of Air Traffic Control. This domain provides a prime example of an established linguistic norm: that of “phraseology”, the controlled language used between pilots and controllers to optimise and secure their most frequent communications. If pilots and controllers do not speak the same language, the phraseology used is then based on English. Whenever the limits of phraseology are reached, pilots and controllers revert to a more natural form of language which has only recently been described in this domain: plain language. However, several problems relating to the implementation of plain language and phraseology have been identified by professional Aviation English teachers. To meet the needs of the French civil aviation university (ENAC), a survey of the different uses of the English language by French controllers and international pilots is presented. The method of analysis consists in a comparative study between two corpora: one representing the prescribed norm and the other corresponding to real pilot-controller communications. This comparative analysis allows the description and categorization of the different types of languages used on the frequency in air navigation typical situations. Some differences are found between the two corpora. Depending on the situation, pilots and controllers’ messages can indeed vary from a lexical, semantic or syntactic and discursive point of view. Some variations reflect the influence of natural language on the speakers while others can be considered as a strategy to “humanise” radiotelephony communications.
4

Conception dirigée par les modèles à l’aide de langages de modélisation hétérogènes : application aux profils UML / Model-driven engineering using heterogeneous modeling languages : application to UML profiles

Noyrit, Florian 25 October 2012 (has links)
Les divers intervenants qui décrivent, étudient et réalisent un système complexe ont besoin de points de vue adaptés à leurs préoccupations. Cependant, dans le contexte de l’Ingénierie Dirigée par les Modèles, les moyens pour définir et mettre en œuvre ces points de vue sont, soit trop rigides et inadaptées, soit totalement ad hoc. De plus, ces différents points de vue sont rarement indépendants les uns des autres. Dès lors, il faut s’attacher à identifier puis décrire les liens/les correspondances qui existent entre les points de vue pour enfin pouvoir vérifier que les réponses apportées par les différents intervenants constituent un tout cohérent.Les travaux exposés dans cette thèse permettent la définition de langages dédiés basés sur UML pour les points de vue. Pour cela, une méthode outillée qui analyse la sémantique des descriptions textuelles des concepts du domaine que l’on souhaite projeter sur UML est proposée afin de faciliter la définition de profils UML. Les résultats obtenus sur les cas d’études concrets étudiés sont encourageants et dépassent les résultats des outils existants. Pour définir des points de vue basés sur des profils UML, cette thèse propose une méthode qui permet au méthodologiste d’expliciter le point de vue voulu. Un outil génère ensuite l’outillage qui met en œuvre ce point de vue dans un environnement de modélisation ainsi que le langage dédié correspondant là où la pratique actuelle repose sur une mise en œuvre essentiellement manuelle.Pour assister l’identification des liens entre points de vue, cette thèse propose là aussi d’analyser la sémantique des descriptions textuelles des concepts des langages utilisés par les points de vue. Utilisée en complément des heuristiques syntaxiques existantes, l’approche proposée permet d’obtenir de bons résultats lorsque les terminologies des langages analysés sont éloignées. Un cadre théorique basé sur la théorie des catégories est proposé pour expliciter formellement les correspondances. Pour utiliser ce cadre, une catégorie pour les langages basés sur UML a été proposée. Afin de pouvoir également expliciter les correspondances entre les modèles issus de ces langages, la catégorie des ontologies OWL est utilisée. Une solution est proposée pour caractériser des correspondances plus complexes que la simple équivalence. Ce cadre théorique permet la définition formelle de relations complexes qui permettront de raisonner sur la cohérence de la description de l’architecture. Une fois la description de l’architecture intégrée en un tout en suivant les correspondances formalisées, la question de la cohérence est abordée. Les expérimentations faites sur un cas d’étude concret pour vérifier la cohérence à un niveau syntaxique donnent des résultats pratiques satisfaisants. Les expérimentations menées sur le même cas pour vérifier la cohérence à un niveau sémantique ne donnent pas de résultats pratiques satisfaisants. / The various stakeholders who describe study and implement a complex system require viewpoints that are dedicated to their concerns. However, in the context of Model-Driven Engineering, approaches to define and implement those viewpoints are either too rigid and inappropriate or completely ad hoc. In addition, those various viewpoints are rarely independent from each other. Therefore, we must strive to identify and describe the relationships/correspondences between the viewpoints in order to be able to verify that the parts of the solution given by the various stakeholders form a consistent whole.The work presented in this thesis provides a way to define dedicated languages based on UML for the viewpoints. For this, a method that analyzes the semantics of the textual descriptions of the concepts of the domain we want to map to UML has been implemented to facilitate the definition of UML profiles. The results we get on the concrete test cases we considered are encouraging and go beyond results of existing tools. To define a viewpoint based on some UML profiles, this thesis provides a method that lets the methodologist make explicit the viewpoint he/she wants. A tool can then generate the tooling that implements this viewpoint in a modeling environment together with the corresponding dedicated language while current practice is based on an implementation essentially manual.To assist the identification of relationships between the viewpoints, this thesis proposes again to analyze the semantics of textual descriptions of concepts of the languages used by the viewpoints. Used in combination with existing syntactic heuristics, the proposed approach provides good results when the terminologies of the languages that are analyzed are far apart. A theoretical framework based on category theory is provided to make explicit formally correspondences. To use this framework, a category for languages based on UML has been proposed. To be able to make explicit the correspondences between the models of those languages as well, the category of OWL ontologies is used. A solution is proposed to characterize correspondences that are more complex than the simple equivalence relationship. This theoretical framework provides a way to define formally complex relationships that can be used to verify the consistency of the architectural description. Once the description of the architecture has been integrated according to the formal correspondences, the issue of consistency is considered. The experiments carried out on a concrete test case to verify consistency on a syntactic perspective give satisfactory practical results. The experiments carried on the same test case to verify consistency on a semantic perspective don’t give satisfactory practical results.

Page generated in 0.0683 seconds