Global ETD Search

1	Discourse analysis of arabic documents and application to automatic summarization / Analyse discursive des documents arbes et applications au résumé automatique Keskes, Iskandar 11 May 2015 (has links) Dans un discours, les textes et les conversations ne sont pas seulement une juxtaposition de mots et de phrases. Ils sont plutôt organisés en une structure dans laquelle des unités de discours sont liées les unes aux autres de manière à assurer à la fois la cohérence et la cohésion du discours. La structure du discours a montré son utilité dans de nombreuses applications TALN, y compris la traduction automatique, la génération de texte et le résumé automatique. L'utilité du discours dans les applications TALN dépend principalement de la disponibilité d'un analyseur de discours performant. Pour aider à construire ces analyseurs et à améliorer leurs performances, plusieurs ressources ont été annotées manuellement par des informations de discours dans des différents cadres théoriques. La plupart des ressources disponibles sont en anglais. Récemment, plusieurs efforts ont été entrepris pour développer des ressources discursives pour d'autres langues telles que le chinois, l'allemand, le turc, l'espagnol et le hindi. Néanmoins, l'analyse de discours en arabe standard moderne (MSA) a reçu moins d'attention malgré le fait que MSA est une langue de plus de 422 millions de locuteurs dans 22 pays. Le sujet de thèse s'intègre dans le cadre du traitement automatique de la langue arabe, plus particulièrement, l'analyse de discours de textes arabes. Cette thèse a pour but d'étudier l'apport de l'analyse sémantique et discursive pour la génération de résumé automatique de documents en langue arabe. Pour atteindre cet objectif, nous proposons d'étudier la théorie de la représentation discursive segmentée (SDRT) qui propose un cadre logique pour la représentation sémantique de phrases ainsi qu'une représentation graphique de la structure du texte où les relations de discours sont de nature sémantique plutôt qu'intentionnelle. Cette théorie a été étudiée pour l'anglais, le français et l'allemand mais jamais pour la langue arabe. Notre objectif est alors d'adapter la SDRT à la spécificité de la langue arabe afin d'analyser sémantiquement un texte pour générer un résumé automatique. Nos principales contributions sont les suivantes : Une étude de la faisabilité de la construction d'une structure de discours récursive et complète de textes arabes. En particulier, nous proposons : Un schéma d'annotation qui couvre la totalité d'un texte arabe, dans lequel chaque constituant est lié à d'autres constituants. Un document est alors représenté par un graphe acyclique orienté qui capture les relations explicites et les relations implicites ainsi que des phénomènes de discours complexes, tels que l'attachement, la longue distance du discours pop-ups et les dépendances croisées. Une nouvelle hiérarchie des relations de discours. Nous étudions les relations rhétoriques d'un point de vue sémantique en se concentrant sur leurs effets sémantiques et non pas sur la façon dont elles sont déclenchées par des connecteurs de discours, qui sont souvent ambigües en arabe. o une analyse quantitative (en termes de connecteurs de discours, de fréquences de relations, de proportion de relations implicites, etc.) et une analyse qualitative (accord inter-annotateurs et analyse des erreurs) de la campagne d'annotation. Un outil d'analyse de discours où nous étudions à la fois la segmentation automatique de textes arabes en unités de discours minimales et l'identification automatique des relations explicites et implicites du discours. L'utilisation de notre outil pour résumer des textes arabes. Nous comparons la représentation de discours en graphes et en arbres pour la production de résumés. / Within a discourse, texts and conversations are not just a juxtaposition of words and sentences. They are rather organized in a structure in which discourse units are related to each other so as to ensure both discourse coherence and cohesion. Discourse structure has shown to be useful in many NLP applications including machine translation, natural language generation and language technology in general. The usefulness of discourse in NLP applications mainly depends on the availability of powerful discourse parsers. To build such parsers and improve their performances, several resources have been manually annotated with discourse information within different theoretical frameworks. Most available resources are in English. Recently, several efforts have been undertaken to develop manually annotated discourse information for other languages such as Chinese, German, Turkish, Spanish and Hindi. Surprisingly, discourse processing in Modern Standard Arabic (MSA) has received less attention despite the fact that MSA is a language with more than 422 million speakers in 22 countries. Computational processing of Arabic language has received a great attention in the literature for over twenty years. Several resources and tools have been built to deal with Arabic non concatenative morphology and Arabic syntax going from shallow to deep parsing. However, the field is still very vacant at the layer of discourse. As far as we know, the sole effort towards Arabic discourse processing was done in the Leeds Arabic Discourse Treebank that extends the Penn Discourse TreeBank model to MSA. In this thesis, we propose to go beyond the annotation of explicit relations that link adjacent units, by completely specifying the semantic scope of each discourse relation, making transparent an interpretation of the text that takes into account the semantic effects of discourse relations. In particular, we propose the first effort towards a semantically driven approach of Arabic texts following the Segmented Discourse Representation Theory (SDRT). Our main contributions are: A study of the feasibility of building a recursive and complete discourse structures of Arabic texts. In particular, we propose: An annotation scheme for the full discourse coverage of Arabic texts, in which each constituent is linked to other constituents. A document is then represented by an oriented acyclic graph, which captures explicit and implicit relations as well as complex discourse phenomena, such as long-distance attachments, long-distance discourse pop-ups and crossed dependencies. A novel discourse relation hierarchy. We study the rhetorical relations from a semantic point of view by focusing on their effect on meaning and not on how they are lexically triggered by discourse connectives that are often ambiguous, especially in Arabic. A thorough quantitative analysis (in terms of discourse connectives, relation frequencies, proportion of implicit relations, etc.) and qualitative analysis (inter-annotator agreements and error analysis) of the annotation campaign. An automatic discourse parser where we investigate both automatic segmentation of Arabic texts into elementary discourse units and automatic identification of explicit and implicit Arabic discourse relations. An application of our discourse parser to Arabic text summarization. We compare tree-based vs. graph-based discourse representations for producing indicative summaries and show that the full discourse coverage of a document is definitively a plus. Analyse de discours Langue arabe SDRT Relations de discours
2	La subordonnée participiale au participe passé en Français : de la phrase au discours / Participial subordinate clause : from sentence to discourse Abdoulhamid, Ali 10 February 2009 (has links) L’intégration du contexte dans l’analyse de la subordonnée participiale au participe passé permet d’établir plusieurs catégories de cette construction, selon qu’elle est employée seule, qu’elle contient un marqueur temporel ou l’auxiliaire étant. Lorsqu’elle n’a pas ces éléments, la construction est toujours en relation de coréférence événementielle avec son contexte d’apparition. Elle est toujours composée de verbe résultatif, borné à gauche et à droite, et est séparée de la proposition qui l’héberge par un intervalle. Deux types de constructions participiales se dégagent de cette catégorie. La première n’apporte aucune information nouvelle dans le discours. Elle indique une Généralisation du contexte antérieur et est en relation de Consécutivité avec la proposition qui l’héberge. Elle peut être un connecteur ou un introducteur de cadre temporel. La seconde est rhématique par l’aspect de son procès. C’est une Particularisation du contexte antérieur qui est souvent en relation de Narration avec la PH. La construction qui contient un marqueur temporel se rapproche de celle qui n’en a pas dans plusieurs aspects. Mais elle diffère de celle-ci parce que le marqueur peut servir à conférer au participe le caractère résultatif s’il n’en a pas, ou une autonomie syntaxique. En ce qui concerne celle qui est composée de l’auxiliaire étant, elle se distingue des deux autres dans plusieurs angles. D’abord, si elle est contextuelle, son procès est souvent distinct de celui de son contexte d’apparition. Ensuite, théoriquement, elle peut contenir n’importe quel participe passé, avec un procès borné seulement à droite, mais pas à gauche. Enfin, elle entretient avec ce contexte et avec la proposition qui l’héberge plusieurs types de relations de discours qu’on ne peut avoir avec les autres types de subordonnées participiales. / The typology of French subordinate participial clauses studied here is grounded in their context, which is shown to partially determine their distribution (‘pure’ or naked, introduced by a temporal adverbial, or yet containing the auxiliary étant ‘being’). When naked, the clause always entertains a relationship of coreference with the events denoted in the preceding context, and its verb is resultative, yielding a temporal interval between the two eventualities. In some cases, the participial clause does not introduce any new information : it simply generalises the contents of the (not necessarily immediately) preceding sentence, indicates that the main clause is consequent upon it, and functions like a discursive connective or a pure temporal adjunct. In other cases, it is rhematic, at least in so far has it provides aspectual specifications, and thus play anundeniable narrative rôle. When a temporal expression (une fois, sitôt…) introduces the clause, the semantic value of the participle is also specified, and the clause acquires a form of syntactic autonomy it does not have otherwise. Finally, when the auxiliary étant occurs, the subordinate clause can denote a hitherto unknown eventuality, whose aspectual properties are distinct from the aforementioned cases ; in particular, reference is only made to the end point, never to the beginning of the action thus described. This third type of participial clause is also shown to entertain textual and/or discursive relations with the context that are crucially different from the other types. Subordination Participe passé Contexte Relations de discours Bornage Subordination Past participle Context Discourse relations Aspect
3	Prédicats statifs, causatifs et résultatifs en discours. Sémantique des adjectifs évaluatifs et des verbes psychologiques Martin, Fabienne 19 September 2006 (has links) (PDF) Cette thèse analyse les propriétés sémantiques et discursives des prédicats d'état ('laid, généreux') ainsi que des prédicats causatifs et résultatifs, et plus particulièrement des verbes psychologiques à Expérienceur objet ('stimuler, encourager'). Le cadre adopté est celui de la sémantique néo-davidsonienne (Parsons, 1990) et de la sémantique du discours (Kamp & Reyle 1993, Asher 1993). La première partie (chap 1-7) est consacrée aux prédicats d'état, et la seconde aux prédicats causatifs et résultatifs (chap. 8-9). Dans le chapitre 1, on expose les arguments en faveur de l'idée que les verbes d'état ont un argument implicite davidsonien comme les verbes d'action. Abordant ensuite les constructions en 'by/in' ('by/in smoking, he broke his promise'), l'auteur propose de considérer, avec Goldman et contre Davidson, que celles-ci décrivent deux événements distincts, liés par une relation de génération. L'analyse goldmanienne de ces constructions est ensuite étendue aux prédicats d'état ('in doing this, he was clever'), ce qui permet de distinguer les prédicats qui dénotent un état dépendant d'une action, comme 'clever' en usage occurrentiel, des prédicats qui dénotent un état indépendant d'une action, comme beautiful (cf. '??in doing this, he was beautiful'). Le chapitre 2 fait le point sur les spécificités des prédicats d'état par rapport aux prédicats d'activité. Y est notamment montré que certains prédicats d'état acceptent le "progressif interprétatif" ('tu es en train de croire au Père Noël!'). Ce type de progressif est distingué du progressif standard et du progressif actif anglais ('he was being clever'); sont définis également les "prédicats interprétatifs" qui n'acceptent que ce progressif. Le chapitre 3 élabore une typologie aspectuelle des prédicats d'état. Sont d'abord distingués quatre types d'états en fonction de l'intervalle pendant lequel l'état en cause est vérifié. On montre que cette quadri-partition rend mieux compte des données linguistiques que la dichotomie classique en 'stage level predicates' et 'individual level predicates'. Ensuite sont définis les "prédicats d'état pur" comme beau, qui dénotent un état indépendant de toute action, et les "prédicats d'état endo-actionnel" comme 'généreux/bruyant' en usage occurrentiel, qui dénote un état généré par une action. On présente des arguments contre l'assimilation de ces derniers prédicats à des prédicats d'action. Est alors analysée l'ambiguïté des prédicats comme "généreux" dans l'emploi occurrentiel: 'Pierre m'a donné des bonbons. Il a été généreux' peut vouloir dire soit que Pierre a été généreux de (décider de) me donner des bonbons (lecture-d), soit qu'il a été généreux dans la manière de me les donner (lecture-m). Dans la foulée, on examine la relation temporelle qui prend place entre un état s et l'action e dont il dépend. Enfin, on montre que l'analyse proposée peut rendre compte de la concurrence entre passé composé et imparfait dans les phrases dénotant un état occurrentiel. A partir de la typologie aspectuelle élaborée au chapitre 3, le chapitre 4 revisite le problème que soulèvent certains prédicats d'état dans les constructions à prédicat second descriptif ('Pierre a donné des bonbons saoul/??généreux') et propose une nouvelle solution. On montre ensuite que cette solution peut être adaptée pour résoudre un problème moins étudié, à savoir celui que posent certains prédicats d'état dans les subordonnées temporelles en 'quand '(cf. 'Il était généreux, quand il a distribué les bonbons' versus '??Il a distribué des bonbons quand il était généreux'). Enfin, on fait le point sur la difficulté qu'éprouvent les prédicats évaluatifs à entrer dans les constructions présuppositionnelles, parmi lesquelles les subordonnées temporelles, mais les GN définis ('La femme rousse/??généreuse commanda une bière'). Le chapitre 5 est consacré aux relations rhétoriques qui s'établissent entre la description d'un état et la description d'un événement, aux combinaisons possibles entre ces relations rhétoriques, et à la manière dont tel ou tel prédicat d'état, vu ses propriétés sémantiques, contribue à établir telle ou telle relation rhétorique avec la description d'événement. Le chapitre 6 revient sur le problème que soulève l'indéfini des en lecture non générique avec certains prédicats d'état, notamment les prédicats évaluatifs ('Des livres étaient sales' versus '??Des livres étaient merveilleux'). En se fondant sur les outils de la 'Decision Theoretic Semantic's (Merin 1999), l'auteur fait l'hypothèse qu'un prédicat P n'accepte des que si la quantité des éléments satisfaisant P dans le contexte est non pertinente pour les fins du discours, et s'il est clair, par ailleurs, que les qualités implicites que peuvent instancier les dits éléments ne contribuent en aucune façon à expliquer qu'ils satisfont P. On montre que ces deux conditions sont respectées (resp. violées) avec les prédicats d'état compatibles (resp. incompatibles) avec des dans sa lecture non générique. Le chapitre 7 est consacré à la sémantique qu'il faut assigner aux prédicats d'état évaluatifs. On expose tout d'abord les arguments en faveur d'une sémantique "réaliste", qui analyse les prédicats évaluatifs comme des prédicats unaires dénotant de vraies propriétés. On distingue ensuite, dans le contenu informationnel des énoncés évaluatifs, un composant assertif et deux implicatures associées. On termine par l'analyse des prédicats évaluatifs superlatifs ('merveilleux'); est argumentée l'idée que ces prédicats ont un composant expressif, en ce sens que le locuteur, en les utilisant, implicite qu'une entité satisfaisant le prédicat a déclenché en lui une émotion, vécue ou rejouée lors de l'énonciation. On montre en quoi ce composant expressif contribue à expliquer pourquoi de tels prédicats sont difficilement utilisables à l'impératif ou dans certains types de questions. Le chapitre 8 répertorie trois classes parmi les verbes, dits "résultatifs", qui présupposent l'occurrence d'un événement e causant ou générant l'événement asserté e'. On présente d'abord le problème que pose la définition de cette présupposition, puis une nouvelle solution est exposée. On montre alors que la présupposition des verbes résultatifs -- achèvements droits et accomplissements strictement forts --- est de nature scalaire et peut s'expliquer par la Loi d'exhaustivité de Ducrot. Le chapitre 9 est consacré aux verbes psychologiques à Expérienceur objet (VPEO). Après avoir classé ces verbes en fonction de leur structure événementielle, on fait le point sur les différentes lectures qu'ils peuvent accepter. On montre ensuite qu'à la différence des VPEO acceptables dans les constructions agentives, les VPEO qui y sont peu acceptables exhibent deux propriétés cruciales. D'abord, ils présupposent toujours, à l'instar des verbes étudiés dans le chapitre 8, l'occurrence de l'événement impliquant le sujet; ensuite, certains d'entre eux sont "interprétatifs", en ce sens que l'assertion du changement d'état psychologique ne s'avère pertinente pour les fins du discours que si l'interprétant connaît, par ailleurs, l'événement qui cause ce changement. Cela permet d'expliquer pourquoi les verbes en question ne peuvent faire avancer la narration comme le ferait un prédicat d'action normal, et pourquoi ils sont peu compatibles avec les adverbes de manière orientés sur l'agent, les pseudo-clivées ou les compléments de lieu. On termine par l'analyse aspectuelle de la classe des VPEO, en montrant qu'on y trouve des membres des cinq classes aspectuelles distinguées dans le chapitre précédent. prédicats statifs verbes psychologiques adjectifs évaluatifs aspect Aktionsart actionalité verbes d'achèvement indéfinis relations de discours prédicat d'état verbes statifs verbes d'état états dépendant d'une action pragmatique lexicale sémantique lexicale

1

Page generated in 0.1363 seconds