• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 154
  • 24
  • 16
  • 12
  • 9
  • 3
  • 2
  • 2
  • 1
  • 1
  • Tagged with
  • 233
  • 64
  • 50
  • 33
  • 32
  • 29
  • 29
  • 29
  • 28
  • 28
  • 27
  • 26
  • 26
  • 23
  • 22
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
181

La vie économique des communautés chrétiennes aux trois premiers siècles / The Economic Life of the Christian Communities during the First Three Centuries

Cornillon, Jonathan 01 December 2017 (has links)
Notre thèse a pour objectif d’éclaircir les formes et l’esprit de la vie économique des communautés chrétiennes aux trois premiers siècles. Du ministère de Jésus à la fin du IIIe siècle, les chrétiens, dans leur diversité, ont développé des modes de vie particuliers dans lesquels les pratiques économiques, fortement influencées par leur morale, ont joué un rôle majeur. Nous chercherons à éclaircir les modalités de financement de la mission et de la vie communautaire des chrétiens, mais aussi les formes institutionnelles de la gestion de ces aspects économiques ainsi que les formes de solidarité matérielle qui ont été développées par les premiers chrétiens. Dès le ministère de Jésus, une réflexion pratique sur le maniement des richesses a été menée et a produit une organisation économique particulière fortement marquée par un modèle communautaire. La portée d’un tel modèle dans les trois premiers siècles chrétiens doit être évaluée. Nous nous attachons avant tout aux aspects concrets de cette vie économique, pour en comprendre le fonctionnement. Notre étude se fonde essentiellement sur des sources littéraires chrétiennes, néotestamentaires et patristiques, mais aussi sur des sources archéologiques, épigraphiques ou papyrologiques lorsqu’elles sont disponibles. / Our dissertation aims to enlighten different aspects of the economic life of the Christian communities during the first three centuries. From Jesus to the end of the third century, Christians, in different ways, developed specific ways of life in which the economic practices played a key role. We will try to explain how the mission and the communal life of Christians were funded, but also what role played the ecclesiastical institutions in the use of the common fund. A very important part of our work will also consist in explaining the concrete practices of the Christians concerning the care for the poor in the community. The first Christian communities developed a thought about the economic life of a religious community as early as the preaching of Jesus and we have to try to understand better the meaning and the concrete consequences of these thoughts on their communal life, and the posterity of these practices. To investigate about the economic life of the first Christian communities, we will use most of all the New Testament and patristic texts, even if at some points archaeological, epigraphical and papyrological sources can be used to strengthen our analysis.
182

Analyse contrastive des verbes dans des corpus médicaux et création d’une ressource verbale de simplification de textes / Automatic analysis of verbs in texts of medical corpora : theoretical and applied issues

Wandji Tchami, Ornella 26 February 2018 (has links)
Grâce à l’évolution de la technologie à travers le Web, la documentation relative à la santé est de plus en plus abondante et accessible à tous, plus particulièrement aux patients, qui ont ainsi accès à une panoplie d’informations sanitaires. Malheureusement, la grande disponibilité de l’information médicale ne garantit pas sa bonne compréhension par le public visé, en l’occurrence les non-experts. Notre projet de thèse a pour objectif la création d’une ressource de simplification de textes médicaux, à partir d’une analyse syntaxico-sémantique des verbes dans quatre corpus médicaux en français qui se distinguent de par le degré d’expertise de leurs auteurs et celui des publics cibles. La ressource conçue contient 230 patrons syntaxicosémantiques des verbes (appelés pss), alignés avec leurs équivalents non spécialisés. La méthode semi-automatique d’analyse des verbes appliquée pour atteindre notre objectif est basée sur quatre tâches fondamentales : l’annotation syntaxique des corpus, réalisée grâce à l’analyseur syntaxique Cordial (Laurent, Dominique et al, 2009) ; l’annotation sémantique des arguments des verbes, à partir des catégories sémantiques de la version française de la terminologie médicale Snomed Internationale (Côté, 1996) ; l’acquisition des patrons syntactico-sémantiqueset l’analyse contrastive du fonctionnement des verbes dans les différents corpus. Les patrons syntaxico-sémantiques des verbes acquis au terme de ce processus subissent une évaluation (par trois équipes d’experts en médecine) qui débouche sur la sélection des candidats constituant la nomenclature de la ressource de simplification. Les pss sont ensuite alignés avec leurs correspondants non spécialisés, cet alignement débouche sur le création de la ressource de simplification, qui représente le résultat principal de notre travail de thèse. Une évaluation du rendement du contenu de la ressource a été effectuée avec deux groupes d’évaluateurs : des linguistes et des non-linguistes. Les résultats montrent que la simplification des pss permet de faciliter la compréhension du sens du verbe en emploi spécialisé, surtout lorsque un certains paramètres sont réunis. / With the evolution of Web technology, healthcare documentation is becoming increasinglyabundant and accessible to all, especially to patients, who have access to a large amount ofhealth information. Unfortunately, the ease of access to medical information does not guaranteeits correct understanding by the intended audience, in this case non-experts. Our PhD work aimsat creating a resource for the simplification of medical texts, based on a syntactico-semanticanalysis of verbs in four French medical corpora, that are distinguished according to the levelof expertise of their authors and that of the target audiences. The resource created in thepresent thesis contains 230 syntactico-semantic patterns of verbs (called pss), aligned withtheir non-specialized equivalents. The semi-automatic method applied, for the analysis of verbs,in order to achieve our goal is based on four fundamental tasks : the syntactic annotation of thecorpora, carried out thanks to the Cordial parser (Laurent et al., 2009) ; the semantic annotationof verb arguments, based on semantic categories of the French version of a medical terminologyknown as Snomed International (Côté, 1996) ; the acquisition of syntactico-semantic patternsof verbs and the contrastive analysis of the verbs behaviors in the different corpora. Thepss, acquired at the end of this process, undergo an evaluation (by three teams of medicalexperts) which leads to the selection of candidates constituting the nomenclature of our textsimplification resource. These pss are then aligned with their non-specialized equivalents, thisalignment leads to the creation of the simplification resource, which is the main result of ourPhD study. The content of the resource was evaluated by two groups of people : linguists andnon-linguists. The results show that the simplification of pss makes it easier for non-expertsto understand the meaning of verbs used in a specialized way, especially when a certain set ofparameters is collected.
183

"Se mettre en scène" dans les adaptations contemporaines de textes classiques : un point tournant dans l'art de la mise en scène ? / “Staging Oneself” in Contemporary Adaptations of Classic Texts : a Turning Point in the Art of Mise en Scène?

Özer-Chulliat, Sibel 06 December 2016 (has links)
Depuis quelques années, certains metteurs en scènes européens prennent des initiatives particulièrement audacieuses dans leurs adaptations de textes classiques, coupant le texte, modifiant l’ordre des monologues et allant jusqu’à injecter des morceaux de textes écrits par eux ou bien issus d’autres oeuvre littéraires. Ils n’hésitent plus à "se mettre en scène", c’est-à-dire à traiter avant tout leurs propres questions existentielles par l’intermédiaire des textes classiques, se libérant ainsi de toute pression exercée sur eux par les interprétations textuelles faisant autorité ou bien par les représentations de ces textes dans l’imaginaire collectif, et emmenant les textes classiques dans un "ailleurs" très personnel. Leurs mises en scène dépassent la fragmentation et le désordre propres au théâtre postmoderne et s’attachent au contraire à raconter une histoire cohérente, centrée sur les préoccupations intimes du metteur en scène. Ce nouveau type de mises en scène s’appuie sur des influences diverses, depuis André Antoine jusqu’à Heiner Müller, en passant par Stanislavski, Artaud et Brecht, et constitue une nouvelle étape dans le processus d’autonomisation de l’art de la mise en scène à l'oeuvre depuis le XIXème siècle. Le corpus de cette thèse comprend quatre récentes adaptations (réalisées entre 2008 et 2011) de textes classiques : Hamlet de Thomas Ostermeier, Hamlet de Nikolaï Kolyada, Roméo et Juliette d’Olivier Py et Un tramway de Krzysztof Warlikowski (à partir de Un tramway nommé Désir de Tennessee Williams). Il comprend également une mise en pratique sous la forme d’une adaptation, Pygmalion - J’ai créé une femme (à partir de Pygmalion de George Bernard Shaw), réalisée par l’auteur de la thèse en 2014 au sein des Théâtres Nationaux de Turquie, et ayant permis de tester les arguments et conclusions tirés des analyses précédentes. / In recent years, some European directors are taking particularly bold initiatives in their adaptations of classic texts, cutting the text, changing the order of monologues and even injecting pieces of texts written by them or from other literary works. They do not hesitate to "stage themselves", that is to say, to treat primarily their own existential questions through the classic texts, thus releasing any pressure exerted on them by the authoritative textual interpretations or by the representations of these texts in the collective imagination, and taking the classic texts in a very personal "elsewhere". Their stagings exceed the fragmentation and disorder specific to postmodern theater and focus instead on telling a coherent story, centered on the intimate concerns of the director. This new type of staging draws on diverse influences from André Antoine to Heiner Müller through Stanislavski, Brecht and Artaud, and represents a new stage in the empowerment process of the art of staging at work since the nineteenth century. The corpus of this thesis includes four recent adaptations (conducted between 2008 and 2011) of classic texts: Thomas Ostermeier’s Hamlet, Nikolai Kolyada’s Hamlet, Olivier Py’s Romeo and Juliet, and Krzysztof Warlikowski’s A Streetcar (from A Streetcar Named Desire by Tennessee Williams). It also includes a practical application in the form of an adaptation, Pygmalion - I Created A Woman (from Pygmalion by George Bernard Shaw), directed by the author of the thesis in 2014 in the Turkish State Theatres and having tested the arguments and conclusions from previous analyzes.
184

Contribution to automatic text classification : metrics and evolutionary algorithms / Contributions à la classification automatique de texte : métriques et algorithmes évolutifs

Mazyad, Ahmad 22 November 2018 (has links)
Cette thèse porte sur le traitement du langage naturel et l'exploration de texte, à l'intersection de l'apprentissage automatique et de la statistique. Nous nous intéressons plus particulièrement aux schémas de pondération des termes (SPT) dans le contexte de l'apprentissage supervisé et en particulier à la classification de texte. Dans la classification de texte, la tâche de classification multi-étiquettes a suscité beaucoup d'intérêt ces dernières années. La classification multi-étiquettes à partir de données textuelles peut être trouvée dans de nombreuses applications modernes telles que la classification de nouvelles où la tâche est de trouver les catégories auxquelles appartient un article de presse en fonction de son contenu textuel (par exemple, politique, Moyen-Orient, pétrole), la classification du genre musical (par exemple, jazz, pop, oldies, pop traditionnelle) en se basant sur les commentaires des clients, la classification des films (par exemple, action, crime, drame), la classification des produits (par exemple, électronique, ordinateur, accessoires). La plupart des algorithmes d'apprentissage ne conviennent qu'aux problèmes de classification binaire. Par conséquent, les tâches de classification multi-étiquettes sont généralement transformées en plusieurs tâches binaires à label unique. Cependant, cette transformation introduit plusieurs problèmes. Premièrement, les distributions des termes ne sont considérés qu'en matière de la catégorie positive et de la catégorie négative (c'est-à-dire que les informations sur les corrélations entre les termes et les catégories sont perdues). Deuxièmement, il n'envisage aucune dépendance vis-à-vis des étiquettes (c'est-à-dire que les informations sur les corrélations existantes entre les classes sont perdues). Enfin, puisque toutes les catégories sauf une sont regroupées dans une seule catégories (la catégorie négative), les tâches nouvellement créées sont déséquilibrées. Ces informations sont couramment utilisées par les SPT supervisés pour améliorer l'efficacité du système de classification. Ainsi, après avoir présenté le processus de classification de texte multi-étiquettes, et plus particulièrement le SPT, nous effectuons une comparaison empirique de ces méthodes appliquées à la tâche de classification de texte multi-étiquette. Nous constatons que la supériorité des méthodes supervisées sur les méthodes non supervisées n'est toujours pas claire. Nous montrons ensuite que ces méthodes ne sont pas totalement adaptées au problème de la classification multi-étiquettes et qu'elles ignorent beaucoup d'informations statistiques qui pourraient être utilisées pour améliorer les résultats de la classification. Nous proposons donc un nouvel SPT basé sur le gain d'information. Cette nouvelle méthode prend en compte la distribution des termes, non seulement en ce qui concerne la catégorie positive et la catégorie négative, mais également en rapport avec toutes les autres catégories. Enfin, dans le but de trouver des SPT spécialisés qui résolvent également le problème des tâches déséquilibrées, nous avons étudié les avantages de l'utilisation de la programmation génétique pour générer des SPT pour la tâche de classification de texte. Contrairement aux études précédentes, nous générons des formules en combinant des informations statistiques à un niveau microscopique (par exemple, le nombre de documents contenant un terme spécifique) au lieu d'utiliser des SPT complets. De plus, nous utilisons des informations catégoriques telles que (par exemple, le nombre de catégories dans lesquelles un terme apparaît). Des expériences sont effectuées pour mesurer l'impact de ces méthodes sur les performances du modèle. Nous montrons à travers ces expériences que les résultats sont positifs. / This thesis deals with natural language processing and text mining, at the intersection of machine learning and statistics. We are particularly interested in Term Weighting Schemes (TWS) in the context of supervised learning and specifically the Text Classification (TC) task. In TC, the multi-label classification task has gained a lot of interest in recent years. Multi-label classification from textual data may be found in many modern applications such as news classification where the task is to find the categories that a newswire story belongs to (e.g., politics, middle east, oil), based on its textual content, music genre classification (e.g., jazz, pop, oldies, traditional pop) based on customer reviews, film classification (e.g. action, crime, drama), product classification (e.g. Electronics, Computers, Accessories). Traditional classification algorithms are generally binary classifiers, and they are not suited for the multi-label classification. The multi-label classification task is, therefore, transformed into multiple single-label binary tasks. However, this transformation introduces several issues. First, terms distributions are only considered in relevance to the positive and the negative categories (i.e., information on the correlations between terms and categories is lost). Second, it fails to consider any label dependency (i.e., information on existing correlations between classes is lost). Finally, since all categories but one are grouped into one category (the negative category), the newly created tasks are imbalanced. This information is commonly used by supervised TWS to improve the effectiveness of the classification system. Hence, after presenting the process of multi-label text classification, and more particularly the TWS, we make an empirical comparison of these methods applied to the multi-label text classification task. We find that the superiority of the supervised methods over the unsupervised methods is still not clear. We show then that these methods are not fully adapted to the multi-label classification problem and they ignore much statistical information that coul be used to improve the classification results. Thus, we propose a new TWS based on information gain. This new method takes into consideration the term distribution, not only regarding the positive and the negative categories but also in relevance to all classes. Finally, aiming at finding specialized TWS that also solve the issue of imbalanced tasks, we studied the benefits of using genetic programming for generating TWS for the text classification task. Unlike previous studies, we generate formulas by combining statistical information at a microscopic level (e.g., the number of documents that contain a specific term) instead of using complete TWS. Furthermore, we make use of categorical information such as (e.g., the number of categories where a term occurs). Experiments are made to measure the impact of these methods on the performance of the model. We show through these experiments that the results are positive.
185

Un encyclopédiste méconnu du XIIIe siècle : Arnold de Saxe

Draelants, Isabelle 20 January 2001 (has links) (PDF)
En Occident au XIIIe siècle, pour répondre au nouvel afflux de connaissances issues des traductions gréco-latines et arabo-latines du siècle précédent, s'organisent des milieux d'enseignement et de diffusion, sinon de vulgarisation de la philosophie et de la science. Les universités naissent alors, mais les collèges d'ordres religieux surtout s'établissent en relais du savoir ; parmi eux, les ordres mendiants prennent une part essentielle. En parallèle se met en place un outillage mental et intellectuel capable d'assimiler et de manier ces nouveaux contenus qui ouvrent peu à peu à une autre conception du monde : on découvre les œuvres sur la nature d'Aristote après avoir usé longuement de sa seule logique. On comprend mieux Platon à la lumière des écrits arabes. On décrit les astres, les animaux, les plantes, les maladies, grâce à des critères qui mêlent à la fois une typologie neuve influencée par Aristote et des héritages de l'Antiquité tardive. Dans ce processus dynamique, Arnold de Saxe est un des premiers à satisfaire une telle demande intellectuelle en offrant une compilation-florilège de philosophie naturelle et morale intitulée "De floribus rerum naturalium" ; celle-ci compte quatre livres de véritables "fleurs de la nature" et un cinquième consacré à la morale où s'organisent des citations puisées dans la littérature latine disponible. Ce travail de doctorat s'intéresse à Arnold de Saxe à travers une étude complète de l'ensemble de sa production, qui permet de déterminer quels furent son milieu d'activité et son époque, la France et l'Allemagne des deuxième et troisième quarts du XIIIe siècle. Avant cette étude, Arnoldus Saxo, Arnoldus Luca ou Arnoldus de Saxonia n'était connu qu'à travers le "De floribus" (erronément appelé "De finibus" par V. Rose), qu'on situait entre 1220 et 1230. L'étude met au jour huit nouveaux manuscrits de l'ouvrage encyclopédique qui s'ajoutent aux quatre déjà connus [depuis la thèse déposée en nov. 2000, j'ai découvert deux autres manuscrits partiels du De floribus rerum naturalium]. En outre, la thèse a permis la découverte et l'étude de trois autres ouvrages du même auteur : un traité de médecine "a capite ad calcem" qui intègre les progrès récents de la science médicale ; un dialogue en forme de disputatio en quatre parties sur les vertus et des vices ("De iudiciis virtutum et viciorum"), et une brève " consolation " imitée de celle attribuée à Sénèque. La thèse, centrée sur l'histoire des textes et l'assimilation du savoir, caractérise les sources d'information philosophiques et scientifiques d'Arnold de Saxe. Chacune des œuvres dont l'auteur a fait des extraits est identifiée précisément, l'origine possible de l'information est caractérisée, et l'utilisation qu'en fait Arnold de Saxe est comparée à celle des philosophes contemporains. L'analyse est articulée sur les matières présentes dans la production de l'auteur : physique du ciel et de la terre ; animaux, plantes et médecine ; minéralogie ; morale. Dans ces différents domaines, la documentation est composée d'un tiers de traités sous le nom d'Aristote, dont les petites œuvres authentiques sur la nature et quelques textes importants comme les Météorologiques, ou le De animalibus, et l'Ethique, mais aussi de nombreux pseudépigraphes, comme le "De causis" néoplatonicien ou un De speculis (Catroptique d'Euclide). S'ajoutent au corpus aristotélicien des textes issus de la tradition médicale et hermétique arabe, dont certains sont peu répandus mais se couvrent de noms connus comme Pythagore, Esculape ou Hermès. Les versions de tous ces textes sont des traductions gréco-latines de Jacques de Venise et Burgundio de Pise, et arabo-latines de Dominicus Gundissalvi, Johannes Hispanus, Jean de Séville et de Limia, Gérard de Crémone et Michel Scot ; toutes ces traductions sont antérieures à celles de Robert Grosseteste et de Guillaume de Moerbeke. Les joyaux de l'Antiquité, sertis dans la monture du christianisme mais souvent transformés et légués par les Arabes, devaient une certaine lumière à la tradition hermétique. La troisième part du corpus documentaire d'Arnold de Saxe est constituée d'œuvres latines anciennes, dans le domaine de la cosmologie et de la morale : Macrobe et Martianus Capella y côtoient Sénèque et Cicéron. Le tout forme un ensemble qui hésite entre néo-platonisme et aristotélisme de la pensée, entre tradition et nouveauté de la documentation. Arnold de Saxe a collecté cette documentation au début de son activité, dans une sorte de compendium qui ne semble pas avoir survécu. L'auteur fait mention de cette première étape de son travail sous l'intitulé vague de "Sermo de libris philosophorum", dont les sources du "De floribus rerum naturalium" sont manifestement en grande partie issues. Arnold de Saxe leur sera fidèle par volonté et dépendant par nécessité : il s'applique à respecter la lettre, tout en abrégeant de manière sévère, et il utilise la documentation disponible, quelle que soit sa qualité. Le "De uirtutibus lapidum" (Livre des pierres) est la part scientifique la plus originale de l'encyclopédie naturelle "De floribus", dont elle constitue un traité particulier plusieurs fois remanié ; elle est aussi celle qui aura un succès immédiat considérable via la reprise intégrale de son contenu chez Albert le Grand, (De mineralibus, tr. 2 et 3), et Vincent de Beauvais (Speculum naturale, livre VIII). Au "De floribus rerum naturalium" en quatre livres sera ajouté un cinquième, "De moralibus", qui a également circulé comme œuvre indépendante. Le traité de médecine (Practica medicine) qui a suivi ces premiers travaux assimile les apports de l'école de Salerne et fait preuve d'une connaissance de l'évolution médicale contemporaine. En effet, Avicenne y tient une place importante en rival de Constantin l'Africain et un chapitre particulier est consacré à la maladie d'amour (De amore hereos). Le traité éthique des vertus et des vices, rédigé en fin de parcours sous la forme d'un dialogue scolastique aux accents d'humanisme chrétien, s'inspire surtout des auteurs antiques, déjà cités dans le "De moralibus", la cinquième partie du De floribus. L'homme et le démon s'y affrontent verbalement l'homme et le démon sous l'œil du juge suprême qu'est Dieu. Paradoxalement pour un tel sujet, on n'y trouve ni sentences bibliques ou patristiques, ni préceptes religieux issus de textes médiévaux, car Sénèque y domine sur l'Ethique d'Aristote. Le penchant stoïcien se confirme dans la courte "consolation". En plus de ces œuvres, il est possible qu'Arnold de Saxe soit l'auteur d'une introduction à l'astronomie/astrologie, trouvée dans un manuscrit copié à Bâle au début du XVe siècle. A partir du contenu de ses œuvres, destinées surtout à répondre à l'"utilitas" d'une communauté qu'il est difficile de caractériser, on ne peut faire d'Arnold de Saxe un penseur ; mais il s'agit d'un "philosophe" au sens médiéval du terme, dans la mesure où il produit une œuvre de compilation multiple et originale à partir de la seule littérature profane et est rompu aux techniques intellectuelles de son temps. Naturaliste, féru de médecine, c'était aussi un enseignant amoureux de la morale classique. Sa diffusion, relativement limitée, fut surtout germanique (manuscrits d'origine allemande et du tiers nord de la France). En revanche, sa réception, pour l'étude des pierres et la description du monde animal, fut immédiate dans la littérature didactique, chez le franciscain Barthélemy l'Anglais et chez les dominicains Vincent de Beauvais et Albert le Grand. Arnold a alimenté, dans le De mineralibus d'Albert le Grand, la conception hermétique de la "vertu universelle" et de la vertu spécifique qu'on trouve chez Avicenne pour expliquer l'action thérapeutique de certaines substances et voir dans tout élément naturel un principe actif ; il a aussi fourni à Albert toutes les citations d'Evax et Aaron et la plupart des extraits du lapidaire d'Aristote. Arnold de Saxe a par ailleurs été le relais de savoirs qui se seraient sans lui perdus, comme la biologie des plantes et des animaux de Iorach (qu'il faut identifier avec Iuba, roi de Mauritanie, qui écrivit en grec au Ier siècle) et le traité des pierres attribué à Aristote dont il retient entre autres les notions de pôle et d'aimant. Arnold de Saxe conserve des extraits de la minéralogie d'Aristote en deux versions distinctes, secundum Dioscoridem et secundum Gerardi, ce qui met sur la piste d'une traduction de Gérard de Crémone qui n'avait pas été mise au jour jusqu'ici. L'analyse de sa documentation et des influences qu'il subit ou qu'il propage montrent que les foyers de l'activité d'Arnold ont dû être Magdeburg, où il connut sans doute le franciscain Barthélemy l'Anglais qui s'y trouvait dès 1231 (le manuscrit d'Heidelberg attribue le traité des pierres à Arnoldus Saxo Magdeburgensis); Cologne, où il rencontra peut-être le dominicain Albert le Grand qui y fut lecteur, comme l'induisent les citations réciproques (Albert est cité dans le traité de médecine) ; Paris, où il croisa sans doute les médecins du temps et fit connaître son encyclopédie ; Erfurt peut-être, où ses œuvres sont conservées mieux qu'ailleurs. Faut-il voir dans Arnold de Saxe, appelé "Arnoldus Luca Magdeburgensis" dans le manuscrit d'Heidelberg, le maître de l'école cathédrale de Magdeburg, qui disparaît des documents diplomatiques vers 1243 ? Arnoldus Luca n'est-il pas aussi l'"Arnoldus Luscus" dominicain expérimenté en astronomie que cite avec admiration Berthold von Moosburg, un disciple de l'albertinisme à Cologne au XIVe siècle ? En dehors de l'histoire des textes, des documents qui l'attesteraient restent encore à découvrir. Comme les autres encyclopédistes de son époque, le Saxon a privilégié une information tirée d'auteurs qui nourrissaient déjà une volonté de synthèse totale, c'est-à-dire - pour ce qui le concerne - Aristote, Avicenne, Constantin l'Africain. Mais il a évité pour sa part les textes rabattus de Pline et d'Isidore de Séville pour se tourner vers ce qu'il appelle des "philosophes modernes", à savoir les médecins et naturalistes arabes, Aristote, mais aussi Sénèque, Boèce et Martianus Capella. Ensemble, ces "auctoritates" donnent au "De floribus rerum naturalium" l'allure néoplatonisante d'une synthèse naturaliste faite de métaphysique, de physique et d'éléments hermétiques qui accompagnèrent le célébrissime Aristote à travers les étapes de sa transmission grecque, syriaque, arabe et latine.
186

Grammaires locales pour l'analyse automatique de textes : méthodes de construction et outils de gestion

Constant, Matthieu 08 September 2003 (has links) (PDF)
L'explosion du nombre de documents disponibles (notamment sur Internet) a rendu le domaine du Traitement Automatique des Langues (TAL) et ses outils incontournables. De nombreux chercheurs marquent l'importance de la linguistique dans ce domaine. Ils préconisent la construction de larges bases de descriptions linguistiques, composées de lexiques et de grammaires. Cette démarche a un gros inconvénient : elle nécessite un investissement lourd qui s'inscrit sur le long terme. Pour palier à ce problème, il est nécessaire de mettre au point des méthodes et des outils informatiques d'aide à la construction de composants linguistiques fins et directement applicables à des textes. Nous nous sommes penché sur le problème des grammaires locales qui décrivent des contraintes précises et locales sous la forme de graphes. Deux questions fondamentales se posent : - Comment construire efficacement des grammaires précises, complètes et applicables à des textes ? - Comment gérer leur nombre et leur éparpillement ? Comme solution au premier problème, nous avons proposé un ensemble de méthodes simples et empiriques. Nous avons exposé des processus d'analyse linguistique et de représentation à travers deux phénomènes : les expressions de mesure (un immeuble d'une hauteur de 20 mètres) et les adverbes de lieu contenant un nom propre locatif (à l'île de la Réunion), deux points critiques du TAL. Sur la base de M. Gross (1975), nous avons ramené chaque phénomène à une phrase élémentaire. Ceci nous a permis de classer sémantiquement certains phénomènes au moyen de critères formels. Nous avons systématiquement étudié le comportement de ces phrases selon les valeurs lexicales de ses éléments. Les faits observés ont ensuite été représentés formellement soit directement dans des graphes à l'aide d'un éditeur, soit par l'intermédiaire de tables syntaxiques ensuite converties semiautomatiquement en graphes. Au cours de notre travail, nous avons été confronté à des systèmes relationnels de tables syntaxiques pour lesquels la méthode standard de conversion due à E. Roche (1993) ne fonctionnait plus. Nous avons donc élaboré une nouvelle méthode adaptée avec des formalismes et des algorithmes permettant de gérer le cas où les informations sur les graphes à construire se trouvent dans plusieurs tables. En ce qui concerne le deuxième problème, nous avons proposé et implanté un prototype de système de gestion de grammaires locales : une bibliothèque en-ligne de graphes. Le but à terme est de centraliser et de diffuser les grammaires locales construites au sein du réseau RELEX. Nous avons conçu un ensemble d'outils permettant à la fois de stocker de nouveaux graphes et de rechercher des graphes suivant différents critères. L'implémentation d'un moteur de recherche de grammaires nous a également permis de nous pencher sur un nouveau champ d'investigation dans le domaine de la recherche d'information : la recherche d'informations linguistiques dans des grammaires locales.
187

Extraire et valider les relations complexes en sciences humaines : statistiques, motifs et règles d'association

Cadot, Martine 12 December 2006 (has links) (PDF)
Cette thèse concerne la fouille de données en sciences humaines. Cette branche récente de l'intelligence artificielle consiste en un ensemble de méthodes visant à extraire de la connaissance à partir de données stockées sur des supports informatiques. Parmi celles-ci, l'extraction de motifs et de règles d'association est une méthode de traitement des données qui permet de représenter de façon symbolique la structure des données, comme le font les méthodes statistiques classiques, mais qui, contrairement à celles-ci, reste opérationnelle en cas de données complexes, volumineuses. Toutefois ce modèle informatique des données, construit à partir de comptages de cooccurrences, n'est pas directement utilisable par les chercheurs en sciences humaines : il est essentiellement dédié aux données dichotomiques (vrai/faux), ses résultats directs, très morcelés, sont difficiles à interpréter, et sa validité peut paraître douteuse aux chercheurs habitués à la démarche statistique. Nous proposons des techniques que nous avons construites puis expérimentées sur des données réelles dans le but de réduire les difficultés d'utilisation que nous venons de décrire : 1) un test de randomisation à base d'échanges en cascade dans la matrice sujets x propriétés permet d'obtenir les liaisons statistiquement significatives entre deux propriétés, 2) une extension floue de la méthode d'extraction classique des motifs, qui produit des règles d'association floues généralisant les règles binaires et proches des règles floues définies par les chercheurs poursuivant les travaux de Zadeh, 3) MIDOVA, un algorithme extrayant les interactions n-aires entre variables - problème peu connu, peu abordé en informatique, et abordé avec de fortes limitations en statistiques - et 4) des méta-règles pour nettoyer le jeu de règles d'association de ses principales contradictions et redondances.
188

Étude comparative du vocabulaire de description de la danse dans les archives et du vocabulaire de représentation de la danse dans la littérature

Paquette-Bigras, Ève 03 1900 (has links)
Notre recherche s’insère dans la mouvance des humanités numériques; nous y faisons dialoguer les arts et les sciences de l’information. Depuis quelques décennies, la danse est un sujet d’études et de recherche à part entière. Il devient donc nécessaire de mieux décrire la danse dans les archives, sachant que la description en amont influe grandement sur l’accès en aval. Les méthodes d’extraction automatique de connaissances nous semblent offrir de nouvelles possibilités. L’objectif de notre recherche est de contribuer au développement d’outils de gestion de l’information dans les archives de la danse en comparant un vocabulaire de description de la danse dans les archives et un vocabulaire de représentation de la danse dans la littérature, recueilli grâce à des méthodes d’extraction automatique de connaissances, pour en distinguer une possible complémentarité, particulièrement en ce qui a trait au vocabulaire de l’expérience esthétique. D’abord, nous analysons un vocabulaire de description de la danse dans les archives. Nous décrivons certains outils de description des archives de la danse et nous analysons le thésaurus de descripteurs Collier. Nous constatons que le vocabulaire de description de la danse dans les archives ne semble pas prendre en compte l’expérience esthétique. Ensuite, nous analysons un vocabulaire de représentation de la danse dans la littérature. Un vocabulaire structuré de l’expérience esthétique de la danse moderne est ainsi extrait d’un corpus de textes de l’écrivain français Stéphane Mallarmé et analysé. Puis nous comparons les deux vocabulaires afin d'en distinguer la complémentarité quant à la description de l’expérience esthétique. Nous formulons une première suggestion d’amélioration de certains thésaurus employés dans les archives de la danse : un thésaurus au vocabulaire essentiellement factuel, comme le thésaurus de descripteurs Collier, peut être enrichi de termes à propos de l’expérience esthétique. Le vocabulaire de représentation de la danse dans la littérature est jusqu’à un certain point complémentaire au vocabulaire de description de l’expérience esthétique de la danse dans les archives. Nous menons ainsi une première expérimentation qui justifie en partie la pertinence de certaines méthodes d’extraction de connaissances dans le développement et la maintenance de ressources documentaires pour le domaine des arts d’interprétation tels que la danse. / This research falls within the field of digital humanities; arts and information science engage in dialogue. In the last few decades, dance has become a distinct research subject. Dance description in archives needs to be improved, because the quality of the description impacts access to the documentation. Knowledge extraction seems to offer new opportunities in this regard. The goal of this research is to contribute to the development of information management tools by comparing a vocabulary for describing dance in archives with a vocabulary for representing dance in literature obtained through knowledge extraction. We look for possible complementarity, particularly in regard to the aesthetic experience. First, some tools for describing dance in archives are described, and the Collier Descriptor Thesaurus is analyzed. We observe that this vocabulary for describing dance in archives does not take into account aesthetic experience. Second, a vocabulary for representing dance in literature is analyzed. More specifically, a structured vocabulary of aesthetic experience of modern dance is drawn from a corpus of texts from the French writer Stéphane Mallarmé, and the vocabulary obtained is analyzed. Finally, the two vocabularies are compared to consider their complementarity. We conclude that some vocabularies for describing dance in archives, consisting mainly of factual terms, such as the Collier Descriptor Thesaurus, can be enriched with terms related to aesthetic experience. The vocabulary for representing dance in literature complements to a certain extent the vocabulary for describing dance in archives. Thus this initial experiment supports the relevance of knowledge extraction in information resources maintenance and development for performing arts such as dance. / Diese Arbeit beschäftigt sich mit dem Fachgebiet der Digital Humanities und verbindet dabei Kunst mit informationswissenschaftlichen Methoden. In den letzten Jahrzehnten ist Tanz ein eigenständiges Forschungsgebiet geworden. Da sich die Qualität der Beschreibung direkt auf den Zugang zu Dokumenten im Archiv auswirkt, bedarf die Beschreibung von Tanz in Archiven Verbesserung. Ziel der Forschung ist es zur Entwicklung von Informationsverwaltungs-Tools beizutragen, indem das Vokabular der Beschreibung von Tanz im Archiv mit Vokabular aus der Literatur, extrahiert aus textuellen Datenbanken, verglichen wird. Dabei liegt der Fokus auf der Komplementarität beider Quellen, besonders in Bezug auf die Beschreibung von ästhetischen Erfahrungen. Zunächst werden Tools für die Beschreibung von Tanz in Archiven beschrieben und der Collier Descriptor Thesaurus analysiert. Dabei zeigt sich, dass das Vokabular der Tanz-Beschreibung im Archiv ästhetische Erfahrung generell nicht berücksichtigt. Daraufhin wird das Vokabular der Tanz-Darstellung in der Literatur am Beispiel der Text-Sammlung des franzözischen Dichters Stéphane Mallarmé analysiert. Im Anschluss werden die zwei Wortschätze verglichen, um die Komplementarität beider Quellen zu beschreiben. Die Arbeit kommt zu dem Schluss, dass das Vokabular der Tanz-Beschreibung im Archiv hauptsächlich aus sachbezogenen Begriffen besteht (z.B. der Collier Descriptor Thesaurus), welche um Begriffe zur ästhetischen Erfahrung ergänzt werden können. Die Begriffe für die Tanz-Beschreibung in der Literatur komplementieren bis zu einem gewissen Grad das Vokabular der Tanz-Beschreibung im Archiv. Demzufolge bildet diese Arbeit eine Grundlage für weitere Forschung im Bereich der Wissensextraktion in textuellen Datenbanken im Fachgebiet darstellender Künste wie Tanz.
189

Accès à l'information : vers une hybridation fouille de données et traitement automatique des langues

Charnois, Thierry 01 December 2011 (has links) (PDF)
Ce mémoire porte sur mes travaux de recherche en traitement automatique des langues (TAL) et en fouille de données textuelles. Il présente comment ces travaux s'organisent autour de la problématique de l'accès à l'information dans les textes. Notre démarche s'appuie sur la prise en compte de l'aspect sémantique de la langue sous forme de modélisation linguistique et de ressources linguistiques pour le développement d'applications. La méthodologie de l'accès à l'information est donc ici vue comme un accès au sens à partir d'une modélisation linguistique relative à l'application visée plutôt qu'un accès aux formes de surface comme l'utilisent par exemple actuellement les méthodes prédominantes des moteurs de recherche. En retour, la formalisation du modèle linguistique et son expérimentation sur corpus visent à améliorer notre connaissance des phénomènes traités et permettre un retour qualitatif, c'est-à-dire explicatif, sur le modèle. L'intérêt pour les méthodes de fouille fondées sur les motifs et la volonté de les intégrer au TAL -- par exemple, pour acquérir automatiquement des ressources linguistiques et alimenter à moindre coût les systèmes de TAL -- procède de la même démarche. Une telle combinaison vise d'une part à repenser la manière dont les processus de TAL peuvent tirer bénéfice de méthodes de fouille spécifiquement adaptées au texte, et d'autre part à renforcer les processus de fouille, en fonction des spécificités de la donnée textuelle, par une prise en compte d'informations de nature linguistique visant notamment à sélectionner l'information la plus pertinente.
190

Discours de presse et veille stratégique d'événements Approche textométrique et extraction d'informations pour la fouille de textes

Erin, Macmurray 02 July 2012 (has links) (PDF)
Ce travail a pour objet l'étude de deux méthodes de fouille automatique de textes, l'extraction d'informations et la textométrie, toutes deux mises au service de la veille stratégique des événements économiques. Pour l'extraction d'informations, il s'agit d'identifier et d'étiqueter des unités de connaissances, entités nommées -- sociétés, lieux, personnes, qui servent de points d'entrée pour les analyses d'activités ou d'événements économiques -- fusions, faillites, partenariats, impliquant ces différents acteurs. La méthode textométrique, en revanche, met en oeuvre un ensemble de modèles statistiques permettant l'analyse des distributions de mots dans de vastes corpus, afin faire émerger les caractéristiques significatives des données textuelles. Dans cette recherche, la textométrie, traditionnellement considérée comme étant incompatible avec la fouille par l'extraction, est substituée à cette dernière pour obtenir des informations sur des événements économiques dans le discours. Plusieurs analyses textométriques (spécificités et cooccurrences) sont donc menées sur un corpus de flux de presse numérisé. On étudie ensuite les résultats obtenus grâce à la textométrie en vue de les comparer aux connaissances mises en évidence au moyen d'une procédure d'extraction d'informations. On constate que chacune des approches contribuent différemment au traitement des données textuelles, produisant toutes deux des analyses complémentaires. À l'issue de la comparaison est exposé l'apport des deux méthodes de fouille pour la veille d'événements.

Page generated in 0.0547 seconds