Spelling suggestions: "subject:"humanités"" "subject:"humanité""
21 |
A characterisation of comics and sequential art for supporting the evolution of digital formats for comics : a crowdsourcing approach / Une caractérisation de la bande dessinée et de l'art séquentiel pour soutenir l'évolution des formats numériques de la bande dessinée : une approche de crowdsourcingTufis, Mihnea 20 April 2017 (has links)
Nous présentons une solution pour la création d'un corpus numérisé en utilisant une approche crowdsourcing pour annoter des bandes dessinées (BD). Les encodages XML qui en résultent aident également les chercheurs, les éditeurs, les bibliothécaires et les conservateurs de collections BDs. Pour atteindre notre objectif de recueil de données, nous développons un moteur de crowdsourcing en ligne pour annoter les BDs. Les tâches sont conçues pour reproduire l'expérience de lecture des pages des BDs, en demandant aux participants d'identifier et d'annoter les éléments structurels (cases, splash-pages) et de contenu (personnages, lieux, événements, onomatopées, objets, lignes de mouvement) des BDs. Notre approche fournit aux chercheurs en humanités numériques (digital humanities) la possibilité de bâtir un corpus structuré et annoté, aujourd’hui manquant. Cela permet d’accélérer la recherche liée à la BD et à la théorie de l'art séquentiel. Les bibliothécaires et les conservateurs de collections des BDs disposeront d'un contenu structuré qui pourrait permettre la création d'artefacts spécifiques, tels que des dictionnaires de BDs, des indices de recherche ou des dictionnaires d'onomatopée. Du point de vue de l'édition, les standards actuels pour les BDs numériques se chargent exclusivement de la couche de présentation (c'est-à-dire, rendre tout simplement une publication sur l'écran d'un dispositif numérique). Mais la nature artistique de la BD et le grand potentiel des BDs numériques nous permettent d'aller au-delà de la simple présentation du contenu. À cet égard, nous contribuons avec des améliorations aux standards sémantiques (CBML) et de présentation (EPUB). / We address the difficulty of creating a digitised corpus by using a crowdsourced approach for annotating comic books. The resulting XML-based encodings assist researchers, publishers and collection curators equally. To achieve our data collection goal, we develop an online crowdsourcing engine for annotating comics. The tasks are designed to mirror the page reading experience, with participants asked to identify and annotate structural (panel layout, splash pages, meta-panels) and content (characters, places, events, onomatopoeia) elements of comic books. Our approach provides Digital Humanities (DH) scholars with a (currently missing) structured, annotated corpus; this enables and accelerates research related to comics and sequential art theory. Curators and collectors of physical or online comics collections are provided with a structured content which could enable the creation of artefacts such as comic books dictionaries, search indices and dictionaries of onomatopoeia. From a publishing perspective, current standards for digital comics are taking care exclusively of the presentation layer (i.e. rendering a publication on the screen of a device). But the artistic nature of comics and the great potential digital comics have already showcased allow us to go beyond simple content presentation. To this respect we present our contributions with enhancements to current semantic (CBML) and presentation (EPUB) open standards that will allow publishers and digital comics authors to create an improved reading experience.
|
22 |
La formation scolaire de Baudelaire / The Formative Years of BaudelaireHatakeyama, Toru 15 June 2010 (has links)
Si l'on sait depuis longtemps que tous les hommes de lettres du XIXe siècle partageaient une culture largement similaire, transmise et fortifiée par l'enseignement secondaire, rares sont, jusqu'à présent, les études qui ont cherché à rendre compte avec précision de la nature de cette culture classique. Notre étude avait pour objectif de combler autant que possible cette lacune. Nous avons essayé de reconstituer la vie scolaire de Baudelaire tout en tenant compte des enjeux historiques de l’époque. Tenter de décrire la situation historique de l’enseignement secondaire au XIXe siècle, nécessitait de prendre en compte les nombreux conflits d'ordre politique et idéologique qui influencent le contenu de l'enseignement. Nous avons donc parcouru l’histoire de l’enseignement secondaire, de Napoléon à Jules Ferry, afin de fournir une synthèse des caractéristiques de l'enseignement reçu par Baudelaire. En croisant les différentes sources que sont les programmes officiels, les rapports des inspecteurs généraux, les articles de journaux et les témoignages personnels, nous avons également analysé la pratique réelle des études classiques dans les différentes classes suivies par Baudelaire. Cette thèse est donc le fruit d'un travail interdisciplinaire qui vise non seulement à élucider une partie importante de la culture classique de Baudelaire mais aussi à mettre en lumière la genèse de certaines valeurs littéraires nouvelles au XIXe siècle. / Writers of the 19th century and, more generally, people schooled in the humanities, all shared a common literary culture acquired through their schooling in secondary schools. But the analysis of the contents of secondary education, and of the link between such schooling and literary production remains largely a field of study left untouched. Our objective was to fill this gap. We thus tried to reconstitute Baudelaire's schooling by emphasizing the main historical developments of the time in order to fully understand what was at stakes in the academic world. To give a truthful account of 19th century secondary education, one needs also to take into account the numerous political and ideological conflicts whose influence on the educational system was pervasive throughout the period. We therefore explored the history of 19th century France's educational system, from Napoleon to Jules Ferry, to provide a detailed overview of the main characteristics of such a system. By crossing sources like official programs, general inspectors' reports, articles in the press and personal accounts from prominent writers of the time, we also endeavored to study how Baudelaire was taught at the time. Our work relies heavily on interdisciplinary approaches and aims not only at clarifying an important part of the classical education received by Baudelaire but also at throwing light on the emergence of new literary values in the 19th century.
|
23 |
A generic approach towards the collaborative construction of digital scholarly editions / Une approche générique pour la construction collaborative d'éditions critiques électroniquesBarrellon, Vincent 27 November 2017 (has links)
Les éditions critiques numériques sont des ressources patrimoniales annotées, sous une forme numérique. De telles éditions prennent la forme d'une transcription des ressources originales, augmentées d'un apparat critique, c'est-à-dire, la forme de données structurées. Dans un contexte collaboratif, a structure de ces données est définie explicitement par un schéma, document interprétable qui contraint la manière dont les éditeurs vont pouvoir annoter les ressources primaires et va de ce fait garantir une certaine homogénéité dans le respect de la politique éditoriale. Les projets d'édition critique numérique font classiquement face à deux problèmes techniques. Le premier a à voir avec l'expressivité des langages d'annotation, qui empêchent l'expression de certaines informations utiles. La seconde tient au fait que, par expérience, les schémas qui sous-tendent une édition critique vont être amenés à évoluer au cours de la réalisation de cette édition ; cependant, modifier le schéma implique qu'il faille mettre à jour l'intégralité des données structurées validées par ce schéma, ce qui est habituellement effectué à la main par les éditeurs, au moyen de scripts ad-hoc – si les éditeurs, faute de moyens ou de temps, ne renoncent pas à faire évoluer la structure de données. Dans ce travail de thèse, nous définissons les fondements théoriques pour l'établissement d'un système éditorial dédié à l'édition critique numérique. Nous définissons les eAG, un modèle d'annotation déporté basé sur un formalisme de graphes cycliques, autorisant a plus grande expressivité. Nous définissons un mécanisme de schéma innovant, SeAG, permettant la validation à la volée des eAG au cours de leur manufacture. Nous définissons également une syntaxe de balisage présentant des similarités avec les langages d'annotation classiques comme XML, tout en préservant l'expressivité des eAG. Enfin, nous proposons une algèbre bidirectionnelle pour les eAG de telle sorte que, si un SeAG S est transformé en un SeAG S', alors tout eAG I validé par S est traduit de manière semi-automatique sous la forme d'un eAG I', validé par S', et tel que toute mise à jour de I (respectivement I') soit propagé, de manière semi-automatique, sur I' (resp. I). / Digital Scholarly Editions are critically annotated patrimonial literary resources, in a digital form. Such editions roughly take the shape of a transcription of the original resources, augmented with critical information, that is, of structured data. In a collaborative setting, the structure of the data is explicitly defined in a schema, an interpretable document that governs the way editors annotate the original resources and guarantees they follow a common editorial policy. Digital editorial projects classically face two technical problems. The first has to do with the expressiveness of the annotation languages, that prevents from expressing some kinds of information. The second relies in the fact that, historically, schemas of long-running digital edition projects have to evolve during the lifespan of the project. However, amending a schema implies to update the structured data that has been produced, which is done either by hand, by means of ad-hoc scripts, or abandoned by lack of technical skills or human resources. In this work, we define the theoretical ground for an annotation system dedicated to scholarly edition. We define eAG, a stand-off annotation model based on a cyclic graph model, enabling the widest range of annotation. We define a novel schema language, SeAG, that permits to validate eAG documents on-the-fly, while they are being manufactured. We also define an inline markup syntax for eAG, reminiscent of the classic annotation languages like XML, but retaining the expressivity of eAG. Eventually, we propose a bidirectional algebra for eAG documents so that, when a SeAG S is amended, giving S', an eAG I validated by S is semi-automatically translated into an eAG I' validated by S', and so that any modification applied to I (resp. I') is semi-automatically propagated to I' (resp. I) – hence working as an assistance tool for the evolution of SeAG schemas and eAG annotations.
|
24 |
Comparaison semi-automatique des traductions en langue française de l’Odyssée d’Homère (1547-1955) / Semi-automatic comparison of French translations of Homer’s Odyssey (1547-1955)Reboul, Marianne 05 October 2017 (has links)
Cette étude explore l’ensemble des traductions de l’Odyssée d’Homère en langue française depuis la Renaissance jusqu’à nos jours. Elle participe à la constitution d’une histoire des traductions à partir du nouvel outillage technique et conceptuel offert par le numérique, qui permet d’envisager à nouveaux frais l’histoire des traductions d’un texte fondateur de la civilisation occidentale. Notre hypothèse, selon laquelle le tournant dans la manière de traduire Homère s’effectue entre la fin du XVIIIe siècle et le début du XIXe siècle en France, avec les progrès de l’archéologie et de la philologie, a pu être vérifiée tout au long de cette étude, grâce au programme que nous avons construit. Cette étude a donc pu retracer à la fois l’histoire des traductions de l’Odyssée et se rattacher à l’histoire plus large qu’est l’histoire des traductions. Notre étude a aussi pour but de rendre accessibles à tous les résultats que nous avons obtenus. Nous avons numérisé et rassemblé toutes les traductions de l’Odyssée en langue française dans un format XML enrichi. Nous avons traité 26 traductions de l’Odyssée, dont 23 sont intégrales. Hormis les textes sous droits, tous les textes sont en libre accès sous cette forme. L’outil numérique que nous avons créé de toutes pièces n’est pas seulement un instrument destiné à faciliter le travail du chercheur : il permet de trouver des phénomènes qui sont indécelables à l’œil nu, et d’obtenir des résultats qui ne peuvent pas, même avec la plus grande rigueur, être obtenus par un humain. Nous voyons ainsi la double fonction de l’outil informatique, qui sert à la fois d’outil de vérification et de découverte. D’une part, l’outil informatique permet de rendre vérifiable les intuitions de la philologie qui sont opérationnalisées et parfois visualisables de manière pédagogique. D’autre part, des phénomènes inattendus peuvent être rendus visibles par les expériences, comme des inflexions que la longue durée ou la quantité de textes auraient masquées. / This study goes through the whole of the French translations of Homer’s Odyssey from the Renaissance up to the XXth century. It is a further step in the study of the history of translations, based on a new technical and conceptual tool, using a wide range of new techniques in the field of Digital Humanities, which should help us enhance research about such a major text in Western civilization. Our hypothesis is to locate the turning point in the ways to translate Homer at the end of the XVIIIth century in France, with progress made in archeology and philology, a hypothesis that has been verified throughout this study, thanks to the software we made. We have studied both the history of the translations of the Odyssey and a wider history, that is to say, history of translations in general. Our study also aimed at giving access to the wider public to the results we got. We digitized and gathered all the French translations of the Odyssey in an enriched XML format. We have dealt with 26 translations, within which 23 are complete. Except for copyrighted texts, all our texts are open source. The digital tool we made does not only exist to ease the scientific work, but it also allows us to see new phenomena that would be impossible to spot with a human eye, and obtain results that cannot, even with rigorous expertise, be obtained by a human. We see there the double function of a digital tool that can both confirm and help discover. Firstly, the tool can allow us to confirm philological intuitions that can be operationalized and visualized in pedagogical way. On the other hand, unexpected phenomena can be found and visualized, such as changes that might have been hidden due to the wide period studied or the quantity of texts analyzed.
|
25 |
Instruments, pratiques et enjeux d’une recherche numériquement équipée en sciences humaines et sociales / Instruments, practices and issues of digitally equipped research in the humanities and social sciencesBigot, Jean-Édouard 06 July 2018 (has links)
Progressivement, les technologies numériques prennent une place plus importante dans la recherche sur les phénomènes socioculturels. Des projets d’équipement se développent dans toutes les disciplines des sciences humaines et sociales (SHS) et des mouvements prônant une révolution instrumentale se multiplient. Cette thèse en sciences de l’information et de la communication propose d’interroger l’avènement d’une recherche « numériquement équipée » en SHS à partir d’une réflexion générale sur les liens entre sciences, technique et écriture. Quels sont les enjeux épistémologiques, mais aussi politiques, sous-jacents à ces logiques d’instrumentation numérique en tant qu’elles instituent de nouvelles techniques d’écriture au cœur des pratiques de recherche ? Le mémoire présente un parcours en trois grandes parties. La première partie inscrit la recherche dans une pensée des rapports fondamentaux entre instruments techniques et connaissance scientifique. Il s’agit également de reconnaître les spécificités d’une approche « communicationnelle » de l’instrumentation scientifique, et en particulier de l’instrumentation numérique. La deuxième partie propose une exploration critique des discours d’escorte qui accompagnent ces transformations en s’appuyant sur les projets émanant de deux courants majeurs du domaine de la recherche numériquement équipée en SHS : les « humanités numériques » et les « méthodes numériques ». Quelles sont les promesses portées par ces mouvements ? Quels imaginaires, quelles représentations de la science et du numérique ces projets de « renouvellement » de la recherche par le numérique abritent-ils, mais aussi à quels « obstacles » se heurtent-ils ? À partir de la théorie des médias informatisés et de l’écriture numérique, et sur la base d’une démarche d’analyse techno-sémiotique, la troisième partie interroge les formes et les pouvoirs de la médiation instrumentale numérique. Sur un plan morphologique et praxéologique, en quoi consiste la conception et la mise en œuvre de tels instruments ? Sur un plan plus politique, quels sont les effets « normatifs » de ces dispositifs instrumentaux sur l’épistémologie des disciplines qui s’en saisissent ? / Gradually, digital technologies are becoming more important in research on sociocultural phenomena. Equipment projects are developing in all the social sciences and the humanities (SSH) and movements advocating an instrumental revolution are multiplying. This thesis proposes to question the advent of a digitally equipped research in the SSH on the basis of a general reflection on the links between science, technology and writing. What are the epistemological and political issues that underlie these digital instrumentation logics as they institute new writing techniques at the heart of research practices? The thesis is composed of three main parts. The first part questions the fundamental relationships between technical instruments and scientific knowledge. It is also about estimating the specificities of a communication approach to scientific instrumentation. The second part proposes a critical exploration of the discourses that accompany these transformations by focusing on projects from two major currents in the field of digitally equipped research in the SSH: the "digital humanities" and the "digital methods". What promises, what "imaginaires", what representations of science do these research practices renewal projects by digital technology contain? But also what "epistemological obstacles" do they encounter? Based on a theory of digital writing, and on a techno-semiotic analysis approach, the thir part questions the forms and powers of the digital instrumentation. On a morphological level, what do the design and implementation of such instruments consist of? On a political level, what are the normative effects of these "dispositifs" on the epistemology of the disciplines that seize them?
|
26 |
Recherche d'information et humanités numériques : une approche et des outils pour l'historien / Information seeking and digital humanities : an approach and tools for the historianSuire, Cyrille 13 September 2018 (has links)
Les travaux de cette thèse portent sur les conséquences du développement du numérique sur la pratique de recherche en SHS au sens large et en histoire en particulier. L'introduction du numérique bouleverse les pratiques de recherche en histoire en mettant à disposition du chercheur un grand volume de sources numérisées ainsi que de nombreux outils d'analyse et d'écriture. Si ces nouveaux moyens de recherche permettent à la discipline d'adopter de nouvelles approches et de renouveler certains points de vue, ils posent également des questions sur les plans méthodologique et épistémologique. Devant ce constat, nous avons choisi d'étudier plus en détail l'impact des outils de recherche d'information, bibliothèques numériques et moteurs de recherche de sources sur l'activité de recherche en histoire. Ces systèmes offrent un accès à un grand volume de documents historiques mais leur fonctionnement repose sur des traitements informatiques pour la plupart invisibles aux yeux des utilisateurs, qui peuvent ainsi s'apparenter à des boîtes noires. L'objectif principal de cette thèse est donc de donner les moyens aux utilisateurs d'observer et de comprendre ces processus dans l'optique de leur permettre d'en intégrer les effets de bord à leur méthodologie. Afin de mieux positionner notre objet d'étude, nous proposons un cadre conceptuel reposant sur la notion de ressource numérique. Ce concept représente les systèmes numériques que nous étudions au sein de leur contexte d'usage, de production et d'exécution, il fait le lien entre des usages attendus par les utilisateurs et des choix méthodologiques ou techniques issus des présupposés de ces concepteurs. Sur la base de ce cadre conceptuel, nous proposons une analyse des bibliothèques numériques et moteurs de recherche de sources en fonction de chacun des contextes. Ainsi, notre étude propose une analyse des usages de ce type de ressource numérique dans le cadre d'une recherche en histoire en adoptant une démarche expérimentale et en produisant des indicateurs de la pratique. Ces indicateurs sont ensuite croisés avec le fonctionnement du système, dans ces contextes de production et d'exécution, pour en révéler les biais méthodologiques. À l'issue de ces analyses, nous proposons un réinvestissement de ces résultats sous la forme d'un outil logiciel dédié à l'enseignement d'une approche critique de la recherche d'information en ligne pour les apprentis historiens. Ces travaux sont évalués par une démarche expérimentale. Elle est construite sur la base d'un prototype d'observation du comportement des utilisateurs en situation de recherche d'information et des outils de démonstration des biais associés au fonctionnement des processus informatiques impliqués lors des phases de production des contenus et d'exécution du système. Ce prototype a fait l'objet de plusieurs phases d'expérimentation liées à son développement, l'évaluation de ces fonctionnalités et de son impact sur la pratique dans un contexte de formation. / The work of this thesis focuses on the consequences of digital technology development on research practice in the humanities in the broad sense and particularly in history. The introduction of digital technology disrupts historical research practices by making available to the researcher a large volume of digitized sources as well as numerous analysis and writing tools. These new capacities of research allow the discipline to adopt new approaches and renew certain points of view, but they also raise methodological and epistemological questions. Given this observation, we have chosen to study in more detail the impact of information retrieval tools, digital libraries and search engines on historical research activity. These systems offer access to a large volume of historical documents but they depend on computer processes that are mostly invisible to users and acting as black boxes. The main objective of this work is to give users the means to observe and understand these processes in order to allow them to integrate their side effects in a suitable methodology. In order to better position our object of study, we propose a conceptual framework based on the notion of digital resource. This concept represents the digital systems that we study within their contexts of use, production and execution. It connects uses expected by users and methodological or technical choices based on the assumptions of system designers. Based on this conceptual framework, we propose an analysis of digital libraries and historical sources search engines according to each context. Thus, our study proposes an analysis of the uses of this type of digital resource within the framework of a research in history. The study adopts an experimental approach and produces indicators of the practice. These indicators are then crossed with the functioning of the system, in its contexts of production and execution, to reveal the potential methodological biases. Following these analyzes, we propose a reinvestment of these results in the form of a software tool dedicated to teaching a critical approach to online information retrieval for student in history. This work is evaluated by an experimental approach. It is built on the basis of a prototype of observation of the behavior of the users when they are looking for information. Our experimental approach is also based on demonstration tools of the biases associated with the functioning of the computer processes involved during the contexts of production and execution. This prototype has been the subject of several experimental phases related to its development, the evaluation of these features and its impact on practice in a training context.
|
27 |
La réalisation matérielle du "Französisches Etymologisches Wörterbuch" : impact de la mise en forme typographique sur le développement d'un projet lexicographique / The material realization of the "Französisches Etymologisches Wörterbuch" : the impact of typography on the development of a lexicographical projectKremer, Sarah 20 December 2018 (has links)
Le dictionnaire étymologique du français de Walther von Wartburg, le Französisches Etymologisches Wörterbuch (FEW), est en cours d’informatisation. Ses 25 volumes, répartis sur plus de 16000 pages, sont saisis puis jalonnés de balises sémantiques XML par une série d’algorithmes afin de permettre la mise en place d’un FEW électronique et son interaction avec différentes ressources extérieures. Or, l’encodage des données saisies ainsi que leur affichage dépendent directement de polices de caractères qui soient en mesure de formater l’ensemble du contenu du FEW, notamment une série de caractères inédits utilisés pour la notation de transcriptions phonétiques.L’objet de cette thèse consiste dans l’étude de la réalisation matérielle du FEW, en particulier sa typographie, des premières publications d’articles en 1922 jusqu’à leur diffusion actuelle sous une forme uniquement numérique. L’étude s’appuie pour cela sur une analyse des évolutions de la présentation du dictionnaire en abordant ses changements, d’ordre lexicographique mais aussi technique. Cette analyse est complétée par l’observation d’une série d’autres dictionnaires dont la mise en forme typographique est remarquable. La thèse participe ainsi à mettre en évidence la manière dont le FEW est un objet lexicographique unique.Le résultat concret de la thèse correspond à la création d’une famille de caractères adaptée aux usages du FEW. Ces polices sont exploitées au sein de deux interfaces: la première accompagne les rédacteurs du FEW lors de l’élaboration de nouveaux articles, la seconde permet aux utilisateurs de consulter et d’interagir avec la base de données du FEW informatisé. Issue d’une collaboration entre linguistes, informaticiens et designers, cette thèse propose un modèle d’intégration du design typographique au sein des humanités numériques / The etymological dictionary of the French language by Walther von Wartburg, entitled Französisches Etymologisches Wörterbuch (FEW), is being digitalized. Its 25 volumes spread over 16,000 pages are currently being typed and tagged with semantical XML language using a series of algorithms, in order to create a computerized FEW, able to interact with several external resources. However, the encoding and the display of the data requires appropriate fonts to typeset the whole dictionary, including a series of specific characters for phonetic transcriptions.The purpose of this thesis is to study the material realization of the FEW, and more specifically its typography, starting from the publication of the first articles in 1922 up to their current circulation as an exclusively digital content. The study is based on an analysis of the evolution of the dictionary's layout, taking into account lexicographical but also technical changes. This analysis is completed by a study of a selection of other dictionaries whose typesetting is remarkable. This thesis hence contributes to highlighting the extent to which the FEW is a unique lexicographic object.The concrete result of this thesis consists in a typeface family tailored to the needs of FEW users. These fonts are implemented in two interfaces: the first one is used by FEW editors to structure and write new articles, the second one enables users to consult and interact with the database of the computerized FEW.The result of a collaboration between linguists, computer scientists and designers, this thesis proposes a new model for integrating typographic design within digital humanities
|
28 |
Détection de points de vue sur les médias sociaux numériques / Stance detection on digital social mediasFraisier, Ophélie 07 December 2018 (has links)
De nombreux domaines ont intérêt à étudier les points de vue exprimés en ligne, que ce soit à des fins de marketing, de cybersécurité ou de recherche avec l'essor des humanités numériques. Nous proposons dans ce manuscrit deux contributions au domaine de la fouille de points de vue, axées sur la difficulté à obtenir des données annotées de qualité sur les médias sociaux. Notre première contribution est un jeu de données volumineux et complexe de 22853 profils Twitter actifs durant la campagne présidentielle française de 2017. C'est l'un des rares jeux de données considérant plus de deux points de vue et, à notre connaissance, le premier avec un grand nombre de profils et le premier proposant des communautés politiques recouvrantes. Ce jeu de données peut être utilisé tel quel pour étudier les mécanismes de campagne sur Twitter ou pour évaluer des modèles de détection de points de vue ou des outils d'analyse de réseaux. Nous proposons ensuite deux modèles génériques semi-supervisés de détection de points de vue, utilisant une poignée de profils-graines, pour lesquels nous connaissons le point de vue, afin de catégoriser le reste des profils en exploitant différentes proximités inter-profils. En effet, les modèles actuels sont généralement fondés sur les spécificités de certaines plateformes sociales, ce qui ne permet pas l'intégration de la multitude de signaux disponibles. En construisant des proximités à partir de différents types d'éléments disponibles sur les médias sociaux, nous pouvons détecter des profils suffisamment proches pour supposer qu'ils partagent une position similaire sur un sujet donné, quelle que soit la plateforme. Notre premier modèle est un modèle ensembliste séquentiel propageant les points de vue grâce à un graphe multicouche représentant les proximités entre les profils. En utilisant des jeux de données provenant de deux plateformes, nous montrons qu'en combinant plusieurs types de proximité, nous pouvons correctement étiqueter 98% des profils. Notre deuxième modèle nous permet d'observer l'évolution des points de vue des profils pendant un événement, avec seulement un profil-graine par point de vue. Ce modèle confirme qu'une grande majorité de profils ne changent pas de position sur les médias sociaux, ou n'expriment pas leur revirement. / Numerous domains have interests in studying the viewpoints expressed online, be it for marketing, cybersecurity, or research purposes with the rise of computational social sciences. We propose in this manuscript two contributions to the field of stance detection, focused around the difficulty of obtaining annotated data of quality on social medias. Our first contribution is a large and complex dataset of 22853 Twitter profiles active during the French presidential campaign of 2017. This is one of the rare datasets that considers a non-binary stance classification and, to our knowledge, the first one with a large number of profiles, and the first one proposing overlapping political communities. This dataset can be used as-is to study the campaign mechanisms on Twitter, or used to test stance detection models or network analysis tools. We then propose two semi-supervised generic stance detection models using a handful of seed profiles for which we know the stance to classify the rest of the profiles by exploiting various proximities. Indeed, current stance detection models are usually grounded on the specificities of some social platforms, which is unfortunate since it does not allow the integration of the multitude of available signals. By infering proximities from differents types of elements available on social medias, we can detect profiles close enough to assume they share a similar stance on a given subject. Our first model is a sequential ensemble algorithm which propagates stances thanks to a multi-layer graph representing proximities between profiles. Using datasets from two platforms, we show that, by combining several types of proximities, we can achieve excellent results. Our second model allows us to observe the evolution of profiles' stances during an event with as little as one seed profile by stance. This model confirms that a large majority of profiles do not change their stance on social medias, or do not express their change of heart.
|
29 |
Automatic annotation of similes in literary texts / Annotation automatique des comparaisons figuratives dans les textes littérairesMpouli Njanga Seh, Suzanne Patience 03 October 2016 (has links)
Cette thèse aborde le problème de la détection automatique des comparaisons figuratives dans des textes littéraires en prose écrits en français ou en anglais et propose un canevas pour décrire ces comparaisons d’un point de vue stylistique. Une comparaison figurative correspond ici à toute structure syntaxique qui met en parallèle au moins deux entités, déroge au principe de compositionnalité et crée une image mentale dans l’esprit de ceux à qui elle est destinée.Trois éléments principaux distinguent notre approche des travaux précédents : son ancrage dans les théories linguistiques et cognitives sur les comparaisons littérales et figuratives, sa capacité à gérer des marqueurs appartenant à différentes catégories grammaticales et sa flexibilité qui lui permet d’envisager différents scénarios syntaxiques. De fait, nous proposons une méthode comprenant trois modules complémentaires : - un module syntaxique qui utilise des dépendances syntaxiques et des règles manuelles pour identifier les comparaisons potentielles ainsi que leurs composantes ;- un module sémantique qui mesure la saillance des motifs détectés et la similarité sémantique des termes comparés en se basant sur une base de données préétablie ;- et un module d’annotation qui fournit entre autres des informations sur le type de comparaison (idiomatique, sensorielle…) et sur les catégories sémantiques employées.Pour finir, au vu des données recueillies au cours des deux campagnes d’annotation que nous avons menées, il paraît clair que la détection automatique des comparaisons figuratives doit tenir compte de plusieurs facteurs parmi lesquels la saillance, la catégorisation et la syntaxe de la phrase. / This thesis tackles the problem of the automatic recognition of similes in literary texts written in English or in French and proposes a framework to describe them from a stylistic perspective. For the purpose of this study, a simile has been defined as a syntactic structure that draws a parallel between at least two entities, lacks compositionality and is able to create an image in the receiver’s mind.Three main points differentiate the proposed approach from existing ones: it is strongly influenced by cognitive and linguistic theories on similes and comparisons, it takes into consideration a wide range of markers and it can adapt to diverse syntactic scenarios. Concretely speaking, it relies on three interconnected modules: - a syntactic module, which extracts potential simile candidates and identifies their components using grammatical roles and a set of handcrafted rules, - a semantic module which separates creative similes from both idiomatic similes and literal comparisons based on the salience of the ground and semantic similarity computed from data automatically retrieved from machine-readable dictionaries;- and an annotation module which makes use of the XML format and gives among others information on the type of comparisons (idiomatic, perceptual…) and on the semantic categories used.Finally, the two annotation tasks we designed show that the automatic detection of figuration in similes must take into consideration.Finally, the two annotation tasks we designed show that the automatic detection of figuration in similes must take into consideration a series of features among which salience, categorisation and the sentence syntax.
|
30 |
Figures romanesques du médecin de Diderot à Balzac / Characterization of Physicians in the French Novel from Diderot to BalzacMacaigne, Samuel 16 March 2019 (has links)
Des Lumières au réalisme, le médecin prend une place toujours plus importante dans la littérature. Si sa discipline évolue et connaît ainsi de considérables progrès, sa représentation dans la fiction devient elle aussi conséquente. De ce fait, le roman s'empare de ce personnage pour lui conférer un rôle de témoin actif des changements historiques et esthétiques, à travers trois domaines : la politique, la spiritualité et les passions. En effet, s'il diagnostique les maladies du corps social, les pathologies que manifeste l'Histoire, il est aussi appelé à sonder les âmes pour déterminer les causes du désarroi intérieur de l'être humain. Derrière la physiologie et l'anatomie, il explore également les arrière-mondes de la foi et des sentiments. Le praticien se doit donc d'éclairer les mystères de la condition humaine. / From the Enlightenment to realism, the doctor acquires an increasingly important place in French literature. With the development and considerable progress of medical science, the fictional doctor also becomes consequential. Hence, the novel calls upon this character to play an active role as witness of the historical and aesthetic changes in three fields: politics, spirituality and passions. In fact, not only does he diagnose the diseases of the social body, the pathologies that History reveals, he is also called upon to sound souls in order to establish the causes of the inner disarray of the human being. Behind the physiology and anatomy, he also explores the afterworldly for faith and feelings. The practitioner must therefore throw light on the mysteries of the human condition.
|
Page generated in 0.3636 seconds