Nous présentons une solution pour la création d'un corpus numérisé en utilisant une approche crowdsourcing pour annoter des bandes dessinées (BD). Les encodages XML qui en résultent aident également les chercheurs, les éditeurs, les bibliothécaires et les conservateurs de collections BDs. Pour atteindre notre objectif de recueil de données, nous développons un moteur de crowdsourcing en ligne pour annoter les BDs. Les tâches sont conçues pour reproduire l'expérience de lecture des pages des BDs, en demandant aux participants d'identifier et d'annoter les éléments structurels (cases, splash-pages) et de contenu (personnages, lieux, événements, onomatopées, objets, lignes de mouvement) des BDs. Notre approche fournit aux chercheurs en humanités numériques (digital humanities) la possibilité de bâtir un corpus structuré et annoté, aujourd’hui manquant. Cela permet d’accélérer la recherche liée à la BD et à la théorie de l'art séquentiel. Les bibliothécaires et les conservateurs de collections des BDs disposeront d'un contenu structuré qui pourrait permettre la création d'artefacts spécifiques, tels que des dictionnaires de BDs, des indices de recherche ou des dictionnaires d'onomatopée. Du point de vue de l'édition, les standards actuels pour les BDs numériques se chargent exclusivement de la couche de présentation (c'est-à-dire, rendre tout simplement une publication sur l'écran d'un dispositif numérique). Mais la nature artistique de la BD et le grand potentiel des BDs numériques nous permettent d'aller au-delà de la simple présentation du contenu. À cet égard, nous contribuons avec des améliorations aux standards sémantiques (CBML) et de présentation (EPUB). / We address the difficulty of creating a digitised corpus by using a crowdsourced approach for annotating comic books. The resulting XML-based encodings assist researchers, publishers and collection curators equally. To achieve our data collection goal, we develop an online crowdsourcing engine for annotating comics. The tasks are designed to mirror the page reading experience, with participants asked to identify and annotate structural (panel layout, splash pages, meta-panels) and content (characters, places, events, onomatopoeia) elements of comic books. Our approach provides Digital Humanities (DH) scholars with a (currently missing) structured, annotated corpus; this enables and accelerates research related to comics and sequential art theory. Curators and collectors of physical or online comics collections are provided with a structured content which could enable the creation of artefacts such as comic books dictionaries, search indices and dictionaries of onomatopoeia. From a publishing perspective, current standards for digital comics are taking care exclusively of the presentation layer (i.e. rendering a publication on the screen of a device). But the artistic nature of comics and the great potential digital comics have already showcased allow us to go beyond simple content presentation. To this respect we present our contributions with enhancements to current semantic (CBML) and presentation (EPUB) open standards that will allow publishers and digital comics authors to create an improved reading experience.
Identifer | oai:union.ndltd.org:theses.fr/2017PA066590 |
Date | 20 April 2017 |
Creators | Tufis, Mihnea |
Contributors | Paris 6, Ganascia, Jean-Gabriel |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | English |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.0023 seconds