La démocratisation des textes numérisés change aujourd’hui nos ambitions scientifiques. Lire les big data n’est plus un idéal auquel on aspire. Dès lors, l’interprétation des gros corpus devient un impératif et se pose en défi. Puisque les textes s’étalent naturellement dans le temps, les gros corpus prennent le plus souvent la forme des corpus chronologiques. Ceux-ci représentent ici un objet de connaissance ordonné qui approfondit notre compréhension des données sérielles et met en question la pertinence du recours à une statistique traditionnelle.Le Monde diplomatique est un mensuel sérieux et reconnu par les instances universitaires comme source de première main. En 2015, il comptait 37 éditions internationales en 20 langues. Journal français engagé à large diffusion internationale, il fait l’objet d’études universitaires nombreuses. Une analyse thématique documentée vise ici l’observation de l’évolution du discours sans complexe du mensuel dans un monde en reconstruction. Comment le MD gère-t-il l’évolution de son discours au lendemain de la chute du mur de Berlin et jusqu’à la fin de la guerre mondiale contre le terrorisme ? La fin du XXe siècle et le début du XXIe siècle est un laps de temps assez court et pourtant foisonnant.Au confluent de ce double intérêt pour les données sérielles chronologiques et l’analyse de l’évolution thématique du MD, une série textuelle chronologique regroupant plus de 5000 articles publiés entre 1990 et 2008 qui comptent plus de 11 millions d’occurrences est réduite à une maquette. Celle-ci devient un prêt-à-monter rapide qui nous assiste dans une lecture qui articule les niveaux descriptifs de la textualité pour aller au fond des moments de sens stabilisé, pour arriver au bout de la marche du temps et pour pratiquer une sémantique appropriée dans toute sa complexité. / Dealing with big data today is becoming a big challenge for scholars who are conducting corpus-based studies. As producing texts spreads normally over time, scholars are interfacing increasingly with chronological corpora. Studying time series deepens our understanding of chronological data and modifies our ideas about the appropriate statistical analysis. The Monde diplomatique is a monthly newspaper distributed worldwide. In 2015, it had 37 editions and was read in 20 languages. As a French international journal offering serious analysis on politics, economics, culture and current affairs, it is an area of interest for several university studies. We aim here to offer a documented analysis of the evolution of its discourse in the aftermath of the Fall of the Berlin Wall and till the end of the Global War on Terror (GWOT).To analyse big corpora that stretch out over time we need to adjust our practices in corpus semantics and statistical data analysis. That is what we propose by using a scale model of a chronological corpus initially composed of more than 5000 articles (ca 11 million text words). A new reduced and authentic model guarantees appropriate approach to different text levels to study meaning over time.
Identifer | oai:union.ndltd.org:theses.fr/2017AZUR2042 |
Date | 11 December 2017 |
Creators | Metwally, Heba |
Contributors | Côte d'Azur, Mayaffre, Damon |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | French |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text |
Page generated in 0.002 seconds