Spelling suggestions: "subject:"texte"" "subject:"exte""
71 |
Détection de textes générés automatiquement / Detection of automatically generated textsNguyen, Minh Tien 03 April 2018 (has links)
Le texte généré automatiquement a été utilisé dans de nombreuses occasions à des buts différents. Il peut simplement passer des commentaires générés dans une discussion en ligne à une tâche beaucoup plus malveillante, comme manipuler des informations bibliographiques. Ainsi, cette thèse introduit d'abord différentes méthodes pour générer des textes libres ayant trait à un certain sujet et comment ces textes peuvent être utilisés. Par conséquent, nous essayons d'aborder plusieurs questions de recherche. La première question est comment et quelle est la meilleure méthode pour détecter un document entièrement généré.Ensuite, nous irons un peu plus loin et montrer la possibilité de détecter quelques phrases ou un petit paragraphe de texte généré automatiquement en proposant une nouvelle méthode pour calculer la similarité des phrases en utilisant leur structure grammaticale. La dernière question est comment détecter un document généré automatiquement sans aucun échantillon, ceci est utilisé pour illustrer le cas d'un nouveau générateur ou d'un générateur dont il est impossible de collecter des échantillons dessus.Cette thèse étudie également l'aspect industriel du développement. Un aperçu simple d'un flux de travail de publication d'un éditeur de premier plan est présenté. À partir de là, une analyse est effectuée afin de pouvoir intégrer au mieux notre méthode de détection dans le flux de production.En conclusion, cette thèse a fait la lumière sur de multiples questions de recherche importantes concernant la possibilité de détecter des textes générés automatiquement dans différents contextes. En plus de l'aspect de la recherche, des travaux d'ingénierie importants dans un environnement industriel réel sont également réalisés pour démontrer qu'il est important d'avoir une application réelle pour accompagner une recherche hypothétique. / Automatically generated text has been used in numerous occasions with distinct intentions. It can simply go from generated comments in an online discussion to a much more mischievous task, such as manipulating bibliography information. So, this thesis first introduces different methods of generating free texts that resemble a certain topic and how those texts can be used. Therefore, we try to tackle with multiple research questions. The first question is how and what is the best method to detect a fully generated document.Then, we take it one step further to address the possibility of detecting a couple of sentences or a small paragraph of automatically generated text by proposing a new method to calculate sentences similarity using their grammatical structure. The last question is how to detect an automatically generated document without any samples, this is used to address the case of a new generator or a generator that it is impossible to collect samples from.This thesis also deals with the industrial aspect of development. A simple overview of a publishing workflow from a high-profile publisher is presented. From there, an analysis is carried out to be able to best incorporate our method of detection into the production workflow.In conclusion, this thesis has shed light on multiple important research questions about the possibility of detecting automatically generated texts in different setting. Besides the researching aspect, important engineering work in a real life industrial environment is also carried out to demonstrate that it is important to have real application along with hypothetical research.
|
72 |
Suivi de chansons par reconnaissance automatique de parole et alignement temporelBeaudette, David January 2010 (has links)
Le suivi de partition est défini comme étant la synchronisation sur ordinateur entre une partition musicale connue et le signal sonore de l'interprète de cette partition. Dans le cas particulier de la voix chantée, il y a encore place à l'amélioration des algorithmes existants, surtout pour le suivi de partition en temps réel. L'objectif de ce projet est donc d'arriver à mettre en oeuvre un logiciel suiveur de partition robuste et en temps-réel utilisant le signal numérisé de voix chantée et le texte des chansons. Le logiciel proposé utilise à la fois plusieurs caractéristiques de la voix chantée (énergie, correspondance avec les voyelles et nombre de passages par zéro du signal) et les met en correspondance avec la partition musicale en format MusicXML. Ces caractéristiques, extraites pour chaque trame, sont alignées aux unités phonétiques de la partition. En parallèle avec cet alignement à court terme, le système ajoute un deuxième niveau d'estimation plus fiable sur la position en associant une segmentation du signal en blocs de chant à des sections chantées en continu dans la partition. La performance du système est évaluée en présentant les alignements obtenus en différé sur 3 extraits de chansons interprétés par 2 personnes différentes, un homme et une femme, en anglais et en français.
|
73 |
Images of eternity in 3DLucarelli, Rita 20 April 2016 (has links) (PDF)
By using the technique of photogrammetry for the 3D visualization of ancient Egyptian coffins decorated with magical texts and iconography, this project aims at building up a new digital platform for an in-depth study of the ancient Egyptian funerary culture and its media. It has started in August 2015 through the support of a Mellon Fellowship for the Digital Humanities at UC Berkeley and up until now it has focused on ancient Egyptian coffins kept at the Phoebe A. Hearst Museum of Anthropology of UC Berkeley. The main outcome will be a digital platform that allows to display a coffin in 3D and where users will be able to pan, rotate, and zoom in on the coffin, clicking on areas of text to highlight them and view an annotated translation together with other metadata (transcription of the hieroglyphic text, bibliography, textual variants, museological data, provenance, etc.)
|
74 |
Les effets de la mise en place d'une adaptation didactique en rédaction sur les productions écrites des élèves à risque intégrésGiguère, Antoine January 2008 (has links)
Dans cet article, l'objectif poursuivi consiste à évaluer les effets de la mise en place d'une adaptation didactique sur l'écriture narrative d'élèves à risque intégrés. L'originalité de l'étude repose sur le choix de la situation d'apprentissage et de l'adaptation didactique afin de permettre aux élèves à risque d'une classe de 4e année du primaire d'une école québécoise de produire des récits structurés et cohérents. L'apport de l'adaptation didactique «texte modèle» réside dans la présentation d'un texte fini répondant aux attentes finales afin de guider le processus d'écriture. L'analyse quantitative des résultats montre des effets significatifs produits par le dispositif didactique sur la compétence à structurer un texte de type narratif et sur celle à le rendre cohérent.
|
75 |
Modeling and mining of Web discussionsStavrianou, Anna 01 February 2010 (has links) (PDF)
Le développement du Web 2.0 a donné lieu à la production d'une grande quantité de discussions en ligne. La fouille et l'extraction de données de qualité de ces discussions en ligne sont importantes dans de nombreux domaines (industrie, marketing) et particulièrement pour toutes les applications de commerce électronique. Les discussions de ce type contiennent des opinions et des croyances de personnes et cela explique l'intérêt de développer des outils d'analyse efficaces pour ces discussions. L'objectif de cette thèse est de définir un modèle qui représente les discussions en ligne et facilite leur analyse. Nous proposons un modèle basé sur des graphes. Les sommets du graphe représentent les objets de type message. Chaque objet de type message contient des informations comme son contenu, son auteur, l'orientation de l'opinion qui y été exprimée et la date où il a été posté. Les liens parmi les objets message montrent une relation de type "répondre à". En d'autres termes, ils montrent quels objets répondent à quoi, conséquence directe de la structure de la discussion en ligne. Avec ce nouveau modèle, nous proposons un certain nombre de mesures qui guident la fouille au sein de la discussion et permettent d'extraire des informations pertinentes. Il existe des mesures centrées sur l'analyse de l'opinion qui traitent de l'évolution de l'opinion au sein de la discussion. Nous définissons également des mesures centrées sur le temps, qui exploitent la dimension temporelle du modèle, alors que les mesures centrées sur le sujet peuvent être utilisées pour mesurer la présence de sujets dans une discussion. La présence de l'utilisateur dans des discussions en ligne peut être exploitée soit par les techniques des réseaux sociaux, soit à travers notre nouveau modèle qui inclut la connaissance des auteurs de chaque objet message. De plus, une liste de messages clés est recommandée à l'utilisateur pour permettre une participation plus efficace au sein de la discussion.
|
76 |
Apprentissage à base de Noyaux Sémantiques pour le Traitement de Données TextuellesAseervatham, Sujeevan 12 December 2007 (has links) (PDF)
Depuis le début des années 80, les méthodes statistiques et, plus spécifiquement, les méthodes d'apprentissage appliquées au traitement de données textuelles connaissent un intérêt grandissant. Cette tendance est principalement due au fait que la taille des corpus est en perpétuelle croissance. Ainsi, les méthodes utilisant le travail d'experts sont devenues des processus coûteux perdant peu à peu de leur popularité au profit des systèmes d'apprentissage.<br />Dans le cadre de cette thèse, nous nous intéressons principalement à deux axes.<br />Le premier axe porte sur l'étude des problématiques liées au traitement de données textuelles structurées par des approches à base de noyaux. Nous présentons, dans ce contexte, un noyau sémantique pour les documents structurés en sections notamment sous le format XML. Le noyau tire ses informations sémantiques à partir d'une source de connaissances externe, à savoir un thésaurus. Notre noyau a été testé sur un corpus de documents médicaux avec le thésaurus médical UMLS. Il a été classé, lors d'un challenge international de catégorisation de documents médicaux, parmi les 10 méthodes les plus performantes sur 44. <br />Le second axe porte sur l'étude des concepts latents extraits par des méthodes statistiques telles que l'analyse sémantique latente (LSA). Nous présentons, dans une première partie, des noyaux exploitant des concepts linguistiques provenant d'une source externe et des concepts statistiques issus de la LSA. Nous montrons qu'un noyau intégrant les deux types de concepts permet d'améliorer les performances. Puis, dans un deuxième temps, nous présentons un noyau utilisant des LSA locaux afin d'extraire des concepts latents permettant d'obtenir une représentation plus fine des documents.
|
77 |
L’œuvre vocale sacrée de Henry Purcell : à la recherche d’un équilibre / Henry Purcell’s sacred works : in search of moderationSimon, Laurent 06 November 2009 (has links)
Le développement de la musique religieuse de Henry Purcell pendant la seconde moitié du dix-septième siècle est le fruit d’un compromis fructueux entre les contraintes politiques et religieuses de l’Angleterre de la Restauration et l’influence du baroque continental. L’évolution stylistique de ses compositions reflète la politique menée par les souverains successifs : Charles II, Jacques II et Guillaume d’Orange. Musicien baroque en pays anti-papiste, Purcell se montre particulièrement habile dans la manière de mettre les mots en musique et parvient à un équilibre entre l’exigence des réformateurs en matière d’intelligibilité du texte et l’esthétique de la contre-réforme. / The development of Henry Purcell’s sacred music in the second half of the seventeenth century originates in a fruitful compromise between the political and religious constraints of Restoration England and the contribution of the continental baroque. The stylistic evolution of his religious compositions reflects the political and religious developments which took place during the successive reigns of Charles II, James II and William of Orange. As a baroque musician and a native of an anti-papist country, Purcell showed considerable skill in the art of setting words to music and managed to blend in the Reformers’ emphasis on the intelligibility of the text and Counter-Reformation aesthetics.
|
78 |
Analyse cognitive de la cohérence interindexeurs lors de l'indexation de documentsDavid, Claire January 2003 (has links)
Thèse numérisée par la Direction des bibliothèques de l'Université de Montréal.
|
79 |
Adaptation du Roi lune de Guillaume Apollinaire : texte ergodique non-interactif pour cinéma ergodique non-interactifDussault, Cédric January 2008 (has links)
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal. / Pour respecter les droits d'auteur, la version électronique de cette thèse ou ce mémoire a été dépouillée, le cas échéant, de ses documents visuels et audio-visuels. La version intégrale de la thèse ou du mémoire a été déposée au Service de la gestion des documents et des archives de l'Université de Montréal.
|
80 |
Littérature, analyse et forme : l'architecture intertextuelle et transtextuelle du discours littéraireSimard, Charles Robert January 2007 (has links)
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal.
|
Page generated in 0.0385 seconds