Global ETD Search

121	La dihydrofolate réductase R67, comme une cible d’antibiotiques et biocatalyseur potentiel Timchenko, Natalia 12 1900 (has links) La dihyrofolate réductase de type II R67 (DHFR R67) est une enzyme bactérienne encodée par un plasmide donc aisément transmissible. Elle catalyse la réaction de réduction du dihydrofolate (DHF) en tétrahydrofolate (THFA) essentiel pour la prolifération cellulaire. La DHFR R67 est une enzyme qui dépend du cofacteur NADPH. La DHFR R67 est différente, structurellement et génétiquement, de l’enzyme DHFR chromosomale présente chez tous les organismes et elle est résistante au triméthoprime (TMP) qui est largement utilisé dans les traitements antibactériens chez l’Homme. Aucun inhibiteur sélectif contre la DHFR R67 n’est actuellement répertorié. Le but de cette étude a été d’identifier des molécules qui pourront inhiber la DHFR R67 sélectivement, sans affecter la DHFR humaine (DHFRh). La vérification de la qualité des essais enzymatiques en conditions déterminées pour le criblage d’inhibiteurs sur plusieurs lectrices à plaques a identifié des appareils appropriés pour l’analyse. L’étude de l’activité enzymatique de la DHFR R67 et de la DHFRh en présence des solvants organiques et liquides ioniques (LIs), comme des co-solvants pour le criblage rationnel d’inhibiteurs, a montré que certains LIs peuvent servir de milieu alternatif pour les essais enzymatiques. Le criblage rationnel basé sur l’approche du design d’un inhibiteur à partir de petites molécules, a révélé des molécules primaires qui inhibent la DHFR R67 de façon faible, mais sélective. Le test des composés biologiquement actifs qui comprennent des petits fragments, a montré l’augmentation de l’affinité entre la DHFR R67 et les composés testés. Trois composés ont été déterminés comme des inhibiteurs sélectifs prometteurs pour la DHFR R67. / Type II R-plasmid encoded dihyrofolate reductase (DHFR), R67 DHFR is a bacterial enzyme that catalyzes the reduction of dihydrofolate (DHF) to tetrahydrofolate (THFA) which is essential for cell proliferation. R67 DHFR is an enzyme that depends on the cofactor NADPH as the hydride donor. R67 DHFR is distinct, structurally and genetically, from E. coli chromosomal DHFR (DHFR Ec) and it provides drug resistance to the widely-administered antibiotic trimethoprim (TMP). No selective inhibitor against R67 DHFR exists currently. The goal of this study was to discover molecules that can selectively inhibit R67 DHFR, without affecting human DHFR (hDHFR). Verification of the quality of enzyme assays under defined conditions for inhibitor screening on plate readers found several appropriate instruments for analysis. The study of the enzymatic activity of R67 DHFR and hDHFR in the presence of organic solvents and ionic liquids (ILs), as co-solvents for rational screening of inhibitors, showed that ILs can provide alternative media for enzymatic assays. Rational screening based on the approach of fragment-based drug design, revealed primary molecules that inhibited DHFR R67 weakly, but selectively. The testing of more complex compounds with known biological activities gave ligands with increased affinity for R67 DHFR. Three compounds were identified as promising selective inhibitors for R67 DHFR. Dihydrofolate réductase R67 résistance bactérienne liquides ioniques inhibiteur sélectif criblage rationnel biocatalyse R67 dihydrofolate reductase rsolvants resistance ionic liquids selective inhibitor rational screening trimétroprime activité enzymatique biocatalysis bacterial resistance trimethoprim enzyme activity organic solvents fragment-based drug design
122	Formalisation de connaissances à partir de corpus : modélisation linguistique du contexte pour l'extraction automatique de relations sémantiques El Maarouf, Ismaïl 06 December 2011 (has links) (PDF) Les corpus, collections de textes sélectionnés dans un objectif spécifique, occupent une place de plus en plus déterminante en Linguistique comme en Traitement Automatique des Langues (TAL). Considérés à la fois comme source de connaissances sur l'usage authentique des langues, ou sur les entités que désignent des expressions linguistiques, ils sont notamment employés pour évaluer la performance d'applications de TAL. Les critères qui prévalent à leur constitution ont un impact évident, mais encore délicat à caractériser, sur (i) les structures linguistiques majeures qu'ils renferment, (ii) les connaissances qui y sont véhiculées, et, (iii) la capacité de systèmes informatiques à accomplir une tâche donnée. Ce mémoire étudie des méthodologies d'extraction automatique de relations sémantiques dans des corpus de textes écrits. Un tel sujet invite à examiner en détail le contexte dans lequel une expression linguistique s'applique, à identifier les informations qui déterminent son sens, afin d'espérer relier des unités sémantiques. Généralement, la modélisation du contexte est établie à partir de l'analyse de co-occurrence d'informations linguistiques issues de ressources ou obtenues par des systèmes de TAL. Les intérêts et limites de ces informations sont évalués dans le cadre de la tâche d'extraction de relations sur des corpus de genre différent (article de presse, conte, biographie). Les résultats obtenus permettent d'observer que pour atteindre une représentation sémantique satisfaisante ainsi que pour concevoir des systèmes robustes, ces informations ne suffisent pas. Deux problèmes sont particulièrement étudiés. D'une part, il semble indispensable d'ajouter des informations qui concernent le genre du texte. Pour caractériser l'impact du genre sur les relations sémantiques, une méthode de classification automatique, reposant sur les restrictions sémantiques qui s'exercent dans le cadre de relations verbo-nominales, est proposée. La méthode est expérimentée sur un corpus de conte et un corpus de presse. D'autre part, la modélisation du contexte pose des problèmes qui relèvent de la variation discursive de surface. Un texte ne met pas toujours bout à bout des expressions linguistiques en relation et il est parfois nécessaire de recourir à des algorithmes complexes pour détecter des relations à longue portée. Pour répondre à ce problème de façon cohérente, une méthode de segmentation discursive, qui s'appuie sur des indices de structuration de surface apparaissant dans des corpus écrits, est proposée. Elle ouvre le champ à la conception de grammaires qui permettent de raisonner sur des catégories d'ordre macro-syntaxique afin de structurer la représentation discursive d'une phrase. Cette méthode est appliquée en amont d'une analyse syntaxique et l'amélioration des performances est évaluée. Les solutions proposées à ces deux problèmes nous permettent d'aborder l'extraction d'information sous un angle particulier : le système implémenté est évalué sur une tâche de correction d'Entités Nommées dans le contexte d'application des Systèmes de Question-Réponse. Ce besoin spécifique entraîne l'alignement de la définition d'une catégorie sur le type de réponse attendue par une question. traitement automatique des langues linguistique linguistique de corpus corpus sémantique relation sémantique extraction d'information entités nommées genre textuel segmentation discursive désambiguïsation extraction de patron adaptation de systèmes
123	Reconstruction robuste des vaisseaux sanguins pour les simulations médicales interactives à partir de données patients Yureidini, Ahmed 13 May 2014 (has links) (PDF) Dans le cadre des simulations interactives, le manque de modèles géométriques reste une des limitations majeures des simulateurs. Actuellement, les simulateurs commerciaux ne proposent pas ou un tout cas, un nombre limité de cas. Un grand nombre des travaux abordent cependant ce sujet tout au long de ces deux dernières décennies. Malgré une vaste littérature, les méthodes ne sont pas adaptées à un contexte interactif, plus particulièrement quand il s'agit des réseaux vasculaires. Dans cette thèse, nous considérons le problème de la segmentation et la reconstruction des vaisseaux sanguins à partir de données patients en Angiographie Rotationnelle (RA) 3D. Pour ce faire, nous proposons deux nouveaux algorithmes, un pour la segmentation et un autre, pour la reconstruction. Tout d'abord, le réseau vasculaire est construit grâce à un algorithme de suivi de la ligne centrale des vaisseaux. De plus, notre procédure de suivi extrait des points à la surface des vaisseaux de manière robuste. Deuxièmement, ces points sont estimés par une surface implicite (un blobby model) qui est, à son tour, raffinée de façon itérative. Les résultats du suivi et de la reconstruction sont produit à partir de données synthétiques et réelles. Lors de la simulation de la navigation d'outils interventionnels, notre modèle géométrique remplit les exigences des simulations interactives: une prédiction et détection rapide des collisions, l'accès à l'information topologique, une surface lisse et la mise à disposition de quantités différentielles pour la résolution des contacts. Simulations médicales interactives Segmentation Suivi des vaisseaux sanguins Estimation de cylindre RANSAC Blobby models
124	Synthesis of polyelectrolyte brushes on silica-based substrates through surface-initiated polymerization : brush characterization and responsiveness to variation in pH and ionic strength Borozenko, Olga 12 1900 (has links) No description available. Brosse de polymère Conformation brosse Poly(acide acrylique) pH- et force ionique Stimuli-répondant Ellipsometrie Dégreffage de brosses et stabilité Propriétés de surface Amorceur siloxane Polymer brush Poly(acrylic acid) Brush conformation pH- and ionic strength responsiveness Ellipsometry Brush degrafting and stability Surface properties Siloxane initiator
125	Capacitance reduction in off-line led drivers by using active ripple compensation techniques Soares, Guilherme Márcio 18 November 2017 (has links) Submitted by Geandra Rodrigues (geandrar@gmail.com) on 2018-01-08T12:01:24Z No. of bitstreams: 1 guilhermemárciosoares.pdf: 24810934 bytes, checksum: d538ec8cfbd6bb9363a5aa07343bda48 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2018-01-22T18:36:09Z (GMT) No. of bitstreams: 1 guilhermemárciosoares.pdf: 24810934 bytes, checksum: d538ec8cfbd6bb9363a5aa07343bda48 (MD5) / Made available in DSpace on 2018-01-22T18:36:10Z (GMT). No. of bitstreams: 1 guilhermemárciosoares.pdf: 24810934 bytes, checksum: d538ec8cfbd6bb9363a5aa07343bda48 (MD5) Previous issue date: 2017-11-18 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Este documento apresenta uma nova técnica para a minimização da ondulação de baixa frequência, típica de conversores para o acionamento de LEDs alimentados a partir da rede elétrica. Esta estratégia baseia-se na modulação em baixa frequência da razão cíclica do conversor de modo que a ondulação de corrente possa ser reduzida e, consequentemente, as capacitâncias de filtragem do conversor possam ser minimizadas. Esta técnica foi desenvolvida para a aplicação em conversores de malha única, como é o caso de conversores de estágio único ou mesmo dois estágios integrados. A modulação da razão cíclica é projetada de maneira que o comportamento de baixa frequência das principais variáveis do conversor seja alterado, permitindo uma redução da ondulação da corrente de saída ao custo de um incremento cotrolado no conteúdo harmônico da corrente de entrada. Duas possíveis metodologias para a implementação da técnica proposta são discutidas ao longo do trabalho. A primeira envolve a injeção de harmônicas específicas no sinal da razão cíclica do conversor através de ramos adicionais na estrutura de controle. Esta abordagem foi aplicada para projetar um controlador de LEDs baseado em um conversor flyback e também em uma topologia integrada baseada na conexão cascata de dois conversores Buck-boost. Este estudo inicial foi expandido para outros conversores e uma análise generalizada acerca da influência da modulação da razão cíclica no comportamento de controladores de LED alimentados a partir da rede elétrica é apresentada. A segunda metodologia para a implementação da compensação ativa da ondulação de baixa frequência do conversor é baseada na otimização de um controlador proporcional-integral a fim de que tal elemento influencie não só no comportamento dinâmico do circuito, mas também na característica de baixa frequência do conversor. Por fim são discutidas as principais contribuições da tese e algumas propostas para trabalhos futuros são apresentadas / This document presents a novel approach for low-frequency output current ripple minimization in off-line light-emitting diode (LED) drivers. This strategy is based on the large-signal modulation of the duty-cycle so that the output ripple can be reduced and, consequently, the required filtering capacitances of the converter can be somehow decreased. This technique is devised to be used on converters in which a single control loop is employed, such as off-line single-stage or integrated converters. The duty-cycle modulation is used to change the shape of the main waveforms of the converter, especially the input and output currents. This allows for a reduction of the output current peak-to-peak ripple while the harmonic content of the input current is increased but kept within the limits imposed by the IEC standard. Two methodologies for implementing the proposed technique are discussed along the text. The first one is related to the injection of harmonic components to the duty cycle signal by means of additional branches inserted in the conventional control structure. This approach was applied to design an off-line flyback-based LED driver and also a circuit based on the Integrated Double Buck-boost converter. This first study was expanded to other topologies and a generalized analysis regarding the impact of the duty cycle modulation on off-line converters is then presented. The second methodology for implementing the ripple compensation is based on the optimization of a proportional-integral controller so that this element is designed to influence not only in the dynamic behavior of the circuit, but also in its low-frequency characteristic. Finally, the main contributions of this work are discussed and the proposals for future works are presented. CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Conversores para o acionamento de LEDs Fontes de alimentação Redução de capacitâncias Correção do fator de potência Fontes de alta confiabilidade Otimização de conversores estáticos LED drivers Power supplies Off-line operation Active ripple compensation Capacitance reduction Power factor correction Electrolytic capacitor avoidance High reliability Power converter optimization
126	A pattern-driven and model-based vulnerability testing for Web applications / Une approche à base de modèles et de patterns pour le test de vulnérabilités d'applications Web Vernotte, Alexandre 29 October 2015 (has links) Cette thèse propose une approche originale de test de vulnérabilité Web à partir de modèles etdirigée par des patterns de tests, nommée PMVT. Son objectif est d’améliorer la capacité de détectionde quatre types de vulnérabilité majeurs, Cross-Site Scripting, Injections SQL, Cross-Site RequestForgery, et Privilege Escalation. PMVT repose sur l’utilisation d’un modèle comportemental del’application Web, capturant ses aspects fonctionnels, et sur un ensemble de patterns de test devulnérabilité qui adressent un type de vulnérabilité de manière générique, quelque soit le type del’application Web sous test.Par l’adaptation de technologies MBT existantes, nous avons développé une chaîne outillée complèteautomatisant la détection des quatre types de vulnérabilité. Ce prototype a été exprimenté et évaluésur deux applications réelles, actuellement utiliseés par plusieurs dizaines de milliers d’utilisateurs.Les résultats d’expérimentation démontrent la pertinence et de l’efficience de PMVT, notamment enaméliorant de façon significative la capacité de détection de vulnérabilités vis à vis des scannersautomatiques d’applications Web existants. / This thesis proposes an original approach, dubbed PMVT for Pattern-driven and Model-basedVulnerability Testing, which aims to improve the capability for detecting four high-profile vulnerabilitytypes, Cross-Site Scripting, SQL Injections, CSRF and Privilege Escalations, and reduce falsepositives and false negatives verdicts. PMVT relies on the use of a behavioral model of theapplication, capturing its functional aspects, and a set of vulnerability test patterns that addressvulnerabilities in a generic way. By adapting existing MBT technologies, an integrated toolchain that supports PMVT automates thedetection of the four vulnerability types in Web applications. This prototype has been experimentedand evaluated on two real-life Web applications that are currently used by tens of thousandsusers. Experiments have highlighted the effectiveness and efficiency of PMVT and shown astrong improvement of vulnerability detection capabilities w.r.t. available automated Web applicationscanners for these kind of vulnerabilities. Test de Vulnérabilité Test à partir de Modèles Patterns de Test de Vulnérabilité Applications Web Cross-Site Scripting Injections SQL Cross-Site Request Forgery Privilege Escalation Vulnerability Testing Model-Based Testing Vulnerability Test Patterns Web applications Cross- Site Scripting SQL Injections Cross-Site Request Forgery Privilege Escalation 004.678
127	Estimation du RUL par des approches basées sur l'expérience : de la donnée vers la connaissance / Rul estimation using experience based approached : from data to knwoledge Khelif, Racha 14 December 2015 (has links) Nos travaux de thèses s’intéressent au pronostic de défaillance de composant critique et à l’estimation de la durée de vie résiduelle avant défaillance (RUL). Nous avons développé des méthodes basées sur l’expérience. Cette orientation nous permet de nous affranchir de la définition d’un seuil de défaillance, point problématique lors de l’estimation du RUL. Nous avons pris appui sur le paradigme de Raisonnement à Partir de Cas (R à PC) pour assurer le suivi d’un nouveau composant critique et prédire son RUL. Une approche basée sur les instances (IBL) a été développée en proposant plusieurs formalisations de l’expérience : une supervisée tenant compte de l’ état du composant sous forme d’indicateur de santé et une non-supervisée agrégeant les données capteurs en une série temporelle mono-dimensionnelle formant une trajectoire de dégradation. Nous avons ensuite fait évoluer cette approche en intégrant de la connaissance à ces instances. La connaissance est extraite à partir de données capteurs et est de deux types : temporelle qui complète la modélisation des instances et fréquentielle qui, associée à la mesure de similarité permet d’affiner la phase de remémoration. Cette dernière prend appui sur deux types de mesures : une pondérée entre fenêtres parallèles et fixes et une pondérée avec projection temporelle. Les fenêtres sont glissantes ce qui permet d’identifier et de localiser l’état actuel de la dégradation de nouveaux composants. Une autre approche orientée donnée a été test ée. Celle-ci est se base sur des caractéristiques extraites des expériences, qui sont mono-dimensionnelles dans le premier cas et multi-dimensionnelles autrement. Ces caractéristiques seront modélisées par un algorithme de régression à vecteurs de support (SVR). Ces approches ont été évaluées sur deux types de composants : les turboréacteurs et les batteries «Li-ion». Les résultats obtenus sont intéressants mais dépendent du type de données traitées. / Our thesis work is concerned with the development of experience based approachesfor criticalcomponent prognostics and Remaining Useful Life (RUL) estimation. This choice allows us to avoidthe problematic issue of setting a failure threshold.Our work was based on Case Based Reasoning (CBR) to track the health status of a new componentand predict its RUL. An Instance Based Learning (IBL) approach was first developed offering twoexperience formalizations. The first is a supervised method that takes into account the status of thecomponent and produces health indicators. The second is an unsupervised method that fuses thesensory data into degradation trajectories.The approach was then evolved by integrating knowledge. Knowledge is extracted from the sensorydata and is of two types: temporal that completes the modeling of instances and frequential that,along with the similarity measure refine the retrieval phase. The latter is based on two similaritymeasures: a weighted one between fixed parallel windows and a weighted similarity with temporalprojection through sliding windows which allow actual health status identification.Another data-driven technique was tested. This one is developed from features extracted from theexperiences that can be either mono or multi-dimensional. These features are modeled by a SupportVector Regression (SVR) algorithm. The developed approaches were assessed on two types ofcritical components: turbofans and ”Li-ion” batteries. The obtained results are interesting but theydepend on the type of the treated data. Indicateur de santé Trajectoires de dégradation IBL Approche basée sur les instances Raisonnement à partir de cas Connaissance Similarité SVR Régression à vecteurs de support Experience based prognostics Remaining Useful Life RUL Health indicators Degradation trajectories IBL Instance Based Learning CBR Knowledge Similarity Support Vector Regression Case Based Reasoning 600
128	On the design of customized risk measures in insurance, the problem of capital allocation and the theory of fluctuations for Lévy processes Omidi Firouzi, Hassan 12 1900 (has links) No description available. Allocation de capital Processus càdlàg Problème de portefeuille optimal Processus Jump-Diffusion Drawdown Vitesse d’épuisement Coherent and convex risk measure Capital allocation Multivariate data-based risk measures Càdlàg Process Optimal portfolio problem Jump-Diffusion processes Spectrally negative Lévy process Speed of depletion
129	"Énoncé de l'errance et errance de l'énonciation dans les romans de Tahar Ben Jelloun, Abdelkébir Khatibi, Ahmadou Kourouma et Pius Ngandu Nkashama" Ben Abdallah, Alaeddine. 16 April 2018 (has links) À la lecture de certains romans de l'Afrique francophone, nous avons observé une prédilection pour la notion de l'errance comme tension vers un ailleurs géographique et surtout imaginaire qui caractérise l'hexis et l'éthos des protagonistes. Dans ce sens, notre corpus, constitué de La prière de l'absent et Partir de Tahar Ben Jelloun, Pèlerinage d'un artiste amoureux d'Abdelkébir Khatibi, Allah n'est pas obligé d'Ahmadou Kourouma, Les étoiles écrasées de Pius Ngandu Nkashama et un corpus secondaire des mêmes auteurs, nous paraît assez représentatif de cette errance. Le style d'écriture de ces romans semble se soumettre à la même esthétique, celle de l'éclatement diégétique et narratif. Tous ces romans illustrent pertinemment le déploiement discursif de l'errance. À travers les pérégrinations géographiques et les divagations se profile un tiraillement, une tension qui tenaille les protagonistes errants. Entre parcours chaotique et aspiration à un ailleurs meilleur, les personnages n'ont devant eux qu'une solution, errer. L'errance, telle qu'elle se donne à lire dans ces romans, dénote clairement le parcours chaotique du protagoniste et reflète son état d'esprit qui, dans son vagabondage et son perpétuel déplacement, se laisse aller à une imagination débridée. Cette errance contamine l'énonciation et introduit une déconstruction textuelle sur les plans narratif et énonciatif. Notre lecture du texte repose sur la sociologie institutionnelle, d'une part, et sur la théorie de l'énonciation, de l'autre. Cette démarche dévoile l'interaction entre le statut social des écrivains et les postures discursives investies dans l'énoncé de leurs textes. Il est ainsi facile de saisir les choix rhétoriques et les stratégies discursives de l'auteur où la notion de l' errance se décline sur les procédés poétiques, mais aussi sur un imaginaire éclaté. PQ 3896.5 UL 2009 B456 Ben Jelloun, Tahar, 1944-. Partir Vie errante dans la littérature
130	DS-Fake : a data stream mining approach for fake news detection Mputu Boleilanga, Henri-Cedric 08 1900 (has links) L’avènement d’internet suivi des réseaux sociaux a permis un accès facile et une diffusion rapide de l’information par toute personne disposant d’une connexion internet. L’une des conséquences néfastes de cela est la propagation de fausses informations appelées «fake news». Les fake news représentent aujourd’hui un enjeu majeur au regard de ces conséquences. De nombreuses personnes affirment encore aujourd’hui que sans la diffusion massive de fake news sur Hillary Clinton lors de la campagne présidentielle de 2016, Donald Trump n’aurait peut-être pas été le vainqueur de cette élection. Le sujet de ce mémoire concerne donc la détection automatique des fake news. De nos jours, il existe un grand nombre de travaux à ce sujet. La majorité des approches présentées se basent soit sur l’exploitation du contenu du texte d’entrée, soit sur le contexte social du texte ou encore sur un mélange entre ces deux types d’approches. Néanmoins, il existe très peu d’outils ou de systèmes efficaces qui détecte une fausse information dans la vie réelle, tout en incluant l’évolution de l’information au cours du temps. De plus, il y a un manque criant de systèmes conçues dans le but d’aider les utilisateurs des réseaux sociaux à adopter un comportement qui leur permettrait de détecter les fausses nouvelles. Afin d’atténuer ce problème, nous proposons un système appelé DS-Fake. À notre connaissance, ce système est le premier à inclure l’exploration de flux de données. Un flux de données est une séquence infinie et dénombrable d’éléments et est utilisée pour représenter des données rendues disponibles au fil du temps. DS-Fake explore à la fois l’entrée et le contenu d’un flux de données. L’entrée est une publication sur Twitter donnée au système afin qu’il puisse déterminer si le tweet est digne de confiance. Le flux de données est extrait à l’aide de techniques d’extraction du contenu de sites Web. Le contenu reçu par ce flux est lié à l’entrée en termes de sujets ou d’entités nommées mentionnées dans le texte d’entrée. DS-Fake aide également les utilisateurs à développer de bons réflexes face à toute information qui se propage sur les réseaux sociaux. DS-Fake attribue un score de crédibilité aux utilisateurs des réseaux sociaux. Ce score décrit la probabilité qu’un utilisateur puisse publier de fausses informations. La plupart des systèmes utilisent des caractéristiques comme le nombre de followers, la localisation, l’emploi, etc. Seuls quelques systèmes utilisent l’historique des publications précédentes d’un utilisateur afin d’attribuer un score. Pour déterminer ce score, la majorité des systèmes utilisent la moyenne. DS-Fake renvoie un pourcentage de confiance qui détermine la probabilité que l’entrée soit fiable. Contrairement au petit nombre de systèmes qui utilisent l’historique des publications en ne prenant pas en compte que les tweets précédents d’un utilisateur, DS-Fake calcule le score de crédibilité sur la base des tweets précédents de tous les utilisateurs. Nous avons renommé le score de crédibilité par score de légitimité. Ce dernier est basé sur la technique de la moyenne Bayésienne. Cette façon de calculer le score permet d’atténuer l’impact des résultats des publications précédentes en fonction du nombre de publications dans l’historique. Un utilisateur donné ayant un plus grand nombre de tweets dans son historique qu’un autre utilisateur, même si les tweets des deux sont tous vrais, le premier utilisateur est plus crédible que le second. Son score de légitimité sera donc plus élevé. À notre connaissance, ce travail est le premier qui utilise la moyenne Bayésienne basée sur l’historique de tweets de toutes les sources pour attribuer un score à chaque source. De plus, les modules de DS-Fake ont la capacité d’encapsuler le résultat de deux tâches, à savoir la similarité de texte et l’inférence en langage naturel hl(en anglais Natural Language Inference). Ce type de modèle qui combine ces deux tâches de TAL est également nouveau pour la problématique de la détection des fake news. DS-Fake surpasse en termes de performance toutes les approches de l’état de l’art qui ont utilisé FakeNewsNet et qui se sont basées sur diverses métriques. Il y a très peu d’ensembles de données complets avec une variété d’attributs, ce qui constitue un des défis de la recherche sur les fausses nouvelles. Shu et al. ont introduit en 2018 l’ensemble de données FakeNewsNet pour résoudre ce problème. Le score de légitimité et les tweets récupérés ajoutent des attributs à l’ensemble de données FakeNewsNet. / The advent of the internet, followed by online social networks, has allowed easy access and rapid propagation of information by anyone with an internet connection. One of the harmful consequences of this is the spread of false information, which is well-known by the term "fake news". Fake news represent a major challenge due to their consequences. Some people still affirm that without the massive spread of fake news about Hillary Clinton during the 2016 presidential campaign, Donald Trump would not have been the winner of the 2016 United States presidential election. The subject of this thesis concerns the automatic detection of fake news. Nowadays, there is a lot of research on this subject. The vast majority of the approaches presented in these works are based either on the exploitation of the input text content or the social context of the text or even on a mixture of these two types of approaches. Nevertheless, there are only a few practical tools or systems that detect false information in real life, and that includes the evolution of information over time. Moreover, no system yet offers an explanation to help social network users adopt a behaviour that will allow them to detect fake news. In order to mitigate this problem, we propose a system called DS-Fake. To the best of our knowledge, this system is the first to include data stream mining. A data stream is a sequence of elements used to represent data elements over time. This system explores both the input and the contents of a data stream. The input is a post on Twitter given to the system that determines if the tweet can be trusted. The data stream is extracted using web scraping techniques. The content received by this flow is related to the input in terms of topics or named entities mentioned in the input text. This system also helps users develop good reflexes when faced with any information that spreads on social networks. DS-Fake assigns a credibility score to users of social networks. This score describes how likely a user can publish false information. Most of the systems use features like the number of followers, the localization, the job title, etc. Only a few systems use the history of a user’s previous publications to assign a score. To determine this score, most systems use the average. DS-Fake returns a percentage of confidence that determines how likely the input is reliable. Unlike the small number of systems that use the publication history by taking into account only the previous tweets of a user, DS-Fake calculates the credibility score based on the previous tweets of all users. We renamed the credibility score legitimacy score. The latter is based on the Bayesian averaging technique. This way of calculating the score allows attenuating the impact of the results from previous posts according to the number of posts in the history. A user who has more tweets in his history than another user, even if the tweets of both are all true, the first user is more credible than the second. His legitimacy score will therefore be higher. To our knowledge, this work is the first that uses the Bayesian average based on the post history of all sources to assign a score to each source. DS-Fake modules have the ability to encapsulate the output of two tasks, namely text similarity and natural language inference. This type of model that combines these two NLP tasks is also new for the problem of fake news detection. There are very few complete datasets with a variety of attributes, which is one of the challenges of fake news research. Shu et al. introduce in 2018 the FakeNewsNet dataset to tackle this issue. Our work uses and enriches this dataset. The legitimacy score and the retrieved tweets from named entities mentioned in the input texts add features to the FakeNewsNet dataset. DS-Fake outperforms all state-of-the-art approaches that have used FakeNewsNet and that are based on various metrics. Détection de fausses nouvelles Exploration de flux de données IA explicable score de légitimité Traitement Automatique du Langage Inférence du langage naturel Similarité de texte Reconnaissance d’entité nommée Réseaux de neurones Fake news detection Data stream mining Explainable AI Legitimacy score Natural Language Processing Natural Language Inference Text similarity Named Entity Recognition Neural Networks

Search results