Spelling suggestions: "subject:"exploration dde textes"" "subject:"exploration dee textes""
1 |
Exploration de textes dans un corpus francophone de droit : le cas SOQUIJTardif, Alexandre January 2014 (has links)
L’intelligence d’affaires a mis en place des processus et des procédures permettant l’accès à une donnée unique. Des rapports, des requêtes et des analyses sont possibles sur cette structure. L’exploration de données a bénéficié de ces démarches et a fait naitre l’exploration de textes.
L’exploration de textes est peu employée par rapport à l’exploration de données, et ce autant par la communauté scientifique que par le domaine privé. La syntaxe et la grammaire mathématique sont universelles tandis que la syntaxe et la grammaire linguistique sont régionales et plus complexes. Ces limitations ont restreint les recherches sur l’exploration des textes.
Ce mémoire s’intéresse à l’utilisation d’un outil d’exploration de textes dans le contexte juridique. Plus précisément, l’objectif de la présente recherche est d’utiliser l’outil pour en découvrir les défis et opportunités découlant de l’exploration des liens des textes et de la classification supervisée et non supervisée. Afin d’atteindre cet objectif, la présente recherche s’appuie sur le « design science » et la méthodologie « CRISP-DM », le tout dans le but de sélectionner un outil logiciel approprié à la recherche, d’effectuer l’exploration de textes et d’analyser les résultats.
Les principaux résultats qui émanent des analyses effectuées avec l’outil IBM PASW SPSS sont les suivants. Premièrement, une analyse des liens entre les textes permet de faire ressortir les concepts des différents domaines de droit. Deuxièmement, l’analyse « Two-Steps » fait ressortir 3 classes dans le corpus complet qui comprend 4 domaines. Enfin, les analyses de classifications supervisées ont eu un taux de succès entre 46 et 60 % sur les échantillons de validation.
Les modèles développés sont peu performants et selon moi ils ne peuvent pas être déployés à la SOQUIJ. La connaissance du domaine juridique est importante afin d’analyser et interpréter les textes propres à la SOQUIJ. Il en va de même afin de créer un dictionnaire pour l’exploration de textes. Ce dictionnaire spécifique au droit manque pour l’obtention de résultats plus probants.
Plusieurs avenues sont intéressantes pour les recherches futures. Des plus intéressantes, notons la validation de l’impact de la création d’un dictionnaire pour réviser les différentes analyses et aussi d’étudier le résultat des 3 classes créées par le « Two-Steps ».
|
2 |
Exploration de textes dans un corpus francophone de droit : le cas SOQUIJTardif, Alexandre January 2014 (has links)
L’intelligence d’affaires a mis en place des processus et des procédures permettant l’accès à une donnée unique. Des rapports, des requêtes et des analyses sont possibles sur cette structure. L’exploration de données a bénéficié de ces démarches et a fait naitre l’exploration de textes.
L’exploration de textes est peu employée par rapport à l’exploration de données, et ce autant par la communauté scientifique que par le domaine privé. La syntaxe et la grammaire mathématique sont universelles tandis que la syntaxe et la grammaire linguistique sont régionales et plus complexes. Ces limitations ont restreint les recherches sur l’exploration des textes.
Ce mémoire s’intéresse à l’utilisation d’un outil d’exploration de textes dans le contexte juridique. Plus précisément, l’objectif de la présente recherche est d’utiliser l’outil pour en découvrir les défis et opportunités découlant de l’exploration des liens des textes et de la classification supervisée et non supervisée. Afin d’atteindre cet objectif, la présente recherche s’appuie sur le « design science » et la méthodologie « CRISP-DM », le tout dans le but de sélectionner un outil logiciel approprié à la recherche, d’effectuer l’exploration de textes et d’analyser les résultats.
Les principaux résultats qui émanent des analyses effectuées avec l’outil IBM PASW SPSS sont les suivants. Premièrement, une analyse des liens entre les textes permet de faire ressortir les concepts des différents domaines de droit. Deuxièmement, l’analyse « Two-Steps » fait ressortir 3 classes dans le corpus complet qui comprend 4 domaines. Enfin, les analyses de classifications supervisées ont eu un taux de succès entre 46 et 60 % sur les échantillons de validation.
Les modèles développés sont peu performants et selon moi ils ne peuvent pas être déployés à la SOQUIJ. La connaissance du domaine juridique est importante afin d’analyser et interpréter les textes propres à la SOQUIJ. Il en va de même afin de créer un dictionnaire pour l’exploration de textes. Ce dictionnaire spécifique au droit manque pour l’obtention de résultats plus probants.
Plusieurs avenues sont intéressantes pour les recherches futures. Des plus intéressantes, notons la validation de l’impact de la création d’un dictionnaire pour réviser les différentes analyses et aussi d’étudier le résultat des 3 classes créées par le « Two-Steps ».
|
3 |
Création de Systèmes d'Intelligence dans une Organisation de Recherche et Développement avec la Scientométrie et la MédiamétriePenteado, Roberto 10 October 2006 (has links) (PDF)
Ce travail est un trait d'union entre les sciences de l'information et de la communication. Une robuste méthodologie et des outils performants d'analyses bibliométriques sont utilisés pour des études scientométriques et médiamétriques. Pour cela, nous avons étudié la production scientifique d'une organisation publique de recherche et développement, l'Entreprise Brésilienne de Recherche Agronomique (Embrapa), les compétences de ses chercheurs et enfin nous avons évalué la performance de cette organisation et ses 40 centres de recherche dans les médias. <br />Les résultats indiquent que la fonction d'analyse d'informations internes et externes aux organisations est aujourd'hui un instrument important et stratégique pour améliorer les décisions et les politiques organisationnelles et contribuer au développement de la société. <br />L'étude des compétences de R&D démontre le potentiel d'intelligence qui peut être générée avec des informations déjà présentes dans les organisations, mais dispersées en plusieurs départements administratifs. Il est le témoin de la nécessité d'organiser des environnements informatiques spécifiques pour la fonction d'analyse dans les organisations, intégrant bases de données et informations d'origines diverses. <br />Avec les méthodologies de médiamétrie les fonctions d'audit du travail de communication organisationnelle, d'évaluation du résultat de campagnes et de la production de dépêches pour la presse gagnent en efficience et l'élaboration de suggestions de reportages peut mieux correspondre aux préférences des éditeurs. Ceci ne serait pas possible sans l'acquisition de l'intelligence sur les médias pour déterminer les tendances, les préférences des divers véhicules et le comportement de leurs éditeurs.<br />La fonction de clipping, d'accompagner ce qui sort dans la presse est présente dans les grandes organisations. L'apport de ce travail consiste à intégrer la fonction analyse d'une base Clipping. A partir de tels corpus et munis des méthodologies et outils décrits plus loin, il est possible de réaliser des études prospectives sur l'évolution historique d'un thème, d'un produit, d'un politicien ou d'une entreprise dans les médias et de faciliter des activités de veille de l'environnement, des concurrents ou de tout un secteur de l'économie.
|
Page generated in 0.1376 seconds