891 |
Uma visão interacionista sociodiscursiva de leitura: por uma proposta interventiva para a aula de leitura no ensino básicoBarbosa, Lílian Paula Leitão January 2016 (has links)
BARBOSA, Lílian Paula Leitão. Uma visão interacionista sociodiscursiva de leitura: por uma proposta interventiva para a aula de leitura no ensino básico. 2016. 266f. - Dissertação (Mestrado) – Universidade Federal do Ceará, Programa de Pós-graduação Profissional em Letras - PROFLETRAS, Fortaleza (CE), 2016. / Submitted by Gustavo Daher (gdaherufc@hotmail.com) on 2017-01-23T15:21:10Z
No. of bitstreams: 1
2016_dis_lplbarbosa.pdf: 1967492 bytes, checksum: be0cfac9c9fa0196a3cdce7b22f0fb3e (MD5) / Approved for entry into archive by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2017-01-25T16:46:57Z (GMT) No. of bitstreams: 1
2016_dis_lplbarbosa.pdf: 1967492 bytes, checksum: be0cfac9c9fa0196a3cdce7b22f0fb3e (MD5) / Made available in DSpace on 2017-01-25T16:46:57Z (GMT). No. of bitstreams: 1
2016_dis_lplbarbosa.pdf: 1967492 bytes, checksum: be0cfac9c9fa0196a3cdce7b22f0fb3e (MD5)
Previous issue date: 2016 / A leitura é o foco principal do nosso trabalho, pois ela tem um lugar de destaque nas práticas sociais, já que é, por meio dela, que os indivíduos se comunicam nos diversos setores da sociedade. Diante da importância da leitura para a formação de um leitor crítico e social, fica evidente a relevância da escola e do agir professoral do professor de Língua Portuguesa LM (Língua Materna) no processo de ensino e aprendizagem da leitura. Este estudo, então, proporcionou a análise dos últimos resultados das provas de larga escala, Spaece e Prova Brasil, aplicadas aos alunos do último ano do Ensino Fundamental II, dos anos de 2009 a 2013 no estado do Ceará, em que foram averiguados, apesar de uma melhora significativa, os baixos índices de proficiência em leitura. Para reverter esse quadro de ainda baixos resultados nas diversas avaliações internas e externas envolvendo leitura no nível básico de ensino, seria necessário que se elaborasse uma transposição didática inovadora, capaz de encorajar professores a novas descobertas e desafios. Verificando essa necessidade, propomos, então, uma intervenção por meio da metodologia da pesquisa-ação, “pesquisa associada a diversas formas de ação coletiva que é orientada em função da resolução de problemas ou de objetivos de transformação” (THIOLLENT, 2008), utilizando um modelo de sequência didática (DOLZ, 2010), voltada para o ensino da leitura para o nível básico, mais especificamente para o nono ano do Ensino fundamental II. Tratar-se-á de uma pesquisa qualitativa sobre a prática da leitura em sala de aula e do trabalho docente cujo foco será o próprio agir profissional do professor-pesquisador. O objetivo deste trabalho, portanto, é propor uma perspectiva interventiva mais atual para tornar essa aula de leitura mais eficiente para a aprendizagem e para o desenvolvimento da competência comunicativa dos discentes. Para conseguirmos tal objetivo, ancoramo-nos em estudos de Braggio (1992), quanto à concepção sócio-histórica ideológica de linguagem, tendo como base o quadro teórico do Interacionismo Sociodiscursivo - ISD (BRONCKART, 1999) e os modelos de aulas de leitura propostos por Cicurel (1991) e Leurquin (2014). / Cette étude a commencé à partir de l’analyse des derniers résultats des évaluations à large échelle, Spaece et Prova Brasil, appliqueés aux élèves de la dernière année de l’enseignement fondamental II, des années de 2009 à 2013, dans l’État du Ceará, dans laquelle des faibles niveaux de compétence en lecture ont été vérifiés, en dépit d’une amélioration significative. Pour changer cette situation de bas résultats dans les diverses évaluations internes et externes qui impliquent la lecture dans l’Éducation de base, il faut élaborer une transposition didactique innovante qui soit capable d’encourager des professeurs aux nouvelles découvertes et aux nouveaux défis. En raison de cette nécessité, on a proposé, alors, une intervention d’après la méthodologie de la recherche-action, définie comme « une recherche associée aux diverses façons d’action collective qui est orientée vers la résolution de problèmes ou d’objectifs de transformation » (THIOLLENT, 2008), en utilisant un modèle de séquence didactique (DOLZ, 2010) pour l’enseignement de la lecture dans l’éducation basique, particulièrement, dans la neuvième année de l’enseignement fondamental II. Il s’agit, de cette façon, d’une recherche qualitative à propos de la pratique de la lecture en classe et du travail enseignant, dont l’objectif est l’agir même professionnel de l’enseignant-chercheur. Ce travail a pour but, donc, de faire une analyse de la pratique actuelle de lecture dans l’enseignement basique et de proposer une perspective d’intervention plus actuelle pour rendre ce cours de lecture plus efficace pour l’apprentissage et pour le développement de la compétence comunicative des élèves. Pour réussir cet objectif, on se base sur les études de Braggio (1992), en ce qui concerne la conception socio-historique idélogique de langage ; sur le cadre théorique de l’Interaccionisme Socio-discursif - ISD - (BRONCKART, 1999) et sur les modèles de cours de lecture proposés par Cicurel (1991) et par Leurquin (2014).
|
892 |
Construction automatique de hiérarchies sémantiques à partir du Trésor de la Langue Française informatisé (TLFi) : application à l'indexation et la recherche d'images / Automatic construction of semantic hierarchies from the Trésor de la langue française informatisé (TLFi) : application for image indexing and retrievalGheorghita, Inga 17 February 2014 (has links)
L’objectif principal de cette thèse est de montrer que les informations lexicales issues d’un dictionnaire de langue, tel le Trésor de la langue française informatisé (TLFi), peuvent améliorer les processus d’indexation et de recherche d’images. Le problème d’utilisation d’une telle ressource est qu’elle n’est pas suffisamment formalisée pour être exploitée d’emblée dans un tel domaine d’application. Pour résoudre ce problème, nous proposons, dans un premier temps, une approche de construction automatique de hiérarchies sémantiques à partir du TLFi. Après avoir défini une caractéristique quantitative (mesurable) et comparable des noms apparaissant dans les définitions lexicographiques, à travers une formule de pondération permettant de sélectionner le nom de poids maximal comme un bon candidat hyperonyme pour un lexème donné du TLFi, nous proposons un algorithme de construction automatique de hiérarchies sémantiques pour les lexèmes des vocables du TLFi. Une fois notre approche validée à travers des évaluations manuelles, nous montrons, dans un second temps, que les hiérarchies sémantiques obtenues à partir du TLFi peuvent être utilisées pour l’enrichissement d’un thésaurus construit manuellement ainsi que pour l’indexation automatique d’images à partir de leurs descriptions textuelles associées. Nous prouvons aussi que l’exploitation d’une telle ressource dans le domaine de recherche d’images améliore la précision de la recherche en structurant les résultats selon les domaines auxquels les concepts de la requête de recherche peuvent faire référence. La mise en place d’un prototype nous a permis ainsi d’évaluer et de valider les approches proposées. / The main purpose of this thesis is to show that the lexical information issuing from a language dictionary, as the Trésor de la langue française informatisé (TLFi), can improve the image indexing and retrieval process. The problem of using of such resource is that it is not sufficiently formalized to be exploited immediately in such application domain.To solve this problem, we propose a first approach of automatic construction of semantic hierarchies from TLFi. After defining a quantitative (measurable) and comparable characteristic of names appearing in dictionary definitions, through a weighting formula that allows us to select the name of the maximum weight as a good hypernym candidate for a given TLFi lexeme, we suggest an algorithm of automatic construction of semantic hierarchies for the lexemes of TLFi vocables.Once our approach is validated through manual evaluations, we demonstrate in the second time that the semantic hierarchies obtained from TLFi can be used to enrich a thesaurus manually built as well as for automatic image indexing using their associated text descriptions. We also prove that the use of such resource in the domain of image retrieval improves the accuracy of search by structuring the results according the domains to which the concepts of the search query are related to. The implementation of a prototype allowed us to evaluate and validate the proposed approaches.
|
893 |
La recherche sur les communications de masse en France. Genèse et essor d'un objet scientifique (1945-1972) / Research on mass communications in France. Genesis and development of a scientific object (1945-1972)Berkas, Ahmed 27 June 2014 (has links)
Les recherches sur les communications de masse en tant que phénomène social dans la France d’après-guerre sont relativement méconnues dans les sciences de l’information et de la communication (SIC). Or, il s’agit d’une période féconde en renouvellement conceptuel et méthodologique dans la recherche en sciences sociales qui s’est traduite par des créations institutionnelles et par l’émergence de nouveaux champs d’investigation. L’enquête dresse un panorama des recherches réservées au phénomène des communications de masse et analyse l’apport de différents acteurs dans la légitimation de cet objet scientifique dans le champ académique français du lendemain de la Libération jusqu’à la reconnaissance des SIC comme discipline à part entière dans les instances académiques françaises au début des années 1970. En s’appuyant sur les concepts de « champ », de « réseau » et de « configuration », l’enquête étudie cet univers de production du savoir par l’analyse d’une sélection de 253 textes publiés dans la période 1945-1972 ; et ce, pour cerner l’évolution cognitive et institutionnelle de cet objet scientifique. Envisagée dans une perspective constructiviste, l’étude relève des recherches sur l’histoire des SIC. / Research on mass communication as a social phenomenon in the post-war France is relatively unrecognized by actors of information and communication sciences (ICS). Nevertheless, it was a fertile period of conceptual and methodological renewal in social science research that has resulted in institutional creations and the emergence of new fields of investigation. The survey provides an overview of the phenomenon of mass communications research and analyses the contribution of different actors in the legitimization of this scientific object in the French academic field after the Liberation to the recognition of ICS as discipline in the French academic bodies in the early 1970s. Based on the concepts of “field”, “network” and “configuration”, the survey examines this universe of knowledge production through the analysis of a selection of 253 texts published in the period 1945-1972 to identify the cognitive and institutional evolution of this scientific object. Considered in a constructivist perspective, the study relates to the field of the ICS history research.
|
894 |
Exploration d'un grand relevé à Nançay et diversité de la population de pulsars / Exploitation of the Nançay large survey : the diversity of pulsar populationOctau, Franck 21 November 2017 (has links)
Depuis la découverte du premier pulsar en 1967, nous connaissons désormais plus de 2500 pulsars aujourd’hui. Les pulsars offrent un champ d’études considérable : depuis l’étude des propriétés du milieu interstellaire et l’étude de la magnétosphère des pulsars jusqu’aux tests de la gravité en champ fort et la caractérisation d’un fond d’ondes gravitationnelles d’origine cosmologique. Cela explique pourquoi nous continuons de chercher de nouveaux pulsars de nos jours. Après des découvertes de pulsars millisecondes dans les sources non identifiées du Fermi Large Area Telescope, un programme de recherche de nouveaux pulsars a été mené à partir de 2012 par G. Desvignes. Observant à 1.4 GHz avec une haute résolution temporelle et fréquentielle, le programme SPAN512 a été conçu pour la recherche de pulsars rapides et lointains situés dans le plan Galactique. Nous décrirons les méthodes d’analyse mises en place pour traiter les données afin de trouver de nouveaux pulsars, méthodes soit basées sur la stabilité de la période de rotation des pulsars soit sur leur émission d’impulsions individuelles. Nous présenterons aussi l’état actuel de l’analyse du programme SPAN512 et les découvertes effectuées, plus particulièrement du pulsar trouvé au cours de ce travail de thèse, PSR J2055+3829, un pulsar milliseconde de période de rotation de 2.08 ms appartenant à un système de type « Veuve Noire ». Ce sera l’occasion de présenter les études chronométriques réalisées pour trouver l’éphéméride de ce pulsar et, dans le même temps, j’en profiterai pour parler d’une analyse similaire faite sur le pulsar J1618-3921, un pulsar dans une orbite excentrique. Enfin, nous présenterons des études polarimétriques de pulsars réalisées à la lumière d’un nouveau modèle, le modèle du vecteur tournant décentré (DRVM). Nous montrerons qu’un champ magnétique hautement décentré peut expliquer les variations brusques de l’angle de polarisation. / Since the discovery of the first pulsar in 1967, we know over 2500 pulsars today. Pulsars offer a broad range of studies: from the study of the properties of interstellar medium and of pulsar magnetospheres up to test of gravity in the strong-field regime and the characterisation of the cosmological Gravitation Waves background. This explains why we keep searching pulsars nowadays. After successful detections of new millisecond pulsars in Fermi Large Area Telescope unassociated sources at Nançay, a blind pulsar survey was initiated in 2012 by G. Desvignes. Conducted at 1.4 GHz with short sampling time and narrow frequency channels, the SPAN512 was designed to find fast and distant pulsars within the Galactic plane. We describe the methods to analyse data in order to find new pulsars, thanks to their spin stability or tto their single pulses. We will also describe the current status of the survey and the discoveries, more especially the pulsar discovered during this thesis, PSR J2055+3829, a 2.08 ms pulsar in a black widow system. It will be the opportunity to present the radio timing analysis of this pulsar and, in the same time, we will describe similar studies conducted on the pulsar J1618-3921, a pulsar in an eccentric orbit. Finally, we present some polarisation studies of pulsars in light of a new model, the Decentred Rotating Vector Model (DRVM). We will show that a highly decentred dipole may explain abrupt variations of polarisation profiles.
|
895 |
Recherche d’information s´emantique : Graphe sémantico-documentaire et propagation d’activation / Semantic Information Retrieval : Semantic-Documentary Graph and Spreading InformationBannour, Ines 09 May 2017 (has links)
La recherche d’information sémantique (RIS), cherche à proposer des modèles qui permettent de s’appuyer, au delà des calculs statistiques, sur la signification et la sémantique des mots du vocabulaire, afin de mieux caractériser les documents pertinents au regard du besoin de l’utilisateur et de les retrouver. Le but est ainsi de dépasser les approches classiques purement statistiques (de « sac de mots »), fondées sur des appariements de chaînes de caractères sur la base des fréquences des mots et de l’analyse de leurs distributions dans le texte. Pour ce faire, les approches existantes de RIS, à travers l’exploitation de ressources sémantiques externes (thésaurus ou ontologies), procèdent en injectant des connaissances dans les modèles classiques de RI de manière à désambiguïser le vocabulaire ou à enrichir la représentation des documents et des requêtes. Il s’agit le plus souvent d’adaptations de ces modèles, on passe alors à une approche « sac de concepts » qui permet de prendre en compte la sémantique notamment la synonymie. Les ressources sémantiques, ainsi exploitées, sont « aplaties », les calculs se cantonnent, généralement, à des calculs de similarité sémantique. Afin de permettre une meilleure exploitation de la sémantique en RI, nous mettons en place un nouveau modèle, qui permet d’unifier de manière cohérente et homogène les informations numériques (distributionnelles) et symboliques (sémantiques) sans sacrifier la puissance des analyses. Le réseau sémantico-documentaire ainsi modélisé est traduit en graphe pondéré. Le mécanisme d’appariement est assuré par une propagation d’activation dans le graphe. Ce nouveau modèle permet à la fois de répondre à des requêtes exprimées sous forme de mots clés, de concepts oumême de documents exemples. L’algorithme de propagation a le mérite de préserver les caractéristiques largement éprouvéesdes modèles classiques de recherche d’information tout en permettant une meilleure prise en compte des modèles sémantiques et de leurs richesse. Selon que l’on introduit ou pas de la sémantique dans ce graphe, ce modèle permet de reproduire une RI classique ou d’assurer en sus certaines fonctionnalités sémantiques. La co-occurrence dans le graphe permet alors de révélerune sémantique implicite qui améliore la précision en résolvant certaines ambiguïtés sémantiques.L’exploitation explicite des concepts ainsi que des liens du graphe, permettent la résolution des problèmes de synonymie, de term mismatch et de couverture sémantique. Ces fonctionnalités sémantiques, ainsi que le passage à l’échelle du modèle présenté, sont validés expérimentalement sur un corpus dans le domaine médical. / Semantic information retrieval (SIR) aims to propose models that allow us to rely, beyond statistical calculations, on the meaning and semantics of the words of the vocabulary, in order to better represent relevant documents with respect to user’s needs, and better retrieve them.The aim is therefore to overcome the classical purely statistical (« bag of wordsé») approaches, based on strings’ matching and the analysis of the frequencies of the words and their distributions in the text.To do this, existing SIR approaches, through the exploitation of external semantic resources (thesauri, ontologies, etc.), proceed by injecting knowledge into the classical IR models (such as the vector space model) in order to disambiguate the vocabulary or to enrich the representation of documents and queries.These are usually adaptations of the classical IR models. We go so to a « bag of concepts » approach which allows us to take account of synonymy. The semantic resources thus exploited are « flattened », the calculations are generally confined to calculations of semantic similarities.In order to better exploit the semantics in RI, we propose a new model, which allows to unify in a coherent and homogeneous way the numerical (distributional) and symbolic (semantic) information without sacrificing the power of the analyzes of the one for the other. The semantic-documentary network thus modeled is translated into a weighted graph. The matching mechanism is provided by a Spreading activation mechanism in the graph. This new model allows to respond to queries expressed in the form of key words, concepts or even examples of documents. The propagation algorithm has the merit of preserving the well-tested characteristics of classical information retrieval models while allowing a better consideration of semantic models and their richness.Depending on whether semantics is introduced in the graph or not, this model makes it possible to reproduce a classical IR or provides, in addition, some semantic functionalities. The co-occurrence in the graph then makes it possible to reveal an implicit semantics which improves the precision by solving some semantic ambiguities. The explicit exploitation of the concepts as well as the links of the graph allow the resolution of the problems of synonymy, term mismatch, semantic coverage, etc. These semantic features, as well as the scaling up of the model presented, are validated experimentally on a corpus in the medical field.
|
896 |
Modélisation d'expertise scientifique pour la constitution de comités de programme / Modelling scientific expertise to cnstitute the program committee of a scientific conferenceTran, Hong Diep 19 December 2017 (has links)
La publication scientifique dans les revues spécialisées et les actes de conférences permet de communiquer les progrès en sciences. Les comités de rédaction et de programme sous-jacents représentent la clé de voûte du processus d'évaluation. Avec le développement des revues et le nombre croissant de conférences scientifiques organisées chaque année, rechercher des experts pour participer à ces comités est une activité chronophage mais critique. Cette thèse se focalise sur la tâche de suggestion de membres de comité de programme (CP) pour des conférences scientifiques. Elle comporte trois volets. Premièrement, nous proposons une modélisation basée sur un graphe hétérogène pondéré de l'expertise scientifique multifacette des chercheurs. Deuxièmement, nous définissons des indicateurs scientométriques pour quantifier les critères impliqués dans la constitution de CP. Troisièmement, nous concevons une approche de suggestion de membres de CP pour une conférence donnée, en combinant les résultats des indicateurs scientométriques susmentionnés. Notre approche est expérimentée pour une des conférences de premier plan de notre communauté de recherche : SIGIR, en considérant ses éditions de 1971 à 2015, ainsi que les conférences proches thématiquement. / Academic publishing in specialized journals and conference proceedings is the main way to communicate progress in science. The underlying editorial and program committees represent the cornerstone of the evaluation process. With the development of journals and the increasing number of scientific conferences held annually, searching for experts who would serve in these committees is a time-consuming and yet critical activity. This PhD thesis focuses on the task of suggesting program committee (PC) members for scientific conferences. It is organized into three parts. First, we propose a modelling of the multifaceted scientific expertise of researchers based on a weighted heterogeneous graph. Second, we define scientometric indicators to quantify the criteria involved in the composition of CPs. Third, we design a CP member suggestion approach for a given conference, combining the results of the aforementioned scientometric indicators. Our approach is experimented in the context of leading conferences of our research community: SIGIR, considering its editions from 1971 to 2015, and topically close conferences.
|
897 |
Définition et évaluation de modèles d'agrégation pour l'estimation de la pertinence multidimensionnelle en recherche d'information / Definition and evaluation of aggregation model for multidimensional relevance estimation in information retrievalMoulahi, Bilel 11 December 2015 (has links)
La problématique générale de notre travail s'inscrit dans le domaine scientifique de la recherche d'information (RI). Les modèles de RI classiques sont généralement basés sur une définition de la notion de pertinence qui est liée essentiellement à l'adéquation thématique entre le sujet de la requête et le sujet du document. Le concept de pertinence a été revisité selon différents niveaux intégrant ainsi différents facteurs liés à l'utilisateur et à son environnement dans une situation de RI. Dans ce travail, nous abordons spécifiquement le problème lié à la modélisation de la pertinence multidimensionnelle à travers la définition de nouveaux modèles d'agrégation des critères et leur évaluation dans des tâches de recherche de RI. Pour répondre à cette problématique, les travaux de l'état de l'art se basent principalement sur des combinaisons linéaires simples. Cependant, ces méthodes se reposent sur l'hypothèse non réaliste d'additivité ou d'indépendance des dimensions, ce qui rend le modèle non approprié dans plusieurs situations de recherche réelles dans lesquelles les critères étant corrélés ou présentant des interactions entre eux. D'autres techniques issues du domaine de l'apprentissage automatique ont été aussi proposées, permettant ainsi d'apprendre un modèle par l'exemple et de le généraliser dans l'ordonnancement et l'agrégation des critères. Toutefois, ces méthodes ont tendance à offrir un aperçu limité sur la façon de considérer l'importance et l'interaction entre les critères. En plus de la sensibilité des paramètres utilisés dans ces algorithmes, est très difficile de comprendre pourquoi un critère est préféré par rapport à un autre. Pour répondre à cette première direction de recherche, nous avons proposé un modèle de combinaison de pertinence multicritères basé sur un opérateur d'agrégation qui permet de surmonter le problème d'additivité des fonctions de combinaison classiques. Notre modèle se base sur une mesure qui permet de donner une idée plus claire sur les corrélations et interactions entre les critères. Nous avons ainsi adapté ce modèle pour deux scénarios de combinaison de pertinence multicritères : (i) un cadre de recherche d'information multicritères dans un contexte de recherche de tweets et (ii) deux cadres de recherche d'information personnalisée. Le deuxième axe de recherche s'intéresse à l'intégration du facteur temporel dans le processus d'agrégation afin de tenir compte des changements occurrents sur les collection de documents au cours du temps. Pour ce faire, nous avons proposé donc un modèle d'agrégation sensible au temps pour combinant le facteur temporel avec le facteur de pertinence thématique. Dans cet objectif, nous avons effectué une analyse temporelle pour éliciter l'aspect temporel des requêtes, et nous avons proposé une évaluation de ce modèle dans une tâche de recherche sensible au temps. / The main research topic of this document revolve around the information retrieval (IR) field. Traditional IR models rank documents by computing single scores separately with respect to one single objective criterion. Recently, an increasing number of IR studies has triggered a resurgence of interest in redefining the algorithmic estimation of relevance, which implies a shift from topical to multidimensional relevance assessment. In our work, we specifically address the multidimensional relevance assessment and evaluation problems. To tackle this challenge, state-of-the-art approaches are often based on linear combination mechanisms. However, these methods rely on the unrealistic additivity hypothesis and independence of the relevance dimensions, which makes it unsuitable in many real situations where criteria are correlated. Other techniques from the machine learning area have also been proposed. The latter learn a model from example inputs and generalize it to combine the different criteria. Nonetheless, these methods tend to offer only limited insight on how to consider the importance and the interaction between the criteria. In addition to the parameters sensitivity used within these algorithms, it is quite difficult to understand why a criteria is more preferred over another one. To address this problem, we proposed a model based on a multi-criteria aggregation operator that is able to overcome the problem of additivity. Our model is based on a fuzzy measure that offer semantic interpretations of the correlations and interactions between the criteria. We have adapted this model to the multidimensional relevance estimation in two scenarii: (i) a tweet search task and (ii) two personalized IR settings. The second line of research focuses on the integration of the temporal factor in the aggregation process, in order to consider the changes of document collections over time. To do so, we have proposed a time-aware IR model for combining the temporal relavance criterion with the topical relevance one. Then, we performed a time series analysis to identify the temporal query nature, and we proposed an evaluation framework within a time-aware IR setting.
|
898 |
Recherche d'information sociale : exploitation des signaux sociaux pour améliorer la recherche d'information / Social information retrieval : harnessing social signals to enhance a searchBadache, Ismail 05 February 2016 (has links)
Notre travail se situe dans le contexte de recherche d'information sociale (RIS) et s'intéresse plus particulièrement à l'exploitation du contenu généré par les utilisateurs dans le processus de la recherche d'information. Le contenu généré par les utilisateurs (en anglais User-generated content, ou UGC) se réfère à un ensemble de données (ex. signaux sociaux) dont le contenu est principalement, soit produit, soit directement influencé par les utilisateurs finaux. Il est opposé au contenu traditionnel produit, vendu ou diffusé par les professionnels. Le terme devient populaire depuis l'année 2005, dans les milieux du Web 2.0, ainsi que dans les nouveaux médias sociaux. Ce mouvement reflète la démocratisation des moyens de production et d'interaction dans le Web grâce aux nouvelles technologies. Parmi ces moyens de plus en plus accessibles à un large public, on peut citer les réseaux sociaux, les blogs, les microblogs, les Wikis, etc. Les systèmes de recherche d'information exploitent dans leur majorité deux classes de sources d'évidence pour trier les documents répondant à une requête. La première, la plus exploitée, est dépendante de la requête, elle concerne toutes les caractéristiques relatives à la distribution des termes de la requête dans le document et dans la collection (tf-idf). La seconde classe concerne des facteurs indépendants de la requête, elle mesure une sorte de qualité ou d'importance a priori du document. Parmi ces facteurs, on en distingue le PageRank, la localité thématique du document, la présence d'URL dans le document, ses auteurs, etc. Une des sources importantes que l'on peut également exploiter pour mesurer l'intérêt d'une page Web ou de manière générale une ressource, est le Web social. En effet, grâce aux outils proposés par le Web 2.0 les utilisateurs interagissent de plus en plus entre eux et/ou avec les ressources. Ces interactions (signaux sociaux), traduites par des annotations, des commentaires ou des votes associés aux ressources, peuvent être considérés comme une information additionnelle qui peut jouer un rôle pour mesurer une importance a priori de la ressource en termes de popularité et de réputation, indépendamment de la requête. Nous supposons également que l'impact d'un signal social dépend aussi du temps, c'est-à-dire la date à laquelle l'action de l'utilisateur est réalisée. Nous considérons que les signaux récents devraient avoir un impact supérieur vis-à-vis des signaux anciens dans le calcul de l'importance d'une ressource. La récence des signaux peut indiquer certains intérêts récents à la ressource. Ensuite, nous considérons que le nombre de signaux d'une ressource doit être pris en compte au regard de l'âge (date de publication) de cette ressource. En général, une ressource ancienne en termes de durée d'existence a de fortes chances d'avoir beaucoup plus de signaux qu'une ressource récente. Ceci conduit donc à pénaliser les ressources récentes vis-à-vis de celles qui sont anciennes. Enfin, nous proposons également de prendre en compte la diversité des signaux sociaux au sein d'une ressource. / Our work is in the context of social information retrieval (SIR) and focuses on the exploitation of user-generated content in the process of seeking information. The Usergenerated content, or UGC, refers to a set of data (eg. social signals) whose content is mainly produced either directly influenced by end users. It is opposed to the traditional content produced, sold or distributed by professionals. The term became popular since 2005, in the Web 2.0 environments and in new social media. This movement reflects the democratization of the means of production and interaction in the web thanks to new technologies. Among these means more and more accessible to a wide public, we can cite social networks, blogs, microblogs, wikis, etc. The majority of information retrieval (IR) systems exploit two classes of features to rank documents in response to user's query. The first class, the most used one, is querydependent, which includes features corresponding to particular statistics of query terms such as term frequency, and term distribution within a document or in the collection of documents. The second class, referred to as documents prior, corresponds to queryindependent features such as the number of incoming links to a document, PageRank, topical locality, presence of URL, document authors, etc. One of the important sources which can also be used to measure the a priori interest of Web resources is social data (signals) associated with Web resource resulting from user interaction with this resource. These interactions representing annotations, comments or votes, produce useful and interesting social information that characterizes a resource in terms of popularity and reputation. Major search engines integrate social signals (e.g. Google, Bing). Searchmetrics1 showed that it exists a high correlation between social signals and the rankings provided by search engines such Google. We propose an approach that exploits social signals generated by users on the resources to estimate a priori relevance of a resource. This a priori knowledge is combined with topical relevance modeled by a language modeling (LM) approach. We also hypothesize that signals are time-dependent, the date when the user action has happened is important to distinguish between recent and old signals. Therefore, we assume that the recency of signals may indicate some recent interests to the resource, which may improve the a priori relevance of document. Secondly, number of signals of a resource depends on the resource age. Generally, an old resource may have much more signals than a recent one. We introduce the time-aware social approach that incorporates temporal characteristics of users' actions as prior in the retrieval model. Precisely, instead of assuming uniform document priors in this retrieval model, we assign document priors based on the signals associated to that document biased by both the creation date of the signals and the age of the document.
|
899 |
Stratégies de bandit pour les systèmes de recommandation / Bandit strategies for recommender systemsLouëdec, Jonathan 04 November 2016 (has links)
Les systèmes de recommandation actuels ont besoin de recommander des objets pertinents aux utilisateurs (exploitation), mais pour cela ils doivent pouvoir également obtenir continuellement de nouvelles informations sur les objets et les utilisateurs encore peu connus (exploration). Il s'agit du dilemme exploration/exploitation. Un tel environnement s'inscrit dans le cadre de ce que l'on appelle " apprentissage par renforcement ". Dans la littérature statistique, les stratégies de bandit sont connues pour offrir des solutions à ce dilemme. Les contributions de cette thèse multidisciplinaire adaptent ces stratégies pour appréhender certaines problématiques des systèmes de recommandation, telles que la recommandation de plusieurs objets simultanément, la prise en compte du vieillissement de la popularité d'un objet ou encore la recommandation en temps réel. / Current recommender systems need to recommend items that are relevant to users (exploitation), but they must also be able to continuously obtain new information about items and users (exploration). This is the exploration / exploitation dilemma. Such an environment is part of what is called "reinforcement learning". In the statistical literature, bandit strategies are known to provide solutions to this dilemma. The contributions of this multidisciplinary thesis the adaptation of these strategies to deal with some problems of the recommendation systems, such as the recommendation of several items simultaneously, taking into account the aging of the popularity of an items or the recommendation in real time.
|
900 |
Un processus de création de valeurs par la RSE : une recherche-intervention au sein de Janssen France / A process of values creation by CSR : a research-intervention at Janssen FranceGimenes, Nathalie 13 June 2018 (has links)
Pourquoi et comment la Responsabilité Sociale d’Entreprise (RSE) invite-t-elle les dirigeants à redéfinir les business model ? Mettre en oeuvre la RSE signifie que l’entreprise requalifie progressivement la création de valeur au regard des valeurs universelles du développement durable. Le business model, en tant qu’outil représentatif du système de création de valeur d’une entreprise n’a plus vocation à créer uniquement de la valeur économique mais aussi des valeurs sociales, sociétales et environnementales. Le profit de l’entreprise est envisagé à travers une équation de profits au pluriel donnant du sens à la performance globale de l’entreprise.La recherche-intervention menée « avec et pour » Janssen France a permis d’élaborer et d’expérimenter un processus de création de valeurs par la RSE facilitant la prise de décision des dirigeants en la matière. Il se compose de trois séquences. Il aide les praticiens à mieux comprendre comment se définit la RSE dans le cadre de leurs activités, à structurer une orientation stratégique et à expliciter concrètement les contributions de l’entreprise aux enjeux du développement durable. En intégrant la RSE au cœur des composantes du business model, l’entreprise élargit la finalité de ses activités et contribue à des enjeux de bien commun. / Why and how does Corporate Social Responsibility (CSR) invite managers to redefine business models? Implementing CSR means that the company is gradually redefining value creation according to the universal values of sustainable development. The business model, as a representative tool of a company's value creation system, no longer aims to create only economic value but also social, societal and environmental values. The profit of the company is considered through an equation of plural profits giving meaning to the overall performance of the company.The research-intervention carried out "with and for" Janssen France has made it possible to develop and test a process of values creation by CSR to facilitate decision making by managers in this area. It consists of three sequences. It helps practitioners to better understand how CSR is defined in their business, to structure a strategic orientation and to make concrete the company's contributions to sustainable development issues. By integrating CSR at the heart of the business model's components, the company broadens the scope of its activities and contributes to the common good.
|
Page generated in 0.0615 seconds