Spelling suggestions: "subject:"modèles dde recherche"" "subject:"modèles dee recherche""
1 |
Learning representations for Information RetrievalSordoni, Alessandro 03 1900 (has links)
La recherche d'informations s'intéresse, entre autres, à répondre à des questions comme: est-ce qu'un document est pertinent à une requête ?
Est-ce que deux requêtes ou deux documents sont similaires ? Comment la similarité entre deux requêtes ou documents peut être utilisée pour améliorer
l'estimation de la pertinence ? Pour donner réponse à ces questions, il est nécessaire d'associer chaque document et requête à des représentations interprétables
par ordinateur. Une fois ces représentations estimées, la similarité peut correspondre, par exemple, à une distance ou une divergence qui opère dans l'espace de représentation.
On admet généralement que la qualité d'une représentation a un impact direct sur l'erreur d'estimation par rapport à la vraie pertinence, jugée par un humain.
Estimer de bonnes représentations des documents et des requêtes a longtemps été un problème central de la recherche d'informations.
Le but de cette thèse est de proposer des nouvelles méthodes pour estimer les représentations des documents et des requêtes, la relation de pertinence entre eux et ainsi modestement avancer l'état de l'art du domaine.
Nous présentons quatre articles publiés dans des conférences internationales et un article publié dans un forum d'évaluation. Les deux premiers articles concernent des méthodes qui créent l'espace de représentation selon une connaissance à priori sur les caractéristiques qui sont importantes pour la tâche à accomplir. Ceux-ci nous amènent à présenter un nouveau modèle de recherche d'informations qui diffère des modèles existants sur le plan théorique et de l'efficacité expérimentale. Les deux derniers articles marquent un changement fondamental dans l'approche de construction des représentations. Ils bénéficient notamment de l'intérêt de recherche dont les techniques d'apprentissage profond par réseaux de neurones, ou deep learning, ont fait récemment l'objet. Ces modèles d'apprentissage élicitent automatiquement les caractéristiques importantes pour la tâche demandée à partir d'une quantité importante de données. Nous nous intéressons à la modélisation des relations sémantiques entre documents et requêtes ainsi qu'entre deux ou plusieurs requêtes. Ces derniers articles marquent les premières applications de l'apprentissage de représentations par réseaux de neurones à la recherche d'informations. Les modèles proposés ont aussi produit une performance améliorée sur des collections de test standard. Nos travaux nous mènent à la conclusion générale suivante: la performance en recherche d'informations pourrait drastiquement être améliorée en se basant sur les approches d'apprentissage de représentations. / Information retrieval is generally concerned with answering questions such as: is this document relevant to this query?
How similar are two queries or two documents?
How query and document similarity can be used to enhance relevance estimation?
In order to answer these questions, it is necessary to access computational representations of documents and queries.
For example, similarities between documents and queries may correspond to a distance or a divergence defined on the representation space.
It is generally assumed that the quality of the representation has a direct impact on the bias with respect to the true similarity, estimated by means of human intervention.
Building useful representations for documents and queries has always been central to information retrieval research.
The goal of this thesis is to provide new ways of estimating such representations and the relevance relationship between them.
We present four articles that have been published in international conferences and one published in an information retrieval evaluation
forum. The first two articles can be categorized as feature engineering approaches, which transduce a priori knowledge about the domain into the features of the representation.
We present a novel retrieval model that compares favorably to existing models in terms of both theoretical originality and experimental effectiveness.
The remaining two articles mark a significant change in our vision and originate from the widespread interest in deep learning research that took place during the time they were written.
Therefore, they naturally belong to the category of representation learning approaches, also known as feature learning. Differently from previous approaches, the learning model discovers alone the most important features for the task at hand, given a considerable amount of labeled data. We propose to model the semantic relationships between documents and queries and between queries themselves.
The models presented have also shown improved effectiveness on standard test collections. These last articles are amongst the first applications of representation learning with neural networks for information retrieval. This series of research leads to the following observation: future improvements of information retrieval effectiveness has to rely on representation learning techniques instead of manually defining the representation space.
|
2 |
Structural empirical models of spatial inequalities: housing choices, policies and generational consequencesSidibe, Modibo 05 December 2011 (has links) (PDF)
Cette thèse présente trois articles où des agents optimisateurs tiennent compte dans leurs choix présents de leurs situations futures. Dans le premier essai, nous estimons un modèle dynamique de choix de logement. Nous nous intéressons à la disponibilité à payer pour les caractéristiques du logement en estimant un modèle hédonique dynamique. Notre méthode d'estimation tient compte des caractéristiques inobservables du logement, qui peuvent être de surcroît corrélées aux caractéristiques observées. Nous utilisons la régulation des loyers comme principale source d'identification, qui rend les loyers indépendants des conditions locales du marché du logement. Les résultats indiquent une corrélation négative entre l'hétérogénéité non observée et les paramètres. L'impossibilité de tenir compte de cette hétérogénéité biaiserait les paramètres. Dans le deuxième essai, nous proposons un modèle d'appariement sur le marché du travail pour évaluer la politique publique des zones franches urbaines. Nous modélisons chaque aire urbaine comme un marché local du travail composé d'une localisation centrale et d'une banlieue. Les firmes font des choix de localisation en fonction de leur productivité. La segmentation ainsi générée crée une différence entre les taux d'arrivée des offres des deux localisations. Les résultats démontrent que la politique a un effet très faible sur le chômage. De plus, le modèle suggère qu'il faudrait multiplier par 20 le nombre de firmes en ZFUs afin d'avoir un effet sur le chômage. Enfin, dans le troisième essai, nous analysons la contribution respective des différences individuelles et entre localisations à la dynamique de la ségrégation et des inégalités. Nous développons un modèle dans l'esprit de Bewley-Huggett-Aiyagari où plusieurs frictions sont présentes. Plus précisément, nous introduisons une segmentation entre les propriétaires et les locataires, l'imperfection du marché du crédit et la mobilité au cours du cycle de vie. De plus, la localisation des individus affecte leur productivité, leur accumulation de capital via la dynamique des prix des logements, et le processus d'acquisition de capital humain de la génération. Nous analysons ainsi la mobilité individuelle à partir de ce cadre de travail.
|
3 |
Etude de l'influence du passage à l'échelle sur les modèles de recherche d'informationImafouo, Amélie 06 December 2006 (has links) (PDF)
Les évolutions technologiques de ces dernières années ont entraîné une croissance exponentielle de la quantité d'information numérique disponible. La Recherche d'Information, discipline dont le cœur de métier est la manipulation de cette information est questionnée par cette croissance rapide. Les travaux présentés dans cette thèse se sont penchés sur le problème de l'influence du passage à l'échelle sur les performances des modèles de Recherche d'Information. Après un tour des travaux du domaine qui prennent en compte le passage à l'échelle, des méthodologies pour construire des espaces de recherche de tailles croissantes et dont le contenu est contrôlé sont proposées dans un premier temps; ces espaces de recherches sont utilisés pour observer les performances de divers modèles de RI en fonction de la taille des données manipulées. Dans un second temps, les travaux portent sur la proposition de métriques prenant en compte plusieurs niveaux de pertinence pour un document; la notion d'importance d'un niveau de pertinence est formalisée et la notion de gain d'information entre deux niveaux de pertinence est introduite. Ces deux notions permettent de fournir des métriques dédiées à analyser la capacité des systèmes de RI à retourner des documents en fonction de leur niveau de pertinence, au fur et à mesure que la taille de l'espace de recherche augmente.
|
4 |
Approches non supervisées pour la recommandation de lectures et la mise en relation automatique de contenus au sein d'une bibliothèque numérique / Unsupervised approaches to recommending reads and automatically linking content within a digital libraryBenkoussas, Chahinez 14 December 2016 (has links)
Cette thèse s’inscrit dans le domaine de la recherche d’information (RI) et la recommandation de lecture. Elle a pour objets :— La création de nouvelles approches de recherche de documents utilisant des techniques de combinaison de résultats, d’agrégation de données sociales et de reformulation de requêtes ;— La création d’une approche de recommandation utilisant des méthodes de RI et les graphes entre les documents. Deux collections de documents ont été utilisées. Une collection qui provient de l’évaluation CLEF (tâche Social Book Search - SBS) et la deuxième issue du domaine des sciences humaines et sociales (OpenEdition, principalement Revues.org). La modélisation des documents de chaque collection repose sur deux types de relations :— Dans la première collection (CLEF SBS), les documents sont reliés avec des similarités calculées par Amazon qui se basent sur plusieurs facteurs (achats des utilisateurs, commentaires, votes, produits achetés ensemble, etc.) ;— Dans la deuxième collection (OpenEdition), les documents sont reliés avec des relations de citations (à partir des références bibliographiques).Le manuscrit est structuré en deux parties. La première partie «état de l’art» regroupe une introduction générale, un état de l’art sur la RI et sur les systèmes de recommandation. La deuxième partie «contributions» regroupe un chapitre sur la détection de comptes rendus de lecture au sein de la collection OpenEdition (Revues.org), un chapitre sur les méthodes de RI utilisées sur des requêtes complexes et un dernier chapitre qui traite l’approche de recommandation proposée qui se base sur les graphes. / This thesis deals with the field of information retrieval and the recommendation of reading. It has for objects:— The creation of new approach of document retrieval and recommendation using techniques of combination of results, aggregation of social data and reformulation of queries;— The creation of an approach of recommendation using methods of information retrieval and graph theories.Two collections of documents were used. First one is a collection which is provided by CLEF (Social Book Search - SBS) and the second from the platforms of electronic sources in Humanities and Social Sciences OpenEdition.org (Revues.org). The modelling of the documents of every collection is based on two types of relations:— For the first collection (SBS), documents are connected with similarity calculated by Amazon which is based on several factors (purchases of the users, the comments, the votes, products bought together, etc.);— For the second collection (OpenEdition), documents are connected with relations of citations, extracted from bibliographical references.We show that the proposed approaches bring in most of the cases gain in the performances of research and recommendation. The manuscript is structured in two parts. The first part "state of the art" includes a general introduction, a state of the art of informationretrieval and recommender systems. The second part "contributions" includes a chapter on the detection of reviews of books in Revues.org; a chapter on the methods of IR used on complex queries written in natural language and last chapter which handles the proposed approach of recommendation which is based on graph.
|
5 |
Trois essais sur les liens entre les marchés immobiliers et l’économie / Three essays on the linkages between real estate markets and the wider economyBouchouicha, Ranoua 13 June 2013 (has links)
Cette thèse présente trois essais qui fournissent un aperçu global de la manière dont les chocs au niveau du marché immobilier affectent l'économie et vice versa.Dans le premier essai, nous utilisons des modèles de Markov à changement de régimes avec des probabilités qui dépendent du temps et des probabilités fixes afin d'évaluer l'ampleur des mécanismes de transmission entre le marché de placements immobiliers, le marché du logement et le marché boursier au Royaume-Uni et aux États-Unis. Nous montrons que la relation entre les marchés immobiliers et les marchés des actions est plus significative quand les marchés immobiliers sont considérés comme des variables explicatives.Dans le deuxième essai, nous introduisons le marché d'immobilier commercial afin d'identifier les interactions entre différents marchés immobiliers et certaines variables macroéconomiques. Nous utilisons une fonction de cohérence dynamique dans un cadre d'analyse spectrale pour évaluer ces liens. Les résultats montrent une tendance commune à long terme des différents marchés immobiliers. Aux États-Unis, les canaux de transmissions: richesse et dépenses de logement sont très conducteurs en cas de crise immobilière. Cependant, au Royaume-Uni, seulement le canal de la richesse s'avère conducteur dans les périodes de ralentissement du marché immobilier. Le troisième essai développe un cadre pour modéliser le marché de logement français. Nous élaborons et estimons un modèle de recherche d'équilibre du marché du logement segmenté entre locataires et propriétaires se caractérisant par une hétérogénéité des besoins de logement. Notre modèle reproduit l'évolution des prix de l'immobilier sur le marché français de 1996 à 2006, ainsi que la corrélation entre le prix, l'âge et la durée. En outre, nous montrons que l'inadéquation des individus avec leur logement est fortement corrélée avec le cycle de vie, et que l'agrégation de ces événements peut empêcher l'équilibre du marché à long terme. / This thesis contains three essays on the linkages between real estate and the wider economy. We provide a global snapshot of how shocks in the real estate market affect the economy and vice versa. In the first essay, we use Markov Switching models with time varying transition probabilities and fixed time transition probabilities in order to assess the magnitude of the transmission mechanisms between real estate markets and stock markets in the UK and the US. The results show a more significant credit price effect than a wealth effect. In addition, the different features of the linkages between real estate markets and stock markets are explained by the difference in the indices constructions of the housing prices and the REIT models in the two countries.In the second essay, an additional property market is included to further investigate the links of different real estate markets with some key macroeconomic variables. We use a dynamic coherence function in a spectral framework to assess these linkages. We find a common trend that drives all the real estate markets, particularly in the long run. The results show that in the US, wealth and housing expenditure channels are very conductive during real estate crises. However, for the UK, only the wealth is significant as a transmission channel during real estate market downturns. The third essay develops a framework that models the French housing market. We specify and estimate an equilibrium search model of the housing market that features a segmented housing market with heterogeneity in housing need. Our model reproduces almost exactly the evolution of French housing prices from 1996 to 2006, along with the correlation between price, age and duration. In addition we show that individuals mismatch is highly correlated with the life-cycle, and that aggregation of such events can prevent the market from clearing over a long period of time.
|
6 |
Labor market search frictions in developing countries : evidence from the MENA region : Egypt and Jordan / Les modèles de recherche d'emploi dans les pays en voie de développementYassin, Shaimaa 04 December 2015 (has links)
Dans les pays en voie de développement, les politiques visent à augmenter les opportunités d'emploi afin d'élever les revenus et les niveaux de vie des populations. Parmi ces pays, les pays arabes de la région MENA ont récemment connu une vague de soulèvement populaire, faisant suite aux accroissements de la pauvreté, des inégalités et de l'exclusion, résultats des faibles performances du marché du travail. Comme l'analyse des flux est devenu l'outil de base de l'économie du travail moderne, cette thèse propose d'expliquer le fonctionnement de ces marchés du travail assez spécifiques, particulièrement ceux de l'Egypte et de la Jordanie, en utilisant la théorie de la recherche d'emploi. Elle se penche sur l'analyse des créations et destructions d'emploi ainsi que des mobilités entre emplois. Elle montre que ces marchés sont très rigides. L'impact de l'introduction des réformes structurelles, visant à flexibiliser l'emploi est ensuite discuté de manière empirique ainsi que théorique. Les résultats montrent que la baisse des coûts de licenciement en Egypte a augmenté significativement les destructions d'emploi, mais n'a eu aucun impact sur les créations. Cet échec partiel de la réforme est un paradoxe empirique, qui est interprété théoriquement par un effet d'éviction dû à l'augmentation du coût de la corruption ou/et à l'augmentation des salaires du secteur public. Une extension originale du modèle théorique de Mortensen-Pissarides est alors développée, permettant l'existence de trois secteurs, public, privé formel et privée informel. Ce cadre rend compte de la nature particulière des pays en voie de développement. Pour examiner la qualité des emplois et pour étudier les avancements dans l'échelle des salaires, une estimation structurelle du modèle de Burdett-Mortensen est ensuite proposée. Elle permet d'étudier et mesurer les frictions d'appariement sur les marchés du travail égyptien et jordanien. Les paramètres estimés sont extrêmement faibles, soulignant la forte rigidité de ces marchés. Le marché du travail jordanien s'avère, par contre, être plus flexible que l'égyptien. Compte tenu de la non-disponibilité de données de panels annuelles dans ces pays, il est montré que des données de panel rétrospectives peuvent être utilisées, pour étudier les transitions de court terme sur ces marchés du travail. Ces données de panel sont par contre soumises à un biais de mémoire. Une méthode originale de correction du biais de mémoire est donc proposée et développée. Elle vise à corriger les transitions à la fois à un niveau macro, en utilisant une méthode de moments simulés, ainsi qu'au niveau micro, en construisant des matrices de poids. / Policy prescriptions for poor developing countries struggle to expand employment opportunities toraise their income levels. Among these are the MENA Arab countries that have recently experiencedan unprecedented tide of popular uprisings following the rising poverty, inequality and exclusion, muchof which is related to the labor market. Since the flow approach to labor markets has become the basic toolbox to modern labor economics, this thesis has at its central insight explaining the functioning ofthose specific labor markets, particularly the Egyptian and Jordanian, using the search equilibrium theory. It looks at analyzing job accession, separations and mobility trends. Overall, evidence of highlevels of rigidity is revealed. The impact of introducing flexible employment protection regulations in these rigid markets is then discussed both empirically and theoretically. Findings show that lowering firing costs in Egypt increased significantly the job separations, but had no impact on job creations.This partial failure of the liberalization reform is interpreted theoretically by a crowding out effect due to increased corruption set up costs or increased public sector wages. A novel theoretical matching model a la Mortensen Pissarides is developped allowing for the existence of public, formal private and informal private sectors, reflecting the particular nature of developing countries. Workers’ movements up the job ladder is then explored through a structural estimation of the frictional parameters in a job search model a la Burdett Mortensen. These markets are found to have very high levels of search frictions especially among the young workers. Given the non-availability of panel data to study labor market flows, longitudinal retrospective panel datasets are extracted from the Egypt and Jordan Labor Market Panel Surveys. These panels are then compared to available contemporaneous crosssectional information, showing that they suffer from recall and design measurement erros. An original methodology is therefore proposed and developped to correct the biased labor market transitionsboth on the aggregate macro-level, using a Simulated Method of Moments (SMM), as well as on themicro-individual transaction level, using constructed micro-data weights.
|
7 |
Impact des réseaux sociaux sur le processus de recherche d’information / Impact of social networks on the information retrieval processBouhini, Chahrazed 21 October 2014 (has links)
L’émergence des réseaux sociaux a révolutionné le Web en permettant notamment aux individus de prolonger leur connexion virtuelle en une relation plus réelle et de partager leurs connaissances. Ce nouveau contexte de diffusion de l’information sur le Web peut constituer un moyen efficace pour cerner les besoins en information des utilisateurs du Web, et permettre à la recherche d’information (RI) de mieux répondre à ces besoins en adaptant les modèles d’indexation et d’interrogation. L’exploitation des réseaux sociaux confronte la RI à plusieurs défis dont les plus importants concernent la représentation de l’information dans un modèle social personnalisé de RI et son évaluation, en l’absence de collections de test et de compétitions dédiées. Nous proposons dans ce travail de bénéficier de l’exploitation des informations issues des réseaux sociaux pour personnaliser la recherche d’information de l’utilisateur en se rapprochant le plus de ses centres d’intérêt et de ses préférences. Les principales contributions de notre travail consistent dans un premier temps à établir un profil social de l’utilisateur à partir du contenu informationnel généré au sein du réseau social. Nous présentons par la suite des modèles de recherche sociale personnalisée d’information (RSPI) permettant d’intégrer le profil social de l’utilisateur à différents niveaux du processus de RI. Dans l’objectif de permettre l’évaluation des modèles de RSPI sur une collection de test dédiée, nous proposons une collection de test de RSPI que nous avons construite à partir du réseau d’annotation collaborative "Delicious" contenant en plus des données classiques d’une collection de test de RI, des données centrées-utilisateur / The emergence of social media has revolutionized the web by allowing individuals to extend their virtual connection in a more real relationship and share knowledge. This new context of information dissemination on the Web can be an effective way to identify the information needs of Web users, and allow information retrieval (IR) to better meet these needs by adapting the indexing and querying models. The information retrieval faced several challenges with the use of social networks, the most important concerns the representation of information in a personalized social IR (PSIR) model and its evaluation in the absence of a social test collections with the user-centered data (user-centered queries and user-centered relevance judgments). We propose to benefit from the use of the user generated content (UGC) on the social networks to personalize his social search in order to better fit his interests and preferences. The main contributions of our work consist of, on the one hand, building a social profile from the UGC within the social network. We propose then a personalized social information retrieval models which integrate the user’s social profile at various levels of the IR process. On the other hand, with the objective of evaluating our PSIR models on a dedicated test collection, we propose a PSIR test collection "DelRSI" we built from the collaborative social bookmarking network "Delicious" ; a PSIR test collection containing in addition to the classical IR test collection’s data, a user-centered data
|
Page generated in 0.0793 seconds