• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • 1
  • Tagged with
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Indexation et interrogation de pages web décomposées en blocs visuels

Faessel, Nicolas 14 June 2011 (has links)
Cette thèse porte sur l'indexation et l'interrogation de pages Web. Dans ce cadre, nous proposons un nouveau modèle : BlockWeb, qui s'appuie sur une décomposition de pages Web en une hiérarchie de blocs visuels. Ce modèle prend en compte, l'importance visuelle de chaque bloc et la perméabilité des blocs au contenu de leurs blocs voisins dans la page. Les avantages de cette décomposition sont multiples en terme d'indexation et d'interrogation. Elle permet notamment d'effectuer une interrogation à une granularité plus fine que la page : les blocs les plus similaires à une requête peuvent être renvoyés à la place de la page complète. Une page est représentée sous forme d'un graphe acyclique orienté dont chaque nœud est associé à un bloc et étiqueté par l'importance de ce bloc et chaque arc est étiqueté la perméabilité du bloc cible au bloc source. Afin de construire ce graphe à partir de la représentation en arbre de blocs d'une page, nous proposons un nouveau langage : XIML (acronyme de XML Indexing Management Language), qui est un langage de règles à la façon de XSLT. Nous avons expérimenté notre modèle sur deux applications distinctes : la recherche du meilleur point d'entrée sur un corpus d'articles de journaux électroniques et l'indexation et la recherche d'images sur un corpus de la campagne d'ImagEval 2006. Nous en présentons les résultats. / This thesis is about indexing and querying Web pages. We propose a new model called BlockWeb, based on the decomposition of Web pages into a hierarchy of visual blocks. This model takes in account the visual importance of each block as well as the permeability of block's content to their neighbor blocks on the page. Splitting up a page into blocks has several advantages in terms of indexing and querying. It allows to query the system with a finer granularity than the whole page: the most similar blocks to the query can be returned instead of the whole page. A page is modeled as a directed acyclic graph, the IP graph, where each node is associated with a block and is labeled by the coefficient of importance of this block and each arc is labeled by the coefficient of permeability of the target node content to the source node content. In order to build this graph from the bloc tree representation of a page, we propose a new language : XIML (acronym for XML Indexing Management Language), a rule based language like XSLT. The model has been assessed on two distinct dataset: finding the best entry point in a dataset of electronic newspaper articles, and images indexing and querying in a dataset drawn from web pages of the ImagEval 2006 campaign. We present the results of these experiments.
2

Seleção de anúncios para veiculação durante a exibição de vídeos na Web

Gomes, Karla Suguiyama Okada 26 February 2010 (has links)
Made available in DSpace on 2015-04-11T14:02:53Z (GMT). No. of bitstreams: 1 karla suguiyama.pdf: 1067694 bytes, checksum: e8bdd19b3cdfa62bbfeeced3b2620b44 (MD5) Previous issue date: 2010-02-26 / Não informado / The Internet has become one of the major media outlets for advertising markets, by exposing its products and services to large audiences at relatively low cost. The main approach of Web advertising is the search advertising whereby ads are selected based on the keywords extracted from the user s search queries submitted to search engines and are matched against keywords associated with ads provided by advertisers, known as a non-intrusive technique called keyword-targeted advertising. The success of keyword-targeted advertising has motivated information gatekeepers to disseminate their ad services over different contexts, such as, content pages and pages of services, leading to the emergence of content-targeted advertising which refers to the issue of matching ads to a web page which is browsed. The impact of advertising on the Web is even greater if we consider the significant increase of their audience, resulting from the proliferation of the material generated by the users in the so-called Web 2.0, specially with the spread of blogs, social networking sites and wikis. Many websites have been highlighted in this context, achieving great popularity and becoming promising sources for advertising, for instance, the video sharing websites, where users can share digital media. In this research, we were trying to investigate alternatives for advertisement selection that would run during the display of on-line videos. In order to avoid the high cost of image processing, we were aiming to explore textual metadata related to videos stored on video sharing websites, through a preliminary study on the usefulness of metadata as a source of information used in the selection of on-line advertisement. While maintaining a video collection and a real ad collection, video metadata was used in experiments with two ad ranking methods: the vector and the vector with the implementation of a block importance model which is based on statistical data and gives a weight to each metadata to estimate the importance of the information carried. In order to evaluate the output of the studied advertisement selection systems, a reference collection containing 81 videos was created. These videos were carefully analyzed in order to determine which products and/or services they could potentially advertise. Based on the information gathered, advertisements were manually picked and thus potentially considered either relevant or irrelevant for their appropriate video contained in the collection. The experimental results obtained showed that the metadata which rather describes video content information, such as its description, potentially offered a greater contribution to the selection of advertisement to be shown during its display. It could also be seen that the application of weights that worked according to the studied block importance model, provided gains of approximately 7% over the vector method that did not use the weights application model. This aspect must be considered important due to the possibility of increasing the profitability of the advertisement selection systems, and given the negative impact of non-relevant advertisement based on credibility and brand of advertisers. / O mercado de publicidade tem encontrado na Web uma das principais mídias para exposição de seus produtos e serviços para um público abrangente a custos relativamente baixos. A principal abordagem de publicidade na Web é a propaganda de busca cujos anúncios são selecionados com base nos termos de consultas feitas por usuários em máquinas de busca e são exibidos junto com as suas respostas, uma técnica não intrusiva conhecida como keyword-targeted advertising (propaganda direcionada baseada em palavra-chave). O sucesso deste formato de publicidade, motivou grandes mediadores de informação a disseminá-lo em vários outros contextos, tais como páginas de conteúdo e páginas de serviços, levando ao surgimento da content-targeted advertising (propaganda direcionada baseada em conteúdo). O impacto da publicidade na Web é ainda maior se considerarmos o aumento expressivo de sua audiência, resultante da proliferação de material gerado pelos próprios usuários finais na chamada Web 2.0, tais como, a disseminação de blogs, redes sociais e wikis. Muitos sites têm-se destacado nesse âmbito, atingindo uma grande popularidade e tornando-se fontes promissoras para a publicidade, entre eles, os sites de compartilhamento de vídeos, nos quais os usuários podem disponibilizar seus próprios vídeos para outros usuários. Neste trabalho procurou-se investigar alternativas para a seleção de anúncios a serem veiculados durante a exibição de vídeos postados na Web. Diferente de trabalhos anteriores, com o intuito de evitar o alto custo de processamento de imagens, buscou-se explorar metadados textuais relacionados aos vídeos disponibilizados pelos sites de compartilhamento destes, através de um estudo preliminar sobre a utilidade dos metadados como fonte de informação a ser usada na seleção de anúncios. Através de uma coleção de vídeos e uma coleção real de propagandas, os metadados dos vídeos foram utilizados em experimentos com dois métodos de ordenação de propagandas: o vetorial e o vetorial com a aplicação de um modelo de importância de blocos que baseado em dados estatísticos, atribui peso a cada metadado visando estimar a importância da informação carregada pelo mesmo. Para a avaliação dos resultados dos sistemas de seleção de propagandas estudados, foi criada uma coleção de referência contendo 81 vídeos. Cada vídeo foi assistido e analisado para a determinação de quais produtos e/ou serviços poderiam ser sugeridos durante a veiculação do mesmo. Baseadas nessas informações, foram selecionadas e associadas manualmente propagandas consideradas relevantes ou não-relevantes para cada vídeo da coleção. Os resultados experimentais obtidos revelaram que os metadados que discorrem mais sobre o conteúdo do vídeo, como a sua descrição, podem oferecer uma contribuição maior para a seleção de anúncios relevantes a serem mostrados durante à exibição do vídeo. Também pôde-se constatar que a aplicação dos pesos de acordo com o modelo de importância de blocos estudado, levou a resultados com um ganho de cerca de 7% em relação ao método vetorial sem a aplicação de pesos. Aspecto que deve ser considerado importante devido a possibilidade de um aumento da lucratividade do sistema de seleção de propagandas e devido ao impacto negativo que a veiculação de um anúncio não-relevante pode causar nos usuários.

Page generated in 0.0409 seconds