Global ETD Search

1	Using external sources of bilingual information for word-level quality estimation in translation technologies Esplà-Gomis, Miquel 25 January 2016 (has links) No description available. Fonts d'informació bilingüe Traducció automàtica Traducció assistida per ordinador Recol·lecció d'informació bilingüe Lenguajes y Sistemas Informáticos
2	Las hemerotecas de la prensa digital. Análisis de diarios españoles Guallar, Javier 11 December 2012 (has links) La tesis presenta un modelo o sistema para el análisis y la evaluación de las hemerotecas de la prensa digital, que se aplica a una muestra de diarios españoles entre 2007 y 2010 y se enmarca en una propuesta de clasificación de fuentes de información sobre prensa digital. La clasificación de las principales fuentes de información sobre prensa digital sigue como criterio fundamental para establecer la tipología de productos la función principal que realizan para el usuario, lo que lleva a establecer cuatro grandes ámbitos: acceso a cabeceras de prensa, búsqueda de información, seguimiento de información y agregación de contenidos. De cada una de estas clases, se describen y analizan distintas subtipologías: directorios, hemerotecas históricas, hemerotecas digitales de medios, bases de datos de prensa, seguimiento de prensa, seguimiento online, seguimiento en redes sociales, agregadores manuales, agregadores automatizados y agregadores sociales. Se muestran para cada tipología ejemplos significativos de las áreas lingüísticas inglesa y española. El sistema de análisis de hemerotecas digitales parte de una amplia revisión bibliográfica de trabajos sobre evaluación de recursos web y bases de datos web, y de trabajos sobre análisis y evaluación de hemerotecas de diarios digitales. Es un procedimiento evaluativo de tipo heurístico basado en 27 indicadores articulados en cuatro grandes secciones: aspectos generales, contenidos, sistema de consulta y presentación de resultados. Se expone para cada indicador: definición, explicación y uso de la puntuación. Los indicadores son: A.1. Denominación A.2. Ubicación del acceso a la hemeroteca A.3. Información sobre la hemeroteca A.4. Coste A.5. Productos documentales B.1. Colecciones disponibles B.2. Formatos disponibles B.3. Cobertura temporal C.1. Tipos de consulta por interrogación (palabras clave) C.2. Lenguaje de consulta C.3. Visualización de los índices C.4. Ajuste de relevancia C.5. Acotación temporal C.6. Acotación en colecciones C.7. Acotación en formatos C.8. Acotación por campos del registro C.9. Reutilización de búsquedas C.10. Consulta de tesauros u otros vocabularios controlados C.11. Acceso por navegación cronológica (browsing) C.12. Ayudas D.1. Gestión de las listas de resultados D.2. Campos visualizados del registro del documento D.3. Agrupación de resultados por categorías D.4. Identificación de los términos de búsqueda en el documento D.5. Formatos de visualización de un mismo documento. D.6. Gestión de los documentos recuperados D.7. Presentación de documentos relacionados Con este modelo, se analizan las hemerotecas digitales de los diarios españoles de mayor audiencia y difusión. Es un estudio longitudinal efectuado entre los años 2007 y 2010. Se presentan con detalle los resultados del análisis realizado en 2010, y se relacionan con los obtenidos anteriormente en 2007. Se señalan los aspectos mejores y peores de las hemerotecas de prensa digital, se establece un ranking de diarios en el que ocupan las primeras posiciones El mundo, Abc, El país y La vanguardia, y se destacan finalmente cinco grandes tendencias observadas: -ampliación del fondo temporal en línea; -hemerotecas gratuitas versus hemerotecas de pago; -simplificación (y empobrecimiento) de la búsqueda; -filtros en la presentación de resultados; -productos documentales en la sección Hemeroteca. / This study presents a system for the analysis and evaluation of digital press archives, analyses the digital press archives of a sample of Spanish newspapers and presents a proposal to classify and analyze the main sources that provide access to online press. The system is a kind of heuristic evaluation procedure based on 27 indicators articulated in four main sections: general features, contents, the query system, and presentation of results. For each indicator is explained: definition, explanation and use of punctuation. With this method, it analyses the digital press archives of the Spanish newspapers with the largest digital circulations between 2007 and 2010. The study points out the best and worst aspects of the digital press archives, establishing a ranking of newspapers in which El Mundo, Abc, El País and La Vanguardia occupy the top positions, and finally shows five major trends: extension of the temporary fund online, free archives versus payment archives, simplification (and depletion) of the query, filters in the presentation of results and documentary products in the archive section. Hemeroteques Hemerotecas Press archives Premsa digital Prensa digital Digital press Documentació periodística Documentación periodística Journalistic documentation Fonts d'informació Recursos de información Information resources Avaluació Evaluación Evaluation Ciències de l'Educació 070
3	Information sources selection methodology for recommender systems based on intrinsic characteristics and trust measure Aciar, Silvana Vanesa 18 June 2007 (has links) El treball desenvolupat en aquesta tesi presenta un profund estudi i proveïx solucions innovadores en el camp dels sistemes recomanadors. Els mètodes que usen aquests sistemes per a realitzar les recomanacions, mètodes com el Filtrat Basat en Continguts (FBC), el Filtrat Col·laboratiu (FC) i el Filtrat Basat en Coneixement (FBC), requereixen informació dels usuaris per a predir les preferències per certs productes. Aquesta informació pot ser demogràfica (Gènere, edat, adreça, etc), o avaluacions donades sobre algun producte que van comprar en el passat o informació sobre els seus interessos. Existeixen dues formes d'obtenir aquesta informació: els usuaris ofereixen explícitament aquesta informació o el sistema pot adquirir la informació implícita disponible en les transaccions o historial de recerca dels usuaris. Per exemple, el sistema recomanador de pel·lícules MovieLens (http://movielens.umn.edu/login) demana als usuaris que avaluïn almenys 15 pel·lícules dintre d'una escala de * a * * * * * (horrible, ...., ha de ser vista). El sistema genera recomanacions sobre la base d'aquestes avaluacions. Quan els usuaris no estan registrat en el sistema i aquest no té informació d'ells, alguns sistemes realitzen les recomanacions tenint en compte l'historial de navegació. Amazon.com (http://www.amazon.com) realitza les recomanacions tenint en compte les recerques que un usuari a fet o recomana el producte més venut. No obstant això, aquests sistemes pateixen de certa falta d'informació. Aquest problema és generalment resolt amb l'adquisició d'informació addicional, se li pregunta als usuaris sobre els seus interessos o es cerca aquesta informació en fonts addicionals. La solució proposada en aquesta tesi és buscar aquesta informació en diverses fonts, específicament aquelles que contenen informació implícita sobre les preferències dels usuaris. Aquestes fonts poden ser estructurades com les bases de dades amb informació de compres o poden ser no estructurades com les pàgines web on els usuaris deixen la seva opinió sobre algun producte que van comprar o posseïxen.Nosaltres trobem tres problemes fonamentals per a aconseguir aquest objectiu: 1 . La identificació de fonts amb informació idònia per als sistemes recomanadors.2 . La definició de criteris que permetin la comparança i selecció de les fonts més idònies. 3 . La recuperació d'informació de fonts no estructurades. En aquest sentit, en la tesi proposada s'ha desenvolupat: 1 . Una metodologia que permet la identificació i selecció de les fonts més idònies. Criteris basats en les característiques de les fonts i una mesura de confiança han estat utilitzats per a resoldre el problema de la identificació i selecció de les fonts. 2 . Un mecanisme per a recuperar la informació no estructurada dels usuaris disponible en la web. Tècniques de Text Mining i ontologies s'han utilitzat per a extreure informació i estructurar-la apropiadament perquè la utilitzin els recomanadors. Les contribucions del treball desenvolupat en aquesta tesi doctoral són: 1. Definició d'un conjunt de característiques per a classificar fonts rellevants per als sistemes recomanadors2. Desenvolupament d'una mesura de rellevància de les fonts calculada sobre la base de les característiques definides3. Aplicació d'una mesura de confiança per a obtenir les fonts més fiables. La confiança es definida des de la perspectiva de millora de la recomanació, una font fiable és aquella que permet millorar les recomanacions. 4. Desenvolupament d'un algorisme per a seleccionar, des d'un conjunt de fonts possibles, les més rellevants i fiable utilitzant les mitjanes esmentades en els punts previs. 5. Definició d'una ontologia per a estructurar la informació sobre les preferències dels usuaris que estan disponibles en Internet. 6. Creació d'un procés de mapatge que extreu automàticament informació de les preferències dels usuaris disponibles en la web i posa aquesta informació dintre de l'ontologia. Aquestes contribucions permeten aconseguir dos objectius importants: 1 . Millorament de les recomanacions usant fonts d'informació alternatives que sigui rellevants i fiables.2 . Obtenir informació implícita dels usuaris disponible en Internet. / The work developed in this thesis presents an in-depth study and provides innovative solutions in the field of recommender systems. The methods used by these systems to carry out recommendations, such as Content-Based Filtering (CBF), Collaborative Filtering (CF) and Knowledge-Based Filtering (KBF), require information from users to predict preferences for certain products. This may be demographic information (genre, age and address), evaluations given to certain products in the past or information about their interests. There are two ways of obtaining this information: users offer it explicitly or the system can retrieve the implicit information available in the purchase and search history. For example, the movie recommender system MovieLens (http://movielens.umn.edu/login) asks users to rate at least 15 movies on a scale of * to * * * * * (awful, ... , must be seen). The system generates recommendations based on these evaluations. When users are not registered into the site and it has no information about them, recommender systems make recommendations according to the site search history. Amazon.com (http://www.amazon.com) make recommendations according to the site search history or recommend the best selling products. Nevertheless, these systems suffer from a certain lack of information. This problem is generally solved with the acquisition of additional information; users are asked about their interests or that information is searched for in additional available sources. The solution proposed in this thesis is to look for that information in various sources, specifically those that contain implicit information about user preferences. These sources can be structured like databases with purchasing information or they can be unstructured sources like review pages where users write their experiences and opinions about a product they buy or possess.We have found three fundamental problems to achieve this objective: 1. The identification of sources with suitable information for recommender systems.2. The definition of criteria that allows the comparison and selection of the most suitable sources.3. Retrieving the information from unstructured sources.In this sense, the proposed thesis has developed:1. A methodology that allows the identification and selection of the most suitable sources. Criteria based on the characteristics of sources and a trust measure have been used to solve the problem of identifying and selecting sources.2. A mechanism to retrieve unstructured information from users available on the Web. Text mining techniques and ontologies have been used to extract information and structure it appropriately for use by the recommenders.The contributions of the work developed in this doctoral thesis are:1. Definition of a set of characteristics to classify relevant sources of information for recommender systems.2. Development of a measure of relevance of sources according to characteristics defined in previous point.3. Application of a trust measure to obtain the most reliable sources. Confidence is measured from the perspective of improving the recommendation; a reliable source is one that leads to improved recommendations.4. Development of an algorithm to select, from a set of possible sources, the most relevant and reliable ones according to measures defined in previous points.5. Definition of an ontology to structure information about user preferences that are available on the Internet.6. The creation of a mapping process that automatically extracts information about user preferences available on the web and put in the ontology.These contributions allow us the achievement of two important objectives:1. Improving recommendations using alternative sources of information that are relevant and trustworthy.2. Obtaining implicit information about user available on the Internet. Mineria de dades Data mining Confianza Trust Confiança Fuentes de infomación Fonts d'informació Information sources Sistemas recomendadores Sistemes recomanadors Recommender systems Perfil de usuario Perfil d'usuari User profile Mineria de datos 68

1

Page generated in 0.067 seconds