Global ETD Search

181	Data complexity in supervised learning: A far-reaching implication Macià Antolínez, Núria 06 October 2011 (has links) Aquesta tesi estudia la complexitat de les dades i el seu rol en la definició del comportament de les tècniques d'aprenentatge supervisat, i alhora explora la generació artificial de conjunts de dades mitjançant estimadors de complexitat. El treball s'ha construït sobre quatre principis que s'han succeït de manera natural. (1) La crítica de la metodologia actual utilitzada per la comunitat científica per avaluar el rendiment de nous sistemes d'aprenentatge ha desencadenat (2) l'interès per estimadors alternatius basats en l'anàlisi de la complexitat de les dades i el seu estudi. Ara bé, tant l'estat primerenc de les mesures de complexitat com la disponibilitat limitada de problemes del món real per fer el seu test han inspirat (3) la generació sintètica de problemes, la qual ha esdevingut l'eix central de la tesi, i (4) la proposta de fer servir estàndards artificials amb semblança als problemes reals. L'objectiu que es persegueix a llarg termini amb aquesta recerca és proporcionar als usuaris (1) unes directrius per escollir el sistema d'aprenentatge idoni per resoldre el seu problema i (2) una col•lecció de problemes per, o bé avaluar el rendiment dels sistemes d'aprenentatge, o bé provar les seves limitacions. / Esta tesis profundiza en el estudio de la complejidad de los datos y su papel en la definición del comportamiento de las técnicas de aprendizaje supervisado, a la vez que explora la generación artificial de conjuntos de datos mediante estimadores de complejidad. El trabajo se ha construido sobre cuatro pilares que se han sucedido de manera natural. (1) La crítica de la metodología actual utilizada por la comunidad científica para evaluar el rendimiento de nuevos sistemas de aprendizaje ha desatado (2) el interés por estimadores alternativos basados en el análisis de la complejidad de los datos y su estudio. Sin embargo, tanto el estado primerizo de las medidas de complejidad como la limitada disponibilidad de problemas del mundo real para su testeo han inspirado (3) la generación sintética de problemas, considerada el eje central de la tesis, y (4) la propuesta del uso de estándares artificiales con parecido a los problemas reales. El objetivo que se persigue a largo plazo con esta investigación es el de proporcionar a los usuarios (1) unas pautas pare escoger el sistema de aprendizaje más idóneo para resolver su problema y (2) una colección de problemas para evaluar el rendimiento de los sistemas de aprendizaje o probar sus limitaciones. / This thesis takes a close view of data complexity and its role shaping the behaviour of machine learning techniques in supervised learning and explores the generation of synthetic data sets through complexity estimates. The work has been built upon four principles which have naturally followed one another. (1) A critique about the current methodologies used by the machine learning community to evaluate the performance of new learners unleashes (2) the interest for alternative estimates based on the analysis of data complexity and its study. However, both the early stage of the complexity measures and the limited availability of real-world problems for testing inspire (3) the generation of synthetic problems, which becomes the backbone of this thesis, and (4) the proposal of artificial benchmarks resembling real-world problems. The ultimate goal of this research flow is, in the long run, to provide practitioners (1) with some guidelines to choose the most suitable learner given a problem and (2) with a collection of benchmarks to either assess the performance of the learners or test their limitations. Mineria de dades Aprenentatge supervisat Complexitat de les dades Minería de datos Aprendizaje superivisado Complejidad de los datos Data mining Supervised learning Data complexity Les TIC i la seva Gestió 004
182	Unsupervised Identification of the User’s Query Intent in Web Search Calderón-Benavides, Liliana 27 September 2011 (has links) This doctoral work focuses on identifying and understanding the intents that motivate a user to perform a search on the Web. To this end, we apply machine learning models that do not require more information than the one provided by the very needs of the users, which in this work are represented by their queries. The knowledge and interpretation of this invaluable information can help search engines to obtain resources especially relevant to users, and thus improve their satisfaction. By means of unsupervised learning techniques, which have been selected according to the context of the problem being solved, we show that is not only possible to identify the user’s intents, but that this process can be conducted automatically. The research conducted in this thesis has involved an evolutionary process that starts from the manual analysis of different sets of real user queries from a search engine. The work passes through the proposition of a new classification of user’s query intents; the application of different unsupervised learning techniques to identify those intents; up to determine that the user’s intents, rather than being considered as an uni–dimensional problem, should be conceived as a composition of several aspects, or dimensions (i.e., as a multi–dimensional problem), that contribute to clarify and to establish what the user’s intents are. Furthermore, from this last proposal, we have configured a framework for the on–line identification of the user’s query intent. Overall, the results from this research have shown to be effective for the problem of identifying user’s query intent. / Este trabajo doctoral se enfoca en identificar y entender las intenciones que motivan a los usuarios a realizar búsquedas en la Web a través de la aplicación de métodos de aprendizaje automático que no requieren datos adicionales más que las necesidades de información de los mismos usuarios, representadas a través de sus consultas. El conocimiento y la interpretación de esta información, de valor incalculable, puede ayudar a los sistemas de búsqueda Web a encontrar recursos particularmente relevantes y así mejorar la satisfacción de sus usuarios. A través del uso de técnicas de aprendizaje no supervisado, las cuales han sido seleccionadas dependiendo del contexto del problema a solucionar, y cuyos resultados han demostrado ser efectivos para cada uno de los problemas planteados, a lo largo de este trabajo se muestra que no solo es posible identificar las intenciones de los usuarios, sino que este es un proceso que se puede llevar a cabo de manera automática. La investigación desarrollada en esta tesis ha implicado un proceso evolutivo, el cual inicia con el análisis de la clasificación manual de diferentes conjuntos de consultas que usuarios reales han sometido a un motor de búsqueda. El trabajo pasa a través de la proposición de una nueva clasificación de las intenciones de consulta de usuarios, y el uso de diferentes técnicas de aprendizaje no supervisado para identificar dichas intenciones, llegando hasta establecer que éste no es un problema unidimensional, sino que debería ser considerado como un problema de múltiples dimensiones, donde cada una de dichas dimensiones, o facetas, contribuye a clarificar y establecer cuál es la intención del usuario. A partir de este último trabajo, hemos creado un modelo para la identificar la intención del usuario en un escenario on–line. Unsupervised Learning User’s query intent Web Usage Mining Data mining Seeking Behavior Aprendizaje No-Supervisado Intención de la consulta del usuario Minería de Uso Web Minería de Datos Comportamiento de Búsqueda 62
183	Minería de datos aplicada a la mejora de procesos de extrusión de elastómeros Barreto Cabrera, Claudia 11 December 2009 (has links) Este trabajo se ha centrado en el proceso de extrusión de perfiles de goma para la industria de la automoción. Los perfiles de goma son productos largos y de muy variadas formas que se colocan en los automóviles para proporcionar hermeticidad y estanqueidad en puertas y ventanillas. Con el uso de los perfiles se evitan varios inconvenientes en el automóvil, tales como ruidos indeseables del medio externo, vibraciones, así como la entrada de agua y aire. La línea de fabricación de los perfiles de goma, está compuesta por varios procesos, tales como la extrusión, el moleteado, el vulcanizado, el flockado y el corte del producto al tamaño indicado, de acuerdo al modelo del automóvil. De los procesos antes mencionados la investigación se centró en la extrusión, ya que a pesar de que su uso se remonta al año 1800 [Bhowmick et al. (1994), Rauwendaal (2002)], aún hay mucho por conocer de él. De acuerdo al Consorcio Nacional de la Industria del Caucho en España, en el año 2005, el 40% de las ventas de productos de goma en este país fueron destinadas al sector de la automoción [CNIC (2005)]. Asimismo, España es el tercer fabricante europeo de productos de goma desde el 2001. Con el objetivo de facilitar, tanto el control de calidad como el control de producción del producto, se lleva a cabo el registro detallado de los parámetros importantes de fabricación de los perfiles. Es decir, se realiza la trazabilidad del producto. Lo que permite proporcionar conocimiento del proceso productivo para determinar, en un momento dado, las causas de un posible defecto, incluso después de haber salido de fábrica y remontarse, si es necesario, a la calidad de las materias primas utilizadas. Se ha supuesto que los problemas surgen durante la extrusión y no en los procesos posteriores a éste. Al revisar la literatura, se han encontrado aplicaciones exitosas en el ámbito industrial [Rodríguez et al. (2003), Martínez de Pisón et al. (2003), Martínez de Pisón et al. (2005)]. / Barreto Cabrera, C. (2009). Minería de datos aplicada a la mejora de procesos de extrusión de elastómeros [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/6608 / Palancia Análisis sammon Minería de datos Extrusión de elastómeros Máquinas de vectores soporte Análisis de componentes principales Análisis cluster Estadística mutivariable 330106 - Estructuras de aeronaves 230405 - Gomas 331003 - Procesos industriales 230404 - Elastómeros
184	Desarrollo de una aplicación de análisis del mercado, basado en el procesamiento del lenguaje natural de la red social Twitter, con Machine Learning para predicción de éxito del lanzamiento de un nuevo producto / Development of an application of Market Analysis, based on the natural language processing of Social Networks, using Machine learning to predict the success of a new Product Launch Fuentes Dávila Otani, Rommy Cecilia, Fuentes Dávila Otani, Karina Paola 10 March 2021 (has links) El presente trabajo contempla el proceso de lanzamiento de los nuevos productos ofrecidos por la empresa Natural Corporation, quien se dedica a la importación de productos japoneses fabricados por los países de JAPÓN y CHINA. El objetivo general del proyecto desarrollar una aplicación móvil para el análisis del mercado para el lanzamiento de los nuevos productos y/o servicios, basado en el procesamiento del lenguaje natural de la red social Twitter con Aprendizaje autónomo para la toma de decisiones publicitarias. / This work explores the process of launching a new product offered by the company “Natural Corporation”, which core business is to import Japanese products manufactured by countries such as: JAPAN and CHINA. The general objective of the project is to develop a mobile application for market analysis of new products and / or services launch, based on the natural language processing of Twitter’s social network with Machine learning to apply accurate advertising decisions. / Tesis Minería de datos Aprendizaje automático Redes sociales Data mining Machine learning Social networks
185	Modelo para automatizar el proceso de predicción de la deserción en estudiantes universitarios en el primer año de estudio / Model to automate the dropout prediction process in university students in the first year of study Cevallos Medina, Erik Nicolay, Barahona Chunga, Claudio Jorge 13 May 2021 (has links) La presente investigación propone un modelo para la automatización de predicción de la deserción de estudiantes universitarios. Esta investigación surge de una problemática existente en el sector educativo peruano: la deserción estudiantil universitaria; es decir, aquellos estudiantes universitarios que abandonan sus estudios de forma parcial o definitiva. La investigación tiene por finalidad brindar una solución que contribuya a reducir la tasa de deserción universitaria, aplicando tecnologías de análisis predictivo y minería de datos, que detecte anticipadamente a estudiantes con posibilidades de abandonar sus estudios, brindando así a las instituciones educativas mayor visibilidad y oportunidades de acción ante esta problemática. Se diseñó un modelo de análisis predictivo, en base al análisis y definición de 15 variables de predicción, 3 fases y la aplicación de algoritmos de predicción, basados en la disciplina del Educational Data Minig (EDM) y soportada por la plataforma IBM SPSS Modeler. Para validar, se evaluó la aplicación de 4 algoritmos de predicción: árboles de decisión, redes bayesianas, regresión lineal y redes neuronales; en un estudio en una institución universitaria de Lima. Los resultados indican que las redes bayesianas se comportan mejor que otros algoritmos, comparados bajo las métricas de precisión, exactitud, especificidad y tasa de error. Particularmente, la precisión de las redes bayesianas alcanza un 67.10% mientras que para los árboles de decisión (el segundo mejor algoritmo) es de un 61,92% en la muestra de entrenamiento para la iteración con razón de 8:2. Además, las variables “persona deportista” (0,29%), “vivienda propia” (0,20%) y “calificaciones de preparatoria” (0,15%) son las que más contribuyen al modelo de predicción. / This research proposes a model for the automation of prediction of university student dropout. This research arises from an existing problem in the Peruvian educational sector: university student dropout; that is, those university students who partially or permanently abandon their studies. The purpose of the research is to provide a solution that contributes to reducing the university dropout rate, applying predictive analysis technologies and data mining, which detects in advance students with the possibility of dropping out of their studies, thus providing educational institutions with greater visibility and opportunities. of action before this problem. A predictive analysis model was designed, based on the analysis and definition of 15 prediction variables, 3 phases and the application of prediction algorithms, based on the Educational Data Mining (EDM) discipline and supported by the IBM SPSS Modeler platform. To validate, the application of 4 prediction algorithms was evaluated: decision trees, Bayesian networks, linear regression, and neural networks; in a study at a university institution in Lima. The results indicate that Bayesian networks perform better than other algorithms, compared under the metrics of precision, accuracy, specificity, and error rate. Particularly, the precision of Bayesian networks reaches 67.10% while for decision trees (the second-best algorithm) it is 61.92% in the training sample for the iteration with a ratio of 8: 2. In addition, the variables "sports person" (0.29%), "own home" (0.20%) and "high school grades" (0.15%) are the ones that contribute the most to the prediction model. / Tesis Minería de datos Deserción universitaria Análisis predictivo Data mining College dropout Predictive analytics
186	Modelo de RNA para predecir la morosidad de microcredito en la Banca Estatal Peruana Palacios Quichíz, Luis Esteban January 2012 (has links) El Banco de la Nación tiene una delicada labor que cumplir ante los problemas sociales y económicos, para ampliar su cobertura a todo el territorio nacional y a todos los ciudadanos. Por ello conviene que aumente radicalmente su competencia tecnológica a fin de adoptar decisiones óptimas. Una de las formas tecnológicas de hacerlo es adoptar un modelo de Red Neuronal Artificial (RNA) que posteriormente será implementado y probado. El presente trabajo de tesis pretende realizar una propuesta sobre un nuevo servicio de Microcrédito, el cual se intenta vincularlo a un aspecto muy puntual de la computación moderna aplicada, donde se muestre que es posible predecir la morosidad de los clientes, planteando un modelo basado en RNA. Este acercamiento innovador también incluirá la metodología de Minería de Datos para proyectos relacionados con redes neuronales artificiales. PALABRAS CLAVES: Microcrédito, Redes Neuronales y Minería de datos. / The National Bank has a delicate work to play in social and economic problems, about extending their coverage throughout the national territory and for all citizens. Therefore it is important to increase radically their technological skills so that they know best decisions. One of the technological ways of doing so is adopting a model Artificial Neuronal network (RNA) which will then be implemented and tested. The present thesis work made a proposal on a new service of microcredit, are trying to link it to a very specific aspect of applied modern computing, showing specifically that it is possible predict the delinquency customers, proposing a model based on RNA. This innovative approach also includes the Data Mining methodology for projects relationship with neural networks. KEYWORDS: Microcredit, Artificial Neural Network and Data Mining. / Tesis Bancos - Procesamiento de datos Minería de datos Redes neuronales (Computación) Crédito - Procesamiento de datos
187	Análisis de publicaciones en una red social de microblogging para la detección automática de sucesos violentos durante manifestaciones públicas Oncevay Marcos, Félix Arturo 04 May 2017 (has links) El activismo social en el Perú se encuentra en crecimiento, principalmente en las zonas urbanas y en los sectores de ingresos medios, donde las redes sociales han llegado a influir en las diversas acciones de la población, y en el modo de informar, influir y convocar a las personas. Es por ello que se han observado casos recientes como las marchas contra la Ley Laboral Juvenil o ‘Ley Pulpín’, donde se movilizó una gran cantidad de personas, y se podían observar dos manifestaciones en paralelo pero afines: en la calle y en las redes sociales, principalmente en Twitter. Sin embargo, a pesar de ser convocada como marcha pacífica, sucedieron actos de violencia y enfrentamientos, los cuales lamentablemente son frecuentes en la realidad peruana. En este contexto, se propone el desarrollo de un mecanismo para analizar los mensajes publicados en Twitter durante una manifestación real. El objetivo principal es identificar y caracterizar automáticamente los diferentes sucesos de violencia que pueden ocurrir durante la protesta. Para esto, luego de recolectar publicaciones de Twitter durante manifestaciones reales, se analizarán cuáles son las mejores técnicas a aplicar para el tratamiento y transformación de estos mensajes a información relevante para nuestro objetivo. El enfoque de esta investigación se plantea desde las áreas de la ingeniería del conocimiento (análisis del dominio del conocimiento sobre violencia), la minería de textos (detección, resumen y descripción de eventos a partir de textos) y el procesamiento de lenguaje natural. Finalmente, se calcularán métricas de evaluación sobre los sucesos violentos identificados, para validar la eficacia del procedimiento propuesto. / Tesis Minería de datos Redes sociales
188	Modelo computacional de minería de microblogs para el análisis del comportamiento del consumidor de telefonía celular Apaza Delgado, Santiago Hernán 26 November 2016 (has links) Los mensajes de Twitter están siendo cada vez más usados para determinar el sentimiento de los consumidores de servicios o productos. Para ello se hacen uso de diversas técnicas computacionales, desde las tradicionales adaptadas de problemas de clasificación de textos y las recientes que usan modelos de aprendizaje de máquina. En ambos enfoques se debe desarrollar una serie de etapas que van desde el pre–procesamiento hasta la evaluación. El presente documento muestra el resultado del proceso de aplicación de diversas técnicas de Análisis de Sentimiento para poder asignar una polaridad positiva, negativa o neutral a los tweets de los consumidores de telefonía celular en el Perú, con la finalidad de poder identificar cual es el comportamiento que presentan los clientes de las empresas de telefonía celular representado en opiniones vertidas en la red social Twitter. Para ello se extrajeron 26,917,539 publicaciones de la red social Twiter durante 2 periodos, cada uno de 30 días. Estas publicaciones corresponden a los tweets de los seguidores de tres empresas de telefonía celular en el Perú, incluyendo una relativamente nueva en el mercado peruano. El procedimiento seguido comprendió las siguientes tareas: a) Recolección de tweets de los seguidores de las empresas de telefonía celular; b) Pre–procesamiento de la data obtenida para poder identificar elementos importantes de cada tweet; c) Filtrado de elementos poco relevantes, o ruido; y d) Clasificación de cada publicación basado en las características obtenidas en etapas previas. Los resultados obtenidos nos muestran que la introducción de un diccionario de lexicones incrementó el número de términos que pueden ser considerados para la clasificación. Así mismo, el uso de este diccionario al cual se le aumento nuevos términos permitió incrementar la tasa de clasificación en un 0,75%. Finalmente, gracias a estas técnicas de análisis de sentimiento, es posible explotar el contenido de redes sociales de manera que puedan servir a las corporaciones para la toma de decisiones, especialmente de servicio a sus usuarios. / Tesis Emociones--Ontología Telefonía celular--Redes sociales Redes sociales--Minería de datos
189	Análisis del posicionamiento sectorial de compañías en temas de dirección de proyectos usando la plataforma Linkedin y técnicas de procesado de lenguaje natural Rivas Huapalla, Juan José Antonio 18 September 2019 (has links) En un mundo íntegramente inmerso en la era digital, las personas han adoptado una nueva forma de adquirir conocimientos, datos y referencias sobre sus gustos e intereses. Sin embargo, esta nueva era ha generado una gran cantidad de información que, muchas veces, es completamente abrumadora para el ser humano. En lo que respecta al área laboral, esto no cambia en absoluto. La gran mayoría de empresas, en la actualidad, cuentan con una página web y, si son empresas multinacionales, tendrán una en cada país donde operan. Asimismo, las redes sociales se han convertido en un medio altamente eficaz para comunicarse, no solamente con los consumidores finales sino, además, con futuros colaboradores en busca de nuevas oportunidades. La red laboral LinkedIn es un claro ejemplo de este fenómeno. En esta red se puede encontrar a empresas de todo el mundo, de distintos sectores y tamaños, ofreciendo puestos de trabajo y, no menos importante, información sobre lo que se encuentran realizando en su sector, noticias sobre sus nuevas implementaciones y publicaciones de sus colaboradores. La presente tesis nace de la necesidad de identificar cómo se presentan las empresas hacia las personas y el entorno con intereses afines en esta red laboral. Al ser esta red sumamente amplia, se acotó la data a empresas de ingeniería presentes en el mercado español, tomando como referencia el listado de empresas por la Clasificación Nacional de Actividades Económicas (CNAE), específicamente las empresas que brindan servicios técnicos de ingeniería y otras actividades relacionadas con el asesoramiento técnico. Se ha hecho uso de distintas técnicas de minería de datos y lenguaje de programación natural mediante el lenguaje de programación R, tomando en cuenta las noticias del último año (10 de agosto de 2018) de 168 empresas con actividad regular en LinkedIn y con perfiles en idioma español o inglés. De esta forma, se podrán encontrar relaciones reales entre las acciones que promueven dentro de esta red, así como los clústeres que pueden existir en las empresas de ingeniería con respecto a su promoción en la era digital. Para realizar este análisis, se ha dividido la data recogida de las empresas estudiadas en tres (3) periodos temporales denominados: “2018 S2”, “2018 S1” y “2017 S2”, esto se entiende como los semestres de los años mencionados. Asimismo, se agruparon en cinco (5) grandes sectores: Telecomunicaciones, Industria Energética, Industria Automotriz y Aeroespacial, Industria Civil e Infraestructuras y Gestión y Control de la Calidad. La finalidad de estas segmentaciones es interpretar el comportamiento de las empresas en general por periodos temporales y contrastarla con un análisis sectorial. Finalmente, se expondrán las interpretaciones y conclusiones de los resultados obtenidos al sintetizar los datos obtenidos. De esta manera, se podrá saber qué es lo que realmente están transmitiendo las empresas a través de esta red laboral. Minería de datos
190	Modelado y simulación del comportamiento neurológico del tracto urinario inferior: sistema de ayuda al diagnóstico / Modelling and simulation of the neurological behaviour of the lower urinary tract: decision support system Gil, David 12 November 2008 (has links) No description available. Urología Sistema multiagente Señales urológicas Disfunciones urológicas neurogénicas Minería de datos Redes neuronales artificiales Sistemas neurodifusos Procesamiento de datos Árboles de decisión Análisis de componentes principales

Search results