Global ETD Search

1	Optimización del clasificador “naive bayes” usando árbol de decisión C4.5 Alarcón Jaimes, Carlos January 2015 (has links) El clasificador Naive Bayes es uno de los modelos de clasificación más efectivos, debido a su simplicidad, resistencia al ruido, poco tiempo de procesamiento y alto poder predictivo. El clasificador Naive Bayes asume una fuerte suposición de independencia entre las variables predictoras dada la clase, lo que generalmente no se cumple. Muchas investigaciones buscan mejorar el poder predictivo del clasificador relajando esta suposición de independencia, como el escoger un subconjunto de variables que sean independientes o aproximadamente independientes. En este trabajo, se presenta un método que busca optimizar el clasificador Naive Bayes usando el árbol de decisión C4.5. Este método, selecciona un subconjunto de variables del conjunto de datos usando el árbol de decisión C4.5 inducido y luego aplica el clasificador Naive Bayes a estas variables seleccionadas. Con el uso previo del árbol de decisión C4.5 se consigue remover las variables redundantes y/o irrelevantes del conjunto de datos y escoger las que son más informativas en tareas de clasificación, y de esta forma mejorar el poder predictivo del clasificador. Este método es ilustrado utilizando tres conjuntos de datos provenientes del repositorio UCI , Irvin Repository of Machine Learning databases de la Universidad de California y un conjunto de datos proveniente de la Encuesta Nacional de Hogares del Instituto Nacional de Estadística e Informática del Perú, ENAHO – INEI, e implementado con el programa WEKA. Redes bayesianas Clasificador bayesiano Naive Bayes Árbol de decisión C4.5
2	Sistema de información para la toma de decisiones, usando técnicas de análisis predictivo para la Empresa IASACORP International S.A. Espinoza Espinoza, Bertha Yrene, Gutiérrez Rivera, Natalia Elizabeth January 2015 (has links) En la actualidad, las empresas manejan una gran cantidad de información, el cual era inimaginable años atrás, la capacidad de recolectarla es muy impresionante. En consecuencia, para varias empresas esta información se ha convertido en un tema difícil de manejar. Diariamente, las empresas sea del sector, tipo o tamaño que sea, toman decisiones, las cuales la mayoría son decisiones estratégicas que pueden afectar el correcto funcionamiento de la empresa. Es aquí, donde ingresa una de las herramientas más mencionadas en el área de TI: Business Intelligence, este término se refiere al uso de datos en una empresa para facilitar la toma de decisiones, explotar su información, y mejor aún, plantear o predecir escenarios a futuro. El presente trabajo permitirá al área de Marketing de la empresa Iasacorp International, obtener información sobre el comportamiento y hábitos de compra de los clientes, mediante técnicas de minería de datos como Árbol de Decisión y técnicas de análisis predictivo, la cual ayudará a la toma de decisiones para establecer estrategias de venta de las líneas (bisutería, complementos de vestir, accesorios de cabello, etc.) que maneja la empresa y de las próximas compras. De acuerdo a lo planteado anterior mente, la implementación de este tipo de sistemas de información ofrece a la empresa ventajas competitivas, permite a la gerencia analizar y entender mejor la información y por consecuencia tomar mejores decisiones de negocio. At present, companies handle a lot of information, which was unimaginable years ago, the ability to collect it is very impressive. Consequently, for many companies this information has become a difficult issue to handle. Due to the large volume of information we have, instead of being useful you can fall in a failed attempt to give proper use. Every day, companies in any sector, type or size, make decisions, most of which are strategic decisions that may affect the proper functioning of the company. It´s here, where we talk about the most mentioned tools in the area of IT: Business Intelligence, this term refers to the use of data in an enterprise to facilitate decision-making, exploit their information, and better yet, raise or predict scenarios future. This work will allow the area Iasacorp Marketing Company International, information on the behavior and buying habits of customers, through predictive analysis techniques, which will help the decision to establish sales strategies lines (jewelry, clothing, hair accessories, etc.) that manages the company and nearby shopping. According to the points made above, the implementation of such information systems offers companies competitive advantages, allows management to better analyze and understand information and consequently make better business decisions. Business Intelligence Análisis Predictivo Árbol de Decisión Predictive Analytics Decision Tree
3	Metodología para procesos de Inteligencia de Negocios con mejoras en la extracción y transformación de fuentes de datos, orientado a la toma de decisiones Morales Cardoso, Santiago Leonardo 25 March 2019 (has links) Con la idea de guiar a personas que están a cargo de diferentes tipos de organizaciones para tomar mejores decisiones, hemos analizado y considerado que uno de los retrasos en los proyectos de Inteligencia de Negocios (IN) ocurre en los procesos de Extracción, Transformación y Carga de Datos (ETL), se propone un algoritmo basado en ID3, pero que incluye mejoras en la investigación de sus nodos mediante atributos ubicados en diferentes fuentes de datos estructurados o no, los mismos que pasan por procesos especiales de limpieza y en este estudio se les da una denominación de "pureza". Una vez obtenidos, los nodos se clasifican según los cálculos recursivos de entropía y ganancia de información para lograr una estructura sólida que tome decisiones para cualquier objetivo que se presente en un caso de estudio. Clasificación Datos de Limpieza IN Árbol de decisión
4	Modelo predictivo de deserción universitaria de la carrera de Ingeniería Informática en la Universidad Ricardo Palma Gálvez Chambilla, Melissa Beatriz, Flores Cornejo, Katherine Briggite January 2015 (has links) La deserción universitaria se ha convertido en un problema importante a ser investigado. La tasa de deserción ha llegado a constituir uno de los principales indicadores de eficiencia interna dentro de cualquier institución de educación. Investigar las causas de la deserción con metodologías adecuadas que permitan predecir esta, contribuye a la toma de decisiones dentro de la gestión de la unidad académica. El objetivo del presente proyecto consiste en investigar y proponer una metodología que permita identificar en forma automática a los estudiantes con mayor riesgo de deserción de las carreras de Ingeniería Informática en la Universidad Ricardo Palma. Para la implementación de este proyecto se adoptó la metodología CRISP-DM que estructura el proceso de minería de datos en seis fases, que interactúan entre ellas de forma iterativa. Se evaluaron los modelos de Árboles de decisión y Clustering para analizar el comportamiento de los estudiantes, evaluando factores como el rendimiento del alumno, condición social y aspectos socioeconómicos. La exactitud de los modelos es calculada a partir de la información que brindó la Oficina Central de Informática y Cómputo de la Universidad Ricardo Palma, en la cual se realizó una transformación y simulación de algunas variables para mayor efectividad del modelo. The college desertion has become an important problem to be investigated. The desertion rate has come to be one of the main indicators of internal efficiency in any educational institution. The research of the causes of desertion with appropriate methodologies to predict, contributes to decision making in the academic management The objective of this project is to investigate and propose a methodology to automatically identify students at high risk of dropping out of the Computer Engineering career at the Ricardo Palma University. To implement this project, we used the CRISP-DM methodology to structure the data mining process into six phases, which interact with each other iteratively. It was applied the models of decision trees and clustering to analyze the behavior of the students, evaluating factors such as student performance, social status and socio-economic aspects. The accuracy of the models is calculated from the information provided the Central Office of Information and Computation at the Ricardo Palma University, in which it was applied a transformation and simulation of some variables for greater effectiveness and performance of the model. Deserción universitaria Minería de datos Modelo predictivo Árbol de decisión Desertion University Data Mining Predictive Model Decision tree
5	Aplicación de Data Science en la pequeña empresa, caso: Pollería Mister Pollo Baldeón Maraví, Brian, Fukushima Castillo, Hugo Kenji, Ochante Quispe, Milagros Karina, Quevedo Trujillo, Haedly Victoria, Tejada Alarcón, Ernesto Rosendo 14 July 2021 (has links) El presente trabajo tiene como finalidad aplicar los conocimientos y técnicas impartidas durante los tres cursos de Ciencia de Datos. Específicamente identificar y utilizar las variables encontradas en el negocio para determinar un modelo que permita una mayor permanencia del personal en la empresa Mister Pollo. En ese contexto, la investigación se apoyará en la metodología de ciencia de datos de IBM, la cual inicia con la fase de comprensión del negocio para identificar el problema de la organización, analizando sus fortalezas y debilidades; así como la fase de recopilación y preparación de los datos, análisis, interpretación, modelado y evaluación de la data. Asimismo, el tipo de investigación que se emplea es mixto, pues en la fase inicial tiene un enfoque descriptivo que permite entender la importancia de las variables utilizadas. En la segunda fase, el enfoque se vuelve predictivo gracias a la utilización de una técnica de aprendizaje supervisado, en este caso, el modelo de árbol de decisión para la determinación de una herramienta que permita evaluar la mayor permanencia de trabajadores en el restaurante. Esto permitirá que el Gerente General de la empresa pueda elaborar un plan de acción para poder controlar y minimizar la rotación del personal, considerando diferentes escenarios, perfiles y necesidades de la empresa. Finalmente, en la conclusión de este proyecto se evaluarán los hallazgos en el modelo seleccionado para verificar que responden a los objetivos planteados por el Gerente de la empresa Míster Pollo en coordinación con el equipo de trabajo. / The purpose of this work is to apply the knowledge and techniques taught during the three Data Science courses. Specifically, to identify and use the variables found in the business to determine a model that allows a greater permanence of the personnel in the company Mister Pollo. In this context, the research will be supported by IBM's data science methodology, which begins with the phase of understanding the business to identify the organization's problem, analyzing its strengths and weaknesses; as well as the phase of data collection and preparation, analysis, interpretation, modeling and evaluation of the data. Likewise, the type of research used is mixed, since in the initial phase it has a descriptive approach that allows understanding the importance of the variables used. In the second phase, the approach becomes predictive thanks to the use of a supervised learning technique, in this case, the decision tree model for the determination of a tool to evaluate the greater permanence of workers in the restaurant. This will allow the General Manager of the company to develop an action plan to control and minimize staff turnover, considering different scenarios, profiles and needs of the company. Finally, at the conclusion of this project, the findings of the selected model will be evaluated to verify that they respond to the objectives set by the Manager of the company Míster Pollo in coordination with the work team. / Trabajo de investigación Aprendizaje supervisado Árbol de decisión Data science Supervised learning Decision tree
6	Árbol de decisión para la selección de un motor de base de datos / Decision tree for the selection of database engine Bendezú Kiyán , Enrique Renato, Monjaras Flores, Álvaro Gianmarco 30 August 2020 (has links) Desde los últimos años, la cantidad de usuarios que navega en internet ha crecido exponencialmente. Por consecuencia, la cantidad de información que se maneja crece a manera desproporcionada y, por ende, el manejo de grandes volúmenes de información obtenidos de internet ha ocasionado grandes problemas. Los diferentes tipos de bases de datos tienen un funcionamiento variado, dado que, se ve afectado el rendimiento para ejecutar las transacciones cuando se lidia con diferentes cantidades de información. Entre este tipo de variedades, se analizará las bases de datos relacionales, bases de datos no relaciones y bases de datos en memoria. Para las organizaciones es muy importante contar con un acelerado manejo de información debido a la gran demanda por parte de los clientes y el mercado en general, permitiendo que no se disminuya la agilidad de operación interna cuando se requiera manejar información, y conservar la integridad de esta. Sin embargo, cada categoría de base de datos está diseñada para cubrir diferentes casos de usos específicos para mantener un alto rendimiento con respecto al manejo de los datos. El presente proyecto tiene como objetivo el estudio de diversos escenarios de los principales casos de uso, costos, aspectos de escalabilidad y rendimiento de cada base de datos, mediante la elaboración de un árbol de decisión, en el cual, se determine la mejor opción de categoría de base de datos según el flujo que decida tomar el usuario. Palabras clave: Base de Datos, Base de Datos Relacional, Base de Datos No Relacional, Base de Datos en Memoria, Árbol de Decisión. / In recent years, the number of users browsing the internet has grown exponentially. Consequently, the amount of information handled grows disproportionately and, therefore, the handling of large volumes of information obtained from the Internet has caused major problems. Different types of databases work differently, since the performance of executing transactions suffers when dealing with different amounts of information. Among this type of varieties, relational databases, non-relationship databases and in-memory databases will be analyzed. For organizations it is very important to have an accelerated information management due to the great demand from customers and the market in general, allowing the agility of internal operation to not be diminished when it is required to manage information, and to preserve the integrity of is. However, each category of database is designed to cover different specific use cases to maintain high performance regarding data handling. The purpose of this project is to study various scenarios of the main use cases, costs, scalability and performance aspects of each database, through the development of a decision tree, in which the best option for database category according to the flow that the user decides to take. / Tesis Base de datos Base de datos relacional Base de datos no relacional Base de datos en memoria Árbol de decisión Database Relational database Non-relational database In memory database Decision tree Sql Nosql

1

Page generated in 0.049 seconds