Memoria para optar al título de Ingeniero Civil Matemático / El presente trabajo muestra la implementación de técnicas de clasificación basadas en árboles de decisión para resolver y entender el problema de identificación de genes anotados en el ADN de la bacteria Escherichia Coli. Junto a lo anterior, se pretenden entender algunos principios biológicos subyacentes tras el mecanismo celular de identificación genética.
Los métodos de clasificación que se implementan en este trabajo intentan simular la manera en que los complejos procesos celulares de transcripción y traducción genética identifican o encuentran las posiciones de inicio de los genes responsables de la posterior síntesis proteica. Se respeta la forma en que esta información es adquirida sin caer en el error de alejarse del marco biológico en cuestión. Para resolver el problema se crearon tres estrategias de clasificación basadas en la combinación de modelos de árboles de decisión y de un algoritmo de optimización sobre el área ocupada en el ADN por zonas génicas.
La primera estrategia consiste en utilizar el algoritmo de optimización sobre candidatos a genes, obtenidos de una lectura secuencial en la doble hebra, para reducir la cantidad de potenciales genes. La solución obtenida es clasificada por los árboles de decisión. La segunda estrategia consiste en realizar el mismo proceso pero usando candidatos obtenidos desde una lectura en ambos sentidos de la doble hebra de ADN. La tercera estrategia consiste en iterar sucesivamente la optimización junto a los árboles utilizando la información incorrectamente clasificada por estos.
Los resultados obtenidos se resumen como un conjunto de candidatos clasificados positivamente por los árboles de decisión y que cumplen con las restricciones impuestas por el algoritmo de optimización. / CMM - Conicyt PIA AFB170001
Identifer | oai:union.ndltd.org:UCHILE/oai:repositorio.uchile.cl:2250/165720 |
Date | January 2018 |
Creators | Guzmán Toro, Alonso Tomás |
Contributors | Martínez Aguilera, Servet, Maass Sepúlveda, Alejandro, Tobar Henríquez, Felipe |
Publisher | Universidad de Chile |
Source Sets | Universidad de Chile |
Language | Spanish |
Detected Language | Spanish |
Type | Tesis |
Rights | Attribution-NonCommercial-NoDerivs 3.0 Chile, http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ |
Page generated in 0.0022 seconds