Spelling suggestions: "subject:"preprocesamiento dde datos"" "subject:"preprocesamiento dee datos""
1 |
Clasificación de proteínas repetidas basado en su información estructural utilizando aprendizaje de máquinaTenorio Ku, Luiggi Gianpiere 12 February 2021 (has links)
En los últimos años, las proteínas repetidas, las cuales son caracterizadas por
poseer regiones que se repiten a lo largo de su estructura, han demostrado
poseer un rol fundamental dentro de la naturaleza. Esta importancia se debe a
sus propiedades funcionales que toman relevancia dentro de varios procesos
biológicos como la salud, el desarrollo neuronal y la ingeniería de proteínas.
Debido a ello, una tarea, dentro del área de estudio de estas proteínas, es la
identificación y clasificación de estas, lo que permite identificar las propiedades
funcionales que posee.
Asimismo, en la actualidad, existen métodos complejos para la clasificación e
identificación de proteínas repetidas a partir de su estructura, los cuales implican
un uso intenso y costoso de recursos computacionales. Además, por la aparición
de nuevos procesos experimentales, las proteínas recientemente descubiertas por
año se incrementan de forma exponencial. En consecuencia, ello obliga que estos
procesos realicen una gran cantidad ejecuciones y generen una gran cantidad de
archivos que se traducen en grandes costos de procesamiento y almacenamiento.
En este proyecto se busca implementar un modelo de aprendizaje de máquina
con la capacidad de detectar la presencia de regiones repetidas dentro de una
cadena proteica con el fin de que esta información sea útil para procesos más
complejos como ReUPred para que eviten procesar grandes cantidades de datos
irrelevantes. Dicho objetivo, implica la construcción de un proceso de
transformación de datos necesaria para extraer las características estructurales
de la cadena de proteína y formar la representación de datos a utilizar como
entrada para el desarrollo, entrenamiento y validación del modelo.
Adicionalmente, se plantea desplegar dicho modelo mediante un servicio web
para que pueda ser utilizado por otros investigadores del área.
|
2 |
Exploración de métodos de clasificación de proteínas repetidas basado en su información estructural utilizando aprendizaje de máquinaTenorio Ku, Luiggi Gianpiere 04 September 2020 (has links)
En la actualidad, existen métodos complejos para la clasificación e identificación de proteínas repetidas a partir de su estructura, los cuales implican un uso intenso y costoso de recursos computacionales. Debido a ello, en el presente trabajo de investigación se busca explorar soluciones alternativas y complementarias a otros sistemas en la etapa de clasificación de proteínas repetidas con técnicas del área de estudio de aprendizaje de máquina. Estas técnicas son conocidas por ser efectivas y rápidas para la sistematización de varios procedimientos de clasificación, segmentación y transformación de datos con la condición de que se disponga de una cantidad considerable de datos. De esa forma, en consecuencia de la cantidad de datos estructurales que se han generado en los últimos años en el ambito de las proteínas y las proteínas repetidas, es posible utilizar técnicas de aprendizaje de máquina para la clasificación de las mismas. Por ello, en este trabajo, a partir de un análisis a los datos que se poseen en la actualidad y una revisión sistemática de la literatura, se proponen posibles soluciones que utilizan aprendizaje de máquina para la clasificación automatizada y rápida de proteínas repetidas a partir de su estructura. De estas posibles soluciones, se concluye que es posible la implementación de un clasificador con múltiples entradas utilizando información de los ángulos de torsión y distancia entre aminoácidos de una proteína, la cual va a ser implementada y evaluada en un trabajo futuro.
|
Page generated in 0.085 seconds