Spelling suggestions: "subject:"nnálisas multivariada"" "subject:"nnálisas multivariadas""
1 |
Anomaly detection in streaming multivariate time seriesSánchez Enríquez, Heider Ysaías January 2017 (has links)
Doctor en Ciencias, Mención Computación / Este trabajo de tesis presenta soluciones para al problema de detección de anomalı́as en
flujo de datos multivariantes. Dado una subsequencia de serie temporal (una pequeña parte
de la serie original) como entrada, uno quiere conocer si este corresponde a una observación
normal o es una anomalı́a, con respecto a la información histórica. Pueden surgir dificultades
debido principalmente a que los tipos de anomalı́a son desconocidos. Además, la detección
se convierte en una tarea costosa debido a la gran cantidad de datos y a la existencia de
variables de dominios heterogéneos. En este contexto, se propone un enfoque de detección
de anomalı́as basado en Discord Discovery, que asocia la anomalı́a con la subsecuencia
más inusual utilizando medidas de similitud. Tı́picamente, los métodos de reducción de la
dimensionalidad y de indexación son elaborados para restringir el problema resolviéndolo
eficientemente.
Adicionalmente, se propone técnicas para generar modelos representativos y consisos a
partir de los datos crudos con el fin de encontrar los patrones inusuales. Estas técnicas
también mejoran la eficiencia en la búsqueda mediante la reducción de la dimensionalidad.
Se aborda las series multivariantes usando técnicas de representación sobre subsequencias no-
normalizadas, y se propone nuevas técnicas de discord discovery basados en ı́ndices métricos.
El enfoque propuesto es comparado con técnicas del estado del arte. Los resultados ex-
perimentales demuestran que aplicando la transformación de translación y representación
de series temporales pueden contribuir a mejorar la eficacia en la detección. Además, los
métodos de indexación métrica y las heurı́sticas de discord discovery pueden resolver eficien-
temente la detección de anomalı́as en modo offline y online en flujos de series temporales
multivariantes. / Este trabajo ha sido financiado por beca CONICYT - CHILE / Doctorado para Extranjeros, y apoyada parcialmente por el Proyecto FONDEF D09I1185 y el Programa de Becas de NIC Chile
|
2 |
Synergistic (Analysis of) algorithms and data structuresOchoa Méndez, Carlos Ernesto January 2019 (has links)
Tesis para optar al grado de Doctor en Ciencias, Mención Computación / Los refinamientos actuales del análisis del peor caso sobre instancias con tamaño de entrada fijo consideran el orden de la entrada (por ejemplo, las subsecuencias ordenadas en una secuencia de números y las cadenas poligonales simples en las que puede dividirse una secuencia de puntos) o la estructura de la entrada (por ejemplo, la multiplicidad de los elementos en un multiconjunto y las posiciones relativas entre un conjunto de puntos en el plano), pero nunca, hasta donde sabemos, ambos al mismo tiempo. En esta tesis se proponen nuevas técnicas que combinan soluciones que se aprovechan del orden y la estructura de la entrada en una sola solución sinérgica para ordenar multiconjuntos, y para calcular la eficiencia de Pareto y la envoltura convexa de un conjunto de puntos en el plano. Estas soluciones sinérgicas se aprovechan del orden y la estructura de la entrada de tal forma que asintóticamente superan cualquier solución comparable que se aproveche solo de una de estas características. Como resultados intermedios, se describen y analizan varios algoritmos de mezcla: un algoritmo para mezclar secuencias ordenadas que es óptimo para cada instancia del problema; el primer algoritmo adaptativo para mezclar eficiencias de Pareto; y un algoritmo adaptativo para mezclar envolturas convexas en el plano. Estos tres algoritmos se basan en un paradigma donde las estructuras se dividen antes de ser mezcladas. Este paradigma es conveniente para extenderlo al contexto donde se responden consultas.
Karp et al. (1998) describieron estructuras de datos diferidas como estructuras "perezosas" que procesan la entrada gradualmente a medida que responden consultas sobre los datos, trabajando la menor cantidad posible en el peor caso sobre instancias de tamaño fijo y número de consultas fijo. En esta tesis se desarrollan nuevas técnicas para refinar aún más estos resultados y aprovechar al mismo tiempo el orden y la estructura de la entrada y el orden y la estructura de la secuencia de consultas en tres problemas distintos: calcular el rango y la posici\'on de un elemento en un multiconjunto, determinar si un punto está dominado por la eficiencia de Pareto de un conjunto de puntos en el plano y determinar si un punto pertenece a la envoltura convexa de un conjunto de puntos en el plano. Las estructuras de datos diferidas que se obtienen superan todas las soluciones previas que solo se aprovechan de un subconjunto de estas características.
Como una extensión natural a los resultados sinérgicos obtenidos en este trabajo para ordenar un multiconjunto, se describen estructuras de datos comprimidas que se aprovechan del orden y la estructura de la entrada para representar un multiconjunto, mientras se responden consultas del rango y la posición de elementos en el multiconjunto. / CONICYT-PCHA/Doctorado Nacional/2013-63130161, y los proyectos CONICYT Fondecyt/Regular nos 1120054 y 1170366
|
Page generated in 0.1015 seconds