Spelling suggestions: "subject:"procesamiento dde imagenet digitales"" "subject:"procesamiento dde imagen digitales""
1 |
Diseño de una arquitectura rápida para la aplicación del teorema de las rebanadas en el cálculo de la DFT-2D utilizando la transformada de radón periódica discretaMendoza Trelles, Rodrigo Raúl 02 July 2020 (has links)
En el ámbito del procesamiento digital de imágenes, la DFT-2D se utiliza para diversos propósitos como: detección de ruido, aplicación de filtros, tomografía computarizada, etc [1]. Algoritmos rápidos para su cálculo, como la FFT (“Fast Fourier Transform”) permiten reducir su complejidad computacional. Esto es posible gracias al uso de recursividad y separabilidad al procesar una cantidad NxN de datos que igualen una potencia de dos (es decir N = 2p, p entero). Sin embargo, es deseable que el aumento de velocidad se pueda dar también en tamaños que no son potencia de dos, con el propósito de tener mayores posibilidades en cuanto a tamaños de imagen. Por lo anterior mencionado, esta tesis se enfocó en imágenes de tamaño N × N donde N es un número primo. Por ejemplo, hay 168 números primos menores a 1000, mientras que solo hay 9 números enteros positivos potencia de 2 en ese rango. El método de cálculo de la DFT-2D que se utilizó fue el de la aplicación de la Transformada de Radón Periódica Discreta o DPRT (la cual trabaja con números primos) y seguidamente el Teorema de las Rebanadas de Fourier Discreto o DFST [2]. Se tomó como modelo de solución la FDPRT [3], arquitectura que utiliza hardware en paralelo como técnica de HPC (High Performance Computing). Esta es capaz de calcular la DPRT en tiempo lineal. En el trabajo realizado diseñó una arquitectura que permita calcular el DFST en tiempo lineal. Para esto, se priorizó la reducción del tiempo de ejecución mediante el uso de hardware paralelo, aunque esto significó que los recursos crezcan de forma cuadrática. De esta manera, se diseñó una arquitectura y un algoritmo que permiten calcular y mapear los puntos de la matriz de Fourier desde la matriz en el espacio de Radón en 2 + ⌈log2 N⌉ + N ciclos de reloj (asintóticamente O(N)). Asimismo, se cuantificó la cantidad de recursos utilizados en la arquitectura (conversores de punto fijo a punto flotante, sumadores, multiplicadores, etc.) en función del tamaño de la imagen, lo cual permitió corroborar que estos crecen cuadráticamente. Finalmente, se validó el funcionamiento del algoritmo usando el software Matlab R2013a y se realizó una comparación teórica con librerías actuales (FFTW y MKL) para cálculo rápido de la DFT-2D utilizando C en el entorno de desarrollo Visual Studio 2019.
|
2 |
Desarrollo de un aplicativo movil para la extracción automática de información del documento de indentificación mediante visión computacionalCarrillo Fuertes, Tomas Ivan 02 July 2020 (has links)
Los seres humanos han tenido varias formas de identificar individuos y grupos, pero los orígenes del sistema de identificación nacional contemporáneo se remontan a 1938, cuando los legisladores en el Reino Unido aprobaron la Ley de Registro Nacional, que exigía que todos los residentes posean tarjetas de identidad. Posteriormente, Alemania, Francia, Polonia, Grecia, entre otros, también instituyeron sistemas de tarjeta de identidad (ID) después del final de la Segunda Guerra Mundial. En Perú, el Documento Nacional de Identidad (DNI) constituye la única cédula de identidad personal reconocida por el Estado para todos los actos civiles, comerciales, administrativos, judiciales y, en general, para todos aquellos casos en que, por mandato legal, deba ser presentado. Su emisión se encuentra a cargo del Registro Nacional de Identificación y Estado Civil - RENIEC.
Así, la presentación del DNI implica sobre todo verificar la información que se encuentra en ella, para certificar que pertenece al portador. Para empresas como de seguros, bancos, clínicas, entre otros; es importante realizar esta tarea de verificación de forma rápida y precisa, pero por lo general esta tarea es realizada de forma manual mediante el uso de la aplicación que facilita la RENIEC, pero la cual requiere una autorización además que posee un costo por consulta1. También existen diversos aplicativos OCR para leer información de las personas a partir de tarjetas de presentación, pasaporte y documentos de identidad, sin embargo, estas herramientas son tecnologías cerradas y propietarias, cuyos costos se hacen elevados en el tiempo. Por ello, el presente trabajo busca desarrollar un modelo algorítmico que permita extraer la información de una persona a partir de la imagen de su DNI electrónico.
Para conseguir este objetivo, el aplicativo utiliza algoritmos de procesamiento de imagen para identificar los datos de la persona en el DNI, luego separa cada dato de la persona en palabras y por último cada palabra en letras. Cada imagen que contiene una letra será clasificada por un modelo para identificar que letra es. En este trabajo para la clasificación de letras se probó los modelos de Adaboost, basado en árboles de decisiones y YOLO (v3 tiny), que es una arquitectura neuronal inspirada en GoogLeNet. Tomando una muestra de 17 DNI electrónicos se obtuvo como resultado el 87% de letras correctamente detectadas con Adaboost y 98% con YOLO. En base a este resultado se concluye que los modelos Adaboost y YOLO pueden mejorar la extracción de la información de una persona a partir de la imagen de su DNI electrónico. / Tesis
|
Page generated in 0.1496 seconds