La detección y localización de rostros es una de las áreas de investigación más activa en el
ámbito del procesamiento digital de imágenes, debido a que es un componente principal para
muchos sistemas de identificación y seguimiento de rostros, así como también para aplicaciones
con interfaces hombre-máquina. Esto, apoyado por las predicciones de un fuerte crecimiento
en el mercado biométrico mundial, hacen que sea de gran relevancia la búsqueda de nuevos
métodos de detección de rostros, más rápidos y precisos, que se adapten de manera robusta
a ambientes y condiciones complejas. En particular, está demostrado que las aplicaciones de
reconocimiento de rostros dependen en gran medida de la exactitud con que se realiza su
localización, motivo por el cual, es necesario contar con métodos que permitan un mayor
grado de certeza en la estimación de la posición del rostro.
En esta tesis, se estudiaron dos nuevos métodos que apuntan a resolver de mejor manera
este problema. El primero de ellos permite obtener información precisa acerca del rostro,
como son su posición, excentricidad, tamaño y rotación coronal. Este método, basado en la
Transformada Elíptica Lineal (LET), asocia una elipse al rostro y funciona transformando
el contorno semi elíptico inferior de la cara en un borde vertical en el espacio de salida.
La detección de dicho borde, permite estimar los parámetros de la elipse que se ajusta de
mejor manera al rostro. La metodología fue probada sobre las bases de datos de Purdue,
Caltech, FERET y Yale-B, obteniendo tasas de localización 98.2 %, 95.3 %, 95.7 % y 79.6 %
respectivamente.
La segunda parte de este trabajo consistió en estudiar la optimización de moldes direccionales
mediante la utilización de enjambres de partículas (Particle Swarm Optimization).
La optimización tuvo por objetivo el mejorar el desempeño y selectividad de los moldes y el
disminuir el tiempo de procesamiento, a la vez de estudiar el efecto de generar moldes personalizados
para un individuo o situación particular. Los resultados muestran una leve mejora
sobre los moldes originales de un 2 % a 3 % en las tasas de localización, pero con una reducción
de 40 % en el tiempo de cálculo y una mucho mayor selectividad, lo que los hace más
robustos. Las tasa de localización sobre la base de datos de Yale-B es de aproximadamente un
82 %. También, se probó la eficacia del método al ser usado en conjunto con un detector de
iris para estimar la posición de los ojos en imágenes estáticas de la base de datos de Purdue,
obteniéndose tasas de detección de iris por sobre el 98 % para criterios de error muy exigentes.
Ambas metodologías fueran comparadas con el detector internacionalmente utilizado propuesto
por Viola y Jones, obteniendo tasas de localización muy similares. En el caso de Yale-B
los métodos propuestos en esta Tesis son ampliamente superiores, demostrando su robustez
frente a condiciones extremas de iluminación y contraste.
Identifer | oai:union.ndltd.org:UCHILE/oai:repositorio.uchile.cl:2250/102159 |
Date | January 2009 |
Creators | Aravena Cereceda, Carlos Marcelo |
Contributors | Pérez Flores, Claudio, Facultad de Ciencias Físicas y Matemáticas, Departamento de Ingeniería Eléctrica, Estévez Valencia, Pablo, Held Barrandeguy, Claudio, Zegers Fernández, Pablo |
Publisher | Universidad de Chile |
Source Sets | Universidad de Chile |
Language | Spanish |
Detected Language | Spanish |
Type | Tesis |
Rights | Attribution-NonCommercial-NoDerivs 3.0 Chile, http://creativecommons.org/licenses/by-nc-nd/3.0/cl/ |
Page generated in 0.0023 seconds