En aquesta tesi es proposa i estudia una arquitectura per al reconeixement òptic a temps real d'imatges en color. Aquest estudi es divideix en tres parts principals. La primera és la definició d'un formalisme per a descriure les imatges en color mitjançant funcions tridimensionals, entre les que una conté la distribució de color de cada píxel. La segona part consisteix en la construcció i optimització d'un correlador òptic basat en moduladors espacials de llum a temps real, i el desenvolupament i implementació òptica d'una tècnica de codificació de funcions tridimensionals. La primera part de l'estudi tracta de la optimització del correlador òptic. El primer aspecte que es considera és la obtenció de modulació de només amplitud per a l'escena del correlador, i l'obtenció de modulació de només fase per al filtre. Per a aconseguir-ho es proposa analitzar la modulació de llum el·lípticament polaritzada i triar els estats de polarització que condueixen a les millors modulacions. També es proposa un procediment per a l'alineament dels diferents elements del correlador, donat que l'alineament és un factor clau per al correcte funcionament del correlador òptic. El procediment proposat està basat en la utilització d'escenes de prova, que tenen una reconstrucció al pla de correlació que es veu dramàticament afectada pels defectes d'alineament dels diferents elements del correlador.La segona part de l'estudi és la formulació de funciones tridimensionals per al reconeixement d'imatges en color. Es defineix la transformada de Fourier i la correlació per aquestes funcions. S'interpreta l'espectre de Fourier de la distribució de color en termes de magnituds colorimètriques, com el to, la saturació i la intensitat. Tanmateix, s'estenen alguns filtres típics de la correlació, com es el filtre de només fase. En el cas d'imatges en color, la uniformització de la magnitud de l'espectre de Fourier 3D es tradueix en un realçat dels contorns presents a la resposta impulsional, junt amb la normalització de la intensitat i la saturació dels colors. Finalment, en la tercera part de la tesi, es proposa una tècnica per a codificar la correlació de funciones tridimensionals al correlador òptic dissenyat. La tècnica proposada consisteix a representar els diferents canals de les funciones 3D mitjançant xarxes portadores, d'idèntics període i direcció, però amb fases diferents. Es demostra matemàticament que es pot obtenir tant l'espectre de Fourer 3D com la correlació 3D. Tanmateix es presenten resultats experimentals, tant de la transformada de Fourier com de reconeixement d'objectes en color per correlació 3D. / In this thesis a new architecture for real time color pattern recognition is proposed and studied. This study is divided in three main parts: First, the definition of a formalism to describe color images by three dimensional functions, in which the third variable contains the color distribution of each pixel. The second part is the construction and optimization of an optical correlator based on liquid crystal display panels. Finally, the third part consists on and the development and implementation of a technique that permits to encode three dimensional functions in optical signals.The first part of the study is concerned on the optimization of the optical correlator. The first aspect that is considered is how to obtain amplitude only modulation in the scene of the correlator and phase only modulation for the filter of the correlator. To do this, the analysis of the modulation of the elliptical components of polarized light is proposed. Then, the elliptical states that produce a best configuration are chosen by configuring the polarizing elements of the correlator.A procedure for the alignment of the different elements of the correlator is also proposed, because the alignment is a key factor for the correct performance of an optical correlator. The proposed procedure is based in the use of test scenes whose reconstruction in the correlation plane is dramatically affected by the misalignments of the different elements of the correlator.The second part of the study is the formulation of three dimensional functions for color pattern recognition. 3D Fourier transform and 3D correlation function are defined for this kind of signals. An interpretation of the Fourier spectrum of color distributions is given in terms of colorimetric magnitudes such as the hue, saturation and intensity of the corresponding colors. Also, some frequency filters, such as the phase only filter typical of pattern recognition are extended for color images. In this case, the normalization of the magnitude of the 3D Fourier spectrum is translated in an enhancement of the contours present on the impulse response filter, together with the normalization of the intensity and saturation of the colors. Finally, in the third part of the thesis, an encoding technique to obtain three dimensional correlation using optical signals is proposed. The proposed technique consists on represent the different channels of the 3D signals by carrier gratings. The gratings have the same period and direction but have different phase. The mathematical demonstration for the encoding of the 3D Fourier transform and 3D correlation are given. Experimental results that show that 3D Correlation can be implemented in an optical processor for color pattern recognition purposes are also given.
Identifer | oai:union.ndltd.org:TDX_UAB/oai:www.tdx.cat:10803/3347 |
Date | 28 February 2003 |
Creators | Nicolás Román, José |
Contributors | Yzuel Giménez, María Josefa, Campos Coloma, Juan, Universitat Autònoma de Barcelona. Departament de Física |
Publisher | Universitat Autònoma de Barcelona |
Source Sets | Universitat Autònoma de Barcelona |
Language | English |
Detected Language | English |
Type | info:eu-repo/semantics/doctoralThesis, info:eu-repo/semantics/publishedVersion |
Format | application/pdf |
Source | TDX (Tesis Doctorals en Xarxa) |
Rights | info:eu-repo/semantics/openAccess, ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs. |
Page generated in 0.0031 seconds