Global ETD Search

1	Color Constancy and Image Segmentation Techniques for Applications to Mobile Robotics Vergés Llahí, Jaume 27 July 2005 (has links) Aquesta Tesi que pretén proporcionar un conjunt de tècniques per enfrontar-se al problema que suposa la variació del color en les imatges preses des d'una plataforma mòbil per causa del canvi en les condicions d'il·luminació entre diverses vistes d'una certa escena preses en diferents instants i posicions. També tracta el problema de la segmentació de imatges de color per a poder-les utilitzar en tasques associades a les capacitats d'un robot mòbil, com ara la identificació d'objectes o la recuperació d'imatges d'una gran base de dades.Per dur a terme aquests objectius, primerament s'estableix matemàticament la transformació entre colors degut a variacions d'il·luminació. Així es proposa un model continu per la generació del senyal de color com a generalització natural d'altres propostes anteriors. D'aquesta manera es pot estudiar matemàticament i amb generalitat les condicions per l'existència, unicitat i bon comportament de les solucions, i expressar qualsevol tipus d'aplicació entre colors, independentment del tipus de discretització. Així, queda palès la relació íntima entre el problema de la invariància de color i el de la recuperació espectral, que també es planteja a la pràctica. El model desenvolupat es contrasta numèricament amb els de regressió lineal, en termes d'errors de predicció.Un cop establert el model general, s'opta per un model lineal simplificat a l'hora de realitzar els càlculs pràctics i permet alleugerir el nombre dels mateixos. En particular, el mètode proposat es basa en trobar la transformació més probable entre dues imatges a partir del càlcul d'un conjunt de transformacions possibles i de l'estimació de la freqüència i grau d'efectivitat de cadascuna d'elles. Posteriorment, es selecciona el millor candidat d'acord amb la seva versemblança. L'aplicació resultant serveix per transformar els colors de la imatge tal i com es veuria sota les condicions d'il·luminació canòniques.Una vegada el color de les imatges d'una mateixa escena es manté constant, cal procedir a la seva segmentació per extreure'n la informació corresponent a les regions amb color homogeni. En aquesta Tesi es suggereix un algorisme basat en la partició de l'arbre d'expansió mínima d'una imatge mitjançant una mesura local de la probabilitat de les unions entre components. La idea és arribar a una segmentació coherent amb les regions reals, compromís entre particions amb moltes components (sobresegmentades) i amb molt poques (subsegmentades). Un altre objectiu és que l'algorisme sigui prou ràpid com per ser útil en aplicacions de robòtica mòbil. Aquesta característica s'assoleix amb un plantejament local del creixement de regions, tot i que el resultat presenti caràcters globals (color). La possible sobresegmentació es suavitza gràcies al factor probabilístic introduït.L'algorisme de segmentació també hauria de generar segmentacions estables en el temps. Així, l'algorisme referit s'ha ampliat incloent-hi un pas intermedi entre segmentacions que permet de relacionar regions semblants en imatges diferents i propagar cap endavant els reagrupaments de regions fets en anteriors imatges, així si en una imatge unes regions s'agrupen formant-ne una de sola, les regions corresponents en la imatge següent també s'han d'agrupar juntes. D'aquesta manera, dues segmentacions correlatives s'assemblen i es pot mantenir estable la segmentació d'una seqüència.Finalment, es planteja el problema de comparar imatges a partir del seu contingut. Aquesta Tesi es concentra només en la informació de color i, a més de investigar la millor distància entre segmentacions, es busca també mostrar com la invariància de color afecta les segmentacions.Els resultats obtinguts per cada objectiu proposat en aquesta Tesi avalen els punts de vista defensats, i mostren la utilitat dels algorismes, així com el model de color tant per la recuperació espectral com pel càlcul explícit de les transformacions entre colors. / This Thesis endeavors providing a set of techniques for facing the problem of color variation in images taken from a mobile platform and caused by the change in the conditions of lighting among several views of a certain scene taken at different instants and positions. It also treats the problem of segmenting color images in order to use them in tasks associated with the capacities of a mobile robot, such as object identification or image retrieval from a large database.In order to carry out these goals, first transformation among colors due to light variations is mathematically established. Thus, a continuous model for the generation of color is proposed as a natural generalization of other former models. In this way, conditions for the existence, uniqueness, and good behavior of the solutions can be mathematically studied with a great generality, and any type of applications among colors can be expressed independently of the discretization scheme applied. Thus, the intimate relation among the problem of color invariance and that of spectral recovery is made evident and studied in practice too. The developed model is numerically contrasted with those of a least squares linear regression in terms of prediction errors.Once the general model is established, a simplified linear version is chosen instead for carrying out the practical calculations while lightening the number of them. In particular, the proposed method is based on finding the likeliest transformation between two images from the calculation of a set of feasible transformations and the estimation of the frequency and the effectiveness degree of each of them. Later, the best candidate is selected in accordance with its likelihood. The resulting application is then able to transform the image colors as they would be seen under the canonical light.After keeping the image colors from a scene constant, it is necessary to proceed to their segmentation to extract information corresponding to regions with homogeneous colors. In this Thesis, an algorithm based on the partition of the minimum spanning tree of an image through a local measure of the likelihood of the unions among components is suggested. The idea is to arrive at a segmentation coherent with the real regions, a trade-off between partitions with many component (oversegmented) and those with fewer components (subsegmented).Another goal is that of obtaining an algorithm fast enough to be useful in applications of mobile robotics. This characteristic is attained by a local approach to region growing, even though the result still shows global feature (color). The possible oversegmentation is softened thanks to a probabilistic factor.The segmentation algorithm should also generate stable segmentations through time. Thus, the aforementioned algorithm has been widened by including an intermediate step that allows to relate similar regions in different images and to propagate forwards the regrouping of regions made in previous images. This way, if in some image some regions are grouped forming only one bigger region, the corresponding regions in the following image will also be grouped together. In this way, two correlatives segmentations resemble each other, keeping the whole segmented sequence stabler.Finally, the problem of comparing images via their content is also studied in this Thesis, focusing on the color information and, besides investigating which is for our aims the best distance between segmentation, also showing how color constancy affects segmentations. The results obtained in each of the goals proposed in this Thesis guarantee the exposed points of view, and show the utility of the algorithms suggested, as well as the color model for the spectral recovery and the explicit calculation of the transformations among colors. visió artificial reconeixement d'objectes segmentació d'imatges invariança de calor robòtica 1203. Ciència dels ordinadors 62 621.3
2	Reconeixement òptic de patrons amb discriminació variable per mitjà de la correlació no-lineal dual. Aplicació al reconeixement d'objectes en color Pérez Cabré, Elisabet 01 December 1998 (has links) En el panorama actual dels processadors d'imatges basats en la correlació òptica, es pot dir que s'ha avançat molt per aconseguir un augment de la capacitat discriminativa del sistema de reconeixement que permeti diferenciar el patró buscat de qualsevol altre objecte que presenti algun tipus de diferència. En una altra línia de desenvolupament, trobem els sistemes que emmagatzemen informació del patró en diferents situacions, o atorguen al sistema la capacitat de reconeixement invariant a distorsions, com ara rotacions, canvis d'escala, d'il·luminació, etc. En aquesta situació de diversitat de mètodes i sistemes , un canvi d'objectiu o de tasca de reconeixement, implica, inevitablement, un canvi important del procediment a seguir i, tal vegada, del dispositiu òptic a emprar.En aquest treball, hem proposat un sistema de reconeixement basat en la correlació òptica que té, com a característica més destacada, la capacitat de discriminació variable en funció dels requeriments del problema plantejat. Sense necessitat de modificar el dispositiu optoelectrònic i variant de manera senzilla els valors d'uns paràmetres inclosos en el processament digital intermedi, s'aconsegueixen reproduir diferents mètodes de correlació, lineals i no-lineals convencionals, d'altres intermedis, i també permet, dins el mateix model, nous processaments de la informació. D'aquesta manera, s'obté un sistema molt versàtil, en què és possible controlar graus de tolerància diferents en funció de vàries característiques dels objectes. Per a l'obtenció del sistema de reconeixement òptic amb capacitat de discriminació variable, hem emprat la correlació no-lineal dual (DNC) com a mètode de processament base del nostre sistema. Les operacions lineals i no-lineals aplicades independentment sobre l'escena a analitzar i l'objecte de referència, poden ser modificades de manera contínua variant uns paràmetres reals, L i M, inclosos en un processament digital intermedi. També s'ha introduït una funció que delimita, en el domini de freqüències, la regió de suport sobre la qual s'aplica la no-linealitat. L'arquitectura sobre la que es realitza la DNC, és el correlador de transformades conjuntes (JTC), que presenta l'avantatge de no requerir filtres adaptats a l'objecte a reconèixer. S'han proposat simplificacions en quant al dispositiu i a l'algorisme que faciliten la realització experimental de la DNC i en redueixen el temps de computació. S'han estudiat els efectes d'algunes limitacions experimentals del sistema. S'ha estudiat el control de la capacitat de discriminació variable del sistema DNC davant de modificacions en la forma, en la intensitat, en la textura i en el color dels objectes. S'ha portat a terme experimentalment el sistema de reconeixement DNC i s'han obtingut resultats que demostren la possibilitat d'obtenir realment una capacitat de discriminació variable del sistema davant de canvis de forma i d'intensitat dels objectes.En la línia d'adaptar la capacitat de discriminació a les necessitats del problema de reconeixement plantejat, incloem el cas on la discriminació dels objectes requereix diferenciar colors similars, pertanyents a una mateixa gamma de tonalitat. En aquest sentit, hem proposat un mètode de descomposició multicanal de la informació cromàtica de l'escena a analitzar i de l'objecte a reconèixer, que cal aplicar prèviament a la correlació òptica. La descomposició multicanal es fa mitjançant una selecció de canals quasimonocromàtics que s'adapta la gamma de tonalitat dels colors implicats. S'ha realitzat experimentalment la descomposició cromàtica proposada, i mitjançant un correlador convergent s'ha implementat experimentalment un correlador multicanal amb una capacitat de discriminació alta davant d'objectes en color de tonalitat propera dins una mateixa gamma. Els resultats experimentals demostren la millora en quant a discriminació de la descomposició adaptada en canals quasimonocromàtics, davant l'ús de la descomposició convencional RGB.Ambdues propostes, la descomposició cromàtica multicanal en canals quasimonocromàtics seleccionats i la DNC, s'han estudiat separadament. No obstant això, també s'ha proposat la seva aplicació conjunta en els casos on els requeriments de discriminació cromàtica són elevats i, a l'hora, es permet un cert grau de tolerància respecte a un altre aspecte de l'objecte, com per exemple, la seva forma.Els resultats de la tesi, que hem presentat de manera resumida, poden tenir un major impacte o aplicació en els sistemes automàtics de visió artificial i en robòtica. Pel fet de tractar-se d'un sistema amb capacitat de discriminació variable segons diferents característiques de l'objecte a detectar (forma, intensitat, textura, color, ...), les propostes d'aquest treball es dirigeixen als sistemes de detecció i inspecció que requereixen una capacitat de discriminació variable de manera controlada en els diferents aspectes comentats. La introducció de la informació del color, i més concretament la proposta de la descomposició adaptada de la informació cromàtica en canals quasimonocromàtics, va especialment dirigida als sistemes de detecció i inspecció que requereixin una capacitat de discriminació en color elevada, i unida a la capacitat de discriminació respecte a la forma. discriminació variable tractament d'imatges reconeixement d'objectes color correlació òptica 2209. Óptica 53 535 6

Search results

Color Constancy and Image Segmentation Techniques for Applications to Mobile Robotics

Reconeixement òptic de patrons amb discriminació variable per mitjà de la correlació no-lineal dual. Aplicació al reconeixement d'objectes en color