Sparsification for Topic Modeling and Applications to Information RetrievalMuoh, Chibuike 30 November 2009 (has links)
Image classification for a large number of object categoriesBosch Rué, Anna 25 September 2007 (has links)
L'increment de bases de dades que cada vegada contenen imatges més difícils i amb un nombre més elevat de categories, està forçant el desenvolupament de tècniques de representació d'imatges que siguin discriminatives quan es vol treballar amb múltiples classes i d'algorismes que siguin eficients en l'aprenentatge i classificació. Aquesta tesi explora el problema de classificar les imatges segons l'objecte que contenen quan es disposa d'un gran nombre de categories. Primerament s'investiga com un sistema híbrid format per un model generatiu i un model discriminatiu pot beneficiar la tasca de classificació d'imatges on el nivell d'anotació humà sigui mínim. Per aquesta tasca introduïm un nou vocabulari utilitzant una representació densa de descriptors color-SIFT, i desprès s'investiga com els diferents paràmetres afecten la classificació final. Tot seguit es proposa un mètode par tal d'incorporar informació espacial amb el sistema híbrid, mostrant que la informació de context es de gran ajuda per la classificació d'imatges. Desprès introduïm un nou descriptor de forma que representa la imatge segons la seva forma local i la seva forma espacial, tot junt amb un kernel que incorpora aquesta informació espacial en forma piramidal. La forma es representada per un vector compacte obtenint un descriptor molt adequat per ésser utilitzat amb algorismes d'aprenentatge amb kernels. Els experiments realitzats postren que aquesta informació de forma te uns resultats semblants (i a vegades millors) als descriptors basats en aparença. També s'investiga com diferents característiques es poden combinar per ésser utilitzades en la classificació d'imatges i es mostra com el descriptor de forma proposat juntament amb un descriptor d'aparença millora substancialment la classificació. Finalment es descriu un algoritme que detecta les regions d'interès automàticament durant l'entrenament i la classificació. Això proporciona un mètode per inhibir el fons de la imatge i afegeix invariança a la posició dels objectes dins les imatges. S'ensenya que la forma i l'aparença sobre aquesta regió d'interès i utilitzant els classificadors random forests millora la classificació i el temps computacional. Es comparen els postres resultats amb resultats de la literatura utilitzant les mateixes bases de dades que els autors Aixa com els mateixos protocols d'aprenentatge i classificació. Es veu com totes les innovacions introduïdes incrementen la classificació final de les imatges. / The release of challenging data sets with ever increasing numbers of object categories isforcing the development of image representations that can cope with multiple classes andof algorithms that are efficient in training and testing. This thesis explores the problem ofclassifying images by the object they contain in the case of a large number of categories. We first investigate weather the hybrid combination of a latent generative model with a discriminative classifier is beneficial for the task of weakly supervised image classification.We introduce a novel vocabulary using dense color SIFT descriptors, and then investigate classification performances by optimizing different parameters. A new way to incorporate spatial information within the hybrid system is also proposed showing that contextual information provides a strong support for image classification. We then introduce a new shape descriptor that represents local image shape and its spatial layout, together with a spatial pyramid kernel. Shape is represented as a compactvector descriptor suitable for use in standard learning algorithms with kernels. Experimentalresults show that shape information has similar classification performances and sometimes outperforms those methods using only appearance information. We also investigate how different cues of image information can be used together. Wewill see that shape and appearance kernels may be combined and that additional informationcues increase classification performance. Finally we provide an algorithm to automatically select the regions of interest in training. This provides a method of inhibiting background clutter and adding invariance to the object instance's position. We show that shape and appearance representation over the regions of interest together with a random forest classifier which automatically selects the best cues increases on performance and speed. We compare our classification performance to that of previous methods using the authors'own datasets and testing protocols. We will see that the set of innovations introduced here lead for an impressive increase on performance.
Ανάπτυξη ολοκληρωμένου συστήματος εκτίμησης της πυκνότητας του μαστού από εικόνες μαστογραφίαςΧατζηστέργος, Σεβαστιανός 05 December 2008 (has links)
Αντικείμενο της παρούσας εργασία είναι ο υπολογισμός και η ταξινόμηση, με βάση το σύστημα, BIRADS της πυκνότητας του μαστού από εικόνες μαστογραφίας. Στα πλαίσια της προσπάθειας αυτής αναπτύχθηκε ολοκληρωμένο υπολογιστικό σύστημα σε γραφικό περιβάλλον ως λογισμικό πακέτο, σε γλώσσα Visual C++ .NET . Το υπολογιστικό αυτό σύστημα δέχεται σαν είσοδο εικόνες μαστογραφίας σε οποιοδήποτε από τα δημοφιλή bitmap format εικόνων όπως jpeg και tiff καθώς και DICOM αρχεία. Η λειτουργία του μπορεί να χωριστεί σε τρία στάδια: το στάδιο της προεπεξεργασίας, το στάδιο απομόνωσης της περιοχής του μαστού και το στάδιο καθορισμού της πυκνότητας του μαστού. Στο πρώτο στάδιο παρέχονται μια σειρά από στοιχειώδη εργαλεία επεξεργασίας εικόνας όπως εργαλεία περιστροφής, αποκοπής και αλλαγής αντίθεσης . Επιπρόσθετα παρέχεται η δυνατότητα Ανισοτροπικού Φιλτραρίσματος της εικόνας. Στο δεύτερο στάδιο γίνεται η απομόνωση της περιοχής του μαστού είτε απευθείας από τον χρήστη είτε αυτόματα με χρήση των ιδιοτήτων του μονογονικού (monogenic) σήματος για την αφαίρεση του παρασκηνίου (background) καθώς και κυματιδίων Gabor για τον διαχωρισμού του θωρακικού μυός. Στο τρίτο στάδιο παρέχεται η δυνατότητα ταξινόμησης της πυκνότητας του μαστού από τον χρήστη με τον καθορισμό κατάλληλου κατωφλίου των επιπέδων γκρίζου της εικόνας αλλά και η δυνατότητα αυτόματης ταξινόμησης της πυκνότητας του μαστού κατά BIRADS με χρήση Δομικών Στοιχείων Υφής (textons) και της τεχνικής pLSA. Όλες οι παραπάνω λειτουργίες παρέχονται μέσω μίας κατά το δυνατόν φιλικότερης προς τον χρήστη διεπαφής. / The present thesis aims at the classification of breast tissue according to BIRADS system based on texture features. To this end an integrated software system was developed in visual C ++. The system takes as inputs pictures in most of the popular bitmap formats like .jpeg and .till as well as DICOM. The functionality of the system is provided by three modules: (a) pre-processing module, (b) breast segmentation module and (c) the breast tissue density classification module. In the pre-processing module a set tools for image manipulation (rotation, crop, gray level adjustment) are available which are accompanied by the ability to perform anisotropic filtering to the input image. In the second module, the user has the ability to interactively define the actual borders of the breast or ask the system to perform it automatically. Automatic segmentation is a two step procedure; in the first step breast tissue is separated from its background by using the characteristics of monogenic signals, while in the second step the pectoral muscle region is subtracted using Gabor wavelets. In the density classification module the user can either ask for a calculation of breast density based on user-defined grey level threshold or perform an automatic BIRADS-based classification using texture characteristics in conjunction with Probabilistic Latent Semantic Analysis (pLSA) algorithm. Special emphasis was given to the development of a functional and user-friendly interface.
