This work presents my research about the use of Convolutional Neural Network (CNNs) for
transfer learning through its application for colonic polyp classification and iris super-resolution.
Traditionally, machine learning methods use the same feature space and the same distribution
for training and testing the tools. Several problems in this approach can emerge as, for example,
when the number of samples for training (especially in a supervised training) is limited. In the
medical field, this problem is recurrent mainly because obtaining a database large enough with
appropriate annotations for training is highly costly and may become impractical. Another
problem relates to the distribution of textural features in a image database which may be too
large such as the texture patterns of the human iris. In this case a single and specific training
database might not get enough generalization to be applied to the entire domain. In this work
we explore the use of texture transfer learning to surpass these problems for two applications:
colonic polyp classification and iris super-resolution.
The leading cause of deaths related to intestinal tract is the development of cancer cells
(polyps) in its many parts. An early detection (when the cancer is still at an early stage) can
reduce the risk of mortality among these patients. More specifically, colonic polyps (benign tumors
or growths which arise on the inner colon surface) have a high occurrence and are known
to be precursors of colon cancer development. Several studies have shown that automatic detection
and classification of image regions which may contain polyps within the colon can be
used to assist specialists in order to decrease the polyp miss rate.
However, the classification can be a difficult task due to several factors such as the lack or
excess of illumination, the blurring due to movement or water injection and the different appearances
of polyps. Also, to find a robust and a global feature extractor that summarizes and
represents all these pit-patterns structures in a single vector is very difficult and Deep Learning
can be a good alternative to surpass these problems.
One of the goals of this work is show the effectiveness of CNNs trained from scratch for
colonic polyp classification besides the capability of knowledge transfer between natural images
and medical images using off-the-shelf pretrained CNNs for colonic polyp classification. In this
case, the CNN will project the target database samples into a vector space where the classes are
more likely to be separable.
The second part of this work dedicates to the transfer learning for iris super-resolution. The
main goal of Super-Resolution (SR) is to produce, from one or more images, an image with a
higher resolution (with more pixels) at the same time that produces a more detailed and realistic
image being faithful to the low resolution image(s). Currently, most iris recognition systems
require the user to present their iris for the sensor at a close distance. However, at present, there
is a constant pressure to make that relaxed conditions of acquisitions in such systems could be
allowed. In this work we show that the use of deep learning and transfer learning for single
image super resolution applied to iris recognition can be an alternative for Iris Recognition of
low resolution images. For this purpose, we explore if the nature of the images as well as if the
pattern from the iris can influence the CNN transfer learning and, consequently, the results in
the recognition process. / Diese Arbeit pr¨asentiert meine Forschung hinsichtlich der Verwendung von ”Transfer-Learning”
(TL) in Kombination mit Convolutional Neural Networks (CNNs), um dadurch die Klassifikation
von Dickdarmpolypen und die Qualit¨at von Iris Bildern (”Iris-Super-Resolution”) zu
verbessern.
Herk¨ommlicherweise verwenden Verfahren des maschinellen Lernens den gleichen Merkmalsraum
und die gleiche Verteilung zum Trainieren und Testen der abgewendeten Methoden.
Mehrere Probleme k¨onnen bei diesem Ansatz jedoch auftreten. Zum Beispiel ist es
m¨ oglich, dass die Anzahl der zu trainierenden Daten (insbesondere in einem ”supervised training”
Szenario) begrenzt ist. Im Speziellen im medizinischen Anwendungsfall ist man regelm¨aßig
mit dem angesprochenen Problem konfrontiert, da die Zusammenstellung einer Datenbank,
welche ¨ uber eine geeignete Anzahl an verwendbaren Daten verf ¨ ugt, entweder sehr kostspielig
ist und/oder sich als ¨ uber die Maßen zeitaufw¨andig herausstellt. Ein anderes Problem betrifft
die Verteilung von Strukturmerkmalen in einer Bilddatenbank, die zu groß sein kann, wie es
im Fall der Verwendung von Texturmustern der menschlichen Iris auftritt. Dies kann zu dem
Umstand f ¨ uhren, dass eine einzelne und sehr spezifische Trainingsdatenbank m¨oglicherweise
nicht ausreichend verallgemeinert wird, um sie auf die gesamte betrachtete Dom¨ane anzuwenden.
In dieser Arbeit wird die Verwendung von TL auf diverse Texturen untersucht, um die
zuvor angesprochenen Probleme f ¨ ur zwei Anwendungen zu ¨ uberwinden: in der Klassifikation
von Dickdarmpolypen und in Iris Super-Resolution.
Die Hauptursache f ¨ ur Todesf¨alle im Zusammenhang mit dem Darmtrakt ist die Entwicklung
von Krebszellen (Polypen) in vielen unterschiedlichen Auspr¨agungen. Eine Fr ¨uherkennung
kann das Mortalit¨atsrisiko bei Patienten verringern, wenn sich der Krebs noch in einem fr ¨uhen
Stadium befindet. Genauer gesagt, Dickdarmpolypen (gutartige Tumore oder Wucherungen,
die an der inneren Dickdarmoberfl¨ache entstehen) haben ein hohes Vorkommen und sind bekanntermaßen
Vorl¨aufer von Darmkrebsentwicklung. Mehrere Studien haben gezeigt, dass die automatische
Erkennung und Klassifizierung von Bildregionen, die Polypen innerhalb des Dickdarms
m¨oglicherweise enthalten, verwendet werden k¨onnen, um Spezialisten zu helfen, die
Fehlerrate bei Polypen zu verringern.
Die Klassifizierung kann sich jedoch aufgrund mehrerer Faktoren als eine schwierige Aufgabe
herausstellen. ZumBeispiel kann das Fehlen oder ein U¨ bermaß an Beleuchtung zu starken
Problemen hinsichtlich der Kontrastinformation der Bilder f ¨ uhren, wohingegen Unsch¨arfe aufgrund
von Bewegung/Wassereinspritzung die Qualit¨at des Bildmaterials ebenfalls verschlechtert.
Daten, welche ein unterschiedlich starkes Auftreten von Polypen repr¨asentieren, bieten auch
dieM¨oglichkeit zu einer Reduktion der Klassifizierungsgenauigkeit. Weiters ist es sehr schwierig,
einen robusten und vor allem globalen Feature-Extraktor zu finden, der all die notwendigen
Pit-Pattern-Strukturen in einem einzigen Vektor zusammenfasst und darstellt. Um mit diesen
Problemen ad¨aquat umzugehen, kann die Anwendung von CNNs eine gute Alternative bieten.
Eines der Ziele dieser Arbeit ist es, die Wirksamkeit von CNNs, die von Grund auf f ¨ ur
die Klassifikation von Dickdarmpolypen konstruiert wurden, zu zeigen. Des Weiteren soll
die Anwendung von TL unter der Verwendung vorgefertigter CNNs f ¨ ur die Klassifikation
von Dickdarmpolypen untersucht werden. Hierbei wird zus¨atzliche Information von nichtmedizinischen
Bildern hinzugezogen und mit den verwendeten medizinischen Daten verbunden:
Information wird also transferiert - TL entsteht. Auch in diesem Fall projiziert das CNN
iii
die Zieldatenbank (die Polypenbilder) in einen vorher trainierten Vektorraum, in dem die zu
separierenden Klassen dann eher trennbar sind, daWissen aus den nicht-medizinischen Bildern
einfließt.
Der zweite Teil dieser Arbeit widmet sich dem TL hinsichtlich der Verbesserung der Bildqualit¨at
von Iris Bilder - ”Iris- Super-Resolution”. Das Hauptziel von Super-Resolution (SR) ist es, aus
einem oder mehreren Bildern gleichzeitig ein Bild mit einer h¨oheren Aufl¨osung (mit mehr
Pixeln) zu erzeugen, welches dadurch zu einem detaillierteren und somit realistischeren Bild
wird, wobei der visuelle Bildinhalt unver¨andert bleibt. Gegenw¨artig fordern die meisten Iris-
Erkennungssysteme, dass der Benutzer seine Iris f ¨ ur den Sensor in geringer Entfernung pr¨asentiert.
Jedoch ist es ein Anliegen der Industrie die bisher notwendigen Bedingungen - kurzer
Abstand zwischen Sensor und Iris, sowie Verwendung von sehr teuren hochqualitativen Sensoren
- zu ver¨andern. Diese Ver¨anderung betrifft einerseits die Verwendung von billigeren
Sensoren und andererseits die Vergr¨oßerung des Abstandes zwischen Iris und Sensor. Beide
Anpassungen f ¨ uhren zu Reduktion der Bildqualit¨at, was sich direkt auf die Erkennungsgenauigkeit
der aktuell verwendeten Iris- erkennungssysteme auswirkt. In dieser Arbeit zeigen
wir, dass die Verwendung von CNNs und TL f ¨ ur die ”Single Image Super-Resolution”, die bei
der Iriserkennung angewendet wird, eine Alternative f ¨ ur die Iriserkennung von Bildern mit
niedriger Aufl¨osung sein kann. Zu diesem Zweck untersuchen wir, ob die Art der Bilder sowie
das Muster der Iris das CNN-TL beeinflusst und folglich die Ergebnisse im Erkennungsprozess
ver¨andern kann.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.uft.edu.br:11612/1009 |
Date | 22 March 2018 |
Creators | Ribeiro, Eduardo Ferreira |
Contributors | Uhl, Andreas |
Publisher | Universidade de Salzburg, Salzburg, Faculty of Natural Sciences, Áustria |
Source Sets | IBICT Brazilian ETDs |
Language | English |
Detected Language | German |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Source | reponame:Repositório Institucional da UFT, instname:Universidade Federal do Tocantins, instacron:UFT |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.003 seconds