101 |
Ποιοτικός έλεγχος ραφής σε υπερ-εύκαμπτα υλικά με χρήση μεθόδων ψηφιακής επεξεργασίας σημάτων βίντεο / Seam quality control of non-rigid materials based on digital signal processing techniques of video dataΜαριόλης, Ιωάννης 07 July 2010 (has links)
Στα πλαίσια της διατριβής μελετήθηκε αρχικά το πρόβλημα της εύρεσης της θέσης του υφάσματος επάνω στην τράπεζα εργασίας με μεθόδους ψηφιακής ανάλυσης σημάτων βίντεο, παρουσία φαινομένων παραμόρφωσης και μερικής επικάλυψης του υφάσματος. Οι νέες μέθοδοι εντοπισμού που αναπτύχθηκαν αξιολογήθηκαν πειραματικά παρουσιάζοντας ικανοποιητική ακρίβεια εντοπισμού και ανοχή του συστήματος σε μερικές επικαλύψεις και παραμορφώσεις.
Μετά την ολοκλήρωση της ραφής του υφάσματος πραγματοποιείται αυτόματος εντοπισμός της θέσης της ραφής από ψηφιακές φωτογραφίες. Αναπτύχθηκαν τρείς πρωτότυπες μέθοδοι εντοπισμού της θέσης της ραφής οι οποίες διαφοροποιούνται στο στάδιο της προεπεξεργασίας. Η πειραματική αξιολόγηση γίνεται σε βάση δεδομένων που περιέχει 118 εικόνες έτοιμων ενδυμάτων.
Προτού πραγματοποιηθεί ποιοτικός έλεγχος ραφής, οι εικόνες κανονικοποιούνται ως προς τη θέση και τον προσανατολισμό της ραφής χρησιμοποιώντας τις παραπάνω μεθόδους αυτόματου εντοπισμού της θέσης της ραφής. Αναπτύχθηκαν και αξιολογήθηκαν τρείς διαφορετικές μέθοδοι αυτόματης αναγνώρισης της ποιότητας σε δείγματα ραφής οι οποίες εξάγουν τρία διαφορετικά σύνολα χαρακτηριστικών. Η πρώτη μέθοδος βασίζεται σε φασματικά χαρακτηριστικά, η δεύτερη στην επιβολή αυτό-σκίασης, ενώ η τρίτη βασίζεται στην εκτίμηση της ανομοιομορφίας της επιφάνειας των δειγμάτων ραφής. Η πειραματική αξιολόγηση γίνεται σε βάση δεδομένων δειγμάτων ραφής που περιλαμβάνει 325 ραφές.
Η εκτίμηση της ποιότητας ραφής πραγματοποιείται με ταξινόμηση σε πέντε διατεταγμένους βαθμούς ποιότητας. Σε αυτήν την κατεύθυνση, προτείνονται και συγκρίνονται τέσσερις μέθοδοι αναγνώρισης προτύπων διατεταγμένων κατηγοριών. Η πρώτη μέθοδος χρησιμοποιεί για την ταξινόμηση μοντέλο σύμμετρων αναλογιών πιθανότητας. Η δεύτερη μέθοδος κάνει αναγνώριση με χρήση γραμμικού μοντέλου. Οι άλλες δύο μέθοδοι είναι πρωτότυπες και επίσης χρησιμοποιούν γραμμικό μοντέλο για την ταξινόμηση. Η διαφοροποίησή τους από τη δεύτερη μέθοδο είναι ότι η επιλογή των αριθμητικών τιμών των διατεταγμένων κατηγορίων δεν γίνεται αυθαίρετα., αλλά προκύπτει ως λύση προβλημάτων ελαχιστοποίησης.. Η πειραματική αξιολόγηση και σύγκριση των μεθόδων στο πρόβλημα του ποιοτικού ελέγχου ραφών οδηγεί στην επιλογή του μοντέλου σύμμετρων αναλογιών πιθανότητας σε περίπτωση που υπάρχει ικανός αριθμός παραδειγμάτων εκπαίδευσης, ενώ σε αντίθετη περίπτωση μπορεί να προτιμηθεί το γραμμικό μοντέλο αφού προηγηθεί βελτιστοποίηση με χρήση κάποιας εκ των δύο προτεινόμενων μεθόδων επιλογής αριθμητικών τιμών. / One of the problems studied in the present dissertation is that of the detection of the fabrics’ position on the working area. The proposed detection methods are based on image processing and analysis techniques and take into consideration both partial occlusion and fabric deformation. The methods have been experimentally evaluated and the results indicate sufficient detection accuracy and robustness regarding partial occlusion and fabric deformation.
After sewing the fabric, the position and orientation of the seam is automatically detected. Three novel seam detection methods have been developed using different pre-processing techniques. The experimental evaluation of the three detection methods is made on a database containing 118 images of ready sewn garments.
Before performing seam quality control the seam images are normalized with respect to the seam position and orientation, using the aforementioned seam detection methods. Feature selection has been studied next, extracting three different sets of features and assessing seam quality using three different methods. The first method uses spectral features; the second method is based on the detection of self-shadows onto the seam specimens, while the third method is based on the estimation of the surface roughness of the specimens. The experimental evaluation of the proposed methods is made on a database containing 325 images of seam specimens.
Seam quality control is performed by classifying the seam specimens into five ordinal grades of quality. In this direction, four classification methods are proposed and evaluated, taking into account the ordered arrangement of the classes. The first method uses the proportional odds model; while the second method uses a linear model. The other two methods are novel and also employ a linear model. The difference between these two methods and the second method is that the numerical values they are assigning to the ordered categories are not arbitrary like in the case of the second method. The experimental evaluation of these four methods indicates that in case of a large number of training data, the first method which is based on the proportional odds model is more efficient, while in case of an insufficient number of training data the linear model optimized by one of the two novel methods should be selected.
|
102 |
Υλοποίηση συστήματος κοινής ιδεατής μνήμης για συστάδες πολυεπεξεργαστικών συστημάτων / Software distributed shared memory for clusters of multiprocessorsΤουρναβίτης, Γεώργιος 16 May 2007 (has links)
Οι συστάδες υπολογιστών αποτελούν μία σύγχρονη ευρέως χρησιμοποιούμενη και ιδιαίτερα ανταγωνιστική αρχιτεκτονική για την υλοποίηση υπολογιστικών συστημάτων υψηλών επιδόσεων με χαμηλό κόστος. Παράλληλα, η ευρεία εμπορική διάθεση πολυεπεξεργαστικών συστημάτων μικρής κλίμακας, επιτρέπει τον συνδυασμό τους σε υβριδικά σχήματα συστάδων πολυεπεξεργαστών. Παρά την ευελιξία που παρέχεται στη σχεδίαση τους, η απαίτηση για χρήση κατανεμημένων μοντέλων προγραμματισμού αυξάνει σημαντικά την πολυπλοκότητα της ανάπτυξης εφαρμογών. Μία εναλλακτική προσέγγιση αποτελούν τα συστήματα κοινής ιδεατής μνήμης. Τα συστήματα κοινής ιδεατής μνήμης παρέχουν στις εφαρμογές, που εκτελούνται σε διαφορετικούς κόμβους της συστάδας, πρόσβαση σε έναν διαμοιραζόμενο χώρο διευθύνσεων αποκρύπτοντας την υποκείμενη κατανεμημένη αρχιτεκτονική. Βασικότερο περιορισμό της πλειονότητας των υπαρχόντων υλοποιήσεων αποτελεί η απουσία υποστήριξης πολυνηματισμού. Το χαρακτηριστικό αυτό έχει ως άμεση συνέπεια τη χαμηλή χρησιμοποίηση των σύγχρονων πολυεπεξεργαστικών υπολογιστικών μονάδων, καθώς ούτε η εφαρμογή αλλά ούτε και οι μηχανισμοί που εξασφαλίζουν τη συνέπεια της κοινής μνήμης εκτελούνται παράλληλα. Στα πλαίσια της παρούσας μεταπτυχιακής εργασίας παρουσιάζεται η σχεδίαση και η υλοποίηση μίας πλατφόρμας κοινής ιδεατής μνήμης χρησιμοποιώντας μηχανισμούς υλοποιημένους αποκλειστικά σε λογισμικό. Το προτεινόμενο σύστημα στοχεύει στην αποδοτικότερη χρησιμοποίηση των πόρων των πολυεπεξεργαστικών μονάδων της συστάδας, υποστηρίζοντας την πολυνηματική εκτέλεση της εφαρμογής σε κάθε κόμβο. Τόσο το πρωτόκολλο συνέπειας της κατανεμημένης μνήμης, όσο και το υποσύστημα επικοινωνίας, επανασχεδιάστηκαν ώστε να χρησιμοποιούν πολλαπλά νήματα εκτέλεσης. Επιπλέον παρουσιάζονται και αξιολογούνται εναλλακτικοί ιεραρχικοί αλγόριθμοι συγχρονισμού που επιτρέπουν την αποδοτικότερη χρήση της υβριδικής οργάνωσης των συστάδων. / Software Distributed Shared Memory (SDSM) systems provide an abstraction layer of shared memory semantics on top of a distributed set of computational nodes. The use of small-scale Symmetric Multiprocessor (SMP) nodes has the potential for bridging the performance-cost gap between the low-end SMPs and high-end Distributed Shared Memory (DSM) systems, using a hybrid software and hardware coherency model presented in this thesis. We present the design and discuss the main architectural choices involved in our implementation of a multithreaded SDSM system. Our implementation was developed on top of Pthreads and the TCP/IP network protocol, employing a simple yet efficient design. Finally, we evaluate and analyze the performance of the multithreading SDSM platform, using a wide set of benchmark applications.
|
103 |
Αυτόματη εξαγωγή λεξικής - σημασιολογικής γνώσης από ηλεκτρονικά σώματα κειμένων με χρήση ελαχίστων πόρων / Automatic extraction of lexico - semantic knowledge from electronic text corpora using minimal resourcesΘανόπουλος, Αριστομένης 25 June 2007 (has links)
Το αντικείμενο της διατριβής είναι η μελέτη μεθόδων αυτόματης εξαγωγής των συμφράσεων και των σημασιολογικών ομοιοτήτων των λέξεων από μεγάλα σώματα κειμένων. Υιοθετείται μια προσέγγιση ελάχιστων γλωσσικών πόρων που εξασφαλίζει την απεριόριστη μεταφερσιμότητα των μεθόδων σε φυσικές γλώσσες και θεματικές περιοχές. Για την αξιολόγηση των προτεινόμενων μεθόδων προτείνονται, αξιολογούνται και εφαρμόζονται μεθοδολογίες με βάση πρότυπες βάσεις λεξικής γνώσης (στην Αγγλική), όπως το WordNet. Για την εξαγωγή των συμφράσεων προτείνονται νέα μέτρα εξαγωγής στατιστικά σημαντικών διγράμμων και γενικά ν-γράμμων που αξιολογούνται θετικά. Για την εξαγωγή των λεξικών - σημασιολογικών ομοιοτήτων των λέξεων ακολουθείται καταρχήν η προσέγγιση ομοιότητας περικειμένων λέξεων με παραθυρικές μεθόδους, όπου μελετώνται το πεδίο συμφραζομένων, το φιλτράρισμα των συνεμφανίσεων των λέξεων, τα μέτρα ομοιότητας, όπου εισάγεται ο παράγοντας του αριθμού κοινών παραμέτρων, καθώς και η αντιμετώπιση συστηματικών σφαλμάτων, ενώ προτείνεται η αξιοποίηση των λειτουργικών λέξεων. Επιπλέον, προτείνεται η αξιοποίηση της ομοιότητας περικείμενων εκφράσεων, που απαντάται συχνά σε θεματικώς εστιασμένα κείμενα, με ένα αλγόριθμο βασισμένο στην ετεροσυσχέτιση ακολουθιών λέξεων. Μελετάται η μεθοδολογία αξιοποίησης των παρατακτικών συνδέσεων ενώ προτείνεται μια μέθοδος ενοποίησης ετερογενών σωμάτων γνώσης λεξικών – σημασιολογικών ομοιοτήτων. Τέλος, η εξαχθείσα γνώση μετασχηματίζεται σε σημασιολογικές κλάσεις με μια συμβολική μέθοδο ιεραρχικής ομαδοποίησης και επίσης ενσωματώνεται επιτυχώς σε ένα διαλογικό σύστημα μηχανικής μάθησης όπου ενισχύει την απόδοση της αναγνώρισης του σκοπού του χρήστη συμβάλλοντας στην εκτίμηση του ρόλου των άγνωστων λέξεων. / The research described in this dissertation regards automatic extraction of collocations and lexico-semantic similarities from large text corpora. We follow an approach based on minimal linguistic resources in order to achieve unrestricted portability across languages and thematic domains. In order to evaluate the proposed methods we propose, evaluate and apply methodologies based on English gold standard lexical resources, such as WordNet. For the extraction of collocations we propose and test a few novel measures for the identification of statistically significant bigrams and, generally, n-grams, which exhibit strong performance. For the extraction of lexico-semantic similarities we follow a distributional window-based approach. We study the contextual scope, the filtering of lexical co-occurrences and the performance of similarity measures. We propose the incorporation of the number of common parameters into the latter, the exploitation of functional words and a method for the elimination of systematic errors. Moreover, we propose a novel approach to exploitation of word sequence similarities, common in technical texts, based on cross-correlation of word sequences. We refine an approach for word similarity extraction from coordinations and we propose a method for the amalgamation of lexico-semantic similarity databases extracted via different principles and methods. Finally, the extracted similarity knowledge is transformed in the form of soft hierarchical semantic clusters and it is successfully incorporated into a machine learning based dialogue system, reinforcing the performance of user’s plan recognition by estimating the semantic role of unknown words.
|
104 |
Αυτόματη επιλογή σημασιολογικά συγγενών όρων για την επαναδιατύπωση των ερωτημάτων σε μηχανές αναζήτησης πληροφορίας / Automatic selection of semantic related terms for reformulating a query into a search engineΚοζανίδης, Ελευθέριος 14 September 2007 (has links)
Η βελτίωση ερωτημάτων (Query refinement) είναι η διαδικασία πρότασης εναλλακτικών όρων στους χρήστες των μηχανών αναζήτησης του Διαδικτύου για την διατύπωση της πληροφοριακής τους ανάγκης. Παρόλο που εναλλακτικοί σχηματισμοί ερωτημάτων μπορούν να συνεισφέρουν στην βελτίωση των ανακτηθέντων αποτελεσμάτων, η χρησιμοποίησή τους από χρήστες του Διαδικτύου είναι ιδιαίτερα περιορισμένη καθώς οι όροι των βελτιωμένων ερωτημάτων δεν περιέχουν σχεδόν καθόλου πληροφορία αναφορικά με τον βαθμό ομοιότητάς τους με τους όρους του αρχικού ερωτήματος, ενώ συγχρόνως δεν καταδεικνύουν το βαθμό συσχέτισής τους με τα πληροφοριακά ενδιαφέροντα των χρηστών. Παραδοσιακά, οι εναλλακτικοί σχηματισμοί ερωτημάτων καθορίζονται κατ’ αποκλειστικότητα από τη σημασιολογική σχέση που επιδεικνύουν οι συμπληρωματικοί όροι με τους αρχικούς όρους του ερωτήματος, χωρίς να λαμβάνουν υπόψη τον επιδιωκόμενο στόχο της αναζήτησης που υπολανθάνει πίσω από ένα ερώτημα του χρήστη. Στην παρούσα εργασία θα παρουσιάσουμε μια πρότυπη τεχνική βελτίωσης ερωτημάτων η οποία χρησιμοποιεί μια λεξική οντολογία προκειμένου να εντοπίσει εναλλακτικούς σχηματισμούς ερωτημάτων οι οποίοι αφενός, θα περιγράφουν το αντικείμενο της αναζήτησης του χρήστη και αφετέρου θα σχετίζονται με τα ερωτήματα που υπέβαλε ο χρήστης. Το πιο πρωτοποριακό χαρακτηριστικό της τεχνικής μας είναι η οπτική αναπαράσταση του εναλλακτικού ερωτήματος με την μορφή ενός ιεραρχικά δομημένου γράφου. Η αναπαράσταση αυτή παρέχει σαφείς πληροφορίες για την σημασιολογική σχέση μεταξύ των όρων του βελτιωμένου ερωτήματος και των όρων που χρησιμοποίησε ο χρήστης για να εκφράσει την πληροφοριακή του ανάγκη ενώ παράλληλα παρέχει την δυνατότητα στον χρήστη να επιλέξει ποιοι από τους υποψήφιους όρους θα συμμετέχουν τελικά στην διαδικασία βελτιστοποίησης δημιουργώντας διαδραστικά το νέο ερώτημα. Τα αποτελέσματα των πειραμάτων που διενεργήσαμε για να αξιολογήσουμε την απόδοση της τεχνικής μας, είναι ιδιαίτερα ικανοποιητικά και μας οδηγούν στο συμπέρασμα ότι η μέθοδός μας μπορεί να βοηθήσει σημαντικά στη διευκόλυνση του χρήστη κατά τη διαδικασία επιλογής ερωτημάτων για την ανάκτηση πληροφορίας από τα δεδομένα του Παγκόσμιου Ιστού. / Query refinement is the process of providing Web information seekers with alternative wordings for expressing their information needs. Although alternative query formulations may contribute to the improvement of retrieval results, nevertheless their realization by Web users is intrinsically limited in that alternative query wordings do not convey explicit information about neither their degree nor their type of correlation to the user-issued queries. Moreover, alternative query formulations are determined based on the semantics of the issued query alone and they do not consider anything about the search intentions of the user issuing that query. In this paper, we introduce a novel query refinement technique which uses a lexical ontology for identifying alternative query formulations that are both informative of the user’s interests and related to the user selected queries. The most innovative feature of our technique is the visualization of the alternative query wordings in a graphical representation form, which conveys explicit information about the refined queries correlation to the user issued requests and which allows the user select which terms to participate in the refinement process. Experimental results demonstrate that our method has a significant potential in improving the user search experience.
|
105 |
Ανάπτυξη μεθόδων για την επιλογή της καλύτερης διαθέσιμης τεχνολογίας για την επεξεργασία υγρών βιομηχανικών αποβλήτων / Development of a decision – supporting tool for the selection of best available technology for industrial wastewater treatmentΓεωργιοπούλου, Μάρθα 22 May 2008 (has links)
Η επιλογή της καλύτερης διαθέσιμης τεχνολογίας για την επεξεργασία βιομηχανικών αποβλήτων που προέρχονται από μια δεδομένη πηγή απαιτεί μια καλά δομημένη και περιεκτική μεθοδολογία για συστηματική αποτίμηση των εναλλακτικών τεχνολογιών. Μια κατάλληλη μεθοδολογία για την επιλογή ενός ολοκληρωμένου συστήματος διαχείρισης βιομηχανικών απόβλητων από περιβαλλοντική και οικονομική άποψη αναπτύσσεται και εφαρμόζεται σε μια βιομηχανία γάλακτος. Προκειμένου να επιλεγεί το πιο φιλικό προς το περιβάλλον και το περισσότερο οικονομικό ολοκληρωμένο σύστημα επεξεργασίας, διαφορετικές τεχνολογίες επεξεργασίας βιομηχανιών αποβλήτων εξετάστηκαν. Τα συστήματα επεξεργασίας αποτελούνται από εναλλακτικές διεργασίες προεπεξεργασίας, τεχνολογίες βιολογικής επεξεργασίας (αερόβιες και αναερόβιες) και την επεξεργασία της ιλύος. Αναπτύχθηκε ένα μοντέλο τύπου ριζόχαρτου που υπολογίζει την κατανάλωση των υλικών, της ενέργειας, των κύριων αναλωσίμων και τις εκπομπές που συνδέονται με τις φάσεις οικοδόμησης και λειτουργίας των εναλλακτικών τεχνολογιών επεξεργασίας. Στη συνέχεια χρησιμοποιήθηκε η μεθοδολογία της Ανάλυσης Κύκλου Ζωής (ΑΚΖ) για να υπολογιστούν ποσοτικά οι πιθανές περιβαλλοντικές επιπτώσεις σε κάθε περίπτωση. Οι επιλογές που βασίζονται στην αναερόβια χώνευση αναδείχθηκαν ότι είναι περισσότερο φιλικές προς το περιβάλλον και οδηγούν σε λιγότερες εκπομπές. / The selection of the best available technology for the treatment of industrial wastewater originating from a given source requires a well structured and comprehensive methodology for the systematic evaluation of the alternative technologies. A suitable methodology for the selection of an integrated system of management of industrial wastewater from the environmental and economic viewpoints is developed and applied to a milk industry. In order to select the environmentally friendlier and most economic integrated treatment system, different industrial wastewater treatment technologies were considered. The treatment systems consisted of alternative pretreatment processes, biological treatment technologies (aerobic and anaerobic) and sludge treatment. A spreadsheet model that calculates the consumption of materials, energy, main consumables and emissions associated with both the construction and operation phases of the alternative treatment technologies was constructed. The Life Cycle Assessment (LCA) methodology was then used to quantify the potential environmental impacts in each case. Options based on anaerobic digestion were found to be the most environmentally friendly leading to fewer emissions.
|
106 |
Functional classification of proteins using mass spectrometry data and exploration of their frequency of identification in proteomic analysis / Λειτουργική ταξινόμηση πρωτεϊνών με δεδομένα φασματογραφίας μάζας και διερεύνηση της συχνότητας ταυτοποίησής τους σε πρωτεομική ανάλυσηΜπουγιούκος, Παναγιώτης 11 January 2010 (has links)
Prostate cancer is a significant public health concern due to its high incidence and mortality, and that no consensus exists regarding the best form of treatment for any stage of the disease. Prostate cancer mortality can be reduced by the early prostate cancer detection. The earlier the detection the more effective the treatment would be. Prostate cancer screening or early detection has been accomplished applying the digital rectal examination (DRE) , the measurement of serum the prostate specific antigen (PSA), transrectal ultrasonography and combinations of these tests. MS based proteomics and particularly MS-SEDLI-TOF technology have assisted in discovering prostate cancer biomarkers.
On the other hand, a major cause of mortality for women is the ovarian cancer. Malignant ovarian tumors are heterogeneous in their biological and clinical behaviour and a greater understanding of how they develop and progress is a prerequisite to successful early detection, screening programs, and treatment modalities.
Accordingly, the aims of the present thesis are: (i) To develop a reliable pattern recognition system for the discrimination of healthy from patients with prostate cancer as well as controls from patients with ovarian cancer ,(ii) To develop efficient algorithms in order to handle the large number of features that are extracted from proteomic spectra, (iii) To develop a methodology to facilitate the investigation of the low intensity peaks which are the peaks in which biologists are mostly interested in, (iv) To propose potential biomarkers for discriminating healthy from prostate cancer cases and healthy from ovarian cancer cases . To cope with the above issues and in search of efficient methods for handling proteomic spectra a novel multi classifier pattern recognition methodology has been designed, developed and implemented, for the analysis of prostate and ovarian proteomic data. Furthermore, a novel method for splitting and grouping peaks according to their intensities has been developed to be consistent with biologist interest in investigating low intensity peaks. / Τα δεδομένα πρωτεομικής τα οποία εξάγονται από φασματογράφο μάζας έχουν ως αποτέλεσμα την δημιουργία ενός μονοδιάστατου σήματος το οποίο στον οριζόντιο άξονα έχει τιμές μάζας/φορτίο και στον κατακόρυφο άξονα έχει τις αντίστοιχες τιμές έντασης. Οι τιμές στον οριζόντιο άξονα (μάζα/φορτίο) οι οποίες αντιπροσωπεύουν πεπτίδια ή πρωτεΐνες έχουν ένα εύρος από 0 έως δεκάδες χιλιάδες. Επομένως τα πρωτεομικά φάσματα θεωρούνται ιδιαίτερα πολύπλοκα. Η διαχείριση της πληροφορίας των πρωτεομικών φασμάτων καθώς και η εξαγωγή διαγνωστικών συμπερασμάτων είναι ένα πεδίο ανοιχτό προς έρευνα.
Ο καρκίνος του προστάτη αποτελεί την δεύτερη πιο σημαντική αιτία θανάτου στην Ηνωμένες Πολιτείες Αμερικής και τον Καναδά. Η θνησιμότητα που οφείλεται στον καρκίνο του προστάτη μπορεί να μειωθεί από την έγκαιρη πρόγνωσή του. Όσο ποιο έγκαιρη είναι η πρόγνωσή του τόσο ποιο αποτελεσματική είναι η θεραπεία του. Ο προστάτης είναι ένας αδένας που βρίσκεται στο εσωτερικό του σώματος, κάτω από την ουροδόχο κύστη του άνδρα και περιβάλλει την ουρήθρα. Τον αδένα αυτό τον έχει ένας άνδρας ήδη από την στιγμή που γεννιέται. Με την λειτουργία του συμβάλει, στον έλεγχο της ούρησης, το οποίο το πετυχαίνει λόγω της ανατομικής του θέσης, στον εμπλουτισμό του σπέρματος με χρήσιμα και απαραίτητα συστατικά και στη λειτουργία της εκσπερμάτισης. Ο καρκίνος του προστάτη είναι η ανάπτυξη καρκινικών κυττάρων στον αδένα αυτόν. Τα καρκινικά κύτταρα πολλαπλασιάζονται πολύ πιο γρήγορα από τα φυσιολογικά κύτταρα, και έτσι, η ολοένα αυξανόμενη συγκέντρωσή τους δημιουργεί όγκους. Επιπλέον, τα καρκινικά κύτταρα έχουν την δυνατότητα να μεταφέρονται σε άλλα σημεία του σώματος (κάνουν μετάσταση) και να καταστρέφουν τα υγιή κύτταρα. Η πρωτεομική με την εφαρμογή της φασματογραφίας μάζας έχει βοηθήσει σημαντικά στην πρόγνωση του καρκίνου του προστάτη και στην ανακάλυψη γνωστών βιοδεικτών του καρκίνου του προστάτη όπως είναι το ειδικό αντιγόνο του προστάτη (PSA), η προστατική όξινη φωσφατάση (PAP), το ειδικό πεπτίδιο του προστάτη (PSP) και το ειδικό αντιγόνο μεμβράνης του προστάτη (PSMA).
Ο καρκίνος των ωοθηκών είναι μια συνήθεις γυναικολογική κακοήθεια με ποικίλα ιστολογικά χαρακτηριστικά. Είναι η κύρια αιτία θανάτου από καρκίνου ανάμεσα σε όλες τις γυναικολογικές κακοήθειες, καθώς και ο πέμπτος πιο συχνός τύπος καρκίνου μεταξύ γυναικών του δυτικού κόσμου. Η πλειοψηφία των κακοηθών όγκων των ωοθηκών εμφανίζεται σε γυναίκες ηλικίας άνω των 65 χρόνων, ενώ οι καλοήθεις όγκοι είναι συνηθέστεροι σε νεότερης ηλικίας γυναίκες μεταξύ 25 και 45 χρόνων. Λόγω της πολυπαραγοντικής φύσης του καρκίνου, είναι πολύ πιθανό, μια ομάδα βιοδεικτών να είναι πιο ενδεικτικοί για την πρόβλεψη της βιολογικής συμπεριφοράς διαφόρων όγκων, από την χρήση ενός μόνο βιοδείκτη. Το CA-125 είναι ένας δείκτης ο οποίος χρησιμοποιείται για την διάγνωσης και συγκεκριμένα στην πρόγνωση του καρκίνου των ωοθηκών. Η επιβεβαίωση του και αξιοπιστία του βιοδείκτη CA-125 οδήγησε στην ευρέως χρήση του, ως βιοδείκτης για τον καρκίνο των ωοθηκών, καθώς και στην κλινική διάγνωση της ανταπόκρισης του ασθενούς κατά την θεραπεία του καρκίνου. Πρόσφατες προσπάθειες επικεντρώθηκαν στην βελτίωση της διαγνωστικής ακρίβειας του CA-125, είτε χρησιμοποιώντας μόνο τον συγκεκριμένο βιοδείκτη (CA-125), είτε χρησιμοποιώντας τον με νέους βιοδείκτες που έχουν συσχετιστεί με τον καρκίνο των ωοθηκών. Ο βιοδείκτης CA-125 βρίσκεται στο μητρικό γάλα και στο αμνιακό υγρό στις υγιείς γυναίκες. Παρόλα αυτά υπάρχει επίσης σε γυναίκες με γυναικολογικά προβλήματα όπως μητρικό λειομύωμα και ενδομητρίωση μειώνοντας έτσι την ειδικότητα του βιοδείκτη. Επιπροσθέτως άλλοι βιοδείκτες οι οποίοι έχουν βρεθεί είναι οι prostasin, OVX1, CA-15.3, CA-72.4, και inhibin.
Έτσι οι στόχοι της παρούσας διατριβής είναι: (i) ο κατάλληλος συνδυασμός των βημάτων, προεπεξεργασίας, εξαγωγής χαρακτηριστικών, επιλογής χαρακτηριστικών και επιλογής ταξινομητή ώστε η διάγνωση να είναι ακριβέστερη από τις υπάρχουσες μεθόδους. (ii) να προταθούν βιοδείκτες (biomarkers) και συγκεκριμένα τιμές φάσματος (μάζας/φορτίου) οι οποίες ενδεχομένως να σχετίζονται με τις ασθένειες προς μελέτη (Καρκίνου του προστάτη και των ωοθηκών).
Για την εκπλήρωση των ανωτέρω στόχων σχεδιάστηκαν και αναπτύχθηκαν μεθοδολογίες με στόχο την ακριβή διάκριση των υγειών από ασθενείς με καρκίνο του προστάτη και ωοθηκών. Προτείνονται τιμές μάζας/φορτίο οι οποίες ενδεχομένως να αποτελέσουν χρήσιμους βιοδείκτες για τον καρκίνο του προστάτη και για τον καρκίνο των ωοθηκών. Επίσης υλοποιήθηκε μεθοδολογία για να μπορέσουμε να ερευνήσουμε την διαγνωστική αξία των κορυφών, των πρωτεομικών φασμάτων, με διάφορες τιμές έντασης και κυρίως των χαμηλών, οι οποίες θεωρούνται ως πλούσιες σε πληροφορία από τους βιολόγους.
|
107 |
Optimization of cDNA microarray image analysis methods / Βελτιστοποίηση της επεξεργασίας εικόνας μικροσυστοιχιών DNAΔασκαλάκης, Αντώνιος 03 May 2010 (has links)
The expression of genetic information, in all organisms, might be characterized as in a constant state of flux with only a fraction of the gene within a genome being expressed at any given time. The genes’ expression pattern reflects the response of cells to stimuli that control growth, development and signal environmental changes. Understanding genes’ expression at the level of transcription and/or other stages of gene regulation at the mRNA level (half life of mRNA, RNA production from primary transcript) might reveal insights into the genes expression mechanisms that control these changes.
With the DNA microarray technology researchers are now able to determine, in a single experiment, the gene expression profiles of hundreds to tens of thousands of genes in tissue, tumors, cells or biological fluids. Accordingly, and since the patterns of gene expression are strongly functionally correlated, microarrays might provide unprecedented information both on basic research (e.g. expression profiles of different tissues) and on applied research (e.g. human diseases, drug and hormone action etc).
While the simultaneous measurement of thousands of gene expression levels potentially serves as source of profound knowledge, genes quantification (i.e. extraction of the genes expression levels) is confounded by various types of noise originating both from the microarray experimental procedure (e.g. sample preparation) and the probabilistic characteristics of the microarray detection process (e.g. scanning errors). The “noisy” nature of the measured gene expression levels obscures some of the important characteristics of the biological processes of interest. The latter, as a direct effect, renders the extraction of biological meaningful conclusions through microarray experiments difficult and affects the accuracy of the biological inference. Thus, as a major challenge in DNA microarray analysis, and especially for the accurate extraction of genes expression levels, might be considered the effective separation of “true” gene expression values from noise.
Noise reduction is an essential process, which has to be incorporated into the microarray image analysis pipeline in order to minimize the “errors” that propagate throughout the microarray analysis pipeline and, consequently, affect the extracted gene expression levels. A possible solution, as proposed in previous studies, for addressing microarray image noise is image enhancement. Results of these studies have indicated a superior quality of the enhanced images, without however examining whether enhancement leads to more accurate spot segmentation or reduces the variability of the extracted gene expression levels.
As foresaid, noise also complicates the extraction of meaningful biological conclusions. While more advanced methods have been introduced [28-32] that attempt to prevent the noisy set of genes from being grouped, there is a lack of consensus among experts on the selection of a single method for determining meaningful clusters of genes. The latter, directly affects the biological inference, since different number of clusters are produced when different clustering techniques or either different parameters in the clustering algorithms are utilized.
Thus, it turns up that it is not only important to assess the performance of each analysis stage independently (i.e. whether the techniques employed in the microarray analysis pipeline provide accurate extracted gene expression levels or the clustering techniques group biologically related genes) but it is also necessary to ensure an acceptable performance of all steps, as a whole, in terms of biologically meaningful information.
This thesis has been carried out towards the development of a complete microarray image processing and analysis framework in order to improve the extraction and, consequently, the quantification of gene expression levels on spotted complementary DNA (cDNA) microarray images. The aims of the present thesis are: a) to model and address the effects of cDNA microarray image noise in such a way that it will increase the accuracy of the extracted gene expression levels, b) to investigate the impact of noise and facilitate genes expression data analysis in order to allow biologists to develop an integrated understanding of the process being studied, c) to introduce a semi-supervised biologically informed criterion for the detection of meaningful biological clusters of genes that answer specific biological questions, d) to investigate the performance and the impact of various state-of-art and novel cDNA microarray image segmentation techniques in the quantification of genes expression levels
For exploring all of these aspects, a complete and robust framework of microarray image processing and analysis techniques was designed, built and implemented. The framework incorporated in the microarray analysis pipeline a novel combination of image processing and analysis techniques originating from the comprehensive quantitative investigation of the impact of noise on spot segmentation, intensity extraction and data mining. Additionally, novel formulations of known image segmentation techniques have been introduced, implemented and evaluated in the task of microarray image segmentation. The usefulness of the proposed methods has been validated experimentally on both simulated and real cDNA microarray images. / Η έκφραση της γενετικής πληροφορίας, σε όλους τους οργανισμούς, χαρακτηρίζεται από μια σταθερή κατάσταση «ροής» στην οποία όμως μόνο ένα μέρος του γονιδίου μέσα στο γονιδίωμα (genome) εκφράζεται ανά χρονική στιγμή. Το γονιδιακό μοτίβο έκφρασης (gene expression pattern or gene expression profile) θα μπορούσαμε να πούμε ότι αντανακλά την αντίδραση των κυττάρων στα διάφορα εξωτερικά ερεθίσματα. Για να μπορέσουν να απαντηθούν ερωτήματα σχετικά με τους μηχανισμούς που επηρεάζουν και μεταβάλλουν τη γονιδιακή έκφραση ανάλογα με το εξωτερικό ερέθισμα είναι απαραίτητη η μελέτη της γονιδιακής έκφρασης σε μεταγραφικό επίπεδο (transcription level) ή/και άλλα στάδια (παράγοντες) που ρυθμίζουν τη γονιδιακή έκφραση (gene regulation) σε επίπεδο mRNA.
Με τη χρήση της τεχνολογίας των μικροσυστοιχιών, οι ερευνητές έχουν πλέον τη δυνατότητα να μελετήσουν ταυτόχρονα την γονιδιακή έκφραση δεκάδων ή και εκατοντάδων χιλιάδων γονιδίων σε ιστούς, κύτταρα όγκους κλπ με τη χρήση ενός και μόνο πειράματος. Κατά συνέπεια, και από τη στιγμή που τα γονιδιακά μοτίβα έκφρασης συσχετίζονται έντονα λειτουργικά (functionally correlated), η τεχνολογία των μικροσυστοιχιών παρέχει ανεκτίμητης αξίας πληροφορίες που μπορούν να δώσουν ώθηση τόσο στην ανάπτυξη της βασικής έρευνας π.χ. μελέτη των γονιδιακών προφίλ έκφρασης διαφορετικών ιστών όσο και στην ανάπτυξη της εφαρμοσμένης έρευνας π.χ. μελέτη ασθενειών, δράση φαρμάκων και ορμονών κλπ.
Παρά τη δυνατότητα που παρέχει η τεχνολογία των μικροσυστοιχιών για την ταυτόχρονη μέτρηση των επιπέδων έκφρασης χιλιάδων γονιδίων, η ποσοτικοποίηση της γονιδιακής έκφρασης (δηλ. η εξαγωγή των επιπέδων έκφρασης των γονιδίων), επηρεάζεται από τους διάφορους τύπους θορύβου που υπεισέρχονται τόσο κατά την πειραματική διαδικασία κατασκευής των μικροσυστοιχιών (π.χ. προετοιμασία δειγμάτων) όσο και από τα πιθανοκρατικά χαρακτηριστικά που διέπουν τη διαδικασία ανίχνευσης (microarray scanning procedure) των μικροσυστοιχιών (π.χ. λάθη ανίχνευσης). Η «θορυβώδης» φύση των γονιδίων και κατά συνέπεια των μετρούμενων γονιδιακών εκφράσεων «κρύβει» (obscure) μερικά από τα πιο σημαντικά χαρακτηριστικά των βιολογικών διαδικασιών ενδιαφέροντος και καθιστά δύσκολη την εξαγωγή χρήσιμων βιολογικών συμπερασμάτων.
Από τα παραπάνω διαφαίνεται ότι η μείωση του θορύβου είναι μια πολύ σημαντική διαδικασία η οποία θα πρέπει να ενσωματωθεί στην αλγοριθμική μεθοδολογία που μέχρι στιγμής χρησιμοποιείται για την εξαγωγή των γονιδιακών εκφράσεων από τις εικόνες μικροσυστοιχιών. Με αυτό τον τρόπο θα ελαχιστοποιηθούν τα πιθανά «λάθη» τα οποία μεταφέρονται (propagate) κατά τη διαδικασία εξαγωγής των εντάσεων (μέσω της χρησιμοποιούμενης αλγοριθμικής μεθοδολογίας) και τελικά επηρεάζουν την «ακριβή» εξαγωγή των γονιδιακών εκφράσεων.
‘Ως πιθανή λύση για την αντιμετώπιση του θορύβου στις εικόνες μικροσυστοιχιών, έχει προταθεί στη διεθνή βιβλιογραφία η χρήση τεχνικών αναβάθμισης εικόνας. Τα αποτελέσματα αυτών των επιστημονικών εργασιών συμπεραίνουν ότι με τη χρήση τεχνικών αναβάθμισης η ποιότητα των επεξεργασμένων εικόνων είναι σαφώς καλύτερη. Ωστόσο, καμία από αυτές τις εργασίες δεν μελετάει εάν οι τεχνικές αναβάθμισης οδηγούν στον ακριβέστερο προσδιορισμό των παρυφών των κουκίδων (spot) από τις οποίες εξάγονται οι γονιδιακές εκφράσεις ή εάν βοηθάνε στη μείωση της μεταβλητότητας (variability) των εξαγόμενων γονιδιακών εκφράσεων.
Επιπρόσθετα, όπως έχει ήδη προαναφερθεί, ο θόρυβος παρεμποδίζει την εξαγωγή χρήσιμων βιολογικών συμπερασμάτων. Παρά το μεγάλο πλήθος εξελιγμένων μεθόδων που έχουν προταθεί στη διεθνή βιβλιογραφία για την αποτροπή της ομαδοποίησης γονιδίων που χαρακτηρίζονται ως «θορυβώδη», δεν έχει καθοριστεί ακόμα (από τους ειδικούς) μια ενιαία μέθοδος που να βρίσκει και να ομαδοποιεί γονίδια τα οποία θα παρέχουν βιολογικά χρήσιμες πληροφορίες. Αποτέλεσμα αυτής της «ασυμφωνίας» μεταξύ των ειδικών αποτελεί η εξαγωγή διαφορετικών βιολογικών συμπερασμάτων ανάλογα α) με τον αριθμό των δημιουργούμενων γονιδιακών ομάδων (που εξαρτάται άμεσα από τη διαφορετική μέθοδο ομαδοποίησης (clustering)) και β) με τις διαφοροποιήσεις που μπορεί να έχουμε στις παραμέτρους των διαφόρων μεθόδων ομαδοποίησης.
H παρούσα διατριβή στοχεύει στη δημιουργία ενός ολοκληρωμένου πλαισίου για την επεξεργασία και ανάλυση εικόνων μικροσυστοιχιών με σκοπό την βελτιστοποίηση της εξαγωγής και κατά συνέπεια της ποσοτικοποίησης των γονιδιακών εντάσεων από εικόνες μικροσυστοιχιών κουκίδων (spotted cDNA microarray images). Οι στόχοι της παρούσας διατριβής συνοψίζονται ως εξής: α) μοντελοποίηση και περιορισμός των επιδράσεων του θορύβου σε εικόνες μικροσυστοιχιών κουκίδων κατά τέτοιο τρόπο ώστε να αυξηθεί η ακρίβεια των εξαγόμενων γονιδιακών εκφράσεων, β) μελέτη της επίδρασης του θορύβου και βελτιστοποίηση των μεθόδων ανάλυσης των γονιδιακών εκφράσεων με σκοπό τη διευκόλυνση των βιολόγων στην εξαγωγής βιολογικών συμπερασμάτων και την καλύτερη κατανόηση της βιολογικής διεργασίας που μελετάται, γ) εισαγωγή ενός ημιεποπτευόμενου (semi-supervised) κριτηρίου που στηριζόμενο σε βιολογικές πληροφορίες θα αποσκοπεί στην ανεύρεση βιολογικά σημαντικών ομάδων γονιδίων τα οποία ταυτόχρονα θα απαντούν σε συγκεκριμένα βιολογικά ερωτήματα ,δ) μελέτη της επίδρασης και της απόδοσης διαφόρων τεχνικών κατάτμησης εικόνων μικροσυστοιχιών κουκίδων, τόσο ανωτάτου επιπέδου (state-of-art) όσο και νέων, στην ποσοτικοποίηση γονιδιακών εκφράσεων.
Για την πραγματοποίηση των παραπάνω στόχων σχεδιάστηκε και κατασκευάστηκε μια πλήρως δομημένη μεθοδολογία (a complete and robust framework) που περιελάμβανε αλγοριθμους επεξεργασίας και ανάλυσης εικόνας κουκίδων μικροσυστοιχιών Η προτεινόμενη μεθοδολογία ενσωμάτωσε στην ήδη υπάρχουσα αλγοριθμική μεθοδολογία (microarray analysis pipeline) έναν πρωτότυπο συνδυασμό τεχνικών επεξεργασίας και ανάλυσης εικόνας βασισμένο στην εις βάθος ποσοτική έρευνα της επίδρασης του θορύβου στην κατάτμηση κουκίδων (spot segmentation), στην εξαγωγή εντάσεων και στην εξόρυξη δεδομένων (data mining). Επιπρόσθετα, κατά την παρούσα διατριβή προτάθηκαν, κατασκευάστηκαν και αξιολογήθηκαν νέες τεχνικές κατάτμησης εικόνας από μικροσυστοιχές κουκίδων. Η χρησιμότητα των προτεινόμενων μεθοδολογιών αξιολογήθηκε τόσο σε εικονικές (simulated) όσο και σε πραγματικές εικόνες μικροσυστοιχιών κουκίδων.
|
108 |
Κατασκευή συστήματος αναγνώρισης κινδύνου σύγκρουσης αυτοκινήτου με προπορευόμενο με ψηφιακής επεξεργασίας σημάτων videoΔούκας, Γεώργιος 20 October 2010 (has links)
Σκοπός της παρούσας διπλωματικής εργασίας είναι η κατασκευή ενός συστήματος που να μπορεί να ξεχωρίζει τα οχήματα από άλλα αντικείμενα με τη χρήση κυματιδίου Haar και φίλτρου Gabor (εξαγωγή χαρακτηριστικών) και SVM, RBF για ταξινόμηση. / The aim of this thesis is the construction of a system that will be able to distiguish vehicles from other objects using Haar and Gabor filter (export characteristic) and SVM, RBF for classification.
|
109 |
Eύρεση καρδιακού ρυθμού ασθενούς με τεχνικές ψηφιακής επεξεργασίας εικόνας στο υπέρυθρο φάσμαΜοσχόβας, Γεώργιος 27 December 2010 (has links)
Στην παρούσα διπλωματική εργασία ασχοληθήκαμε με την εύρεση του καρδιακού παλμού ενός ατόμου με τεχνικές ψηφιακής επεξεργασίας εικόνας στο κοντινό και στο μέσο υπέρυθρο φάσμα. Χρησιμοποιήσαμε μια σειρά από διόδους εκπομπής στο υπέρυθρο φάσμα και μια βιντεοκάμερα με την οποία πήραμε τα προς εξέταση δεδομένα.
Στηριζόμαστε στην ιδιότητας της αιμοσφαιρίνης να απορροφά το υπέρυθρο φως ορισμένου μήκους κύματος. Επεξεργαζόμενοι το οπτικό υλικό που προκύπτει από τις μετρήσεις μας με κατάλληλες μεθόδους μπορούμε να πλησιάσουμε στην εύρεση του καρδιακού ρυθμού, μελετώντας τα βιολογικά σήματα και ευρίσκοντας μεθόδους
βελτίωσης τους.
Θα κάνουμε μία σύντομη αναφορά στα κεφάλαια που περιλαμβάνει η εργασία αυτή.
Στην αρχή γίνεται μια γνωριμία με τον τομέα της Βιοιατρικής Τεχνολογίας, τις εφαρμογές αυτού και τους κλάδους που τον συνθέτουν.
Εν συνεχεία, δίνονται κάποιες εισαγωγικές έννοιες σε σχέση με τα βιολογικά σήματα καθώς και οι βασικές αρχές επεξεργασίας αυτών.
Κατόπιν προσεγγίζονται βασικές έννοιες φυσιολογίας του καρδιοκυκλοφοριακού συστήματος και της αιμοσφαιρίνης, καθώς διαδραματίζει σημαντικότατο ρόλο στην πειραματική μας διαδικασία.
Ακολουθεί η περιγραφή της πειραματικής διάταξης καθώς και τα αποτελέσματα που προέκυψαν από τις πειραματικές διαδικασίες που πραγματοποιήθηκαν στο εργαστήριο μας.
Στα επόμενα τρία κεφάλαια πραγματοποιείται η επεξεργασία των σημάτων μας αρχικά με τη βοήθεια του μετασχηματισμού Fourier και έπειτα με τη χρήση μιας σειράς κατωδιαβατών φίλτρων εφαρμοσμένων στα σήματα φωτεινότητας αλλά και στις εικόνες που προέκυψαν από το πειραματικό μέρος της εργασίας. Παραθέτουμε τα αποτελέσματα και τα συμπεράσματα μας από τη μελέτη αυτών.
Τέλος,γίνεται αναφορά στις βασικές αρχές που διέπουν την απορρόφηση του φωτός κια στις βασικές διεργασίες που συνtελούν στη λειτουργία αυτή. / In this paper we dealt with finding the heartbeat of a person with digital image processing techniques in the near and mid infrared range. We used a series of infrared emitting diodes spectrum and a CCD video camera with which we got to test data.
We rely on the status of hemoglobin to absorb the infrared light of certain wavelength. By editing visual materials resulting from our measurements using appropriate methods we can get closer to finding the rhythm, studying the biological signals.
In the beginning there is an introduction to the field of medical technology, applications and industries such as it is composed.
Then, we present some introductory concepts in relation to biological signals and the basic principles of processing.
Afterwards, we approached concepts of circulation physiology and the properties of hemoglobin, as it plays a crucial role in our experimental procedure.
We also describe the experimental setup and the results of the experimental procedures performed in our laboratory.
The next three chapters are about the processing of signals using the Fourier transformation and then we use a series of low-pass filters applied to luminance signals and images obtained from the experimental part. Then we refer to the results and conclusions from our study which shows similarities between the heart rate curve and the luminance curve.
Finally, reference is made to the basic principles governing the absorption of light,as it is the basic feature used to interpret our results.
|
110 |
Αλληλεπιδραστικό σύστημα μετατροπής προτάσεων φυσικής γλώσσας σε κατηγορηματική λογική πρώτης τάξης με αυτόματη εισαγωγή προτάσεων και δημιουργία υποδείξεων για το χρήστηΠερίκος, Ισίδωρος 07 April 2011 (has links)
Η αναπαράσταση γνώσης αποτελεί ένα σημαντικό πεδίο της τεχνητής νοημοσύνης. Ενώ η αναπαράσταση γνώσης για τον κόσμο στην καθημερινή ζωή μας γίνεται σε φυσική γλώσσα, για τα υπολογιστικά συστήματα είναι απαραίτητο να χρησιμοποιηθεί ένας συμβολισμός που να παρέχει ακριβή αναπαράσταση της γνώσης, κάτι που δεν μπορεί να παρέχει η φυσική γλώσσα λόγω της πολυσημαντικότητας των προτάσεων. Μια γλώσσα αναπαράστασης είναι η Κατηγορηματική Λογική Πρώτης Τάξης –ΚΛΠΤ (First Order Logic-FOL).
Η ΚΛΠΤ ως γλώσσα αναπαράσταση γνώσης και αυτομάτου συλλογισμού έχει πολλές πτυχές. Μια από αυτές με την οποία ασχολούμαστε στην παρούσα διπλωματική είναι η μετατροπή φυσικής γλώσσας (ΦΓ) σε Κατηγορηματική Λογική Πρώτης Τάξης (ΚΛΠΤ). Πρόκειται για μια ad-hoc διαδικασία, για την οποία δεν υπάρχει κάποιος συγκεκριμένος αλγόριθμος.
Στα πλαίσια της παρούσας διπλωματικής εργασίας αναπτύχθηκε ένα σύστημα το οποίο μοντελοποιεί την διαδικασία της μετατροπή φυσικής γλώσσας (ΦΓ) σε κατηγορηματική λογική (ΚΛΠΤ) και αυτοματοποιεί την διαδικασία εισαγωγής προτάσεων-παραδειγμάτων για τον χρήστη-διδάσκοντα. Παράλληλα μέσω μιας αλληλεπιδραστικής διεπαφής (User Interface) κατευθύνει τον χρήστη-φοιτητή κατά την διάρκεια της μετατροπής παρέχοντας βοήθειες και υποδείξεις για κάθε πρόταση.
Ο χρήστης-διδάσκοντας μπορεί να εισάγει προτάσεις-παραδείγματα σε ΚΛΠΤ στο σύστημα. Στην συνέχεια κάθε πρόταση ΚΛΠΤ αναλύεται αυτόματα στα βήματα της διαδικασίας και αποθηκεύονται τα κατάλληλα στοιχεία.
Μια άλλη πτυχή της διπλωματικής αποτελεί η υλοποίηση της ημι-αυτοματοποίησης της παραγωγής κατάλληλων υποδείξεων σε όλα βήματα της διαδικασίας για κάθε πρόταση. Για την υλοποίηση αυτή χρειάστηκε να γίνει μια κατηγοριοποίηση των επιπέδων των παρεχόμενων υποδείξεων και μια τυποποίηση των λεκτικών εκφράσεων των αντίστοιχων μηνυμάτων. / Knowledge Representation is a fundamental topic of Artificial Intelligence. In everyday life people use natural language to communicate, however natural language cannot be used for knowledge representation in computer systems. The main reason is that natural language has not clear semantic.
A basic KR language is First-Order Logic (FOL), the main representative of logic-based representation languages, which is part of almost any introductory AI course and textbook. Teaching FOL as a knowledge representation and reasoning language includes many aspects. One of them is the translation of natural language (NL) sentences into FOL formulas, often called logic formalization of NL sentences. It is an ad-hoc process; there is no specific algorithm that can be automated within a computer. This is mainly due to the fact that NL has no clear semantics as FOL does.
During this master thesis, a web-based interactive system has been developed. It’s main aim is to provide a structured process to students and guide them in translating a NL sentence into a FOL one. Also an assistant system has been created to automate the insert of new sentences into the system. The teacher can insert the sentence in natural language and it’s FOL formula. Then the formula is automatically analyzed and the necessary information for the translation is extracted and stored.
Another work done during this master thesis is the implementation of a semi-automatic help generation system. The aim of this system is to recognize the students’ errors and provide them help and guidelines during the stages of the conversion process.
|
Page generated in 0.0279 seconds