• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 18
  • 1
  • Tagged with
  • 20
  • 20
  • 20
  • 20
  • 9
  • 7
  • 5
  • 5
  • 5
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Σημασιολογικός παγκόσμιος ιστός και τεχνικές εξατομίκευσης στις διαδικασίες αναζήτησης/διαπέρασης / Semantic web and personalization in searching and crawling

Καϊτανίδης, Χρήστος 01 October 2008 (has links)
Η συγκεκριμένη μεταπτυχιακή διπλωματική εργασία ασχολείται με την αλληλεπίδραση δύο παράλληλων διεργασιών στην προσπάθεια αξιοποίησης του Παγκόσμιου Ιστού (Web): (α) τη διεργασία μετεξέλιξης του Παγκόσμιου Ιστού στο σημασιολογικό Παγκόσμιο Ιστό, (β) τη διεργασία βελτίωσης των διαδικασιών διαπέρασης (crawling) και ψαξίματος (searching) στον Παγκόσμιο Ιστό. Στα πρώτα βήματα του Παγκόσμιου Ιστού το σημαντικότερο ίσως πρόβλημα για τους χρήστες που ήθελαν να αναζητήσουν πληροφορίες σε αυτό ήταν η έλλειψη πολλών και χρήσιμων πηγών. Σταδιακά, αλλά με ιδιαίτερα γρήγορους ρυθμούς ο Παγκόσμιος Ιστός μετατράπηκε σε μία από τις μεγαλύτερες πηγές πληροφοριών που χρησιμοποιεί ο άνθρωπος καθώς όλο και περισσότεροι εισάγουν δεδομένα για κάθε είδους δραστηριότητα και θέμα. Το πρόβλημα των χρηστών λοιπόν που αναζητούν πληροφορίες ανάχθηκε στη γρήγορη εξαγωγή των χρήσιμων, από τον τεράστιο όγκο των παρεχόμενων, πληροφοριών. Όροι και τεχνικές όπως Data Mining (Εξόρυξη Δεδομένων), Information Retrieval (Ανάκτηση Πληροφορίας), Knowledge Management (Διαχείριση Γνώσης) επεκτάθηκαν για να καλύψουν και το νεοεμφανιζόμενο μέσο. Επιπλέον, στην προσπάθεια για καλύτερη ποιότητα των παρεχόμενων αποτελεσμάτων στο χρήστη σημαντικό ρόλο διαδραμάτισε η εκμετάλλευση των ιδιαίτερων στοιχείων που μπορούν να εξαχθούν για τα ενδιαφέροντά του, τόσο στο στάδιο της διαπέρασης, όπου συγκεντρώνονται σελίδες συγκεκριμένης θεματολογίας (topic-focused crawling), όσο και στο στάδιο της αναζήτησης μέσα από αυτές των πιο σημαντικών για τον εκάστοτε χρήστη (personalization). Παράλληλα, καθώς ο Παγκόσμιος Ιστός σταδιακά μετεξελίσσεται στο Σημασιολογικό Παγκόσμιο Ιστό (Semantic Web) νέα μοντέλα και πρότυπα (XML, RDF, OWL) αναπτύσσονται για την προώθηση αυτής της διαδικασίας. Η έκφραση, μετάδοση και αναζήτηση πληροφοριών με χρήση αυτών των προτύπων ανοίγει νέους ορίζοντες στη χρήση του Διαδικτύου. Το βασικό αντικείμενο της εργασίας αυτής είναι η αξιοποίηση των παρεχόμενων μοντέλων και προτύπων του Σημασιολογικού Ιστού σε συνδυασμό με ήδη εφαρμοσμένες ιδέες και αλγορίθμους στον απλό Παγκόσμιο Ιστό ώστε να είναι εφικτή η ταχύτερη και ακριβέστερη ανάκτηση και επεξεργασία πληροφοριών. Δόθηκε επίσης προσπάθεια στην αξιοποίηση τεχνικών που εκμεταλλεύονται τις ιδιαίτερες προτιμήσεις κάθε χρήστη, και στη διερεύνηση της χρήσης των νέων μοντέλων και προτύπων του Σημασιολογικού Ιστού για την προώθηση της διαδικασίας αυτής. / The presented master thesis examines the interaction between two parallel tasks aiming to the better utilization of the World Wide Web: (a) the task of transforming the World Wide Web into Semantic Web, (b) the task of improving the results of crawling and searching methods on the Web. In the advent of the World Wide Web the most disconcerting problem for the users searching for information in the Web was the lack of useful and sufficient sources of information. Gradually, though in really fast pace, the World Wide Web transformed into the biggest storage of information that humans can use. More and more people contribute new data on the web about every aspect of their life, activity, job or interest. Eventually, users searching for information have to deal with another problem, quite the opposite than the one mentioned above. They need to find the information they are looking for through an enormous amount of data in the minimum amount of time spend in browsing. Terms and techniques such as Data Mining, Information Retrieval, Knowledge Management were extended to be applicable and to the newly presented media. Moreover, on the strive for better quality of the results returned to users, the utilization of user’s special interests that can be extracted played an important role both in the field of crawling, where pages of a certain subject are gathered (topic-focused crawling), and in the field of searching, where pages are valued according to each user’s needs (personalization). At the same time, while the World Wide Web gradually transforms into Semantic Web, new standards and models (XML, RDF, OWL) are evolving in order to launch this inquiry. The storage, presentation, transmission and search of information according to those standards open up new horizons in the utilization of the Web. The principal effort of this master thesis is the utilization of the newly provided models and standards of the Semantic Web in conjunction with already tested, positively evaluated and applicable ideas and algorithms of the World Wide Web, in order to achieve higher speed in retrieval and accuracy of information. Moreover, strong efforts were given in integrating techniques that take into account the special preferences of each user and in the exploration of the benefits that come from the adaptation of these new models of the Semantic Web.
2

Ηλεκτρονικό εμπόριο & σημασιολογικός ιστός : υλοποίηση του ηλεκτρονικού καταστήματος YourBooks

Καρακατσούλης, Δημοσθένης 14 February 2012 (has links)
Τα τελευταία χρόνια το Internet προσφέρει στις επιχειρήσεις ένα νέο φάσμα δυνατοτήτων επικοινωνίας, διείσδυσης και ανάπτυξης. Βασικός μοχλός ήταν οι ραγδαίες τεχνολογικές εξελίξεις, με σημαντικότερη καινοτομία την ανάπτυξη του Web, που διευκόλυνε την πρόσβαση μέσω φυλλομετρητών (browsers) με υποστήριξη γραφικών και επέτρεψε στο ευρύ κοινό να πλοηγείται εύκολα και γρήγορα. Αυτό είχε ως αποτέλεσμα πολλές επιχειρήσεις να εκμεταλλευτούν αυτή την ανακάλυψη και να δραστηριοποιηθούν εμπορικά χρησιμοποιώντας νέα επικοινωνιακή υποδομή τεχνοτροπία marketing και πωλήσεων. Στο πρώτο κεφάλαιο θα περιγράψουμε τον ορισμό, τις κατηγορίες, τα επιχειρηματικά μοντέλα και τις τεχνολογίες του ηλεκτρονικού εμπορίου. Στην συνέχεια θα αναφερθούμε στον Σημασιολογικό Ιστό που είναι ο «Μεσσίας» του Παγκόσμιου Ιστού δηλαδή ή εξέλιξη του και θα περιγράψουμε εργαλεία και εφαρμογές του για το πώς θα μας βοηθήσει στον τρόπο ζωής μας. Στο τρίτο κεφάλαιο θα αναφέρουμε προγράμματα - εργαλεία που χρησιμοποιούνται με σκοπό να δημιουργήσουμε ένα ηλεκτρονικό κατάστημα και στην συνέχεια στο τέταρτο κεφάλαιο θα παρουσιαστεί ένα κατάστημα αγοράς ηλεκτρονικών βιβλίων, με τις προδιαγραφές και το περιβάλλον που πρέπει να τηρούνται στις μέρες μας με σκοπό να κάνουν τις συναλλαγές ευκολότερες. Τέλος στο πέμπτο κεφάλαιο θα παραθέσουμε τα δικά μας συμπεράσματα και λεπτομέρειες που πρέπει να προσέξουμε όταν αποφασίσουμε να κατασκευάσουμε το δικό μας ηλεκτρονικό κατάστημα (website). / In recent years, Internet offers to businesses a range of new communications facilities, penetration and growth. The main reason was the rapid technological developments, most important innovation to develop the Web, which facilitated access through browsers (browsers) with graphics and allowed the public to navigate quickly and easily. This has led many companies to exploit this discovery and to operate using commercial communications infrastructure and new style of marketing and sales. The first chapter describes the definition, categories, business models and technologies of electronic commerce. Then we refer to the Semantic Web which is the "Messiah" of World Wide Web and describe tools and applications on how to help us in our lifestyle. The third chapter deals with programs - tools used to create an online store and then in the fourth chapter it is presented a detailed e-book online shop, with the standards and the environment to be observed today in order to make trade easier. Finally in the fifth chapter we cite our own conclusions and future surveys in order to be careful when we decide to create our online store (website).
3

Εφαρμογές του σημασιολογικού ιστού στην εκπαίδευση

Γκολφινοπούλου, Ασημίνα 31 May 2012 (has links)
Τα τελευταία χρόνια γίνονται επιταχυνόμενες προσπάθειες για να ενσωματωθούν αποτελεσματικά οι ψηφιακές τεχνολογίες στην εκπαίδευση. Στόχος είναι να προσθέσει η ενσωμάτωση αυτή πραγματική και μετρίσιμη αξία στην εκπαιδευτική διαδικασία. Σκοπός αυτής της εργασίας είναι να παρουσιάσουμε τους τρόπους που η καθιερωμένη markup γλώσσα για τα μαθηματικά, η MathML, μπορεί να βοηθήσει την εκπαίδευση στον τομέα των μαθηματικών. Εξετάζουμε την MathML σαν ένα από τα εργαλεία που προσφέρει η ταχεία ανάπτυξη του Σημασιολογικού Ιστού (Semantic Web). Ειδικότερα παρουσιάζονται οι markup γλώσσες XML, HTML5, MathML και κάποια εργαλεία που βοηθούν στην ενσωμάτωση τέτοιων τεχνολογιών. Για την MathML, δημιουργήθηκε ένας οδηγός χρήσης, προσιτός σε κάθε χρήστη. Στον τομέα της εκπαίδευσης, θα δούμε με ποιους τρόπους ο Σ.Ι. και η MathML προσθέτουν άξια στην εκπαιδευτική διαδικασία. Δημιουργήθηκε σε MathML ένα σενάριο διδασκαλίας στην Τριγωνομετρίας. Μέσω του Θεμελιώδους θεωρήματος Λογισμού, θα δούμε πως μπορεί η MathML να χρησιμοποιηθεί σε συνδυασμό με μια μελλοντική οντολογία αυτόνομων ενοτήτων στα Μαθηματικά όπου η κάθε ενότητα μπορεί να αποτελεί βάση αυτομάθησης/αυτοαξιολόγησης. Τέλος, θα αναφερθούμε στις προοπτικές που υπάρχουν στο άμεσο μέλλον. / In latest years, people making efforts to integrate digital technology effectively in education. The aim of this Postgraduate Work is to give real and measurable value in educational process. The goal is to present some ways that the usual markup language, MathML may help in mathematical education. We investigate MathML, as one of the tools, which are offered by the development of Semantic Web. More specifically, we present XML, HTML5 and MathML markup languages, and some tools which are helpful in integration of these technologies. We create a more approachable guide for helping anyone to understand MathML. In education, we will investigate how Semantic Web and MathML can give extra value in education process. Also we created a teaching scenario using MathML, in Trigonometry. Through the Fundamental Calculus Theorem, we will see a usage of MathML combing it in a future ontology of autonomous units in Mathematics, where each unit can be a base in autoeducate/autoevaluate. In the end, we will refer in future perspectives.
4

Σχεδιασμός και υλοποίηση crowdsourcing διαδραστικής εκπαιδευτικής εφαρμογής με την χρήση του σημασιολογικού ιστού

Σκαπέτης, Ανδρέας 14 October 2013 (has links)
Τα τελευταία χρόνια γίνεται ολοένα όλο και πιο έντονη η επιθυμία, τόσο από εκπαιδευτικούς ή μαθητές, αλλά και από άτομα μεγαλύτερης ηλικίας που θέλουν να αναπτύξουν την γνώση τους σε κάποιο αντικείμενο, για την δημιουργία εκπαιδευτικών μηχανών (λογισμικών) που θα μπορούν να αντικαταστήσουν σε μεγάλο βαθμό τον ρόλο του εκπαιδευτικού. Η προστιθέμενη αξία ενός εκπαιδευτικού λογισμικού θα μπορούσε να είναι η εύκολη πρόσβαση σε μεγάλο όγκο πληροφοριών, η πιο συστηματική εκμάθηση, καθώς και η εξοικονόμηση χρόνου και εκπαιδευτικών πηγών (εννοώντας τους εκπαιδευτικούς ως φυσικά πρόσωπα). Το ζητούμενο δεν είναι απλά η δημιουργία ενός εκπαιδευτικού λογισμικού αλλά ενός "σωστά" δομημένου εκπαιδευτικού συστήματος. Αυτό σημαίνει ότι ο εκπαιδευόμενος θα μπορεί να αντλεί σωστά και μεθοδικά πληροφορία από αυτό, όπως ακριβώς θα έκανε αν είχε στην διάθεσή του έναν καταρτισμένο εκπαιδευτικό. Στην παρούσα λοιπόν εργασία, μέσα από ένας συνδυασμό νέων τεχνολογιών όπως είναι αυτή των οντολογιών και του σημασιολογικού ιστού καθώς επίσης και θεωριών συσχετιζόμενων με την εκπαίδευση, παρουσιάζονται τα βήματα για δημιουργία ενός διαδραστικού crowdsoursing εκπαιδευτικού συστήματος. Παρουσιάζεται ένα σύστημα που με απλά λόγια θα είναι σε θέση να εξυπηρετεί μαθητές και εκπαιδευτικούς αλλά και οποιονδήποτε άλλο ενδιαφερόμενο, να προσφέρει μεθοδική εκμάθηση, να συλλέγει πληροφορία από τους χρήστες του την οποία να επεξεργάζεται και να την διαθέτει σε αυτούς σε ξανά βελτιωμένη και εμπλουτισμένη. / -
5

Χρήση τεχνολογιών σημασιολογικού ιστού για συστήματα συστάσεων

Κάββουρας, Δημήτριος 01 October 2014 (has links)
Σκοπός της εργασίας είναι η μελέτη και εφαρμογή τεχνολογιών σημασιολογικού ιστού για συστήματα συστάσεων, πάνω σε περιεχόμενο που προέρχεται από το διαδίκτυο. Στα πλαίσια της εργασίας σχεδιάστηκε και υλοποιήθηκε διαδικτυακή εφαρμογή που προτείνει άρθρα ειδήσεων λαμβάνοντας υπόψη το προφίλ/ιστορικό του κάθε χρήστη. Λόγω του μεγάλου όγκου πληροφοριών που κατακλύζει το διαδίκτυο συχνά οι χρήστες δυσκολεύονται να ξεχωρίσουν τις πληροφορίες που πραγματικά σχετίζονται με τα ενδιαφέροντα τους. Επιπλέον οι χρήστες έχουν πολύ διαφορετικά ενδιαφέροντα ή προτιμήσεις που μπορούν να ληφθούν υπόψη ώστε να φιλτραριστούν ή να ταξινομηθούν τα αποτελέσματα μιας ερώτησης με σκοπό το αποτέλεσμα να ικανοποιεί τις εξατομικευμένες ανάγκες κάθε χρήστη. Η κατηγορία αυτών των συστημάτων εξατομίκευσης ονομάζεται συστήματα συστάσεων (recommender systems). Τα συστήματα συστάσεων εκμεταλλεύονται τις ιδιαιτερότητες των χρηστών με σκοπό να διευκολύνουν στο να προσδιορίζουν ακριβέστερα τις πληροφορίες ή τις υπηρεσίες για τις οποίες ενδιαφέρονται περισσότερο ή σχετίζονται με τις ανάγκες τους, κάνοντας χρήση ειδικών αλγορίθμων. Οι αλγόριθμοι που χρησιμοποιούνται λαμβάνουν ως είσοδο τα χαρακτηριστικά και τις προτιμήσεις των χρηστών, ή τις σχέσεις μεταξύ των χρηστών ή τα γνωρίσματα των προς σύσταση αντικειμένων και υπολογίζουν το εκτιμώμενο ενδιαφέρον του χρήστη για κάθε αντικείμενο. Στην συνέχεια ταξινομούν ή φιλτράρουν τα αντικείμενα με κριτήριο το εκτιμώμενο ενδιαφέρον. Παρά τη μεγάλη ερευνητική δραστηριότητα στα συστήματα συστάσεων υπάρχουν σημαντικά προβλήματα που δεν έχουν λυθεί ακόμα πλήρως και απαιτείται περαιτέρω έρευνα. Για παράδειγμα οι τυπικές προσεγγίσεις εξαρτώνται από το πεδίο ορισμού(domain). Τα μοντέλα τους δημιουργούνται από τις πληροφορίες που συλλέγονται μέσα σε ένα συγκεκριμένο πεδίο(domain), και δεν μπορούν να επεκταθούν ή να ενσωματωθούν σε άλλα συστήματα. Επιπλέον η ανάγκη για περαιτέρω ευελιξία με τη μορφή συστάσεων που εξάγονται από επερωτήσεις ή προτάσεων που προσανατολίζονται σε ομάδες χρηστών, καθώς και η εξέταση πλαισιακών χαρακτηριστικών στη διάρκεια των διαδικασιών δημιουργίας συστάσεων είναι και αυτές απαιτήσεις που δεν πληρούνται στα περισσότερα συστήματα. Στην εργασία αυτή παρουσιάζουμε ένα σύστημα συστάσεων που χρησιμοποιεί τεχνολογίες σημασιολογικού ιστού για να περιγράψει και να συνδέσει τις ειδήσεις με τις προτιμήσεις του χρήστη ώστε να δημιουργήσει βελτιωμένες συστάσεις. Οι περιγραφές των ειδήσεων και τα προφίλ των χρηστών δημιουργούνται με την βοήθεια εννοιών που ορίζονται σε ένα σύνολο οντολογιών πεδίου. Ανάλογα με τις ομοιότητες μεταξύ των περιγραφών των ειδήσεων και των προφίλ των χρηστών καθώς και τις σημασιολογικές σχέσεις μεταξύ των εννοιών, το σύστημα υποστηρίζει μοντέλα συστάσεων βάσει περιεχομένου που έχουν σαν επίκεντρο το μεμονωμένο χρήστη, και επιτρέπει την εξαγωγή συμπερασμάτων βασισμένα σε κανόνες για την υποστήριξη εξατομικευμένων συστάσεων. Συγκεκριμένα γίνεται αξιολόγηση του μοντέλου που εξατομικεύει τη σειρά με την οποία τα άρθρα ειδήσεων παρουσιάζονται στο χρήστη λαμβάνοντας υπόψη το προφίλ/ιστορικό των βραχυπρόθεσμων και των μακροπρόθεσμων ενδιαφερόντων. / The scope of this Msc Thesis is the study and applies Semantic Web Technologies, for Recommendation Systems, over content for the internet. For the purpose of work, we designed and implemented web application that proposes news articles considering the profile/ history of each user. Because of the information overload which invading the internet, often the users are complicated to distinguish the information that really is related to their interests. The category of these personalization systems called recommendation systems. More over the users have very different interests or preferences that can taken into account in order to classify or filtering the results of question with scope the result to satisfies the personalized needs of each user. The category of these personalization systems called recommendation systems. Recommendation systems exploit the particularities of users with scope facilitate to identify precisely the information or the services for which they are more interested or related to their needs, using special algorithms. The algorithms used take as input the attributes and the user’s preferences, or the relations between users or the attributes of the items to be recommender and calculate the estimated interest of user for each item. Then classify or filtering the items with criterion the estimated interest. Despite the great research activity in recommendation systems common problem have not fully solved yet, and further investigation is needed. For example, typical approach dependent from domain. The model are created from the information where collected in specific domain, and cannot be extended or integrated in other systems. More over the need for further flexibility in the recommendation derived from question or oriented recommendation to group users, and the consideration of contextual features during the recommendation process are also unfulfilled requirements in most systems. This thesis presents news recommendations systems which used semantic web technologies to describe and relate news items, and the user preferences in order to produce enhanced recommendations. The items descriptions and the user profiles are created with concepts in the domain ontology. According to the similarity between the description items and the user profiles, and the semantic relation between concepts, the system supported content –based model that centered on a single user, and allows the Inference rule-based for the supported personalized recommendation. Specifically an evaluation of the model that personalized the order in which news articles are presented to the user, considering the profile/ history of sort – terms and long – terms interests.
6

Σημασιολογική προσωποποίηση στον παγκόσμιο ιστό / Semantic personalization in the world wide web

Βόπη, Αγορίτσα 07 February 2008 (has links)
Η αναζήτηση πληροφορίας στο Παγκόσμιο Ιστό λόγω της ραγδαίας αύξησης του όγκου του αποτελεί ένα δύσκολο και χρονοβόρο εγχείρημα. Επιπρόσθετα, η συνωνυμία και η πολυσημία συμβάλλουν στη δυσκολία εύρεσης πληροφορίας. Στα πλαίσια αυτής της διπλωματικής εργασίας αναπτύχθηκε μια μεθοδολογία για την προσωποποίηση των αποτελεσμάτων μιας μηχανής αναζήτησης ώστε αυτά να ανταποκρίνονται στα ενδιαφέροντα των χρηστών. Η μεθοδολογία αποτελείται από δύο τμήματα, το εκτός σύνδεσης τμήμα και το συνδεδεμένο τμήμα. Στο εκτός σύνδεσης τμήμα χρησιμοποιώντας τα αρχεία πρόσβασης της μηχανής αναζήτησης και εξάγεται πληροφορία για τις επιλογές του χρήστη. Στη συνέχεια πραγματοποιείται η σημασιολογική κατηγοριοποίηση των προηγούμενων επιλογών των χρηστών με χρήση μιας οντολογίας, που αναπτύχθηκε με βάση τους καταλόγους του ODP. Κατόπιν, αναπτύσσεται το προφίλ του χρήστη με βάση την οντολογία αναφοράς που χρησιμοποιήθηκε και στη φάση της σημασιολογικής αντιστοίχισης. Στη συνέχεια, με χρήση αλγορίθμου ομαδοποίησης γίνεται ομαδοποίηση των χρηστών με βάση τα ενδιαφέροντά τους. Στο συνδεδεμένο τμήμα ο αλγόριθμος προσωποποίησης χρησιμοποιεί τις ομάδες που δημιουργήθηκαν στο μη συνδεδεμένο τμήμα και τη σημασιολογική αντιστοίχηση των αποτελεσμάτων της μηχανής αναζήτησης και αναδιοργανώνει τα αποτελέσματά της προωθώντας στις πρώτες θέσεις επιλογής τα αποτελέσματα που είναι περισσότερο σχετικά με τις προτιμήσεις της ομάδας στην οποία ανήκει ο χρήστης. Η μεθοδολογία που προτείνεται έχει εφαρμοστεί σε πειραματική υλοποίηση δίνοντας τα επιθυμητά αποτελέσματα για την προσωποποίηση σύμφωνα με τις σημασιολογικές ομάδες χρηστών. / During the recent years the World Wide Web has been developed rapidly making the efficient searching of information difficult and time-consuming. In this work, we propose a web search results personalization methodology by coupling data mining techniques with the underlying semantics of the web content. To this purpose, we exploit reference ontologies that emerge from web catalogs (such as ODP), which can scale to the growth of the web. Our methodology uses ontologies to provide the semantic profiling of users’ interests based on the implicit logging of their behavior and the on-the-fly semantic analysis and annotation of the web results summaries. Following this the logged web clickthrough data are submitted to offline processing in order to form semantic clusters of interesting categories according to the users’ perspective. Finally, profiles of semantic clusters are combined with the emerging profile of the active user in order to apply a sophisticated re-ranking of search engines results. Experimental evaluation of our approach shows that the objectives expected from semantic users’ clustering in search engines are achievable.
7

Μελέτη τεχνολογιών σημασιολογικού ιστού και ανάπτυξη συστήματος διαχείρισης πολιτισμικών δεδομένων

Μερτής, Αριστοτέλης 07 April 2011 (has links)
Η ψηφιακή εποχή έχει διεισδύσει σε όλες τις πτυχές της ανθρώπινης δραστηριότητας και τις μεταμορφώνει με έναν επαναστατικό και πρωτόγνωρο τρόπο. Ένας ιδιαίτερος ευαίσθητος τομέας για εμάς τους Έλληνες, ο πολιτισμός, δεν θα μπορούσε να μείνει ανεπηρέαστος από το κύμα της ψηφιακής εποχής. Η ψηφιακή εποχή έχει μεταμορφώσει τη πολιτιστική κληρονομιά τόσο από άποψη δημιουργίας όσο και από άποψη διατήρησης πολιτισμού. Ενώ κάποτε συλλέγαμε φυσικά αντικείμενα όπως ζωγραφιές, βιβλία και αγάλματα, τώρα πλέον διατηρούμε και ψηφιακές αναπαραστάσεις των πολιτιστικών αντικειμένων. Μέσω των νέων τεχνολογιών της Πληροφορικής και των Επικοινωνιών μπορούν να δημιουργηθούν, ταυτοποιηθούν και να ανακτηθούν τα ψηφιακά αυτά αγαθά. Η πολιτιστική κληρονομιά έχει κερδίσει μεγάλο ενδιαφέρον τα τελευταία χρόνια. Η επιστημονική κοινότητα ερευνά τις πιθανότητες για παροχή κατάλληλων τεχνολογιών για ολοκληρωμένη πρόσβαση στις συλλογές πολιτισμικής κληρονομιάς, ενώ οι οργανισμοί πολιτισμικής κληρονομιάς γίνονται ολοένα πιο πρόθυμοι να συνεργαστούν και να παρέχουν την καλύτερη δυνατή πρόσβαση στις συλλογές τους μέσα από εξατομικευμένη παρουσίαση και πλοήγηση. Ο Σημασιολογικός Ιστός βρίσκεται στο επίκεντρο της προσπάθειας αυτής. Ο Σημασιολογικός Ιστός είναι το επόμενο στάδιο του σημερινού Διαδικτύου κατά το οποίο, τα δεδομένα θα επισημειώνονται με μεταδεδομένα, τα οποία θα επιτρέπουν στις εφαρμογές του Διαδικτύου να προσφέρουν καλύτερες υπηρεσίες αναζήτησης στο χρήστη. Η διπλωματική αυτή πραγματεύεται τη χρήση των τεχνολογιών του Σημασιολογικού Ιστού για την βελτίωση της πρόσβασης σε πολιτισμικά δεδομένα. Έχει ως στόχο την εμβάθυνση στις τεχνολογίες Σημασιολογικού Ιστού, στην ανάπτυξη μιας καινοτόμου εφαρμογής και στην ανάδειξη των πλεονεκτημάτων. Στο δεύτερο κεφάλαιο παρουσιάζεται πως ο Σημασιολογικός Ιστός λύνει το πρόβλημα της συντακτικής συμβατότητας. Συγκεκριμένα, παρουσιάζεται η τεχνολογία της XML και των διάφορων τεχνολογιών γύρω από αυτήν. Στο τρίτο και στο τέταρτο κεφάλαιο παρουσιάζεται πως επιτυγχάνεται η Σημασιολογική Συμβατότητα. Στο τρίτο κεφάλαιο μελετάται το RDF μοντέλο δεδομένων, η μοντελοποίηση δεδομένων στο Σημασιολογικό Ιστό. Παρουσιάζονται οι διάφοροι τρόποι σύνταξης του καθώς και πως γίνεται αναζήτηση σε γράφους RDF με το πρωτόκολλο SPARQL. Στο τέταρτο κεφάλαιο παρουσιάζεται η έννοια της οντολογίας. Παρουσιάζονται διάφορες γλώσσες περιγραφής οντολογιών ενώ μελετάται σε βάθος η OWL. Στο πέμπτο κεφάλαιο παρουσιάζεται ένα σύνολο θησαυρών και οντολογιών που χρησιμοποιούνται περισσότερο από τους οργανισμούς. Παρουσιάζεται η οντολογία SKOS καθώς και μέθοδοι για τη μεταφορά παραδοσιακών θησαυρών στο Σημασιολογικό Ιστό μέσω του SKOS. Τέλος, παρουσιάζεται το CIDOC-CRM ως μία λύση για την ολοκλήρωση θησαυρών ποικιλίας γνωστικών πεδίων. Στο έκτο κεφάλαιο γίνεται μία ανασκόπηση από επιλεγμένα έργα των τελευταίων ετών που χαρακτηρίζονται από την εφαρμογή των τεχνολογιών του Σημασιολογικού Ιστού στο τομέα του Πολιτισμού και της Πολιτισμικής Κληρονομιάς. Τέλος στο έβδομο κεφάλαιο παρουσιάζεται μία εφαρμογή διαχείρισης πολιτιστικών δρώμενων. Επίσης παρουσιάζεται η πρωτοβουλία των Διασυνδεδεμένων Δεδομένων και πως γίνεται η εφαρμογή μας γίνεται μέρος του Σημασιολογικού Ιστού μέσω της πρωτοβουλίας αυτής. / The digital age has influenced every aspect of human activity and has transformed them in a revolutionary, previously unseen way. A special for us Greeks sector, cultural heritage, could not stay unaffected from the wave of the digital age. The Digital age has transformed Cultural Heritage both from the aspect of creation and the aspect of conservation of civilization. While once we collected only physical objects like paintings, books and statues, now we also collect digital representations of cultural objects. Through the new ICTs the objects can be created, authenticated and retrieved. The domain of Cultural Heritage has gained a lot of popularity during the last years. The scientific community researches new possibilities for integrated access of collections of cultural heritage, while the organizations of cultural heritage are increasingly eager to cooperate and provide the best possible access to their collections through personalized presentation and navigation. The Semantic Web stands in the center of this effort. The Semantic Web is the next stage of today’s Internet, in which, data are annotated with metadata that enable novel applications of the Internet to provide better search services to the user. This thesis researches the usage of Semantic Web technologies for the enhancement of the access to cultural data. Its goal is the study of Semantic Web technologies and the development of a novel application to emphasize its advantages. In the second chapter is presented the XML, which is the vehicle of Semantic Web data representations .In the third chapter , the RDF model is presented. Specifically, the various syntaxes of RDF and how RDF graphs are queried. In the fourth chapter the concept of the ontology is studied. Many ontology description languages are presented and OWL is studied more in depth. In the fifth chapter a number of thesaurus and ontologies are presented that are used by many CH organizations. The SKOS ontology is presented as well as the methods employed to migrate legacy thesauri to the Semantic Web. Also, the CIDOC-CRM ontology is presented as a solution for the integration of various domains. In the sixth chapter a review of selected projects of the last years is presented, that are characterized by the application of the technologies of Semantic Web in the sector of Culture and Cultural heritage. In the last chapter an application of cultural events management is presented. The initiative of Linked Data is also presented and how the application becomes a part of the Semantic Web through this initiative.
8

Ανάπτυξη φροντιστηριακού συστήματος της τυπικής εκπαίδευσης

Πανοπούλου, Χαρίκλεια 24 January 2014 (has links)
Η αλματώδης εξέλιξη που σημειώθηκε και εξακολουθεί να σημειώνεται τα τελευταία χρόνια στις τεχνολογίες του παγκόσμιου ιστού, έχει οδηγήσει σε προσπάθεια ενσωμάτωσης του παγκόσμιου ιστού (Web) σε όλες τις πτυχές της ζωής, σε συνδυασμό με τις εξελίξεις στις τεχνολογίες επικοινωνιών και ιδιαίτερα με την παροχή αξιόπιστων και ταχύτατων ευρυζωνικών δικτύων επικοινωνίας, έχει μετεξελιχθεί σε μία πλατφόρμα παροχής προηγμένων δικτυακών υπηρεσιών οι οποίες καλύπτουν ένα ευρύτατο φάσμα εκπαιδευτικών αναγκών. Αυτό σε συνδυασμό με την σημασία που δίνεται παγκοσμίως στην εκπαιδευτική διαδικασία και η σχέση που θα προκύψει απ’το πάντρεμα εκπαίδευσης και παγκόσμιου ιστού θα εισηγηθούν την εξέλιξη και ανάπτυξη μαθησιάκων εργαλείων με την νόμιμη ενσωμάτωση τους στα πλαίσια της τυπικής εκπαίδευσης. Η ανάπτυξη όμως και η ευρεία αποδοχή των παραπάνω τεχνολογιών οδήγησε στην δημιουργία ενός τεράστιου όγκου πληροφορίας, ο οποίος, σε συνδυασμό με παράγοντες όπως οι διαφορετικές μορφές αναπαράστασης της, η πολυσημία-αμφισημία-συνωνυμία των λέξεων κ.ά., αναστέλλουν τις δυνατότητες που ανοίγονται απ’αυτές. Συνεπώς και τα μαθησιακά εργαλεία σαν πεδίο εφαρμογής των τεχνολογιών αυτών αντιμετωπίζουν προβλήματα όπως τα παραπάνω που προκύπτουν απ’τις τεχνολογίες αυτές. Τα προβλήματα αυτά στα μαθησιακά εργαλεία αφορούν την επιλογή κατάλληλου εκπαιδευτικού υλικού βασισμένο σε σημασιολογικό υπόβαθρο ώστε να επιτευχθεί ένα αποδοτικό μαθησιακό αποτέλεσμα. Για να ξεπεραστούν προβλήματα του ιστού όπως τα παραπάνω, που αφορούν στην διαχείριση της πληροφορίας του, έχουν προταθεί, απ’την αρχή της δεκαετίας του 2000, νέες τεχνολογίες που προχωρούν με γοργούς ρυθμούς στην ολοκλήρωση και επέκτασή τους και μας εντάσσουν στην εποχή του Web 3. Οι τεχνολογίες αυτές δημιουργούν ένα νέο ιστό, το σημασιολογικό ιστό, που στήνεται σαν πέπλο πάνω απ’τον υπάρχοντα ιστό και δίνει νόημα στο περιεχόμενο των σελίδων που διακινούνται σε αυτόν. Πεδίο μελέτης της συγκεκριμένης διπλωματικής είναι η ανάπτυξη ενός φροντιστηριακού συστήματος βασισμένο σε οντολογίες προσδίδοντας στο περιεχόμενό του νόημα και σημασία. Ο χώρος της εκπαίδευσης εφαρμόζει τις νέες τεχνολογίες στα μαθησιακά εργαλεία με σκοπό τη διανομή εκπαιδευτικού υλικού και στην παροχή πιο ενδιαφέρουσας και διαδραστικής διαδικασίας μάθησης. Σκοπός του συστήματος αυτού είναι η ενίσχυση της τυπικής εκπαιδευτικής διαδικασίας σε σημασιολογικά θεμέλια. Στην παρούσα διπλωματική παρουσιάζεται η έννοια του σημασιολογικού ιστού και η αρχιτεκτονική του, οι δυνατότητες των εργαλείων που προτάθηκαν για την υλοποίηση της σημασιολογικής πλατφόρμας μάθησης και πως αυτά συνέβαλλαν στη δημιουργία του. Καθώς, και ποιες είναι οι κατηγορίες της εκπαίδευσης, δίνοντάς μας να αντιληφθούμε την αναγκαιότητα για τον συνδυασμό τους. Συγκεκριμένος στόχος είναι η μελέτη των βελτιώσεων που μπορούν να επέλθουν από επιλεγμένες σημασιολογικές τεχνολογίες, όπως μεταδεδομένα και οντολογίες, στην εξατομικευμένη μάθηση. Για την υλοποίηση αυτού του στόχου 1) περιγράφεται η κατασκευή του εκπαιδευτικού αντικειμένου με οντολογίες, με τη βοήθεια του εργαλείου Protege, οι οποίες δίνουν σημασιολογία στις συσχετίσεις ανάμεσα σε αυτές τις έννοιες, 2) σχεδιάζεται η αρχιτεκτονική και το πλαίσιο λειτουργίας ενός τέτοιου εκπαιδευτικού συστήματος, με τη βοήθεια ενός άλλου εργαλείου, του Drupal, που επίσης υποστηρίζει τεχνολογίες του σημασιολογικού ιστού. Απώτερος σκοπός της προσπάθειας αυτής είναι να τεθούν τα θεμέλια ενός μαθησιακού εργαλείου το οποίο θα αποτελεί ένα δικτυακό υπερμεσικό σημασιολογικό εκπαιδευτικό περιβάλλον με στόχο τη διδασκαλία στην τάξη και τη προσωπική εκπαίδευση σε γνωστικά αντικείμενα όπως τα Μαθηματικά και το οποίο αναπτύχθηκε χρησιμοποιώντας σύγχρονες τεχνολογίες παγκοσμίου ιστού. Αυτό το εκπαιδευτικό εργαλείο θα εκπαιδεύσει μαθητές στη πρώτη και δεύτερη βαθμίδα εκπαίδευσης, μέσω θεωρίας, ασκήσεων, παραδειγμάτων και κριτηρίων αξιολόγησης σε ένα φάσμα της ύλης που επιλέχτηκε ώστε να ξετυλίγεται το διέπον νήμα των αριθμητικών συνόλων. Αξιοποιώντας τις δυνατότητες της πλατφόρμας θα επιτευχθεί καλύτερη μόρφωση, βελτιωμένο υπόβαθρο για τους χρήστες σε ένα αυξανόμενης ανταγωνιστικότητας πανελλαδικό εκπαιδευτικό περιβάλλον. / -
9

Αλγόριθμοι και τεχνικές εξατομικευμένης αναζήτησης σε διαδικτυακά περιβάλλοντα με χρήση υποκείμενων σημασιολογιών

Πλέγας, Ιωάννης 06 December 2013 (has links)
Η τεράστια ανάπτυξη του Παγκόσμιου Ιστού τις τελευταίες δεκαετίες έχει αναδείξει την αναζήτηση πληροφοριών ως ένα από τα πιο σημαντικά ζητήματα στον τομέα της έρευνας στις Τεχνολογίες της Πληροφορικής. Σήμερα, οι σύγχρονες μηχανές αναζήτησης απαντούν αρκετά ικανοποιητικά στα ερωτήματα των χρηστών, αλλά τα κορυφαία αποτελέσματα που επιστρέφονται δεν είναι πάντα σχετικά με τα δεδομένα που αναζητά ο χρήστης. Ως εκ τούτου, οι μηχανές αναζήτησης καταβάλλουν σημαντικές προσπάθειες για να κατατάξουν τα πιο σχετικά αποτελέσματα του ερωτήματος ως προς τον χρήστη στα κορυφαία αποτελέσματα της λίστας κατάταξης των αποτελεσμάτων. Η διατριβή αυτή ασχολείται κυρίως με το παραπάνω πρόβλημα, δηλαδή την κατάταξη στις υψηλότερες θέσεις των πιο σχετικών αποτελεσμάτων ως προς τον χρήστη (ειδικά για ερωτήματα που οι όροι τους έχουν πολλαπλές σημασίες). Στο πλαίσιο της παρούσας έρευνας κατασκευάστηκαν αλγόριθμοι και τεχνικές που βασίζονται στην τεχνική της σχετικής ανατροφοδότησης (relevance feedback) για την βελτίωση των αποτελεσμάτων που επιστρέφονται από μια μηχανή αναζήτησης. Βασική πηγή της ανατροφοδότησης ήταν τα αποτελέσματα που επιλέγουν οι χρήστες κατά την διαδικασία πλοήγησης. Ο χρήστης επεκτείνει την αρχική πληροφορία αναζήτησης (λέξεις κλειδιά) με νέα πληροφορία που προέρχεται από τα αποτελέσματα που διαλέγει. Έχοντας ένα νέο σύνολο πληροφορίας που αφορά τις προτιμήσεις του χρήστη, συγκρίνεται η σημασιολογική πληροφορία του συνόλου αυτού με τα υπόλοιπα αποτελέσματα (αυτά που επιστράφηκαν πριν επιλέξει το συγκεκριμένο αποτέλεσμα) και μεταβάλλεται η σειρά των αποτελεσμάτων προωθώντας και προτείνοντας τα αποτελέσματα που είναι πιο σχετικά με το νέο σύνολο πληροφορίας. Ένα άλλο πρόβλημα που πρέπει να αντιμετωπιστεί κατά την υποβολή ερωτημάτων από τους χρήστες σε μια μηχανή αναζήτησης είναι ότι τα ερωτήματα που υποβάλλονται στις μηχανές αναζήτησης είναι συνήθως μικρά σε αριθμό λέξεων και αμφίσημα. Συνεπώς, πρέπει να υπάρχουν τρόποι αποσαφήνισης των διαφορετικών εννοιών των όρων αναζήτησης και εύρεσης της έννοιας που ενδιαφέρει τον χρήστη. Η αποσαφήνιση των όρων αναζήτησης είναι μια διαδικασία που έχει μελετηθεί στην βιβλιογραφία με αρκετούς διαφορετικούς τρόπους. Στην διατριβή μου προτείνω νέες στρατηγικές αποσαφήνισης των εννοιών των όρων αναζήτησης των μηχανών αναζήτησης και εξερευνάται η αποδοτικότητά τους στις μηχανές αναζήτησης. Η καινοτομία τους έγκειται στη χρήση του Page-Rank σαν ενδείκτη της σημαντικότητας μιας έννοιας για έναν όρο του ερωτήματος. Επίσης είναι ευρέως γνωστό ότι ο Παγκόσμιος Ιστός περιέχει έγγραφα με την ίδια πληροφορία και έγγραφα με σχεδόν ίδια πληροφορία. Παρά τις προσπάθειες των μηχανών αναζήτησης με αλγόριθμους εύρεσης των κειμένων που περιέχουν επικαλυπτόμενη πληροφορία, ακόμα υπάρχουν περιπτώσεις που τα κείμενα που ανακτώνται από μια μηχανή αναζήτησης περιέχουν επαναλαμβανόμενη πληροφορία. Στην διατριβή αυτή παρουσιάζονται αποδοτικές τεχνικές εύρεσης και περικοπής της επικαλυπτόμενης πληροφορίας από τα αποτελέσματα των μηχανών αναζήτησης χρησιμοποιώντας τις σημασιολογικές πληροφορίες των αποτελεσμάτων των μηχανών αναζήτησης. Συγκεκριμένα αναγνωρίζονται τα αποτελέσματα που περιέχουν την ίδια πληροφορία και απομακρύνονται, ενώ ταυτόχρονα τα αποτελέσματα που περιέχουν επικαλυπτόμενη πληροφορία συγχωνεύονται σε νέα κείμενα(SuperTexts) που περιέχουν την πληροφορία των αρχικών αποτελεσμάτων χωρίς να υπάρχει επαναλαμβανόμενη πληροφορία. Ένας άλλος τρόπος βελτίωσης της αναζήτησης είναι ο σχολιασμός των κειμένων αναζήτησης έτσι ώστε να περιγράφεται καλύτερα η πληροφορία τους. Ο σχολιασμός κειμένων(text annotation) είναι μια τεχνική η οποία αντιστοιχίζει στις λέξεις του κειμένου επιπλέον πληροφορίες όπως η έννοια που αντιστοιχίζεται σε κάθε λέξη με βάση το εννοιολογικό περιεχόμενο του κειμένου. Η προσθήκη επιπλέον σημασιολογικών πληροφοριών σε ένα κείμενο βοηθάει τις μηχανές αναζήτησης να αναζητήσουν καλύτερα τις πληροφορίες που ενδιαφέρουν τους χρήστες και τους χρήστες να βρουν πιο εύκολα τις πληροφορίες που αναζητούν. Στην διατριβή αυτή αναλύονται αποδοτικές τεχνικές αυτόματου σχολιασμού κειμένων από τις οντότητες που περιέχονται στην Wikipedia, μια διαδικασία που αναφέρεται στην βιβλιογραφία ως Wikification. Με τον τρόπο αυτό οι χρήστες μπορούν να εξερευνήσουν επιπλέον πληροφορίες για τις οντότητες που περιέχονται στο κείμενο που τους επιστρέφεται. Ένα άλλο τμήμα της διατριβής αυτής προσπαθεί να εκμεταλλευτεί την σημασιολογία των αποτελεσμάτων των μηχανών αναζήτησης χρησιμοποιώντας εργαλεία του Σημασιολογικού Ιστού. Ο στόχος του Σημασιολογικού Ιστού (Semantic Web) είναι να κάνει τους πόρους του Ιστού κατανοητούς και στους ανθρώπους και στις μηχανές. Ο Σημασιολογικός Ιστός στα πρώτα βήματά του λειτουργούσε σαν μια αναλυτική περιγραφή του σώματος των έγγραφων του Ιστού. Η ανάπτυξη εργαλείων για την αναζήτηση σε Σημασιολογικό Ιστό είναι ακόμα σε πρώιμο στάδιο. Οι σημερινές τεχνικές αναζήτησης δεν έχουν προσαρμοστεί στην δεικτοδότηση και στην ανάκτηση σημασιολογικής πληροφορίας εκτός από μερικές εξαιρέσεις. Στην έρευνά μας έχουν δημιουργηθεί αποδοτικές τεχνικές και εργαλεία χρήσης του Παγκόσμιου Ιστού. Συγκεκριμένα έχει κατασκευαστεί αλγόριθμος μετατροπής ενός κειμένου σε οντολογία ενσωματώνοντας την σημασιολογική και συντακτική του πληροφορία έτσι ώστε να επιστρέφονται στους χρήστες απαντήσεις σε ερωτήσεις φυσικής γλώσσας. Επίσης στην διατριβή αυτή αναλύονται τεχνικές φιλτραρίσματος XML εγγράφων χρησιμοποιώντας σημασιολογικές πληροφορίες. Συγκεκριμένα παρουσιάζεται ένα αποδοτικό κατανεμημένο σύστημα σημασιολογικού φιλτραρίσματος XML εγγράφων που δίνει καλύτερα αποτελέσματα από τις υπάρχουσες προσεγγίσεις. Τέλος, στα πλαίσια αυτής της διδακτορικής διατριβής γίνεται επιπλέον έρευνα για την βελτίωση της απόδοσης των μηχανών αναζήτησης από μια διαφορετική οπτική γωνία. Στην κατεύθυνση αυτή παρουσιάζονται τεχνικές περικοπής ανεστραμμένων λιστών ανεστραμμένων αρχείων. Επίσης επιτυγχάνεται ένας συνδυασμός των προτεινόμενων τεχνικών με υπάρχουσες τεχνικές συμπίεσης ανεστραμμένων αρχείων πράγμα που οδηγεί σε καλύτερα αποτελέσματα συμπίεσης από τα ήδη υπάρχοντα. / The tremendous growth of the Web in the recent decades has made the searching for information as one of the most important issues in research in Computer Technologies. Today, modern search engines respond quite well to the user queries, but the results are not always relative to the data the user is looking for. Therefore, search engines are making significant efforts to rank the most relevant query results to the user in the top results of the ranking list. This work mainly deals with this problem, the ranking of the relevant results to the user in the top of the ranking list even when the queries contain multiple meanings. In the context of this research, algorithms and techniques were constructed based on the technique of relevance feedback which improves the results returned by a search engine. Main source of feedback are the results which the users selects during the navigation process. The user extends the original information (search keywords) with new information derived from the results that chooses. Having a new set of information concerning to the user's preferences, the relevancy of this information is compared with the other results (those returned before choosing this effect) and change the order of the results by promoting and suggesting the results that are more relevant to the new set of information. Another problem that must be addressed when the users submit queries to the search engines is that the queries are usually small in number of words and ambiguous. Therefore, there must be ways to disambiguate the different concepts/senses and ways to find the concept/sense that interests the user. Disambiguation of the search terms is a process that has been studied in the literature in several different ways. This work proposes new strategies to disambiguate the senses/concepts of the search terms and explore their efficiency in search engines. Their innovation is the use of PageRank as an indicator of the importance of a sense/concept for a query term. Another technique that exploits semantics in our work is the use of text annotation. The use of text annotation is a technique that assigns to the words of the text extra information such as the meaning assigned to each word based on the semantic content of the text. Assigning additional semantic information in a text helps users and search engines to seek or describe better the text information. In my thesis, techniques for improving the automatic annotation of small texts with entities from Wikipedia are presented, a process that referred in the literature as Wikification. It is widely known that the Web contain documents with the same information and documents with almost identical information. Despite the efforts of the search engine’s algorithms to find the results that contain repeated information; there are still cases where the results retrieved by a search engine contain repeated information. In this work effective techniques are presented that find and cut the repeated information from the results of the search engines. Specifically, the results that contain the same information are removed, and the results that contain repeated information are merged into new texts (SuperTexts) that contain the information of the initial results without the repeated information. Another part of this work tries to exploit the semantic information of search engine’s results using tools of the Semantic Web. The goal of the Semantic Web is to make the resources of the Web understandable to humans and machines. The Semantic Web in their first steps functioned as a detailed description of the body of the Web documents. The development of tools for querying Semantic Web is still in its infancy. The current search techniques are not adapted to the indexing and retrieval of semantic information with a few exceptions. In our research we have created efficient techniques and tools for using the Semantic Web. Specifically an algorithm was constructed that converts to ontology the search engine’s results integrating semantic and syntactic information in order to answer natural language questions. Also this paper contains XML filtering techniques that use semantic information. Specifically, an efficient distributed system is proposed for the semantic filtering of XML documents that gives better results than the existing approaches. Finally as part of this thesis is additional research that improves the performance of the search engines from a different angle. It is presented a technique for cutting the inverted lists of the inverted files. Specifically a combination of the proposed technique with existing compression techniques is achieved, leading to better compression results than the existing ones.
10

Προηγμένες τεχνικές και αλγόριθμοι εξόρυξης γνώσης για την προσωποποίηση της πρόσβασης σε δικτυακούς τόπους / Advanced techniques and algorithms of knowledge mining from Web Sites

Γιαννακούδη, Θεοδούλα 16 May 2007 (has links)
Η προσωποποίηση του ιστού είναι ένα πεδίο που έχει κερδίσει μεγάλη προσοχή όχι μόνο στην ερευνητική περιοχή, όπου πολλές ερευνητικές μονάδες έχουν ασχοληθεί με το πρόβλημα από διαφορετικές μεριές, αλλά και στην επιχειρησιακή περιοχή, όπου υπάρχει μία ποικιλία εργαλείων και εφαρμογών που διαθέτουν ένα ή περισσότερα modules στη διαδικασία της εξατομίκευσης. Ο στόχος όλων αυτών είναι, εξερευνώντας τις πληροφορίες που κρύβονται στα logs του εξυπηρετητή δικτύου να ανακαλύψουν τις αλληλεπιδράσεις μεταξύ των επισκεπτών των ιστότοπων και των ιστοσελίδων που περιέχονται σε αυτούς. Οι πληροφορίες αυτές μπορούν να αξιοποιηθούν για τη βελτιστοποίηση των δικτυακών τόπων, εξασφαλίζοντας έτσι αποτελεσματικότερη πλοήγηση για τον επισκέπτη και διατήρηση του πελάτη στην περίπτωση του επιχειρηματικού τομέα. Ένα βασικό βήμα πριν την εξατομίκευση αποτελεί η εξόρυξη χρησιμοποίησης από τον ιστό, ώστε να αποκαλυφθεί τη γνώση που κρύβεται στα log αρχεία ενός web εξυπηρετητή. Εφαρμόζοντας στατιστικές μεθόδους και μεθόδους εξόρυξης δεδομένων στα web log δεδομένα, μπορούν να προσδιοριστούν ενδιαφέροντα πρότυπα που αφορούν τη συμπεριφορά πλοήγησης των χρηστών, όπως συστάδες χρηστών και σελίδων και πιθανές συσχετίσεις μεταξύ web σελίδων και ομάδων χρηστών. Τα τελευταία χρόνια, γίνεται μια προσπάθεια συγχώνευσης του περιεχομένου του ιστού στη διαδικασία εξόρυξης χρησιμοποίησης, για να επαυξηθεί η αποτελεσματικότητα της εξατομίκευσης. Το ενδιαφέρον σε αυτή τη διπλωματική εργασία εστιάζεται στο πεδίο της εξόρυξης γνώσης για τη χρησιμοποίηση δικτυακών τόπων και πώς η διαδικασία αυτή μπορεί να επωφεληθεί από τα χαρακτηριστικά του σημασιολογικού ιστού. Αρχικά, παρουσιάζονται τεχνικές και αλγόριθμοι που έχουν προταθεί τα τελευταία χρόνια για εξόρυξη χρησιμοποίησης από τα log αρχεία των web εξυπηρετητών. Έπειτα εισάγεται και ο ρόλος του περιεχομένου στη διαδικασία αυτή και παρουσιάζονται δύο εργασίες που λαμβάνουν υπόψη και το περιεχόμενο των δικτυακών τόπων: μία τεχνική εξόρυξης χρησιμοποίησης με βάση το PLSA, η οποία δίνει στο τέλος και τη δυνατότητα ενοποίησης του περιεχομένου του ιστού και ένα σύστημα προσωποποίησης το οποίο χρησιμοποιεί το περιεχόμενο του ιστοτόπου για να βελτιώσει την αποτελεσματικότητα της μηχανής παραγωγής προτάσεων. Αφού αναλυθεί θεωρητικά το πεδίο εξόρυξης γνώσης από τα logs μέσα από την περιγραφή των σύγχρονων τεχνικών, προτείνεται το σύστημα ORGAN-Ontology-oRiented usaGe ANalysis- το οποίο αφορά στη φάση της ανάλυσης των log αρχείων και την εξόρυξη γνώσης για τη χρησιμοποίηση των δικτυακών τόπων με άξονα τη σημασιολογία του ιστοτόπου. Τα σημασιολογικά χαρακτηριστικά του δικτυακού τόπου έχουν προκύψει με τεχνικές εξόρυξης δεδομένων από το σύνολο των ιστοσελίδων και έχουν σχολιαστεί από μία OWL οντολογία. Το ORGAN παρέχει διεπαφή για την υποβολή ερωτήσεων σχετικών με την επισκεψιμότητα και τη σημασιολογία των σελίδων, αξιοποιώντας τη γνώση για το site, όπως αναπαρίσταται πάνω στην οντολογία. Περιγράφεται διεξοδικά ο σχεδιασμός, η ανάπτυξη και η πειραματική αξιολόγηση του συστήματος και σχολιάζονται τα αποτελέσματα του. / Web personalization is a domain which has gained great momentum not only in the research area, where many research units have addressed the problem form different perspectives, but also in the industrial area, where a variety of modules for the personalization process is available. The objective is, researching the information hidden in the web server log files to discover the interactions between web sites visitors and web sites pages. This information can be further exploited for web sites optimization, ensuring more effective navigation for the user and client retention in the industrial case. A primary step before the personalization is the web usage mining, where the knowledge hidden in the log files is revealed. Web usage mining is the procedure where the information stored in the Web server logs is processed by applying statistical and data mining techniques such as clustering, association rules discovery, classification, and sequential pattern discovery, in order to reveal useful patterns that can be further analyzed. Recently, there has been an effort to incorporate Web content in the web usage mining process, in order to enhance the effectiveness of personalization. The interest in this thesis is focused on the domain of the knowledge mining for usage of web sites and how this procedure can get the better of attributes of the semantic web. Initially, techniques and algorithms that have been proposed lately in the field of web usage mining are presented. After, the role of the context in the usage mining process is introduced and two relevant works are presented: a usage mining technique based on the PLSA model, which may integrate attributes of the site content, and a personalization system which uses the site content in order to enhance a recommendation engine. After analyzing theoretically the usage mining domain, a new system is proposed, the ORGAN, which is named after Ontology-oRiented usaGe ANalysis. ORGAN concerns the stage of log files analysis and the domain of knowledge mining for the web site usage based on the semantic attributes of the web site. The web site semantic attributes have resulted from the web site pages applying data mining techniques and have been annotated by an OWL ontology. ORGAN provides an interface for queries submission concerning the average level of visitation and the semantics of the web site pages, exploiting the knowledge for the site, as it is derived from the ontology. There is an extensive description of the design, the development and the experimental evaluation of the system.

Page generated in 0.4275 seconds