• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 15
  • Tagged with
  • 15
  • 14
  • 7
  • 5
  • 5
  • 5
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Ηλεκτρονικές κοινότητες μάθησης

Ρήγκου, Ευαγγελία 31 July 2007 (has links)
Ηλεκτρονικές κοινότητες μάθησης και υπηρεσίες εξατομίκευσης / E-learning communities and personalization
2

Διαδραστική εξατομίκευση ιστοσελίδων / Adaptive site customization

Τζέκου, Παρασκευή 14 November 2007 (has links)
Η εκρηκτική αύξηση του μεγέθους των δεδομένων που είναι διαθέσιμα στο Δίκτυο καθώς και η ποικιλία των εργασιών οι οποίες μπορούν να πραγματοποιηθούν μέσω του Δικτύου έχουν αυξήσει σημαντικά την νομισματική αξία της κίνησης στο Δίκτυο. Για να κερδίσουν από αυτή την αναπτυσσόμενη αγορά, οι διαχειριστές ιστοσελίδων προσπαθούν να αυξήσουν την κίνηση χρηστών στην ιστοσελίδα τους, διαμορφώνοντάς τη κατάλληλα έτσι ώστε να ικανοποιεί τις ανάγκες συγκεκριμένων χρηστών. Η διαμόρφωση και η παραμετροποίηση των ιστοσελίδων παρουσιάζει δύο μεγάλες προκλήσεις: την αποτελεσματική αναγνώριση των ενδιαφερόντων κάθε χρήστη και την ενσωμάτωση των ενδιαφερόντων του στην παρουσίαση και στο περιεχόμενο της ιστοσελίδας. Σε αυτή την εργασία μελετάται ο τρόπος με τον οποίο μπορούμε να αναγνωρίσουμε με ακρίβεια τα ενδιαφέροντα ενός χρήστη χρησιμοποιώντας τα μοτίβα πλοήγησης και παρουσιάζεται ένας καινοτόμος μηχανισμός προτάσεων ο οποίος εφαρμόζει τεχνικές εξόρυξης στο Δίκτυο για να πραγματοποιήσει τη συσχέτιση μεταξύ των ενδιαφερόντων του χρήστη και του περιεχομένου και της δομής της ιστοσελίδας. Στόχος της τεχνικής που παρουσιάζεται είναι να παραμετροποιηθεί η σελίδα για κάθε συγκεκριμένο χρήστη με βάση τα ενδιαφέροντά του. Η πειραματική αξιολόγηση αποδεικνύει ότι είναι δυνατόν να συμπεράνουμε με ακρίβεια τα ενδιαφέροντα ενός χρήστη από την συμπεριφορά του κατά την πλοήγηση και ότι ο μηχανισμός προτάσεων, ο οποίος χρησιμοποιεί τα συμπεράσματα για τα ενδιαφέροντα του χρήστη, έχει σαν αποτέλεσμα σημαντικές βελτιώσεις στη λειτουργικότητα μιας ιστοσελίδας. / The explosive growth of online data and the diversity of goals that may be pursued over the web have significantly increased the monetary value of the web traffic. To tap into this accelerating market, web site operators try to increase their traffic by customizing their sites to the needs of specific users. Web site customization involves two great challenges: the effective identification of the user interests and the encapsulation of those interests into the sites’ presentation and content. In this paper, we study how we can effectively detect the user interests that are hidden behind navigational patterns and we introduce a novel recommendation mechanism that employs web mining techniques for correlating the identified interests to the sites’ semantic content, in order to customize them to specific users. Our experimental evaluation shows that the user interests can be accurately detected from their navigational behavior and that our recommendation mechanism, which uses the identified interests, yields significant improvements in the sites’ usability.
3

Αποδοτικοί αλγόριθμοι εξατομίκευσης βασισμένοι σε εξόρυξη γνώσης απο δεδομένα χρήσης Web / Effective personalization algorithms based on Web usage mining

Ρήγκου, Μαρία 25 June 2007 (has links)
Το Web αποτελεί πλέον µια τεράστια αποθήκη πληροφοριών και συνεχίζει να µεγαλώνει εκθετικά, ενώ η ανθρώπινη ικανότητα να εντοπίζει, να επεξεργάζεται και να αντιλαµβάνεται τις πληροφορίες παραµένει πεπερασµένη. Το πρόβληµα στις µέρες µας δεν είναι η πρόσβαση στην πληροφορία, αλλά το ότι όλο και περισσότεροι άνθρωποι µε διαφορετικές ανάγκες και προτιµήσεις πλοηγούνται µέσα σε περίπλοκες δοµές Web χάνοντας στην πορεία το στόχο της αναζήτησής τους. Η εξατοµίκευση, µια πολυσυλλεκτική ερευνητική περιοχή, αποτελεί µια από τις πιο πολλά υποσχόµενες προσεγγίσεις για τη λύση του προβλήµατος του πληροφοριακού υπερφόρτου, παρέχοντας κατάλληλα προσαρµοσµένες εµπειρίες πλοήγησης. Η διατριβή εξετάζει αλγοριθµικά θέµατα που σχετίζονται µε την υλοποίηση αποδοτικών σχηµάτων εξατοµίκευσης σε περιβάλλον web, βασισµένων σε εξόρυξη γνώσης από δεδοµένα χρήσης web. Οι τεχνικές ανακάλυψης προτύπων που µελετώνται περιλαµβάνουν το clustering, την εξόρυξη κανόνων συσχέτισης και την ανακάλυψη σειριακών προτύπων, ενώ οι προτεινόµενες λύσεις εξατοµίκευσης που βασίζονται στις δύο τελευταίες τεχνικές συνδυάζουν τα δεδοµένα χρήσης µε δεδοµένα περιεχοµένου και δοµής. Ειδικότερα, στο πρώτο κεφάλαιο της διατριβής, ορίζεται το επιστηµονικό πεδίο των σύγχρονων τεχνολογιών εξατοµίκευσης στο περιβάλλον του web, εστιάζοντας στη στενή σχέση τους µε το χώρο του web mining, στοιχειοθετώντας µε αυτό τον τρόπο το γενικότερο πλαίσιο αναφοράς. Στη συνέχεια, περιγράφονται τα διαδοχικά στάδια της τυπικής διαδικασίας εξατοµίκευσης µε έµφαση στη φάση ανακάλυψης προτύπων και τις τεχνικές machine learning που χρησιµοποιούνται σε δεδοµένα χρήσης web και το κεφάλαιο ολοκληρώνεται µε µια συνοπτική περιγραφή της συµβολής της διατριβής στο πεδίο της εξατοµίκευσης σε περιβάλλον web. Στο δεύτερο κεφάλαιο προτείνεται ένας αλγόριθµος για εξατοµικευµένο clustering, που βασίζεται σε µια δοµή range tree που διατρέχεται σε πρώτη φάση για τον εντοπισµό των web αντικειµένων που ικανοποιούν τα ατοµικά κριτήρια του χρήστη. Στα αντικείµενα αυτά, εφαρµόζεται στη συνέχεια clustering, ώστε να είναι δυνατή η αποδοτικότερη διαχείρισή τους και να διευκολυνθεί η διαδικασία λήψης αποφάσεων από πλευράς χρήστη. O αλγόριθµος που προτείνεται αποτελεί βελτίωση του αλγόριθµου kmeans range, καθώς εκµεταλλεύεται το range tree που έχει ήδη κατασκευαστεί κατά το βήµα της εξατοµίκευσης και το χρησιµοποιεί ως τη βασική δοµή πάνω στην οποία στηρίζεται το βήµα του clustering χρησιµοποιώντας εναλλακτικά του k-means, τον αλγόριθµο k-windows. Ο συνολικός αριθµός παραµέτρων που χρησιµοποιούνται για την µοντελοποίηση των αντικειµένων υπαγορεύει και τον αριθµό των διαστάσεων του χώρου εργασίας. Η συνολική πολυπλοκότητα χρόνου του αλγορίθµου είναι ίση µε O(logd-2n+v), όπου n είναι ο συνολικός αριθµός των στοιχείων που δίνονται σαν είσοδος και v είναι το µέγεθος της απάντησης. Στο τρίτο κεφάλαιο της διατριβής προτείνεται ένα αποδοτικό σχήµα πρόβλεψης µελλοντικών δικτυακών αιτήσεων βασισµένο στην εξόρυξη σειριακών προτύπων πλοήγησης (navigation patterns) από αρχεία server log, σε συνδυασµό µε την τοπολογία των συνδέσµων του website και τη θεµατική κατηγοριοποίηση των σελίδων του. Τα µονοπάτια που ακολουθούν οι χρήστες κατά την πλοήγηση καταγράφονται, συµπληρώνονται µε τα κοµµάτια που λείπουν λόγω caching και διασπώνται σε συνόδους και σε επεισόδια, ώστε να προκύψουν σηµασιολογικά πλήρη υποσύνολά τους. Τα πρότυπα που εντοπίζονται στα επεισόδια µοντελοποιούνται µε τη µορφή n-grams και οι αποφάσεις πρόβλεψης βασίζονται στη λογική ενός µοντέλου n-gram+ που προσοµοιάζει το all Kth-τάξης µοντέλο Markov και πιο συγκεκριµένα, το επιλεκτικό µοντέλο Markov. Η υβριδική προσέγγιση που υιοθετεί το προτεινόµενο σχήµα, επιτυγχάνει 100% coverage, ενώ κατά τις πειραµατικές µετρήσεις το άνω όριο της ακρίβειας έφθασε το 71,67% στο σύνολο των προβλέψεων που επιχειρήθηκαν. Το χαρακτηριστικό του πλήρους coverage καθιστά το σχήµα κατάλληλο για συστήµατα παραγωγής συστάσεων, ενώ η ακρίβεια µπορεί να βελτιωθεί περαιτέρω αν µεγαλώσει το παράθυρο πρόβλεψης. Στο τέταρτο κεφάλαιο της διατριβής, εξετάζεται η ενσωµάτωση λειτουργιών εξατοµίκευσης στις ηλεκτρονικές µαθησιακές κοινότητες και προτείνεται ένα σύνολο από δυνατότητες εξατοµίκευσης που διαφοροποιούνται ως προς τα δεδοµένα στα οποία βασίζονται, την τεχνική εξόρυξης προτύπων που χρησιµοποιούν και την αντίστοιχη πολυπλοκότητα υλοποίησης. Οι υπηρεσίες αυτές περιλαµβάνουν: (α) εξατοµίκευση µε βάση το ρόλο του χρήστη, (β) εξατοµίκευση µε βάση το βαθµό δραστηριοποίησης του χρήστη, (γ) εξατοµίκευση µε βάση την ανακάλυψη προτύπων στα ατοµικά ιστορικά µελέτης των εκπαιδευόµενων και (δ) εξατοµίκευση µε βάση συσχετίσεις του περιεχοµένου των µαθηµάτων. / The Web has become a huge repository of information and keeps growing exponentially under no editorial control, while the human capability to find, read and understand content remains constant. Providing people with access to information is not the problem; the problem is that people with varying needs and preferences navigate through large Web structures, missing the goal of their inquiry. Web personalization is one of the most promising approaches for alleviating this information overload, providing tailored Web experiences. The present dissertation investigates algorithmic issues concerning the implementation of effective personalization scenarios in the web environment, based on web usage mining. The pattern discovery techniques deployed comprise clustering, association rule mining and sequential pattern discovery, while the proposed personalization schemas based on the latter two techniques integrate usage data with content and structure information. The first chapter introduces the scientific field of current web personalization technology, focusing on its close relation with the web mining domain, providing this way the general framework of the dissertation. Next, the typical web personalization process is described with emphasis on the pattern discovery phase along with an overview of the machine learning techniques applied on web usage data. The chapter concludes with a synoptic description of the contribution of the dissertation to web personalization research and applications domian. The second chapter introduces an algorithm for personalized clustering based on a range tree structure, used for identifying all web objects satisfying a set of predefined personal user preferences. The returned objects go through a clustering phase before reaching the end user, thus allowing more effective manipulation and supporting the decision making process. The proposed algorithm improves the k-means range algorithm, as it uses the already constructed range tree (i.e. during the personalized filtering phase) as the basic structure on which the clustering step is based, applying instead of the kmeans, the k-windows algorithm. The total number of parameters used for modeling the web objects dictates the number of dimensions of the Euclidean space representation. The time complexity of the algorithm is O(logd-2n+v), where d is the number of dimensions, n is the total number of web objects and v is the size of the answer. The third chapter proposes an effective prediction schema for web requests based on extracting sequential navigational patterns from server log files, combined with the website link structure and the thematic categorization of its content pages. The schema records the paths followed by users when browsing through the website pages, completes them with the missing parts (due to caching) and identifies sessions and episodes, so as to derive meaningful path subsets. The patterns extracted from the episodes are modeled in the form of n-grams and the prediction decisions are based on an n-gram+ model that resembles an all Kth-order Markov model and more specifically a selective Markov model. The hybrid approach adapted achieves full-coverage prediction, and reached the upper limit of 71,67% presicion when tested at an experimental setting. The full-coverage feature makes the proposed schema quite suitable for recommendation engines, while precision is further improved when using a larger prediction window. The fourth chapter examines the integration of personalized functionalities in the framework of electronic learning communities and studies the advantages derived from generating dynamic adaptations on the layout, the content as well as the learning scenarios delivered to each community student based on personal data, needs and preferences. More specifically, the chapter proposes a set of personalization functions differentiated by the data they use, the pattern discovery technique they apply and the resulting implementation complexity. These services comprise: (a) personalization based on the user role in the community, (b) personalization based on the level of user activity, (c) personalization based on discovery of association rules in the personal progress files of students, and (d) personalization based on predefined content correlations among learning topics.
4

Εξατομικευμένη αναζήτηση πληροφορίας στο διαδίκτυο

Κάπρος, Παναγιώτης 18 September 2007 (has links)
Στην παρούσα εργασία αντιμετωπίζουμε την διαδικασία εξατομικευμένης αναζήτησης από την πλευρά της σημασιολογίας και του περιεχομένου των σελίδων. Συγκεκριμένα γίνεται χρήση μιας θεματικής ιεραρχίας για την αυτόματη δημιουργία των προφίλ αναζήτησης των χρηστών και χρησιμοποιείται η ίδια ιεραρχία για τον θεματικό χαρακτηρισμό του περιεχομένου ενός κειμένου. Στηριζόμενοι σε μία συνδυασμένη ανάλυση των ενδιαφερόντων του χρήστη και των θεμάτων των σελίδων εξατομικεύουμε τα ανακτώμενα αποτελέσματα δίνοντας προτεραιότητα σε εκείνα τα αποτελέσματα τα οποία το θεματικό τους περιεχόμενο ανταποκρίνεται στο προφίλ του χρήστη. / This work discusses the process of personalized search under the view point of the semantics content of the web pages. In details, a thematic hierarchy is being used to create automatically user search profiles and the same hierarchy is being used to thematic characterize the content of documents. Based on a combined analysis of users’ interests and the thematic content of web pages, we personalize the results giving priority in those results which their thematic content response to the user profile.
5

Τεχνικές εξόρυξης γνώσης με χρήση σημασιολογιών από δεδομένα πλοήγησης χρηστών (web usage log mining) με σκοπό την εξατομίκευση δικτυακών τόπων / Knowledge extraction techniques using semantics of web usage log mining in order to personalize websites

Θεοδωρίδης, Ιωάννης-Βασίλειος 06 May 2009 (has links)
Η παρούσα Διπλωματική Εργασία μελετά το θέμα της προσωποποίησης - εξατομίκευσης δικτυακών τόπων. Αρχικά, παρουσιάζεται μια ανασκόπηση στη σχετική βιβλιογραφία όπου εντοπίζεται πληθώρα αναφορών και λύσεων -ακαδημαϊκών και εμπορικών- για το συγκεκριμένο θέμα. Στις περισσότερες από αυτές τις περιπτώσεις καταβάλλεται προσπάθεια για εξατομίκευση η οποία στηρίζεται σε δεδομένα που συλλέγονται από δηλώσεις ή ενέργειες του χρήστη, άμεσα ή έμμεσα. Όμως, η μελέτη των σχετικών άρθρων δείχνει ότι η μέχρι σήμερα επιτυχία των εγχειρημάτων αξιοποίησης δεδομένων χρήσης του ιστού (web usage data) είναι περιορισμένη. Το βασικό έλλειμμα που διαπιστώνεται είναι το γεγονός ότι η διαχείριση του περιεχομένου ενός δικτυακού τόπου συνήθως γίνεται με μηχανιστικό τρόπο, αποφεύγοντας τόσο την κατανόηση του περιεχομένου του όσο και της δομής του. Ακολούθως, στη Διπλωματική Εργασία γίνεται απόπειρα εξατομίκευσης δικτυακών τόπων με ημιαυτόματο τρόπο χρησιμοποιώντας τα αρχεία καταγραφής χρήσης ιστού ενώ ταυτόχρονα βασίζεται σε σημασιολογικές και εννοιολογικές αναλύσεις του περιεχομένου των δικτυακών τόπων. Με αυτήν τη μέθοδο υλοποιείται ένα εργαλείο που εξατομικεύει τον δικτυακό τόπο προτείνοντας στους χρήστες ιστοσελίδες με παραπλήσιο εννοιολογικό περιεχόμενο. Αυτό γίνεται δημιουργώντας την οντολογία του εκάστοτε δικτυακού τόπου και συνδυάζοντάς τη με τα δεδομένα πλοήγησης των χρηστών. / The present Diploma Dissertation attempts to study the personalization of websites. Initially, a thorough review of the relevant bibliography is presented, in which a plethora of academic and commercial reports and solutions is located regarding the subject of website personalization. In most cases, to achieve personalization, the researchers are based on data which are directly or indirectly collected by user statements or actions. However, the study of relative articles shows that there is limited success in the use of web usage data for personalization purposes. The fundamental problem lies in the fact that the comprehension of the content and the structure of a website is often neglected or even avoided. Further on, personalization of websites in a semi-automatic way is attempted using log files while it is simultaneously based in semantic and conceptual analysis of the website content. In this way, a tool is developed that personalizes websites by proposing web pages with similar conceptual content to the users. This is done by creating the ontology of the website and combining it with the users’ web usage data.
6

Μελέτη της δομής, των υπηρεσιών και των τεχνολογιών υποστήριξης των κοινωνικών δικτύων και ανάλυση εργαλείων ποσοτικής και ποιοτικής ανάπτυξης

Τσίμπου, Μαρία 09 December 2013 (has links)
Ο εικοστός πρώτος αιώνας θα μπορούσε εύκολα να χαρακτηριστεί ως τεχνολογικός αιώνας μιας και τα νέα δεδομένα μαρτυρούν αύξηση της χρήσης του ηλεκτρονικού υπολογιστή, του Διαδικτύου και κατ’ επέκταση των κοινωνικών δικτύων. Κι αυτό γιατί η επισκεψιμότητα των κοινωνικών δικτύων και η συμμετοχή σε αυτά, τόσο σε παγκόσμιο όσο και σε ελληνικό επίπεδο εκφράζεται ιδιαίτερα υψηλή. Η κοινωνική δικτύωση στο Ιντερνέτ και τα κοινωνικά δίκτυα στο web συνέβαλαν στην μεταβολή της δομής και της ανάπτυξης του Παγκόσμιου Ιστού. Στην παρούσα διπλωματική εργασία θα μελετηθούν τα κοινωνικά δίκτυα, η δομή τους, οι υπηρεσίες που παρέχουν καθώς και οι τεχνολογίες υποστήριξης τους. Επίσης, θα παρουσιαστούν οι τρόποι που επιτυγχάνεται η διαχείριση γνώσης μέσω των κοινωνικών δικτύων και θα αναλυθούν κάποια εργαλεία ποιοτικής και ποσοτικής ανάπτυξης. Η δομή της διπλωματικής εργασίας έχει ως εξής: Στο πρώτο κεφάλαιο ορίζεται η έννοια της εξατομίκευσης, της κοινωνικής δικτύωσης και παρουσιάζονται τα εξής κοινωνικά δίκτυα: My Space, Bebo, Linked In, Facebook, Twitter, YouTube.com, Google+, Friendster, Hi5, Sobees, Zokem, Gowalla, Qik. Στο δεύτερο κεφάλαιο παρουσιάζεται η ανάλυση των κοινωνικών δικτύων καθώς και οι μετρικές της ανάλυσης κοινωνικών δικτύων (μετρήσεις αναφορικά με τους κόμβους, μετρήσεις αναφορικά με τους γράφους). Στο τρίτο κεφάλαιο γίνεται αναφορά στα χαρακτηριστικά των κοινωνικών δικτύων, στους ρόλους κλειδιά εντός των κοινωνικών δικτύων (υπερβολικά κεντρικός ρόλος, ρόλος του αφανή ήρωα, ρόλος μεσάζοντα, ρόλος γεφύρωσης απομακρυσμένων ομάδων, υπερβολικά περιφερειακός ρόλος), στις υπηρεσίες, στις γλωσσικές ιδιότητες, καθώς και στους τομείς που εφαρμόζονται (εκπαιδευτικές, επιχειρηματικές, κυβερνητικές, ιατρικές εφαρμογές, εφαρμογές γνωριμιών). Στο τέταρτο κεφάλαιο παρουσιάζονται οι κίνδυνοι που ελλοχεύουν από την χρήση των κοινωνικών δικτύων. Η χρησιμοποίηση των προσωπικών δεδομένων των χρηστών με διαφόρους τρόπους, η αποπλάνηση ανηλίκων μέσω δημιουργίας ψεύτικων προφίλ, η κλοπή της ταυτότητας και των στοιχείων του λογαριασμού, η μετάδοση ιών, η αποστολή ανεπιθύμητης αλληλογραφίας, καθώς και η προσωποποιημένη επίθεση (phishing) είναι μερικοί από τους κίνδυνους που παρουσιάζονται από την χρήση των κοινωνικών δικτύων.Στο πέμπτο κεφάλαιο παρουσιάζεται εκτενέστερα το κοινωνικό δίκτυο Facebook, τα χαρακτηριστικά του και οι τεχνολογίες υλοποίησής τους. Γίνεται αναφορά στον τρόπο υλοποίησης της υπηρεσίας Chat με την χρήση του πρωτοκόλλου XMPP, Jabber ID. Επίσης, γίνεται αναφορά στο πρωτόκολλο επικοινωνίας IPv6, στην απόδοση διευθύνσεων, στις βελτιώσεις σε σχέση με το IPV4 κτλ. Στο έκτο κεφάλαιο εξετάζεται το λογισμικό για την ανάλυση των κοινωνικών δικτύων. Παρουσιάζονται κάποια εργαλεία ποσοτικής και ποιοτικής μέτρησης των κοινωνικών δικτύων, όπως το UCINET, Pajek, NetMiner II, STRUCTURE, MultiNet, και StOCNET. / The twenty-first century could easily be described as a century when great advance in technology was accomplished and facts reveal the increasing use of computer, internet and social networks. This is because the traffic of social networks and participation in them, both globally and also in Greece is expressed in very high level. Social networking on the Internet and social networks on the web helped to change the structure and development of the World Wide Web. This diploma will study social networks, their structure, the services they provide and their supporting technologies. Moreover, the ways that knowledge management is achieved through social networks will be presented and some tools for qualitative and quantitative growth will be analyzed. The structure of the thesis is as follows: The first chapter defines the concept of personalization, social networking and presents the following social networks: My Space, Bebo, Linked In, Facebook, Twitter, YouTube.com, Google+, Friendster, Hi5, Sobees, Zokem, Gowalla, Qik. The second chapter presents the analysis of social networks and the metrics of social network analysis (measurements with respect to the nodes, measurements regarding graphs). The third chapter refers to the features of social networks, to key roles within social networks (too central role, the role of silent hero role, intermediary role, role bridging remote teams, too peripheral role), services, language properties and applied fields (ex. education, business, government, medical applications, acquaintances). The fourth chapter describes the hazards posed through social networks. The use of personal data in different ways, the seduction of children by creating false profiles, identity and account information theft, transmission of viruses, spamming, 6 and personalized phishing attack are some of the dangers presented by the use of social networks. The fifth chapter presents in more detail the social network Facebook, the features and technologies implemented. This refers to how the Chat service is implemented using the protocol XMPP, Jabber ID. Reference is also made to the communication protocol IPv6, the addressing, the improvements over the IPV4 etc. The sixth chapter discusses the software for the analysis of social networks. It presents some quantitative and qualitative measurement of social networks such as UCINET, Pajek, NetMiner II, STRUCTURE, MultiNet, and StOCNET.
7

Αλγόριθμοι και τεχνικές εξατομικευμένης αναζήτησης σε διαδικτυακά περιβάλλοντα με χρήση υποκείμενων σημασιολογιών

Πλέγας, Ιωάννης 06 December 2013 (has links)
Η τεράστια ανάπτυξη του Παγκόσμιου Ιστού τις τελευταίες δεκαετίες έχει αναδείξει την αναζήτηση πληροφοριών ως ένα από τα πιο σημαντικά ζητήματα στον τομέα της έρευνας στις Τεχνολογίες της Πληροφορικής. Σήμερα, οι σύγχρονες μηχανές αναζήτησης απαντούν αρκετά ικανοποιητικά στα ερωτήματα των χρηστών, αλλά τα κορυφαία αποτελέσματα που επιστρέφονται δεν είναι πάντα σχετικά με τα δεδομένα που αναζητά ο χρήστης. Ως εκ τούτου, οι μηχανές αναζήτησης καταβάλλουν σημαντικές προσπάθειες για να κατατάξουν τα πιο σχετικά αποτελέσματα του ερωτήματος ως προς τον χρήστη στα κορυφαία αποτελέσματα της λίστας κατάταξης των αποτελεσμάτων. Η διατριβή αυτή ασχολείται κυρίως με το παραπάνω πρόβλημα, δηλαδή την κατάταξη στις υψηλότερες θέσεις των πιο σχετικών αποτελεσμάτων ως προς τον χρήστη (ειδικά για ερωτήματα που οι όροι τους έχουν πολλαπλές σημασίες). Στο πλαίσιο της παρούσας έρευνας κατασκευάστηκαν αλγόριθμοι και τεχνικές που βασίζονται στην τεχνική της σχετικής ανατροφοδότησης (relevance feedback) για την βελτίωση των αποτελεσμάτων που επιστρέφονται από μια μηχανή αναζήτησης. Βασική πηγή της ανατροφοδότησης ήταν τα αποτελέσματα που επιλέγουν οι χρήστες κατά την διαδικασία πλοήγησης. Ο χρήστης επεκτείνει την αρχική πληροφορία αναζήτησης (λέξεις κλειδιά) με νέα πληροφορία που προέρχεται από τα αποτελέσματα που διαλέγει. Έχοντας ένα νέο σύνολο πληροφορίας που αφορά τις προτιμήσεις του χρήστη, συγκρίνεται η σημασιολογική πληροφορία του συνόλου αυτού με τα υπόλοιπα αποτελέσματα (αυτά που επιστράφηκαν πριν επιλέξει το συγκεκριμένο αποτέλεσμα) και μεταβάλλεται η σειρά των αποτελεσμάτων προωθώντας και προτείνοντας τα αποτελέσματα που είναι πιο σχετικά με το νέο σύνολο πληροφορίας. Ένα άλλο πρόβλημα που πρέπει να αντιμετωπιστεί κατά την υποβολή ερωτημάτων από τους χρήστες σε μια μηχανή αναζήτησης είναι ότι τα ερωτήματα που υποβάλλονται στις μηχανές αναζήτησης είναι συνήθως μικρά σε αριθμό λέξεων και αμφίσημα. Συνεπώς, πρέπει να υπάρχουν τρόποι αποσαφήνισης των διαφορετικών εννοιών των όρων αναζήτησης και εύρεσης της έννοιας που ενδιαφέρει τον χρήστη. Η αποσαφήνιση των όρων αναζήτησης είναι μια διαδικασία που έχει μελετηθεί στην βιβλιογραφία με αρκετούς διαφορετικούς τρόπους. Στην διατριβή μου προτείνω νέες στρατηγικές αποσαφήνισης των εννοιών των όρων αναζήτησης των μηχανών αναζήτησης και εξερευνάται η αποδοτικότητά τους στις μηχανές αναζήτησης. Η καινοτομία τους έγκειται στη χρήση του Page-Rank σαν ενδείκτη της σημαντικότητας μιας έννοιας για έναν όρο του ερωτήματος. Επίσης είναι ευρέως γνωστό ότι ο Παγκόσμιος Ιστός περιέχει έγγραφα με την ίδια πληροφορία και έγγραφα με σχεδόν ίδια πληροφορία. Παρά τις προσπάθειες των μηχανών αναζήτησης με αλγόριθμους εύρεσης των κειμένων που περιέχουν επικαλυπτόμενη πληροφορία, ακόμα υπάρχουν περιπτώσεις που τα κείμενα που ανακτώνται από μια μηχανή αναζήτησης περιέχουν επαναλαμβανόμενη πληροφορία. Στην διατριβή αυτή παρουσιάζονται αποδοτικές τεχνικές εύρεσης και περικοπής της επικαλυπτόμενης πληροφορίας από τα αποτελέσματα των μηχανών αναζήτησης χρησιμοποιώντας τις σημασιολογικές πληροφορίες των αποτελεσμάτων των μηχανών αναζήτησης. Συγκεκριμένα αναγνωρίζονται τα αποτελέσματα που περιέχουν την ίδια πληροφορία και απομακρύνονται, ενώ ταυτόχρονα τα αποτελέσματα που περιέχουν επικαλυπτόμενη πληροφορία συγχωνεύονται σε νέα κείμενα(SuperTexts) που περιέχουν την πληροφορία των αρχικών αποτελεσμάτων χωρίς να υπάρχει επαναλαμβανόμενη πληροφορία. Ένας άλλος τρόπος βελτίωσης της αναζήτησης είναι ο σχολιασμός των κειμένων αναζήτησης έτσι ώστε να περιγράφεται καλύτερα η πληροφορία τους. Ο σχολιασμός κειμένων(text annotation) είναι μια τεχνική η οποία αντιστοιχίζει στις λέξεις του κειμένου επιπλέον πληροφορίες όπως η έννοια που αντιστοιχίζεται σε κάθε λέξη με βάση το εννοιολογικό περιεχόμενο του κειμένου. Η προσθήκη επιπλέον σημασιολογικών πληροφοριών σε ένα κείμενο βοηθάει τις μηχανές αναζήτησης να αναζητήσουν καλύτερα τις πληροφορίες που ενδιαφέρουν τους χρήστες και τους χρήστες να βρουν πιο εύκολα τις πληροφορίες που αναζητούν. Στην διατριβή αυτή αναλύονται αποδοτικές τεχνικές αυτόματου σχολιασμού κειμένων από τις οντότητες που περιέχονται στην Wikipedia, μια διαδικασία που αναφέρεται στην βιβλιογραφία ως Wikification. Με τον τρόπο αυτό οι χρήστες μπορούν να εξερευνήσουν επιπλέον πληροφορίες για τις οντότητες που περιέχονται στο κείμενο που τους επιστρέφεται. Ένα άλλο τμήμα της διατριβής αυτής προσπαθεί να εκμεταλλευτεί την σημασιολογία των αποτελεσμάτων των μηχανών αναζήτησης χρησιμοποιώντας εργαλεία του Σημασιολογικού Ιστού. Ο στόχος του Σημασιολογικού Ιστού (Semantic Web) είναι να κάνει τους πόρους του Ιστού κατανοητούς και στους ανθρώπους και στις μηχανές. Ο Σημασιολογικός Ιστός στα πρώτα βήματά του λειτουργούσε σαν μια αναλυτική περιγραφή του σώματος των έγγραφων του Ιστού. Η ανάπτυξη εργαλείων για την αναζήτηση σε Σημασιολογικό Ιστό είναι ακόμα σε πρώιμο στάδιο. Οι σημερινές τεχνικές αναζήτησης δεν έχουν προσαρμοστεί στην δεικτοδότηση και στην ανάκτηση σημασιολογικής πληροφορίας εκτός από μερικές εξαιρέσεις. Στην έρευνά μας έχουν δημιουργηθεί αποδοτικές τεχνικές και εργαλεία χρήσης του Παγκόσμιου Ιστού. Συγκεκριμένα έχει κατασκευαστεί αλγόριθμος μετατροπής ενός κειμένου σε οντολογία ενσωματώνοντας την σημασιολογική και συντακτική του πληροφορία έτσι ώστε να επιστρέφονται στους χρήστες απαντήσεις σε ερωτήσεις φυσικής γλώσσας. Επίσης στην διατριβή αυτή αναλύονται τεχνικές φιλτραρίσματος XML εγγράφων χρησιμοποιώντας σημασιολογικές πληροφορίες. Συγκεκριμένα παρουσιάζεται ένα αποδοτικό κατανεμημένο σύστημα σημασιολογικού φιλτραρίσματος XML εγγράφων που δίνει καλύτερα αποτελέσματα από τις υπάρχουσες προσεγγίσεις. Τέλος, στα πλαίσια αυτής της διδακτορικής διατριβής γίνεται επιπλέον έρευνα για την βελτίωση της απόδοσης των μηχανών αναζήτησης από μια διαφορετική οπτική γωνία. Στην κατεύθυνση αυτή παρουσιάζονται τεχνικές περικοπής ανεστραμμένων λιστών ανεστραμμένων αρχείων. Επίσης επιτυγχάνεται ένας συνδυασμός των προτεινόμενων τεχνικών με υπάρχουσες τεχνικές συμπίεσης ανεστραμμένων αρχείων πράγμα που οδηγεί σε καλύτερα αποτελέσματα συμπίεσης από τα ήδη υπάρχοντα. / The tremendous growth of the Web in the recent decades has made the searching for information as one of the most important issues in research in Computer Technologies. Today, modern search engines respond quite well to the user queries, but the results are not always relative to the data the user is looking for. Therefore, search engines are making significant efforts to rank the most relevant query results to the user in the top results of the ranking list. This work mainly deals with this problem, the ranking of the relevant results to the user in the top of the ranking list even when the queries contain multiple meanings. In the context of this research, algorithms and techniques were constructed based on the technique of relevance feedback which improves the results returned by a search engine. Main source of feedback are the results which the users selects during the navigation process. The user extends the original information (search keywords) with new information derived from the results that chooses. Having a new set of information concerning to the user's preferences, the relevancy of this information is compared with the other results (those returned before choosing this effect) and change the order of the results by promoting and suggesting the results that are more relevant to the new set of information. Another problem that must be addressed when the users submit queries to the search engines is that the queries are usually small in number of words and ambiguous. Therefore, there must be ways to disambiguate the different concepts/senses and ways to find the concept/sense that interests the user. Disambiguation of the search terms is a process that has been studied in the literature in several different ways. This work proposes new strategies to disambiguate the senses/concepts of the search terms and explore their efficiency in search engines. Their innovation is the use of PageRank as an indicator of the importance of a sense/concept for a query term. Another technique that exploits semantics in our work is the use of text annotation. The use of text annotation is a technique that assigns to the words of the text extra information such as the meaning assigned to each word based on the semantic content of the text. Assigning additional semantic information in a text helps users and search engines to seek or describe better the text information. In my thesis, techniques for improving the automatic annotation of small texts with entities from Wikipedia are presented, a process that referred in the literature as Wikification. It is widely known that the Web contain documents with the same information and documents with almost identical information. Despite the efforts of the search engine’s algorithms to find the results that contain repeated information; there are still cases where the results retrieved by a search engine contain repeated information. In this work effective techniques are presented that find and cut the repeated information from the results of the search engines. Specifically, the results that contain the same information are removed, and the results that contain repeated information are merged into new texts (SuperTexts) that contain the information of the initial results without the repeated information. Another part of this work tries to exploit the semantic information of search engine’s results using tools of the Semantic Web. The goal of the Semantic Web is to make the resources of the Web understandable to humans and machines. The Semantic Web in their first steps functioned as a detailed description of the body of the Web documents. The development of tools for querying Semantic Web is still in its infancy. The current search techniques are not adapted to the indexing and retrieval of semantic information with a few exceptions. In our research we have created efficient techniques and tools for using the Semantic Web. Specifically an algorithm was constructed that converts to ontology the search engine’s results integrating semantic and syntactic information in order to answer natural language questions. Also this paper contains XML filtering techniques that use semantic information. Specifically, an efficient distributed system is proposed for the semantic filtering of XML documents that gives better results than the existing approaches. Finally as part of this thesis is additional research that improves the performance of the search engines from a different angle. It is presented a technique for cutting the inverted lists of the inverted files. Specifically a combination of the proposed technique with existing compression techniques is achieved, leading to better compression results than the existing ones.
8

Μελέτη ατομοκεντρικών επικοινωνιών

Χριστοδουλοπούλου, Επιστήμη 20 April 2011 (has links)
Αυτή η εργασία περιγράφει το όραμα των I-centric επικοινωνιών (ατομοκεντρικών) - ένα νέο παράδειγμα για μελλοντικά συστήματα τηλεπικοινωνιών. Ο κύριος στόχος αυτής της προσέγγισης είναι να εξετάσει την ανθρώπινη επικοινωνιακή συμπεριφορά. Η εργασία αυτή εστιάζει στην εννοιολογική ολοκλήρωση όλων των πτυχών των ατομοκεντρικών επικοινωνιών. Εξετάζοντας την επικοινωνιακή συμπεριφορά του ανθρώπου, είναι προφανές, ότι οι άνθρωποι συχνά αλληλεπιδρούν με ένα σύνολο αντικειμένων στο περιβάλλον τους. Σύμφωνα με αυτήν την άποψη, μια προσέγγιση είναι να μη δημιουργηθούν συστήματα επικοινωνίας που βασίζονται σε εξειδικευμένες τεχνολογίες αλλά να βασίζονται στην ανάλυση του μεμονωμένου χώρου επικοινωνίας. Το αποτέλεσμα θα είναι ένα σύστημα επικοινωνιών που προσαρμόζεται στις απαιτήσεις κάθε ατόμου (ατομοκεντρικό). Το σύστημα επικοινωνιών θα ενεργεί σύμφωνα με τις απαιτήσεις του ανθρώπου, που απεικονίζουν τις πρόσφατες ενέργειές του ώστε να προσαρμόζεται αυτόματα σε αυτές. Οι ατομοκεντρικές υπηρεσίες προσαρμόζονται στους μεμονωμένους χώρους επικοινωνίας και τις καταστάσεις. Σε αυτό το πλαίσιο το «I», σημαίνει το εγώ ή το άτομο, και Centric σημαίνει προσαρμογή στις απαιτήσεις του «εγώ» και το περιβάλλον του ατόμου. Οι παραπάνω λογικές απαιτούν νοημοσύνη στην παροχή υπηρεσιών προκειμένου να προσωποποιηθούν, να προσαρμοστούν στις περιστασιακές και περιβαλλοντικές συνθήκες και να ελέγχουν το μεμονωμένο χώρο επικοινωνίας. Ένα ατομοκεντρικό σύστημα επικοινωνιών παρέχει τη νοημοσύνη που απαιτείται για τη διαμόρφωση του χώρου επικοινωνίας του κάθε ατόμου που προσαρμόζεται στα ενδιαφέροντα, το περιβάλλον, και τις προτιμήσεις του. Η εργασία εισάγει το όραμα των ατομοκεντρικών επικοινωνιών, που ακολουθείται από την ανάπτυξη ενός προτύπου αναφοράς για τις ατομοκεντρικές επικοινωνίες. Από τη στιγμή που το όραμα και το πρότυπο αναφοράς είναι γενικές έννοιες, εισάγεται στη συνέχεια ένα αρχιτεκτονικό πλαίσιο για τις ατομοκεντρικές επικοινωνίες. Αυτό το πλαίσιο χρησιμοποιείται για να σχεδιαστεί και να υλοποιηθεί ένα ατομοκεντρικό σύστημα επικοινωνιών. / This thesis describes the vision of I-centric communications – a new paradigm for future telecommunication systems. The main objective of this approach is to consider the human communication behaviour. The focus of this thesis is on the conceptual integration of all aspects of I-centric communications. Looking at the communication behaviour of human, it is obvious, that human beings frequently interact with a set of objects in their environment. Following this view, a new approach is not to build communication systems based on specific technologies, but on the analysis of the individual communication space. The result is a communication system that adapts to the demands of each individual (I-centric). The communication system will act on behalf of human’s demands, reflecting recent actions to enable self-adaptation. I-centric Services adapt to individual communication spaces and situations. In this context ‘I’ means I, or individual, ‘Centric’ means adaptable to I requirements and the individual’s environment. The rationales above require intelligence in service provisioning in order to personalize, adapt to situational and environmental conditions, to monitor and to control the individual communication space. I-centric communications system will provide the intelligence required for modelling the communication space of each individual adapting to its interests, environment, and preferences. The thesis introduces the vision of I-centric communications, followed by the development of a reference model for I-centric communications. Since both, the vision and the reference model, are general, an architectural framework for I-centric communications is introduced later on. This framework is used to design and implement an I-centric communications system.
9

Σχεδιασμός κι ανάπτυξη εξατομικευμένου και προσαρμοστικού συστήματος ηλεκτρονικής μάθησης, το μέλλον των Learning Management Systems / Design and development of a personalized and adaptive e-learning system, the future of Learning Management Systems

Σκουληκάρη, Αριάδνη - Ειρήνη 12 June 2015 (has links)
Τα τελευταία χρόνια η αυξανόμενη σημασία της πληροφορίας και της συνεχιζόμενης μάθησης έχει καταστήσει τη χρήση των τεχνολογιών πληροφορικής και επικοινωνιών (Τ.Π.Ε.) στην εκπαίδευση καθώς και την εξ αποστάσεως εκπαίδευση μέσω e-learning συστημάτων, ως επιτακτική ανάγκη. Το κυριότερο πλεονέκτημα των e-learning συστημάτων είναι ότι παρέχουν τη δυνατότητα στον κόσμο να παρακολουθήσει ένα μάθημα, ακόμα κι ένα ολόκληρο πρόγραμμα σπουδών εξ αποστάσεως, μέσω της σύγχρονης και παγκοσμίως πλέον διαδεδομένης μεθόδου των online courses. Τα περισσότερα μεγάλης εμβέλειας και αναγνωρισιμότητας, πανεπιστήμια του εξωτερικού προσφέρουν online μαθήματα μέσω τεχνολογιών του διαδικτύου, χρησιμοποιώντας διαφάνειες, βιντεο-διαλέξεις και online εκπαιδευτικές δραστηριότητες. Ένας τομέας όμως στον οποίο υστερεί η εκπαίδευση εξ αποστάσεως, ακόμα και στα πιο πρόσφατα ανεπτυγμένα e-learning συστήματα, είναι ο τομέας της προσωποποίησης του σπουδαστή και εξατομίκευσης του συστήματος στις ανάγκες του. Η παρούσα διπλωματική εργασία παρουσιάζει τις δυνατότητες που παρέχονται από τα ήδη υπάρχοντα συστήματα e-learning, την τωρινή κατάσταση με τα παρεχόμενα online μαθήματα από πανεπιστήμια του εξωτερικού και το ερευνητικό κενό που υπάρχει σχετικά με την «προσωποποίηση» (personalization) του σπουδαστή και την προσαρμογή (adaptation) του συστήματος στις ανάγκες του. Μελετάται η μοντελοποίηση του χρήστη (user modeling), τα μαθησιακά προφίλ, ο εμπλουτισμός του προφίλ του σπουδαστή ώστε να παρέχει περισσότερες και αξιόλογες πληροφορίες, καθώς και οι δυνατότητες εξατομίκευσης του συστήματος στον εκάστοτε σπουδαστή, ώστε να επιτευχθεί η επιτάχυνση και αποτελεσματικότητα της ηλεκτρονικής μάθησης. Στα πλαίσια της παρούσας διπλωματικής εργασίας σχεδιάστηκε και υλοποιήθηκε ένα σύστημα ηλεκτρονικής μάθησης, το οποίο στηρίζεται στο λογισμικό Moodle και έχουν αναπτυχθεί σε αυτό, νέες υπηρεσίες εξατομίκευσης και προσαρμοστικότητας του συστήματος στις ανάγκες και προτιμήσεις του εκπαιδευομένου. Το Moodle LMS (Modular Object Oriented Dynamic Learning Environment) είναι ελεύθερο λογισμικό διαχείρισης εκπαιδευτικού περιεχομένου και χρησιμοποιείται από πολλά πανεπιστήμια παγκοσμίως. Είναι ευέλικτο, εύκολο στην εκμάθηση και αρκετά ασφαλές για την ασύγχρονη εκπαίδευση από απόσταση. Ενσωματώνει πληθώρα λειτουργιών και δυνατοτήτων που επιτρέπουν στο διδάσκοντα να διαμορφώσει ένα καλά οργανωμένο και ευχάριστο μάθημα με ευρεία κλίμακα δραστηριοτήτων. Στο εξατομικευμένο και προσαρμοστικό σύστημα ηλεκτρονικής μάθησης που αναπτύχθηκε, διαμορφώθηκε ένα μάθημα με πλούσιο εκπαιδευτικό υλικό, το οποίο απαρτίζουν πολλά και διαφορετικού τύπου μαθησιακά αντικείμενα (πηγές πληροφόρησης, δραστηριότητες, κ.α.). Εμπλουτίστηκε το προφίλ χρήστη με περισσότερες προσωπικές πληροφορίες γι αυτόν και στη συνέχεια αναπτύχθηκαν μαθησιακά μονοπάτια που στηρίζονται είτε στα πεδία προφίλ χρήστη, είτε στο μαθησιακό στυλ του εκπαιδευομένου, είτε σε άλλους παράγοντες που παρουσιάζονται αναλυτικά στην εργασία. Για την εξατομίκευση του συστήματος αναπτύχθηκε μία ενότητα «Pre-course test» η οποία περιλαμβάνει δύο νέες υπηρεσίες για την άντληση πληροφοριών του χρήστη, μορφωτικό υπόβαθρο, μαθησιακό στυλ, προηγούμενη γνώση στο αντικείμενο του μαθήματος κ.α. Τα αποτελέσματα που προκύπτουν από εκεί, αξιοποιούνται κατάλληλα για τη διαμόρφωση ομάδων των εκπαιδευομένων και για τις υπηρεσίες προσαρμοστικότητας του συστήματος. Επίσης, στο διαδικτυακό αυτό σύστημα ηλεκτρονικής μάθησης έχουν αναπτυχθεί μαθησιακά αντικείμενα που ενισχύουν στη συνεργατική μάθηση, βελτιώνουν την ποιότητα του μαθήματος και έτσι αυξάνεται το κίνητρο του σπουδαστή. / Nowdays, e-learning environments have become increasingly popular in educational establishments. The rapid growth of e-learning has changed traditional learning behavior and presented a new situation to both educators (lecturers) and learners (students). The majority of current e-learning systems are based on Learning Management Systems (LMS), which allow students attending courses free from space and time limitations. They can attend the class anytime they are available and regardless of the place. LMS are web-based educational systems that offer students an active role in their own education through a variety of learning activities and different kinds of learning content, that the educator has produced. Although this fact, most Learning Management Systems lack of personalization and adaptivity features. The modern trend in education is the production and organization of Massive Open Online Courses (MOOCs) from large and internationally recognized Universities. So, they focus on gathering too many people in these courses (MOOCs) and not on personalization and adaptivity. Personalization in web-based systems means “attention to the user and his needs”. Web-based systems, such as e-commerce sites, focus on personalization by observing the user, his common actions and navigation paths, in order to understand his preferences and what he is looking for. So they differentiate each individual according to his interests, preferences, and generally his “profile”. Then, they adapt the content appropriately to his needs, and the user watches first the content that may interest him. Traditional and commonly used e-learning platforms offer to their users same educational content, same learning activities and possibilities, and generally exactly the same content, with no further personalization support. Some existing open source e-Learning systems may support, under certain circumstances adaptation and personalization features, but need extension and elaboration to acquire sufficiently these characteristics. Especially in the case of distance learning, that teacher and students have no face-to-face communication, learner’s personalization is essential in order the teacher to be aware of each learner’s characteristics. In e-learning systems, personalization could be achieved with an integrated user profile (student profile), which would include except from the classic information (name, surname, email) more specific and useful information. If the teacher had more information about each student, he could be able to guide him more effectively and evaluate him more correctly. In addition to that, if teacher was aware of each learner’s profile, meaning his learning style, interests, preferences and his previous knowledge of the course topics, he would be able to adapt the learning content to his needs. That would increase student’s satisfaction, motivation and consequently his participation in the course. In this master thesis, a personalized and adaptive e-learning system has been developed. The development of this integrated personalized e-learning system, is based on a very popular open source LMS, which in this case is used for further extension and development of new features. The most suitable LMS for implementing those new features is Moodle (Modular Object-oriented Dynamic Learning Environment), due to its modularity and extensibility as well as its vast community of users. There have been added new features in order to enrich student’s profile and adjust learning material to the learner, depending on his profile and learning progress. The teacher has the ability to organize suitable learning objects and learning paths for each student, depending on particular user profile fields, learning styles and student’s performance. This personalized and adaptive e-learning system increases student’s motivation and participation.
10

Τεχνικές και συστήματα διαχείρισης γνώσης στο διαδίκτυο / Techniques and systems for knowledge management on the Web

Μαρκέλλου, Πηνελόπη 25 June 2007 (has links)
Ο Παγκόσμιος Ιστός Πληροφοριών (Web) χαρακτηρίζεται σαν ένα περιβάλλον αχανές, ετερογενές, κατανεμημένο και πολύπλοκο με αποτέλεσμα να είναι δύσκολος ο αποδοτικός χειρισμός των δεδομένων των e-εφαρμογών με βάση παραδοσιακές μεθόδους και τεχνικές. Αυτό με τη σειρά του οδηγεί στην απαίτηση για σχεδιασμό, ανάπτυξη και υιοθέτηση «ευφυών» εργαλείων που θα επιλέξουν και θα εμφανίσουν στο χρήστη την κατάλληλη πληροφορία, στον κατάλληλο χρόνο και με την κατάλληλη μορφή. Η παρούσα διδακτορική διατριβή ασχολείται με το πρόβλημα της εξόρυξης «κρυμμένης» γνώσης από συστήματα και εφαρμογές ηλεκτρονικής μάθησης (e-learning), ηλεκτρονικού εμπορίου (e-commerce) και επιχειρηματικής ευφυΐας (business intelligence) με κύριο στόχο τη βελτίωση της ποιότητας και της απόδοσης των παρεχόμενων υπηρεσιών προς τους τελικούς χρήστες. Συγκεκριμένα, τα ερευνητικά αποτελέσματα επικεντρώνονται στα ακόλουθα: α) Μεθοδολογίες, τεχνικές και προτεινόμενοι αλγόριθμοι εξόρυξης «κρυμμένης» γνώσης από e-εφαρμογές λαμβάνοντας υπόψη τη σημασιολογία των δεδομένων, β) Παραγωγή εξατομικευμένων εκπαιδευτικών εμπειριών, γ) Παραγωγή αποδοτικών συστάσεων για την αγορά online προϊόντων, δ) Παραγωγή επιστημονικών και τεχνολογικών δεικτών από διπλώματα ευρεσιτεχνίας για την ανάδειξη του επιπέδου καινοτόμου δραστηριότητας μιας αγοράς, ε) Προτάσεις για μελλοντικές ερευνητικές κατευθύνσεις που επεκτείνουν τις τεχνικές εξόρυξης γνώσης σε πιο σύνθετους τύπους εφαρμογών και αναδεικνύουν νέες ερευνητικές ευκαιρίες. Στο πρώτο κεφάλαιο παρουσιάζεται μια προσέγγιση για την υποστήριξη εξατομικευμένου e-learning όπου η δομή και η σχέση των δεδομένων και των πληροφοριών παίζουν ουσιαστικό ρόλο. Ο προτεινόμενος αλγόριθμος βασίζεται σε μια οντολογία (ontology) η οποία βοηθά στη δόμηση και στη διαχείριση του περιεχομένου που σχετίζεται με μια δεδομένη σειρά μαθημάτων, ένα μάθημα ή ένα θεματικό. Η διαδικασία χωρίζεται σε δύο στάδια: στις offline ενέργειες προετοιμασίας των δεδομένων, δημιουργίας της οντολογίας και εξόρυξης από δεδομένα χρήσης (usage mining) και στην online παροχή της εξατομίκευσης. Το σύστημα βρίσκει σε πρώτη φάση ένα αρχικό σύνολο συστάσεων βασισμένο στην οντολογία του πεδίου και στη συνέχεια χρησιμοποιεί τα frequent itemsets (συχνά εμφανιζόμενα σύνολα στοιχείων) για να το εμπλουτίσει, λαμβάνοντας υπόψη την πλοήγηση άλλων παρόμοιων χρηστών (similar users). Με τον τρόπο αυτό, μειώνουμε το χρόνο που απαιτείται για την ανάλυση όλων των frequent itemsets και των κανόνων συσχέτισης. Εστιάζουμε μόνο σε εκείνα τα σύνολα που προέρχονται από το συνδυασμό της ενεργούς συνόδου (current session) του χρήστη και των συστάσεων της οντολογίας. Επιπλέον, αυτή η προσέγγιση ανακουφίζει και το πρόβλημα των μεγάλων χρόνων απόκρισης, το οποίο μπορεί στη συνέχεια να οδηγήσει στην εγκατάλειψη του e-learning συστήματος. Αν και η εξατομίκευση απαιτεί αρκετά βήματα επεξεργασίας και ανάλυσης, το εμπόδιο αυτό αποφεύγεται με την εκτέλεση σημαντικού μέρους της διαδικασίας offline. Στο δεύτερο κεφάλαιο μελετάται το πρόβλημα της παραγωγής προτάσεων σε μια εφαρμογή e-commerce. Τα συστήματα συστάσεων (recommendations systems ή RSs) αποτελούν ίσως την πιο δημοφιλή μορφή εξατομίκευσης και τείνουν να μετατραπούν στις μέρες μας σε σημαντικά επιχειρησιακά εργαλεία. Η προτεινόμενη υβριδική προσέγγιση στοχεύει στην παραγωγή αποτελεσματικών συστάσεων για τους πελάτες ενός online καταστήματος που νοικιάζει κινηματογραφικές ταινίες. Η γνώση για τους πελάτες και τα προϊόντα προκύπτει από δεδομένα χρήσης και τη δομή της οντολογίας σε συνδυασμό με τις εκτιμήσεις-βαθμολογίες των πελατών για τις ταινίες καθώς και την εφαρμογή τεχνικών ταιριάσματος «όμοιων» πελατών. Όταν ένα ή περισσότερα κριτήρια ταιριάσματος ικανοποιούνται, τότε άλλες ταινίες μπορούν να προσδιοριστούν σύμφωνα με το οντολογικό σχήμα που έχουν παρόμοια χαρακτηριστικά με αυτές που ο πελάτης έχει ήδη νοικιάσει. Στην περίπτωση ενός νέου πελάτη όπου το ιστορικό του είναι κενό, πληροφορίες από την αίτηση εγγραφής του αναλύονται ώστε να ταξινομηθεί σε μια συγκεκριμένη κλάση πελατών και να παραχθούν προτάσεις με βάση το οντολογικό σχήμα. Αυτή η ολοκλήρωση παρέχει πρόσθετη γνώση για τις προτιμήσεις των πελατών και επιτρέπει την παραγωγή επιτυχημένων συστάσεων. Ακόμη και στην περίπτωση του «cold-start problem» όπου δεν είναι διαθέσιμη αρχική πληροφορία για τη συμπεριφορά του πελάτη, η προσέγγιση μπορεί να προβεί σε σχετικές συστάσεις. Τέλος, στο τρίτο κεφάλαιο μελετάται το πρόβλημα της εξόρυξης γνώσης από καταχωρήσεις διπλωμάτων ευρεσιτεχνίας που καταδεικνύουν το επίπεδο της καινοτόμου δραστηριότητας μιας αγοράς. Η προτεινόμενη προσέγγιση αφορά στην εφαρμογή τεχνικών Text Mining σε διπλώματα ευρεσιτεχνίας που βρίσκονται καταχωρημένα σε βάσεις δεδομένων διαφόρων διεθνών οργανισμών διαχείρισής τους, με στόχο την παραγωγή επιστημονικών και τεχνολογικών δεικτών για την ανάδειξη του επιπέδου καινοτομίας μιας αγοράς και συνεπώς την επιχειρηματική ευφυΐα. Αρχικά τα δεδομένα καθαρίζονται προκειμένου να βελτιωθεί η ποιότητά τους πριν την επεξεργασία. Στη συνέχεια εφαρμόζονται δύο τύποι επεξεργασίας η απλή ανάλυση (simple analysis) και η στατιστική ανάλυση (statistical analysis). Στην πρώτη περίπτωση παράγονται γραφήματα που συσχετίζουν τις πληροφορίες π.χ. κύριοι τομείς ανάπτυξης σε μια χώρα. Στη δεύτερη περίπτωση αναλύονται γλωσσολογικά τα πεδία title και abstract των διπλωμάτων ευρεσιτεχνίας και ομαδοποιούνται τα λήμματα των λέξεων. Στη συνέχεια πάνω στα δεδομένα εφαρμόζονται τεχνικές correspondence και clustering analysis έτσι ώστε αυτά να ομαδοποιηθούν σύμφωνα με τις τεχνολογίες στις οποίες αναφέρονται. Τα clusters πλέον αυτά προβάλλονται όπως και στην απλή ανάλυση παρέχοντας στο χρήστη μια πιο λεπτομερή απεικόνιση της πληροφορίας των διπλωμάτων ευρεσιτεχνίας. Ο συνδυασμός των αναλύσεων που εφαρμόζονται με βάση την προτεινόμενη μεθοδολογία επιτρέπει την αποτύπωση των τεχνολογικών εξελίξεων και καινοτομιών. Οι δείκτες που παράγονται είναι πολύ σημαντικοί αφού μπορούν να ποσοτικοποιήσουν τις πληροφορίες που αφορούν σε συγκεκριμένες τεχνολογίες. Με αυτό τον τρόπο μπορούμε να παράγουμε δείκτες για τη δραστηριότητα συγκεκριμένων φορέων, εφευρετών, χωρών, κλπ. Τέλος, τεχνολογικοί δείκτες που υποδεικνύουν μελλοντικές ελπιδοφόρες τεχνολογίες καθώς και ποιοι φορείς θα είναι πρωτοπόροι σε αυτές μπορούν να εξαχθούν. / The World Wide Web (Web) has been characterized as a vast, heterogeneous, distributed and complicated environment resulting in difficulties for the efficient handling of e-applications’ data with traditional methods and techniques. This leads to the requirement for designing, implementing and adopting “intelligent” tools, able to select and present to the user the suitable information, at the suitable time and in the suitable form. The present dissertation deals with the problem of mining “hidden” knowledge from systems and applications of electronic learning (e-learning), electronic commerce (e-commerce) and business intelligence (BI), aiming mainly at the improvement of quality and performance of the services provided to the end-users. Specifically, the results are focused on the following: a) Methodologies, techniques and proposed algorithms of mining hidden knowledge from e-applications taking into consideration the semantics of data, b) Production of personalized educational experiences, c) Generation of efficient recommendations for the online purchase of products, d) Discovery of scientific and technological indicators in patents that indicate the level of innovation activity of a market, e) Proposals for future research directions that extend the techniques of knowledge mining to more complex types of applications and indicate new research opportunities. The first chapter presents an approach for the support of personalized e-learning in the cases where the structure and the relation of data and information play essential role. The proposed algorithm is based on an ontology which helps in structuring and managing the content that is related with a given course, a lesson or a topic. The process is decomposed into two stages: the offline phase of data preparation, ontology creation and data usage mining and the online phase of producing personalization. The system finds a initial set of recommendations based on the ontology of the domain and then identifies a set of frequent itemsets (sets of items observed often) in order to enrich the initial recommendations, taking into consideration the navigation of other similar users. In this way, we decrease the time required for the analysis of all the frequent itemsets and association rules, by focusing only on those sets that derive from the combination of the current active session of the user and the ontology recommendations. Moreover, this approach also alleviates the problem of long response times that can lead to the abandonment of the system. Even if the personalization requires considerable steps of preparation and analysis, this obstacle is avoided with the implementation of important part of the process offline. The second chapter studies the problem of recommendations’ production in an e-commerce application. Recommendation systems or RSs constitute perhaps the most popular form of personalization and they tend to become in our days an important business tool. The proposed hybrid approach aims in the production of effective recommendations for the customers of an online shop that rents movies. The knowledge for the customers and the movies results from usage data and the structure of an ontology in combination with customer rates about the movies, as well as with the application of matching techniques for discovering similar customers. When one or more matching criteria are satisfied, then other movies can be specified according to the ontological schema that has similar characteristics with those that the customer already has rented. In the case of a new customer with no history information, data from his registration form are analyzed so that he is categorized in a specific group of customers and the recommendations are based on the ontology. This integration provides additional knowledge for the preferences of customers and allows the production of successful recommendations. Even in the case of cold-start problem where initial information on the customer’s behavior is not available, the approach can produce qualitative and relatively precise recommendations. Finally, the third chapter describes the problem of mining knowledge from patent registrations which indicate the level of innovation activity of a market. The proposed approach concerns the application of Text Mining techniques in patents retrieved from the databases of various national and international Patent Offices, aiming at the production of scientific and technological indicators of the innovation level of a market activity and consequently business intelligence. Initially, the data are cleaned in order to improve their quality before the analysis steps. Then two types of analysis are applied on the data: simple analysis and statistical analysis. In the first case, several charts are produced that connect the information e.g. main sectors of development in a country. In the second case, the title and abstract fields of the patents are linguistically analyzed and the lemmas of words are grouped. Then correspondence and clustering analysis are applied. The produced clusters are depicted as in the simple analysis providing the user with a detailed representation of patent information. The combination of analyses that are applied based on the proposed methodology allows the identification of technological evolutions and innovations. The produced indicators are very important since they can quantify the information that concerns specific technologies. In this way, we can produce indicators for the activity of specific institutions, inventors, countries, etc. Finally, technological indicators about the potential emerging technologies as well as the institutions that will be pioneers can be exported.

Page generated in 0.0471 seconds