Spelling suggestions: "subject:"προφίλ χρήση"" "subject:"προφίλ χρήσης""
1 |
Εξατομικευμένη αναζήτηση πληροφορίας στο διαδίκτυοΚάπρος, Παναγιώτης 18 September 2007 (has links)
Στην παρούσα εργασία αντιμετωπίζουμε την διαδικασία εξατομικευμένης αναζήτησης από την πλευρά της σημασιολογίας και του περιεχομένου των σελίδων. Συγκεκριμένα γίνεται χρήση μιας θεματικής ιεραρχίας για την αυτόματη δημιουργία των προφίλ αναζήτησης των χρηστών και χρησιμοποιείται η ίδια ιεραρχία για τον θεματικό χαρακτηρισμό του περιεχομένου ενός κειμένου. Στηριζόμενοι σε μία συνδυασμένη ανάλυση των ενδιαφερόντων του χρήστη και των θεμάτων των σελίδων εξατομικεύουμε τα ανακτώμενα αποτελέσματα δίνοντας προτεραιότητα σε εκείνα τα αποτελέσματα τα οποία το θεματικό τους περιεχόμενο ανταποκρίνεται στο προφίλ του χρήστη. / This work discusses the process of personalized search under the view point of the semantics content of the web pages. In details, a thematic hierarchy is being used to create automatically user search profiles and the same hierarchy is being used to thematic characterize the content of documents. Based on a combined analysis of users’ interests and the thematic content of web pages, we personalize the results giving priority in those results which their thematic content response to the user profile.
|
2 |
Μελέτη ατομοκεντρικών επικοινωνιώνΧριστοδουλοπούλου, Επιστήμη 20 April 2011 (has links)
Αυτή η εργασία περιγράφει το όραμα των I-centric επικοινωνιών (ατομοκεντρικών) - ένα νέο παράδειγμα για μελλοντικά συστήματα τηλεπικοινωνιών. Ο κύριος στόχος αυτής της προσέγγισης είναι να εξετάσει την ανθρώπινη επικοινωνιακή συμπεριφορά. Η εργασία αυτή εστιάζει στην εννοιολογική ολοκλήρωση όλων των πτυχών των ατομοκεντρικών επικοινωνιών. Εξετάζοντας την επικοινωνιακή συμπεριφορά του ανθρώπου, είναι προφανές, ότι οι άνθρωποι συχνά αλληλεπιδρούν με ένα σύνολο αντικειμένων στο περιβάλλον τους. Σύμφωνα με αυτήν την άποψη, μια προσέγγιση είναι να μη δημιουργηθούν συστήματα επικοινωνίας που βασίζονται σε εξειδικευμένες τεχνολογίες αλλά να βασίζονται στην ανάλυση του μεμονωμένου χώρου επικοινωνίας. Το αποτέλεσμα θα είναι ένα σύστημα επικοινωνιών που προσαρμόζεται στις απαιτήσεις κάθε ατόμου (ατομοκεντρικό).
Το σύστημα επικοινωνιών θα ενεργεί σύμφωνα με τις απαιτήσεις του ανθρώπου, που απεικονίζουν τις πρόσφατες ενέργειές του ώστε να προσαρμόζεται αυτόματα σε αυτές. Οι ατομοκεντρικές υπηρεσίες προσαρμόζονται στους μεμονωμένους χώρους επικοινωνίας και τις καταστάσεις. Σε αυτό το πλαίσιο το «I», σημαίνει το εγώ ή το άτομο, και Centric σημαίνει προσαρμογή στις απαιτήσεις του «εγώ» και το περιβάλλον του ατόμου. Οι παραπάνω λογικές απαιτούν νοημοσύνη στην παροχή υπηρεσιών προκειμένου να προσωποποιηθούν, να προσαρμοστούν στις περιστασιακές και περιβαλλοντικές συνθήκες και να ελέγχουν το μεμονωμένο χώρο επικοινωνίας. Ένα ατομοκεντρικό σύστημα επικοινωνιών παρέχει τη νοημοσύνη που απαιτείται για τη διαμόρφωση του χώρου επικοινωνίας του κάθε ατόμου που προσαρμόζεται στα ενδιαφέροντα, το περιβάλλον, και τις προτιμήσεις του.
Η εργασία εισάγει το όραμα των ατομοκεντρικών επικοινωνιών, που ακολουθείται από την ανάπτυξη ενός προτύπου αναφοράς για τις ατομοκεντρικές επικοινωνίες. Από τη στιγμή που το όραμα και το πρότυπο αναφοράς είναι γενικές έννοιες, εισάγεται στη συνέχεια ένα αρχιτεκτονικό πλαίσιο για τις ατομοκεντρικές επικοινωνίες. Αυτό το πλαίσιο χρησιμοποιείται για να σχεδιαστεί και να υλοποιηθεί ένα ατομοκεντρικό σύστημα επικοινωνιών. / This thesis describes the vision of I-centric communications – a new paradigm for future telecommunication systems. The main objective of this approach is to consider the human communication behaviour. The focus of this thesis is on the conceptual integration of all aspects of I-centric communications. Looking at the communication behaviour of human, it is obvious, that human beings frequently interact with a set of objects in their environment. Following this view, a new approach is not to build communication systems based on specific technologies, but on the analysis of the individual communication space. The result is a communication system that adapts to the demands of each individual (I-centric).
The communication system will act on behalf of human’s demands, reflecting recent actions to enable self-adaptation. I-centric Services adapt to individual communication spaces and situations. In this context ‘I’ means I, or individual, ‘Centric’ means adaptable to I requirements and the individual’s environment. The rationales above require intelligence in service provisioning in order to personalize, adapt to situational and environmental conditions, to monitor and to control the individual communication space. I-centric communications system will provide the intelligence required for modelling the communication space of each individual adapting to its interests, environment, and preferences.
The thesis introduces the vision of I-centric communications, followed by the development of a reference model for I-centric communications. Since both, the vision and the reference model, are general, an architectural framework for I-centric communications is introduced later on. This framework is used to design and implement an I-centric communications system.
|
3 |
Προσωποποιημένη προβολή περιεχομένου του Διαδικτύου με τεχνικές προ-επεξεργασίας, αυτόματης κατηγοριοποίησης και αυτόματης εξαγωγής περίληψηςΠουλόπουλος, Βασίλειος 22 November 2007 (has links)
Σκοπός της Μεταπτυχιακής Εργασίας είναι η επέκταση και αναβάθμιση του μηχανισμού που είχε δημιουργηθεί στα πλαίσια της Διπλωματικής Εργασίας που εκπόνησα με τίτλο «Δημιουργία Πύλης Προσωποποιημένης Πρόσβασης σε Περιεχόμενο του WWW».
Η παραπάνω Διπλωματική εργασία περιλάμβανε τη δημιουργία ενός μηχανισμού που ξεκινούσε με ανάκτηση πληροφορίας από το Διαδίκτυο (HTML σελίδες από news portals), εξαγωγή χρήσιμου κειμένου και προεπεξεργασία της πληροφορίας, αυτόματη κατηγοριοποίηση της πληροφορίας και τέλος παρουσίαση στον τελικό χρήστη με προσωποποίηση με στοιχεία που εντοπίζονταν στις επιλογές του χρήστη.
Στην παραπάνω εργασία εξετάστηκαν διεξοδικά θέματα που είχαν να κάνουν με τον τρόπο προεπεξεργασίας της πληροφορίας καθώς και με τον τρόπο αυτόματης κατηγοριοποίησης ενώ υλοποιήθηκαν αλγόριθμοι προεπεξεργασίας πληροφορίας τεσσάρων σταδίων και αλγόριθμος αυτόματης κατηγοριοποίησης βασισμένος σε πρότυπες κατηγορίες.
Τέλος υλοποιήθηκε portal το οποίο εκμεταλλευόμενο την επεξεργασία που έχει πραγματοποιηθεί στην πληροφορία παρουσιάζει το περιεχόμενο στους χρήστες προσωποποιημένο βάσει των επιλογών που αυτοί πραγματοποιούν.
Σκοπός της μεταπτυχιακής εργασίας είναι η εξέταση περισσοτέρων αλγορίθμων για την πραγματοποίηση της παραπάνω διαδικασίας αλλά και η υλοποίησή τους προκειμένου να γίνει σύγκριση αλγορίθμων και παραγωγή ποιοτικότερου αποτελέσματος.
Πιο συγκεκριμένα αναβαθμίζονται όλα τα στάδια λειτουργίας του μηχανισμού. Έτσι, το στάδιο λήψης πληροφορίας βασίζεται σε έναν απλό crawler λήψης HTML σελίδων από αγγλόφωνα news portals. Η διαδικασία βασίζεται στο γεγονός πως για κάθε σελίδα υπάρχουν RSS feeds. Διαβάζοντας τα τελευταία νέα που προκύπτουν από τις εγγραφές στα RSS feeds μπορούμε να εντοπίσουμε όλα τα URL που περιέχουν HTML σελίδες με τα άρθρα. Οι HTML σελίδες φιλτράρονται προκειμένου από αυτές να γίνει εξαγωγή μόνο του κειμένου και πιο αναλυτικά του χρήσιμου κειμένου ούτως ώστε το κείμενο που εξάγεται να αφορά αποκλειστικά άρθρα. Η τεχνική εξαγωγής χρήσιμου κειμένου βασίζεται στην τεχνική web clipping. Ένας parser, ελέγχει την HTML δομή προκειμένου να εντοπίσει τους κόμβους που περιέχουν μεγάλη ποσότητα κειμένου και βρίσκονται κοντά σε άλλους κόμβους που επίσης περιέχουν μεγάλες ποσότητες κειμένου.
Στα εξαγόμενα άρθρα πραγματοποιείται προεπεξεργασία πέντε σταδίων με σκοπό να προκύψουν οι λέξεις κλειδιά που είναι αντιπροσωπευτικές του άρθρου. Πιο αναλυτικά, αφαιρούνται όλα τα σημεία στίξης, όλοι οι αριθμοί, μετατρέπονται όλα τα γράμματα σε πεζά, αφαιρούνται όλες οι λέξεις που έχουν λιγότερους από 4 χαρακτήρες, αφαιρούνται όλες οι κοινότυπες λέξεις και τέλος εφαρμόζονται αλγόριθμοι εύρεσης της ρίζας μίας λέξεις. Οι λέξεις κλειδιά που απομένουν είναι stemmed το οποίο σημαίνει πως από τις λέξεις διατηρείται μόνο η ρίζα.
Από τις λέξεις κλειδιά ο μηχανισμός οδηγείται σε δύο διαφορετικά στάδια ανάλυσης. Στο πρώτο στάδιο υπάρχει μηχανισμός ο οποίος αναλαμβάνει να δημιουργήσει μία αντιπροσωπευτική περίληψη του κειμένου ενώ στο δεύτερο στάδιο πραγματοποιείται αυτόματη κατηγοριοποίηση του κειμένου βασισμένη σε πρότυπες κατηγορίες που έχουν δημιουργηθεί από επιλεγμένα άρθρα που συλλέγονται καθ’ όλη τη διάρκεια υλοποίησης του μηχανισμού. Η εξαγωγή περίληψης βασίζεται σε ευρεστικούς αλγορίθμους. Πιο συγκεκριμένα προσπαθούμε χρησιμοποιώντας λεξικολογική ανάλυση του κειμένου αλλά και γεγονότα για τις λέξεις του κειμένου αν δημιουργήσουμε βάρη για τις προτάσεις του κειμένου. Οι προτάσεις με τα μεγαλύτερη βάρη μετά το πέρας της διαδικασίας είναι αυτές που επιλέγονται για να διαμορφώσουν την περίληψη. Όπως θα δούμε και στη συνέχεια για κάθε άρθρο υπάρχει μία γενική περίληψη αλλά το σύστημα είναι σε θέση να δημιουργήσει προσωποποιημένες περιλήψεις για κάθε χρήστη. Η διαδικασία κατηγοριοποίησης βασίζεται στη συσχέτιση συνημίτονου συγκριτικά με τις πρότυπες κατηγορίες. Η κατηγοριοποίηση δεν τοποθετεί μία ταμπέλα σε κάθε άρθρο αλλά μας δίνει τα αποτελέσματα συσχέτισης του άρθρου με κάθε κατηγορία.
Ο συνδυασμός των δύο παραπάνω σταδίων δίνει την πληροφορία που εμφανίζεται σε πρώτη φάση στο χρήστη που επισκέπτεται το προσωποποιημένο portal. Η προσωποποίηση στο portal βασίζεται στις επιλογές που κάνουν οι χρήστες, στο χρόνο που παραμένουν σε μία σελίδα αλλά και στις επιλογές που δεν πραγματοποιούν προκειμένου να δημιουργηθεί προφίλ χρήστη και να είναι εφικτό με την πάροδο του χρόνου να παρουσιάζεται στους χρήστες μόνο πληροφορία που μπορεί να τους ενδιαφέρει. / The scope of this MsC thesis is the extension and upgrade of the mechanism that was constructed during my undergraduate studies under my undergraduate thesis entitled “Construction of a Web Portal with Personalized Access to WWW content”.
The aforementioned thesis included the construction of a mechanism that would begin with information retrieval from the WWW and would conclude to representation of information through a portal after applying useful text extraction, text pre-processing and text categorization techniques.
The scope of the MsC thesis is to locate the problematic parts of the system and correct them with better algorithms and also include more modules on the complete mechanism.
More precisely, all the modules are upgraded while more of them are constructed in every aspect of the mechanism. The information retrieval module is based on a simple crawler. The procedure is based on the fact that all the major news portals include RSS feeds. By locating the latest articles that are added to the RSS feeds we are able to locate all the URLs of the HTML pages that include articles. The crawler then visits every simple URL and downloads the HTML page. These pages are filtered by the useful text extraction mechanism in order to extract only the body of the article from the HTML page. This procedure is based on the web-clipping technique. An HTML parser analyzes the DOM model of HTML and locates the nodes (leafs) that include large amounts of text and are close to nodes with large amounts of text. These nodes are considered to include the useful text.
In the extracted useful text we apply a 5 level preprocessing technique in order to extract the keywords of the article. More analytically, we remove the punctuation, the numbers, the words that are smaller than 4 letters, the stopwords and finally we apply a stemming algorithm in order to produce the root of the word.
The keywords are utilized into two different interconnected levels. The first is the categorization subsystem and the second is the summarization subsystem. During the summarization stage the system constructs a summary of the article while the second stage tries to label the article. The labeling is not unique but the categorization applies multi-labeling techniques in order to detect the relation with each of the standard categories of the system. The summarization technique is based on heuristics. More specifically, we try, by utilizing language processing and facts that concern the keywords, to create a score for each of the sentences of the article. The more the score of a sentence, the more the probability of it to be included to the summary which consists of sentences of the text.
The combination of the categorization and summarization provides the information that is shown to our web portal called perssonal. The personalization issue of the portal is based on the selections of the user, on the non-selections of the user, on the time that the user remains on an article, on the time that spends reading similar or identical articles. After a short period of time, the system is able to adopt on the user’s needs and is able to present articles that match the preferences of the user only.
|
Page generated in 0.0474 seconds