Spelling suggestions: "subject:"ταξινομεί"" "subject:"ταξινομητή""
1 |
Δυναμική κατασκευή μεγάλης κλίμακας ταξονομίας σε Crowdsourcing περιβάλλονταΚαραμπίνας, Δημήτρης 15 May 2012 (has links)
Στις μέρες μας οι χρήστες εκτός από 'καταναλωτές' πληροφορίας στο διαδίκτυο είναι και 'παραγωγοί' και διαχειριστές της. Μια συνήθης πρακτική είναι η σήμανση του περιεχομένου που διαμοιράζονται με ετικέτες (tags) και η χρήση των ετικετών αυτών σε διαδικασίες αναζήτησης ή εύρεσης περιεχομένου με παρόμοια χαρακτηριστικά. Ένα από τα εργαλεία που ευρέως χρησιμοποιούνται στις διαδικασίες αυτές είναι οι ταξονομίες (taxonomies). Οι ταξονομίες είναι δενδρικές δομές που συνίστανται από κόμβους, καθένας από τους οποίους αντιπροσωπεύει μια κατηγορία-ένοια και συνδέεται με τα παιδιά και τον γονέα του με σχέσεις 'IS-A'. Δημιουργούνται κατά βάση χειρωνακτικά, από ειδικούς, ενώ η ανανέωση και επέκτασή τους είναι αρκετά χρονοβόρες ενέργειες.
Στην εργασία αυτή ασχολούμαστε με την αυτόματη εξαγωγή ταξονομίας από είσοδο που προέρχεται από μια κοινότητα χρηστών. Θεωρούμε πως οι χρήστες μας είναι ικανοί να παρέχουν σχέσεις ετικετών που περιγράφουν καταστάσεις υπερκατηγορίας-υποκατηγορίας μεταξύ θεματικών κόμβων και προσπαθούμε να τις συγκεράσουμε ώστε να προκύψει μια ταξονομία. Η τελική ταξονομία είναι συμβατή με τα 'κβάντα' πληροφορίας που έχουμε στη διάθεσή μας, επιλύει αντικρουόμενες απόψεις χρηστών όσον αφορά την τελική της δομή και αποτυπώνει την ικανότητα της κοινότητας στη διακριτοποίηση εννοιών.
Προτείνουμε έναν αλγόριθμο κατασκευής μιας ταξονομίας και θα αξιολογήσουμε την απόδοσή του, χρησιμοποιώντας τόσο συνθετικά, όσο και πραγματικά δεδομένα. Γίνεται επίσης προσαρμογή και μελέτη του συστήματος σε crowdsourcing περιβάλλοντα, περιβάλλοντα δηλαδή όπου ένας μεγάλος αριθμός από χρήστες χρησιμοποιείται για την περάτωση μικρών εργασιών που χαρακτηριστικό τους είναι η αδυναμία εκτέλεσης τους από υπολογιστικά συστήματα. / Taxonomies are a useful mechanism to organize, evaluate, and search web content. As such, many popular classes of web applications, utilize them. However, their manual generation and maintenance by experts is a timecostly procedure, often resulting in
platform dependent and static vocabularies. We propose a new approach for constructing
taxonomies. Our idea is based on the proven, increased human involvement and desire to annotate web content (e.g., in social media and product categorization applications).
We define the required input from humans in the form of explicit structural, e.g., supertype-subtype relationships between concepts. In this way, we harvest, via
common annotation practices, the collective wisdom of users with respect to the (categorization of) web content they share and access. We further define the principles upon which crowdsourced taxonomy construction algorithms should be based. We show that the resulting problem is NP-Hard.
We provide heuristic algorithms that aggregate human input, resolving conflicting input, and produce taxonomies. We evaluate our algorithms with real world crowdsourcing experiments and on real world
taxonomies.
|
2 |
Αποδοτική ιεραρχημένη ανάκτηση κοινωνικού περιεχομένου με χρήση ταξονομιών ετικετών / TREATS: optimal ranked retrieval with tag taxonomies in social media environmentsΚοντοτάσιου, Ιωάννα 15 May 2012 (has links)
Μία διαδεδομένη τεχνική που χρησιμοποιείται για την επίτευξη
αποδοτικής αναζήτησης περιεχομένου είναι η κατηγοριοποίηση αυτού σε
ταξονομίες ετικετών, δηλαδή σε δενδρικές <<ΕΙΝΑΙ-ΕΝΑ>> ιεραρχίες
λέξεων-κλειδιών που παρέχουν οι χρήστες. Κάθε κόμβος της δενδρικής
δομής αντιστοιχεί σε μία ετικέτα της ταξονομίας.
Στην παρούσα διπλωματική εργασία θα γίνει χρήση τέτοιων ταξονομιών
ετικετών, όπου κάθε αντικείμενο επισημαίνεται από τους χρήστες με μία
ή περισσότερες ετικέτες. Το περιβάλλον το οποίο θα ορίσουμε είναι
ιδιαίτερα δυναμικό, με την έννοια ότι η προσθαφαίρεση και τροποποίηση
των ετικετών από τους χρήστες είναι συνεχής καθώς και ότι αντικείμενα
μπορούν να προσθαφαιρούνται συνεχώς. Στο περιβάλλον αυτό θα
στοχεύσουμε στην αποδοτική ιεραρχημένη ανάκτηση περιεχομένου.
Πρωταρχικό στόχο αποτελεί η δημιουργία μετρικών ομοιότητας μεταξύ
ερωτημάτων, τα οποία υποβάλλονται από χρήστες, και του αποθηκευμένου
και κατηγοριοποιημένου περιεχομένου. Οι μετρικές αυτές θα βασίζονται
στη σημασιολογική απόσταση των κόμβων των ταξονομιών από τους όρους
των υποβληθέντων ερωτημάτων (οι οποίοι όροι θα πρέπει επίσης να
αποτελούν κόμβους της ταξονομίας).
Βάσει των παραπάνω μετρικών θα σχεδιαστούν και θα υλοποιηθούν
αλγόριθμοι για την ανάκτηση των k πιο σχετικών αντικειμένων, οι οποίοι
θα αποτελούν επεκτάσεις των βασικών αλγορίθμων κατωφλίου του Fagin
(Fagin's Threshold Algorithms - TA). Στην προτεινόμενη προσέγγιση θα
καμφθεί η απαίτηση της προΰπαρξης ανεστραμμένων ευρετηρίων. Αντίθετα,
τα απαιτούμενα (από τους αλγορίθμους του Fagin) ανεστραμμένα ευρετήρια
να κατασκευάζονται δυναμικά κατά την απάντηση των ερωτημάτων. / The spark for this work stems from the recent explosion in social media production, the proven interest of users to tag this media, and on the proven capability of semantically rich taxonomies to appropriately classify content.
The rich annotations/tags provided for social media offer a great basis for taxonomies.
Noting that web search increasingly involves taxonomies,
and that there exists already a rich set of taxonomies for many different fields, which can help classify tags, we target the problems associated with efficient taxonomy-based ranked retrieval in social web environments.
In a social-tag taxonomies environment, each tag (taxonomy node) is associated with all documents tagged with this tag. Queries are formulated using tags. The environment is highly dynamic, as documents and tags-documents associations are being added and/or deleted constantly. This dynamism can render as highly inefficient the traditional approaches to ranked retrieval, which are based on text indices, due to the high index creation, maintenance, and use costs.
We first adapt similarity measures between tag queries and documents, which are based on well-established principles of
taxonomy-based search.
We then develop algorithms for top-k queries exploiting taxonomic knowledge.
We contribute a suit of top-k algorithms, coined TREATS (ThREshold Algorithms on TaxonomieS).
Our first algorithm shows how to build per-tag inverted indices (required by the well-established Threshold Algorithms (TA) for top-k query processing). In this way, we port optimal ranked retrieval algorithms into the taxonomy realm.
Our second algorithm, TREATS-sorted, shares the same principles as TA-sorted, but without the need to maintain any inverted text indices! This introduces significant savings: First, in terms of storage required to store the indices. Second, for the overhead for building and maintaining indices. And third, for the overhead incurred during query execution for accessing indices.
Our third algorithm, TREATS-Labelled, further exploits the taxonomic structure in order to introduce large additional performance benefits.
We also prove the correctness and (instance-)optimality of TREATS.
Finally, we have implemented all algorithms and evaluated their efficiency against the baseline TA-random and TA-sorted algorithms, using real data sets with different characteristics.
|
3 |
Περιγραφή μαθησιακών αποτελεσμάτων, συνιστωσών του Ευρωπαϊκού Πλαισίου Προσόντων και επαγγελματικών προφίλ με την χρήση οντολογιών / Using ontologies to encode and match qualifications and learning outcomes for internet related jobsΚαλούδη, Ιωάννα 17 September 2012 (has links)
Η ραγδαία εξέλιξη των τεχνολογιών της πληροφορίας και της επικοινωνίας δεν έχει αφήσει ανεπηρέαστο τον χώρο της αγοράς εργασίας. Συνεχώς κρίνεται αναγκαία η εμφάνιση νέων, ακόμη πιο εξειδικευμένων επαγγελμάτων που συνδέονται με τον χώρο της πληροφορικής. Σκοπός της παρούσας διπλωματικής εργασίας είναι η κατασκευή οντολογίας που περιέχει τις εξής έννοιες: επαγγελματικά προφίλ (job profiles) που σχετίζονται με την πληροφορική, ικανότητες (competences) που συσχετίζονται με τα job profiles, επίπεδα (Proficiency Levels) που προκύπτουν από το Ευρωπαϊκό Πλαίσιο Επαγγελματικών Προσόντων / European Qualification Framework (EQF) και το Ευρωπαϊκό Πλαίσιο ηλεκτρονικών Ικανοτήτων / e-Competence Framework (e-CF) και χαρακτηρίζουν τις ικανότητες αυτές και μαθησιακά αποτελέσματα (Learning Outcomes) που προκύπτουν από τις ικανότητες αυτές. Τα μαθησιακά αποτελέσματα χαρακτηρίζονται μέσα από την οντολογία με βάση την Ταξινομία Bloom ενώ, επιπλέον, γίνεται μια σύνδεση των επιπέδων του πλαισίου EQF και των μαθησιακών αποτελεσμάτων με έννοιες, που συναντάμε στην Σύσταση του Ευρωπαϊκού Κοινοβουλίου και του Συμβουλίου για την θέσπιση του Ευρωπαϊκού Συστήματος Πιστωτικών Μονάδων για την Επαγγελματική Εκπαίδευση και Κατάρτιση (ECVET), όπως προσόντα (qualification) και ψηφίδες (units). Η λειτουργία του συστήματος επαληθεύεται με την υποβολή ερωτημάτων και την αξιολόγηση των αποτελεσμάτων. Η δυναμική της οντολογίας που κατασκευάστηκε θα μπορούσε να αξιοποιηθεί τόσο από εταιρείες για την βελτίωση διαχείρισης ανθρώπινου δυναμικού αλλά και από εκπαιδευτικά ιδρύματα για την εξέλιξη ενός προγράμματος σπουδών. / The lack of a commonly accepted representation of competences and qualifications has led to a mismatch between the outcome of education / training courses and true market needs. Frameworks like EQF and e-CF attempt to deal with the problem by providing an abstract, all-encompassing structure that classifies qualifications into levels of formal education. Being so abstract, these frameworks have to be adapted in order to become useful. Moreover, in order to feed the market needs regarding qualifications to the educational system, a further mapping level is required, that which maps qualifications to learning outcomes. Although several attempts have been made, we have not come across a tool that could automate part of the process. For this reason, in the context of EU project PIN, we have developed a semantically rich mechanism that represents job profiles, qualifications and learning outcomes and maps them to EQF and e-CF levels. In this paper, we present the ontologies that constitute the core of this mechanism. We have developed ontologies that represent the EQF and e-CF frameworks, competences, qualifications and job profiles, and learning outcomes based on the Bloom’s taxonomy. Then we combined these ontologies and filled them with actual job profiles (that were developed in the PIN project) in order to evaluate them. In the paper, we describe the ontology engineering methodology, the ontology properties and the ways they can be used to provide a commonly accessible knowledge layer for semantic Web applications that would need to match qualifications and learning outcomes.
|
4 |
Εννοιολογικός προσανατολισμός της αναζήτησης στον Παγκόσμιο ΙστόΒεργέτη, Δανάη 09 October 2014 (has links)
Tα τελευταία χρόνια, η εξάπλωση του διαδικτύου και το εύρος της πληροφορίας
που διατίθεται στο χρήστη,
καθιστούν
αναγκαία
τη
χρησιμοποίηση
σημασιολογικών τεχνικών προσωποποίησης, προκειμένου να βελτιώσουν την
εμπειρία του χρήστη στο διαδίκτυο. Στις μηχανές αναζήτησης, οι χρήστες
βελτιώνουν το επερώτημά τους με την προσθήκη, την αφαίρεση ή την
αντικατάσταση των λέξεων. Παρ 'όλα αυτά , εκτός από την αλληλεπίδραση με
μια μηχανή αναζήτησης, η εμπειρία ενός χρήστη στο διαδίκτυο κατά την
αναζήτηση της σωστής πληροφορίας, περιλαμβάνει και την περιήγησή του σε
σελίδες ενός δικτυακού τόπου ή μια σειρά από δικτυακούς τόπους. Κατά τη
διάρκεια της συνεδρίας του, ο χρήστης αναδιαμορφώνει την αναζήτησή του.
Ωστόσο, τόσο ο καθορισμός της σημασιολογίας της αναζήτησής του, όσο και ο
προσανατολισμός της αναζήτησής του (γενίκευση ή εξειδίκευση σε ένα
σημασιολογικό πεδίο) με βάση την πλοήγηση μέσα από τις σελίδες, δεν είναι
τόσο εύκολοι. Κάθε σελίδα περιέχει περισσότερες από μία έννοιες. Επιπλέον, η
επιλογή των αντιπροσωπευτικότερων είναι πολύπλοκη διαδικασία.
Σκοπός της παρούσας εργασίας είναι η παρουσίαση της μεθοδολογίας SOSACT.
Η
μεθοδολογία
SOSACT
αποτελεί
μια
σημασιολογική
μεθοδολογία
εξατομίκευσης που παρακολουθεί τις επιλογές του χρήστη κατά τη συνεδρία του
και καθορίζει αν ο χρήστης ειδικεύει ή γενικεύει την πλοήγηση του μέσα από τη
σημασιολογική ανάλυση των σελίδων,
σε ένα εννοιολογικό πεδίο.
Η
μεθοδολογία SOSACT ορίζει το σημασιολογικό προσανατολισμό της πλοήγησης
του χρήστη. Επιπλέον,
στην παρούσα εργασία προτείνεται ο αλγόριθμος
SOSACT, ο οποίος εντοπίζει το σημασιολογικό προσανατολισμό του χρήστη με
τη βοήθεια μίας ταξινομίας.
Η μεθοδολογία SOSACT υλοποιείται από το σύστημα SOSACT. Το σύστημα
SOSACT εφαρμόζει τον αλγόριθμο SOSACT και προτείνει χρήσιμες συστάσεις
προς το χρήστη για τη βελτίωση της διαδικτυακής αναζήτησής του . Το σύστημα
SOSACT αξιολογήθηκε με τη χρησιμοποίηση πραγματικής δραστηριότητας
χρηστών σε μια ιστοσελίδα, για ορισμένο χρονικό διάστημα.
Η μεθοδολογία SOSACT μπορεί να εφαρμοστεί και σε ένα σώμα κειμένων και
όχι μόνο σε διαδικτυακές πηγές. Μπορεί να γίνει ένα χρήσιμο εργαλείο για τη
βελτίωση της πλοήγησης στο διαδίκτυο. Επιπλέον, η προτεινόμενη μεθοδολογία
μπορεί να γεφυρώσει τις τεχνικές αποσαφήνισης του επερωτήματος στις
μηχανές αναζήτησης και τις τεχνικές αναδιαμόρφωσης του αντικειμένου
περιήγησης. Η μεθοδολογία SOSACT θα μπορούσε να χρησιμοποιηθεί σε μια
συγκριτική μελέτη μεταξύ των δύο αυτών τομέων και να οδηγήσει σε νέες
τεχνικές και στις δύο περιοχές έρευνας του Σημασιολογικού Ιστού. / In recent years, the spread of the World Wide Web, as well as the range of
information available to the user make the use of semantic personalization
techniques a necessity in order to enhance the user experience on the web. In search
engines, users refine their query by adding, removing or replacing the keywords in
their query. Thus, query refinement is easy to be detected and tell whether a user
generalizes or specializes his web search. Nevertheless, besides interaction with a
search engine, a user web search involves browsing and navigating through the
pages of a web site or a number of web sites while seeking the right information.
During this session the user reformulates his search. But, defining search orientation
(generalization or specialization) based on navigation through web pages is not that
easy. Each page contains more than one concept. Furthermore, the concepts may be
developed in the same extend and it is difficult to tell about the representative
semantics of a certain page and thus a user session’s orientation.
In order to define user navigation’s orientation a semantic web personalization
methodology is developed, the SOSACT methodology, which tracks user’s hits
through a session and defines whether a user specializes or generalizes his
navigation through semantics analysis of the pages in his session window. Moreover,
the SOSACT algorithm is proposed of capturing user session orientation based on
concept taxonomy.
The SOSACT methodology is implemented by the SOSACT system. The SOSACT
system applies the SOSACT algorithm and proposes useful recommendation to the
user to improve his web search. The SOSACT system is evaluated on real user
activity in a web site for a certain period of time. The experimental outcomes
satisfied the prospective results.
The SOSACT methodology could become a useful tool for navigation refinement.
Furthermore, this work is proved to bridge search engine query refinement and
browsing reformulation techniques. It could be a comparative study between these
two fields and lead to new techniques in both areas or migration techniques between
both areas.
|
Page generated in 0.0364 seconds