Στις μέρες μας οι χρήστες εκτός από 'καταναλωτές' πληροφορίας στο διαδίκτυο είναι και 'παραγωγοί' και διαχειριστές της. Μια συνήθης πρακτική είναι η σήμανση του περιεχομένου που διαμοιράζονται με ετικέτες (tags) και η χρήση των ετικετών αυτών σε διαδικασίες αναζήτησης ή εύρεσης περιεχομένου με παρόμοια χαρακτηριστικά. Ένα από τα εργαλεία που ευρέως χρησιμοποιούνται στις διαδικασίες αυτές είναι οι ταξονομίες (taxonomies). Οι ταξονομίες είναι δενδρικές δομές που συνίστανται από κόμβους, καθένας από τους οποίους αντιπροσωπεύει μια κατηγορία-ένοια και συνδέεται με τα παιδιά και τον γονέα του με σχέσεις 'IS-A'. Δημιουργούνται κατά βάση χειρωνακτικά, από ειδικούς, ενώ η ανανέωση και επέκτασή τους είναι αρκετά χρονοβόρες ενέργειες.
Στην εργασία αυτή ασχολούμαστε με την αυτόματη εξαγωγή ταξονομίας από είσοδο που προέρχεται από μια κοινότητα χρηστών. Θεωρούμε πως οι χρήστες μας είναι ικανοί να παρέχουν σχέσεις ετικετών που περιγράφουν καταστάσεις υπερκατηγορίας-υποκατηγορίας μεταξύ θεματικών κόμβων και προσπαθούμε να τις συγκεράσουμε ώστε να προκύψει μια ταξονομία. Η τελική ταξονομία είναι συμβατή με τα 'κβάντα' πληροφορίας που έχουμε στη διάθεσή μας, επιλύει αντικρουόμενες απόψεις χρηστών όσον αφορά την τελική της δομή και αποτυπώνει την ικανότητα της κοινότητας στη διακριτοποίηση εννοιών.
Προτείνουμε έναν αλγόριθμο κατασκευής μιας ταξονομίας και θα αξιολογήσουμε την απόδοσή του, χρησιμοποιώντας τόσο συνθετικά, όσο και πραγματικά δεδομένα. Γίνεται επίσης προσαρμογή και μελέτη του συστήματος σε crowdsourcing περιβάλλοντα, περιβάλλοντα δηλαδή όπου ένας μεγάλος αριθμός από χρήστες χρησιμοποιείται για την περάτωση μικρών εργασιών που χαρακτηριστικό τους είναι η αδυναμία εκτέλεσης τους από υπολογιστικά συστήματα. / Taxonomies are a useful mechanism to organize, evaluate, and search web content. As such, many popular classes of web applications, utilize them. However, their manual generation and maintenance by experts is a timecostly procedure, often resulting in
platform dependent and static vocabularies. We propose a new approach for constructing
taxonomies. Our idea is based on the proven, increased human involvement and desire to annotate web content (e.g., in social media and product categorization applications).
We define the required input from humans in the form of explicit structural, e.g., supertype-subtype relationships between concepts. In this way, we harvest, via
common annotation practices, the collective wisdom of users with respect to the (categorization of) web content they share and access. We further define the principles upon which crowdsourced taxonomy construction algorithms should be based. We show that the resulting problem is NP-Hard.
We provide heuristic algorithms that aggregate human input, resolving conflicting input, and produce taxonomies. We evaluate our algorithms with real world crowdsourcing experiments and on real world
taxonomies.
Identifer | oai:union.ndltd.org:upatras.gr/oai:nemertes:10889/5250 |
Date | 15 May 2012 |
Creators | Καραμπίνας, Δημήτρης |
Contributors | Τριανταφύλλου, Παναγιώτης, Karampinas, Dimitris, Βαρβαρίγος, Εμμανουήλ, Μεγαλοοικονόμου, Βασίλειος, Τριανταφύλλου, Παναγιώτης |
Source Sets | University of Patras |
Language | gr |
Detected Language | Greek |
Type | Thesis |
Rights | 0 |
Relation | Η ΒΚΠ διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή στο βιβλιοστάσιο διδακτορικών διατριβών που βρίσκεται στο ισόγειο του κτιρίου της. |
Page generated in 0.0024 seconds