• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 45
  • 30
  • 5
  • 4
  • 4
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 99
  • 99
  • 29
  • 25
  • 24
  • 24
  • 24
  • 20
  • 19
  • 19
  • 19
  • 18
  • 16
  • 12
  • 9
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

A Framework for Evaluating Recommender Systems

Bean, Michael Gabriel 01 December 2016 (has links)
Prior research on text collections of religious documents has demonstrated that viable recommender systems in the area are lacking, if not non-existent, for some datasets. For example, both www.LDS.org and scriptures.byu.edu are websites designed for religious use. Although they provide users with the ability to search for documents based on keywords, they do not provide the ability to discover documents based on similarity. Consequently, these systems would greatly benefit from a recommender system. This work provides a framework for evaluating recommender systems and is flexible enough for use with either website. Such a framework would identify the best recommender system that provides users another way to explore and discover documents related to their current interests, given a starting document. The framework created for this thesis, RelRec, is attractive because it compares two different recommender systems. Documents are considered relevant if they are among the nearest neighbors, where "nearest" is defined by a particular system's similarity formula. We use RelRec to compare output of two particular recommender systems on our selected data collection. RelRec shows that LDA recommeder outperforms the TF-IDF recommender in terms of coverage, making it preferable for LDS-based document collections.
22

Using Social Graphs In One-class Collaborative Filtering Problem

Kaya, Hamza 01 September 2009 (has links) (PDF)
One-class collaborative filtering is a special type of collaborative filtering methods that aims to deal with datasets that lack counter-examples. In this work, we introduced social networks as a new data source to the one-class collaborative filtering (OCCF) methods and sought ways to benefit from them when dealing with OCCF problems. We divided our research into two parts. In the first part, we proposed different weighting schemes based on social graphs for some well known OCCF algorithms. One of the weighting schemes we proposed outperformed our baselines for some of the datasets we used. In the second part, we focused on the dataset differences in order to find out why our algorithm performed better on some of the datasets. We compared social graphs with the graphs of users and their neighbors generated by the k-NN algorithm. Our research showed that social graphs generated from a specialized domain better improves the recommendation performance than the social graphs generated from a more generic domain.
23

Tag-based Music Recommendation Systems Using Semantic Relations And Multi-domain Information

Tatli, Ipek 01 September 2011 (has links) (PDF)
With the evolution of Web 2.0, most social-networking sites let their members participate in content generation. Users can label items with tags in these websites. A tag can be anything but it is actually a short description of the item. Because tags represent the reason why a user likes an item, but not how much user likes it / they are better identifiers of user profiles than ratings, which are usually numerical values assigned to items by users. Thus, the tag-based contextual representations of music tracks are concentrated in this study. Items are generally represented by vector space models in the content based recommendation systems. In tag-based recommendation systems, users and items are defined in terms of weighted vectors of social tags. When there is a large amount of tags, calculation of the items to be recommended becomes hard, because working with huge vectors is a time-consuming job. The main objective of this thesis is to represent individual tracks (songs) in lower dimensional spaces. An approach is described for creating music recommendations based on user-supplied tags that are augmented with a hierarchical structure extracted for top level genres from Dbpedia. In this structure, each genre is represented by its stylistic origins, typical instruments, derivative forms, sub genres and fusion genres. In addition to very large vector space models, insufficient number of user tags is another problem in the recommendation field. The proposed method is evaluated with different user profiling methods in case of any insufficiency in the number of user tags. User profiles are extended with multi-domain information. By using multi-domain information, the goal of making more successful and realistic predictions is achieved.
24

An Ontology-based Hybrid Recommendation System Using Semantic Similarity Measure And Feature Weighting

Ceylan, Ugur 01 September 2011 (has links) (PDF)
The task of the recommendation systems is to recommend items that are relevant to the preferences of users. Two main approaches in recommendation systems are collaborative filtering and content-based filtering. Collaborative filtering systems have some major problems such as sparsity, scalability, new item and new user problems. In this thesis, a hybrid recommendation system that is based on content-boosted collaborative filtering approach is proposed in order to overcome sparsity and new item problems of collaborative filtering. The content-based part of the proposed approach exploits semantic similarities between items based on a priori defined ontology-based metadata in movie domain and derived feature-weights from content-based user models. Using the semantic similarities between items and collaborative-based user models, recommendations are generated. The results of the evaluation phase show that the proposed approach improves the quality of recommendations.
25

Cluster-based Collaborative Filtering Recommendation Approach

Tseng, Ching-Ju 12 August 2003 (has links)
Recommendation is not a new phenomenon arising from the digital era, but an existing social behavior in real life. Recommendation systems facilitate such natural social recommendation behavior and alleviate information overload facing individuals. Among different recommendation techniques proposed in the literature, the collaborative filtering approach is the most successful and widely adopted recommendation technique to date. However, the traditional collaborative filtering recommendation approach ignores proximities between items. That is, all user ratings on items are deemed identically important and given an equal weight in neighborhood formation process. In this study, we proposed a cluster-based collaborative filtering recommendation approach that takes into account the content similarities of items in the collaborative filtering process. Our empirical evaluation results show that the cluster-based collaborative filtering approach improves the prediction accuracy without sacrificing the prediction coverage, using those achieved by the traditional collaborative filtering approach as performance benchmarks. Due to the sparsity problem, when a prediction is made based on few neighbors, the cluster average method could achieve a better prediction accuracy than the proposed approach. Thus, we further proposed an enhanced cluster-based collaborative filtering approach that combines our approach and the cluster average method. The empirical results suggest that the enhanced approach could result in a prediction accuracy comparable to or even better than that accomplished by the cluster average method.
26

sALERT : an intelligent information alerting and notification web service / Intelligent information alerting and notification web service

Bhaduri, Sashmit B. 13 August 2012 (has links)
Web services increasingly serve as large repositories and conduits of information. However, they do not always allow for the efficient dissemination of this information, particularly in a reactive way. In this report, I describe sALERT, a web-based application that allows for targeted information from various web services to be combined and cross-referenced in order to produce a system that is more convenient and more efficient in reactively disseminating information. This dissemination is performed using mobile notification mechanisms such as text messages, and information targeting is performed using data from social networks and geolocation sources. I present the design, implementation, and plans for future improvement for this service within this report. / text
27

Χρήση τεχνολογιών σημασιολογικού ιστού για συστήματα συστάσεων

Κάββουρας, Δημήτριος 01 October 2014 (has links)
Σκοπός της εργασίας είναι η μελέτη και εφαρμογή τεχνολογιών σημασιολογικού ιστού για συστήματα συστάσεων, πάνω σε περιεχόμενο που προέρχεται από το διαδίκτυο. Στα πλαίσια της εργασίας σχεδιάστηκε και υλοποιήθηκε διαδικτυακή εφαρμογή που προτείνει άρθρα ειδήσεων λαμβάνοντας υπόψη το προφίλ/ιστορικό του κάθε χρήστη. Λόγω του μεγάλου όγκου πληροφοριών που κατακλύζει το διαδίκτυο συχνά οι χρήστες δυσκολεύονται να ξεχωρίσουν τις πληροφορίες που πραγματικά σχετίζονται με τα ενδιαφέροντα τους. Επιπλέον οι χρήστες έχουν πολύ διαφορετικά ενδιαφέροντα ή προτιμήσεις που μπορούν να ληφθούν υπόψη ώστε να φιλτραριστούν ή να ταξινομηθούν τα αποτελέσματα μιας ερώτησης με σκοπό το αποτέλεσμα να ικανοποιεί τις εξατομικευμένες ανάγκες κάθε χρήστη. Η κατηγορία αυτών των συστημάτων εξατομίκευσης ονομάζεται συστήματα συστάσεων (recommender systems). Τα συστήματα συστάσεων εκμεταλλεύονται τις ιδιαιτερότητες των χρηστών με σκοπό να διευκολύνουν στο να προσδιορίζουν ακριβέστερα τις πληροφορίες ή τις υπηρεσίες για τις οποίες ενδιαφέρονται περισσότερο ή σχετίζονται με τις ανάγκες τους, κάνοντας χρήση ειδικών αλγορίθμων. Οι αλγόριθμοι που χρησιμοποιούνται λαμβάνουν ως είσοδο τα χαρακτηριστικά και τις προτιμήσεις των χρηστών, ή τις σχέσεις μεταξύ των χρηστών ή τα γνωρίσματα των προς σύσταση αντικειμένων και υπολογίζουν το εκτιμώμενο ενδιαφέρον του χρήστη για κάθε αντικείμενο. Στην συνέχεια ταξινομούν ή φιλτράρουν τα αντικείμενα με κριτήριο το εκτιμώμενο ενδιαφέρον. Παρά τη μεγάλη ερευνητική δραστηριότητα στα συστήματα συστάσεων υπάρχουν σημαντικά προβλήματα που δεν έχουν λυθεί ακόμα πλήρως και απαιτείται περαιτέρω έρευνα. Για παράδειγμα οι τυπικές προσεγγίσεις εξαρτώνται από το πεδίο ορισμού(domain). Τα μοντέλα τους δημιουργούνται από τις πληροφορίες που συλλέγονται μέσα σε ένα συγκεκριμένο πεδίο(domain), και δεν μπορούν να επεκταθούν ή να ενσωματωθούν σε άλλα συστήματα. Επιπλέον η ανάγκη για περαιτέρω ευελιξία με τη μορφή συστάσεων που εξάγονται από επερωτήσεις ή προτάσεων που προσανατολίζονται σε ομάδες χρηστών, καθώς και η εξέταση πλαισιακών χαρακτηριστικών στη διάρκεια των διαδικασιών δημιουργίας συστάσεων είναι και αυτές απαιτήσεις που δεν πληρούνται στα περισσότερα συστήματα. Στην εργασία αυτή παρουσιάζουμε ένα σύστημα συστάσεων που χρησιμοποιεί τεχνολογίες σημασιολογικού ιστού για να περιγράψει και να συνδέσει τις ειδήσεις με τις προτιμήσεις του χρήστη ώστε να δημιουργήσει βελτιωμένες συστάσεις. Οι περιγραφές των ειδήσεων και τα προφίλ των χρηστών δημιουργούνται με την βοήθεια εννοιών που ορίζονται σε ένα σύνολο οντολογιών πεδίου. Ανάλογα με τις ομοιότητες μεταξύ των περιγραφών των ειδήσεων και των προφίλ των χρηστών καθώς και τις σημασιολογικές σχέσεις μεταξύ των εννοιών, το σύστημα υποστηρίζει μοντέλα συστάσεων βάσει περιεχομένου που έχουν σαν επίκεντρο το μεμονωμένο χρήστη, και επιτρέπει την εξαγωγή συμπερασμάτων βασισμένα σε κανόνες για την υποστήριξη εξατομικευμένων συστάσεων. Συγκεκριμένα γίνεται αξιολόγηση του μοντέλου που εξατομικεύει τη σειρά με την οποία τα άρθρα ειδήσεων παρουσιάζονται στο χρήστη λαμβάνοντας υπόψη το προφίλ/ιστορικό των βραχυπρόθεσμων και των μακροπρόθεσμων ενδιαφερόντων. / The scope of this Msc Thesis is the study and applies Semantic Web Technologies, for Recommendation Systems, over content for the internet. For the purpose of work, we designed and implemented web application that proposes news articles considering the profile/ history of each user. Because of the information overload which invading the internet, often the users are complicated to distinguish the information that really is related to their interests. The category of these personalization systems called recommendation systems. More over the users have very different interests or preferences that can taken into account in order to classify or filtering the results of question with scope the result to satisfies the personalized needs of each user. The category of these personalization systems called recommendation systems. Recommendation systems exploit the particularities of users with scope facilitate to identify precisely the information or the services for which they are more interested or related to their needs, using special algorithms. The algorithms used take as input the attributes and the user’s preferences, or the relations between users or the attributes of the items to be recommender and calculate the estimated interest of user for each item. Then classify or filtering the items with criterion the estimated interest. Despite the great research activity in recommendation systems common problem have not fully solved yet, and further investigation is needed. For example, typical approach dependent from domain. The model are created from the information where collected in specific domain, and cannot be extended or integrated in other systems. More over the need for further flexibility in the recommendation derived from question or oriented recommendation to group users, and the consideration of contextual features during the recommendation process are also unfulfilled requirements in most systems. This thesis presents news recommendations systems which used semantic web technologies to describe and relate news items, and the user preferences in order to produce enhanced recommendations. The items descriptions and the user profiles are created with concepts in the domain ontology. According to the similarity between the description items and the user profiles, and the semantic relation between concepts, the system supported content –based model that centered on a single user, and allows the Inference rule-based for the supported personalized recommendation. Specifically an evaluation of the model that personalized the order in which news articles are presented to the user, considering the profile/ history of sort – terms and long – terms interests.
28

Information Diffusion and Influence Propagation on Social Networks with Marketing Applications

Cheng, Jiesi January 2013 (has links)
Web and mobile technologies have had such profound impact that we have witnessed significant evolutionary changes in our social, economic and cultural activities. In recent years, online social networking sites such as Twitter, Facebook, Google+, and LinkedIn have gained immense popularity. Such social networks have led to an enormous explosion of network-centric data in a wide variety scenarios, posing unprecedented analytical and computational challenges to MIS researchers. At the same time, the availability of such data offers major research opportunities in various social computing and analytics areas to tackle interesting questions such as: - From a business and marketing perspective, how to mine the novel datasets of online user activities, interpersonal communications and interactions, for developing more successful marketing strategies? - From a system development perspective, how to incorporate massive amounts of available data to assist online users to find relevant, efficient, and timely information? In this dissertation, I explored these research opportunities by studying multiple analytics problems arose from the design and use of social networking services. The first two chapters (Chapter 2 and 3) are intended to study how social network can help to derive a better estimation of customer lifetime value (CLV), in the social gaming context. In Chapter 2, I first conducted an empirical study to demonstrate that friends' activities can serve as significant indicators of a player's CLV. Based on this observation, I proposed a perceptron-based online CLV prediction model considering both individual and friendship information. Preliminary results have shown that the model can be effectively used in online CLV prediction, by evaluating against other commonly-used benchmark methods. In Chapter 3, I further extended the metric of traditional CLV, by incorporating the personal influences on other customers' purchase as an integral part of the lifetime value. The proposed metric was illustrated and tested on seven social games of different genres. The results showed that the new metric can help marketing managers to achieve more successful marketing decisions in user acquisition, user retention, and cross promotion. Chapter 4 is devoted to the design of a recommendation system for micro-blogging. I studied the information diffusion pattern in a micro-blogging site (Twitter.com) and proposed diffusion-based metrics to assess the quality of micro-blogs, and leverage the new metric to implement a novel recommendation framework to help micro-blogging users to efficiently identify quality news feeds. Chapter 5 concludes this dissertation by highlighting major research contributions and future directions.
29

Εξόρυξη γνώσης στον παγκόσμιο ιστό και εφαρμογές σε συστήματα συστάσεων

Φαλιάγκα, Ευανθία 17 September 2012 (has links)
Το διαδίκτυο συγκεντρώνει μεγάλες ποσότητες πληροφοριών, οι οποίες λόγω του όγκου τους πολλές φορές μένουν αναξιοποίητες. Οι τεχνικές εξόρυξης γνώσης μπορούν να αυτοματοποιήσουν τη διαδικασία της ανάκτησης χρήσιμων πληροφοριών από τον ιστό και να συνδυαστούν με συστήματα που μπορούν να αξιοποιήσουν τη γνώση αυτή. Ένα τέτοιο παράδειγμα είναι τα συστήματα συστάσεων, τα οποία μπορούν να αξιοποιούν την υπάρχουσα γνώση και να εντοπίζουν αυτόματα τις κατάλληλες επιλογές από ένα μεγάλο αριθμό εναλλακτικών, με βάση ορισμένα καθορισμένα κριτήρια. Για το λόγο αυτό τα συστήματα συστάσεων είναι άρρηκτα συνδεδεμένα με τεχνικές εξόρυξης γνώσης, οι οποίες μέσα από πληθώρα πληροφοριών μπορούν να εξάγουν χρήσιμα στοιχεία που βοηθούν στην αυτοματοποιημένη παραγωγή συστάσεων, διαδικασία που γίνεται ακόμα πιο πολύπλοκη όταν η πρόταση πρέπει να γίνει με βάση πολλαπλά κριτήρια, με διαφορετικά βάρη το καθένα. Εφαρμογές των συστημάτων συστάσεων υπάρχουν σε τομείς όπως η ψυχαγωγία, το ηλεκτρονικό εμπόριο αλλά και σε διαδικτυακές υπηρεσίες. Μία ακόμη εφαρμογή τους είναι και το πρόβλημα της αξιολόγησης ανθρώπινων χαρακτηριστικών, όπου τα κριτήρια των συστάσεων θα είναι οι δεξιότητες των ανθρώπων και το αντικείμενο της σύστασης θα είναι το πρόσωπο που αξιολογείται. Αυτά ονομάζονται συστήματα ηλεκτρονικών προσλήψεων (e-recruitment συστήματα) και αυτοματοποιούν τη διαδικασία της δημοσίευσης θέσεων εργασίας και τη λήψη βιογραφικών σημειωμάτων. Το πρόβλημα των ηλεκτρονικών προσλήψεων έχει δύο όψεις: Μπορεί να είναι είτε προσανατολισμένο στον υποψήφιο (seeker oriented) είτε προσανατολισμένο στον εργοδότη (company oriented). Στην πρώτη περίπτωση το σύστημα ηλεκτρονικών προσλήψεων προτείνει στον υποψήφιο μία λίστα από θέσεις εργασίας που ταιριάζουν καλύτερα στο προφίλ του. Στη δεύτερη περίπτωση οι εργοδότες δημοσιεύουν τις προδιαγραφές των διαθέσιμων θέσεων εργασίας οι υποψήφιοι εκδηλώνουν ενδιαφέρον και στη συνέχεια γίνεται κατάταξη των υποψηφίων με βάση κριτήρια που εξαρτώνται από τη θέση εργασίας. Αντικείμενο της παρούσας διδακτορικής διατριβής είναι η μελέτη και η εφαρμογή τεχνικών εξόρυξης γνώσης ώστε να βελτιωθεί η διαδικασία των συστάσεων. Οι τεχνικές που προτείνονται εφαρμόζονται σε συστήματα ηλεκτρονικών προσλήψεων προσανατολισμένων στον εργοδότη. Συγκεκριμένα, στο πρώτο κεφάλαιο παρουσιάζονται τα βασικά χαρακτηριστικά των συστημάτων συστάσεων και δίνεται έμφαση στα συστήματα όπου οι συστάσεις βασίζονται στο φιλτράρισμα με βάση το περιεχόμενο. Σαν παράδειγμα των συστημάτων συστάσεων χρησιμοποιήθηκε ένα σύστημα ηλεκτρονικών προσλήψεων προσανατολισμένο στον εργοδότη που αυτοματοποιεί την αξιολόγηση των υποψηφίων. Στη συνέχεια του κεφαλαίου παρουσιάζεται μία νέα προσέγγιση στην κατάταξη υποψηφίων με πολλές βελτιώσεις σε σχέση με τα υπάρχοντα συστήματα. Η προσέγγιση που προτείνεται διαφέρει από τα υπάρχοντα συστήματα ηλεκτρονικών προσλήψεων στο γεγονός ότι δε δέχεται βιογραφικά, αλλά οι υποψήφιοι συμπληρώνουν τα στοιχεία του προφίλ τους χρησιμοποιώντας προκαθορισμένες φόρμες μέσω διαδικτύου. Ακόμη, μοντελοποιεί τα βιογραφικά που προκύπτουν με χρήση της HR-XML γλώσσας μοντελοποίησης και στη συνέχεια κατατάσσει τους υποψηφίους, βαθμολογώντας τα προσόντα τους ανάλογα με τις απαιτήσεις της κάθε θέσης εργασίας. Η διαδικασία βαθμολόγησης και κατάταξης βασίζεται στον αλγόριθμο Analytic Hierarchy Process, ή AHP (Saaty, 1990). Για να ελεγχθεί η λειτουργικότητα και η αποτελεσματικότητα του συστήματος σχεδιάστηκε και εκτελέστηκε ένα σενάριο, που χρησιμοποίησε θέσεις εργασίας από το γραφείο διασύνδεσης του Πανεπιστημίου Πατρών. Στο δεύτερο κεφάλαιο, προτείνεται μία μέθοδος δημιουργίας συστάσεων που βασίζεται στην αυτόματη εξόρυξη των στοιχείων της προσωπικότητας των χρηστών. Το τελευταίο βασίζεται στη γλωσσολογική ανάλυση των γραπτών δεδομένων που σχετίζονται με τους υποψηφίους και είναι διαθέσιμα στις ιστοσελίδες κοινωνικής δικτύωσης. Τα χαρακτηριστικά προσωπικότητας των υποψηφίων θεωρούνται μεγάλης σημασίας στις περισσότερες θέσεις εργασίας αλλά αγνοούνται εντελώς στα υπάρχοντα συστήματα ηλεκτρονικών προσλήψεων. Στο σύστημα παροχής συστάσεων που υλοποιήθηκε, υπολογίστηκε η εξωστρέφεια του κάθε υποψηφίου, το οποίο χρησιμοποιήθηκε σαν ένα από τα κριτήρια κατάταξης. Στη συνέχεια, περιγράφεται η αρχιτεκτονική του συστήματος και παρουσιάζεται η εφαρμογή διαδικτύου που υλοποιήθηκε, η οποία ουσιαστικά είναι ένα ολοκληρωμένο σύστημα ηλεκτρονικών προσλήψεων που κατατάσσει τους υποψηφίους για κάθε θέση εργασίας. Η εφαρμογή αυτή δοκιμάστηκε με πραγματικά δεδομένα μέσω ενός πιλοτικού σεναρίου που σχεδιάστηκε σε συνεργασία με το τμήμα προσωπικού της Novartis Hellas. Για τα πειραματικά αποτελέσματα χρησιμοποιήθηκαν 100 ελληνικά ιστολόγια και υπολογίστηκαν τα LIWC σκορ για κάθε κατηγορία λέξεων σε κάθε ιστολόγιο. Τα αποτελέσματα αξιολογήθηκαν από έμπειρους υπεύθυνους προσλήψεων και δείχνουν την αποτελεσματικότητα του συστήματος σε ένα πραγματικό σενάριο πρόσληψης προσωπικού. Στο τρίτο κεφάλαιο προτείνεται η εφαρμογή εποπτευόμενων αλγορίθμων μάθησης (supervised learning algorithms) σε αυτοματοποιημένα συστήματα συστάσεων, για να αντιμετωπιστεί το πρόβλημα της κατάταξης. Η προτεινόμενη μέθοδος εφαρμόζεται σε ένα σύστημα ηλεκτρονικών προσλήψεων όπου, ένα σύνολο αντικειμενικών κριτηρίων εξάγεται από το LinkedIn προφίλ του υποψηφίου και υπολογίζονται τα χαρακτηριστικά της προσωπικότητάς του χρησιμοποιώντας γλωσσολογική ανάλυση στις δημοσιεύσεις του ιστολογίου του. Το νέο χαρακτηριστικό της μεθόδου είναι ότι πλέον αξιοποιεί τις κατατάξεις που έκανε ο υπεύθυνος προσλήψεων για κάθε θέση εργασίας, τις χρησιμοποιεί σαν δεδομένα εκπαίδευσης και ενσωματώνοντας αλγόριθμους μηχανικής μάθησης, το σύστημα «μαθαίνει» και ταξινομεί τους υποψηφίους με βάση τις προηγούμενες επιλογές. Μία ακόμη βελτίωση που προτείνεται στο κεφάλαιο αυτό είναι η δημιουργία και χρήση ταξινομίας, ώστε να γίνεται σημασιολογική αναζήτηση των δεξιοτήτων που απαιτούνται σε κάθε θέση εργασίας και να μετράται η σχετική προϋπηρεσία. Χρησιμοποιώντας τη σημασιολογική αναζήτηση, το σύστημα μπορεί να ανταποκριθεί σε κάθε θέση εργασίας ακόμα και αν απαιτεί συγκεκριμένη προϋπηρεσία και εξειδικευμένα προσόντα. Τα αποτελέσματα του συστήματος που υλοποιήθηκε για την εφαρμογή της μεθόδου που προτείνεται συγκρίθηκαν με τις κατατάξεις ενός υπεύθυνου προσλήψεων και έδειξαν ότι το σύστημα που αναπτύχθηκε μπορεί να χρησιμοποιηθεί σε πραγματικές συνθήκες με πολύ καλή ακρίβεια. Στο τέταρτο κεφάλαιο παρουσιάζεται μία μέθοδος εξόρυξης γνώσης σε επίπεδο κλώνων μοντέλων για την εκτίμηση της ποιότητας των εφαρμογών. Η μέθοδος προτείνει τη μοντελοποίηση του εννοιολογικού συστήματος μιας εφαρμογής. Στη συνέχεια, εφαρμόζοντας εργαλεία ανάκτησης υπογράφων γίνεται αναζήτηση κλώνων μοντέλων και υπολογίζονται οι κατάλληλες μετρικές ποιότητας. Σκοπός της μεθοδολογίας και του συστήματος που αναπτύχθηκε είναι να ανιχνεύει προβλήματα στο εννοιολογικό σχήμα μιας εφαρμογής όσο αφορά στην αποδοτικότητα, στη συνέπεια, στην ευχρηστία και γενικά στην ποιότητα μιας εφαρμογής. Η προτεινόμενη μεθοδολογία μπορεί να χρησιμοποιηθεί είτε στη φάση του σχεδιασμού μιας εφαρμογής είτε στην ανακατασκευή της. Η σωστή λειτουργία του συστήματος που αναπτύχθηκε επιβεβαιώνεται πειραματικά μέσω ενός πιλοτικού σεναρίου. / The internet gathers vast amounts of information, which remain unexploited. Data mining techniques can automate the process of extracting knowledge from the web, which can be exploited by information systems. On the other hand recommender systems can utilize knowledge for a specific domain to automatically find the best choice from a large number of alternatives according to certain specified criteria. Thus recommender systems are closely related to data mining techniques, which can be employed to extract useful data and produce automatic recommendations. This process becomes more complex when the recommendations are based on multiple criteria with different weights. Recommender systems have many applications in the areas of entertainment, e-commerce and other web services. Another application is the problem of assessing human traits, where the recommendation criteria are the candidates’ skills and the recommendation objective is to assess candidate’s relevance to a specific position. These are termed e-recruitment systems and automate the process of publishing positions and receiving CVs. The online recruitment problem is two-sided: It can be seeker-oriented or company-oriented. In the first case the e-recruitment system recommends to the candidate a list of job positions that better fit his profile. In the second case recruiters publish the specifications of available job positions, the candidates apply and then they are ranked based on criteria that depend on the job position. The purpose of this thesis is the study the application of data mining techniques with an objective to improve the recommendation process. The proposed techniques are applied to company-oriented e-recruitment systems. Specifically, the first chapter presents the basic characteristics of the recommender systems and focuses on systems that make content-based predictions. As an example of recommender systems a company oriented e-recruitment system was used to automatically evaluate job applicants. In this chapter, a new approach for candidate ranking is presented that has many improvements over the existing systems. The proposed approach differs from conventional e-recruitment systems in that it does not accept CVs, but candidates fill predefined online forms. Moreover, it models the resulting CVs using the HR-XML modeling language and then ranks the candidates, graduating the required qualifications for each job. The process of scoring and ranking algorithm is based on the Analytic Hierarchy Process, or AHP. To test the functionality and the efficiency of the system a scenario was set based on job offers from the liaison office of the University of Patras. The second chapter proposes a recommender system based on the algorithm of Analytic Hierarchy Process (AHP) and the automatic extraction of the users’ personality elements. The latter is based on the linguistic analysis of text data associated with the candidates and are available on social networking sites. The personality traits of the candidates are very important in most jobs, but completely ignored in the existing e-recruitment systems. Then, the system architecture is shown and the Web application that was implemented is presented, which is essentially an integrated e-recruitment system that ranks the candidates for each job. This application was tested with real data through a pilot script that was designed in collaboration with the personnel department of Novartis Hellas. For the experimental results were used 100 Greek blogs and LIWC scores were calculated for each category of words in each blog. The results were evaluated by experienced recruiters and show the effectiveness of the system in real scenario recruitment. The third chapter introduces the application of supervised learning algorithms on automated recommender systems, to solve the problem of ranking. The proposed method is applied to an e-recruitment system where a set of objective criteria is extracted from the candidate’s LinkedIn profile and then his personality traits are calculated using linguistic analysis to his blog posts. The new feature of this method is that it uses the recruiter’s rankings for each job position, uses them as training data and incorporates machine learning algorithms. The system “learns” and ranks the candidates based on previous recommendations. Another enhancement proposed in this chapter is the development and use of a taxonomy, to enable a semantic matching of the skills required for each job position and calculate the relevant experience. Using semantic matching, the system can respond to any job position even of it requires specific job experience and specialized skills. The results of the system implemented to validate the proposed method, were compared to a recruiter’s ranking and showed that the implemented system can be used in real world with very good accuracy. The fourth chapter presents a method for model clones mining to evaluate the applications’ quality. The method proposes the modeling of the conceptual schema of the application. Then, using tools for sub graphs mining a search for model clones is performed and the appropriate quality metrics are calculated. The purpose of the methodology and the implemented system was to detect problems in the conceptual schema of an application regarding the efficiency, consistency, usability and overall quality of an application. The proposed methodology can be used either in the design phase of an application or in the reconstruction phase. The proper functionality of the developed system is experimentally confirmed with a pilot scenario.
30

Ανάπτυξη συστήματος παροχής συστάσεων με χρήση τεχνικών σημασιολογικής ανάλυσης

Τουλιάτος, Γεράσιμος 09 July 2013 (has links)
Εξαιτίας του μεγάλου όγκου δεδομένων που υπάρχουν στον Παγκόσμιο Ιστό, η ανεύρεση της επιθυμητής πληροφορίας από ένα χρήστη μπορεί να αποδειχθεί χρονοβόρα. Διάφορα συστήματα προσωποποιημένης αναζήτησης έχουν προταθεί κατά καιρούς για να διευκολύνουν την επίλυση του συγκεκριμένου προβλήματος. Στόχος της παρούσας εργασίας ήταν η μελέτη διάφορων τεχνικών βελτίωσης των αποτελεσμάτων μιας αναζήτησης και η ανάπτυξη ενός συστήματος που θα προβλέπει την πληροφοριακή ανάγκη ενός χρήστη και θα του προτείνει ένα σύνολο από σελίδες που πιθανόν να τον ικανοποιούν. Επειδή το Web αποτελεί ένα πολύ μεγάλο σύστημα, η μελέτη μας ξεκινάει από το επίπεδο ιστοτόπου. Για την ανάπτυξη του συστήματός μας θα κάνουμε χρήση σημασιολογικών τεχνικών ανάλυσης. Πιο συγκεκριμένα, με χρήση μιας οντολογίας θα χαρακτηρίσουμε εννοιολογικά τις σελίδες ενός ιστοτόπου και επιπλέον θα χρησιμοποιήσουμε την οντολογία για να εκφράσουμε την πληροφοριακή ανάγκη του χρήστη. Κατά την περιήγησή του στον ιστότοπο ο χρήστης επιλέγει εκείνους τους συνδέσμους που θεωρεί ότι το φέρνουν πιο κοντά στο στόχο του. Εμείς, χαρακτηρίζουμε κάθε υπερσύνδεσμο με έννοιες που συνδέονται με το περιεχόμενο της σελίδας στην οποία αυτός δείχνει. Επειδή, ο κάθε χρήστης αναπαριστά την πληροφορία με ένα δικό του δίκτυο εννοιών, υιοθετήσαμε μια οντολογία που συγκεντρώνει αυτό που ονομάζουμε “κοινή γνώση” για ένα θέμα. Χρησιμοποιώντας, τις έννοιες από τους υπερσυνδέσμους που επέλεξε ο χρήστης, τις σχέσεις μεταξύ των εννοιών της οντολογίας εκτιμούμε τις πιθανές έννοιες – στόχους του χρήστη και προσδιορίζουμε με αυτόν τον τρόπο την πληροφοριακή του ανάγκη. Τέλος, κατατάσσουμε τις σελίδες ως προς τη εννοιολογική τους συσχέτιση με τα ενδιαφέροντα του χρήστη και δημιουργούμε τις προτάσεις μας. / Due to the large volume of data available on the Web, finding the desired information can be time consuming. Various personalized search systems have been proposed to help resolve this problem. The aim of this work was to study various techniques used to deal with the problem and also, develop a system that will predict a user's information need and propose a set of pages that might satisfy him. Because the Web is a very large system, our study starts at the level of a site. In developing our system we will make use of semantic analysis techniques. Specifically, we will use an ontology to describe the contents of the pages of a website and we will also use the ontology to express the information need of the user. While browsing, the user selects those links, that considers they will bring him closer to his goal. We characterize each link with concepts associated with the content of the page they point to. Because each user represents the information in his own concept network, we adopted an ontology to express what is said to be 'common knowledge' on a topic. Using the concepts of the hyperlinks that the user selected and the relations between the concepts of the ontology, we choose the possible concept that user has in mind, and thus determine his information needs. Finally, we rank the pages of the website against the estimated informational needs of the user, creating so our proposals.

Page generated in 0.1396 seconds