Spelling suggestions: "subject:"σημασιολογικός ιστό"" "subject:"σημασιολογικός εκτός""
11 |
Ανίχνευση και εξόρυξη οικονομικών και εμπορικών πληροφοριών, από τα δεδομένα διαδικτύου με χρήση "ευφυών μέσων" (intelligent agents), και παρουσίαση αυτών των πληροφοριών στους χρήστες με χρήση κινητών συσκευών / Using intelligent agents for mining and distribution of business knowledge from internet data and presentation of them via mobile devicesΤατσιόπουλος, Χρήστος 19 April 2010 (has links)
Στα πλαίσια της παρούσης διδακτορικής διατριβής, εξετάζονται σύγχρονες μεθοδολογίες αναπαράστασης και διαχείρισης γνώσης όπως οι οντολογίες. Επίσης, εξετάζονται σύγχρονες μεθοδολογίες ανακάλυψης και διανομής γνώσης και περιεχομένου όπως οι ευφυείς διαμεσολαβητές (intelligent agents). Μαζί με τα ανωτέρω, εξετάζονται αλγόριθμοι ανάκτησης γνώσης από πολύ μεγάλους όγκους δεδομένων, αναπαριστάμενων υπό την μορφή οντολογιών και δενδρικών δομών υπό την έννοια ταξινομημένων γράφων, βάσει πιο κλασσικών μεθοδολογιών και μοντέλων που αφορούν και αναπτύχθηκαν κυρίως για επιχειρηματικά δεδομένα, όπως είναι οι αλγόριθμοι ταξινόμησης, ομαδοποίησης και συσχέτισης.
Η παρούσα Δ.Δ. εξετάζει επίσης με βάση τις ανωτέρω μεθοδολογίες την «ομοιότητα» (similarity) κατανόησης εννοιών σε κάποιο ορισμένο πεδίο γνώσης από συγκεκριμένους χρήστες του πεδίου αυτού. Στη συνέχεια, προτείνει μία μεθοδολογία αυτόματης ανταλλαγής δομημένου περιεχομένου και εννοιών μεταξύ αυτών, ανάλογα των κοινών ή μη ενδιαφερόντων τους. Το σύστημα αναπτύσσεται σε θεωρητικό επίπεδο στην μεθοδολογία ONARM και υλοποιείται σε επίπεδο λογισμικού με βάση την προτεινόμενη μεθοδολογία στο σύστημα Concept Net. / In the frame of the present PhD dissertation, it is examined the complex problem of knowledge representation and management and methodologies relevant methodologies like the ontologies and intelligent agents. In this frame complex algorithms for knowledge acquisition and representation are examined from very large data volumes, that are represented in terms of ontological graphs (trees – taxonomies), in conjunction with more classical methodologies like algorithm for association, clustering and categorization.
Based on these, the present work proposes the ONARM methodology, focusing in the intelligent understanding of concepts and the intelligent exchange of content, based on concept similarity principles. Then, based on the ONARM theoretical background, build the software platform CONCEPT NET in the domain of tourism.
|
12 |
Εννοιολογικός προσανατολισμός της αναζήτησης στον Παγκόσμιο ΙστόΒεργέτη, Δανάη 09 October 2014 (has links)
Tα τελευταία χρόνια, η εξάπλωση του διαδικτύου και το εύρος της πληροφορίας
που διατίθεται στο χρήστη,
καθιστούν
αναγκαία
τη
χρησιμοποίηση
σημασιολογικών τεχνικών προσωποποίησης, προκειμένου να βελτιώσουν την
εμπειρία του χρήστη στο διαδίκτυο. Στις μηχανές αναζήτησης, οι χρήστες
βελτιώνουν το επερώτημά τους με την προσθήκη, την αφαίρεση ή την
αντικατάσταση των λέξεων. Παρ 'όλα αυτά , εκτός από την αλληλεπίδραση με
μια μηχανή αναζήτησης, η εμπειρία ενός χρήστη στο διαδίκτυο κατά την
αναζήτηση της σωστής πληροφορίας, περιλαμβάνει και την περιήγησή του σε
σελίδες ενός δικτυακού τόπου ή μια σειρά από δικτυακούς τόπους. Κατά τη
διάρκεια της συνεδρίας του, ο χρήστης αναδιαμορφώνει την αναζήτησή του.
Ωστόσο, τόσο ο καθορισμός της σημασιολογίας της αναζήτησής του, όσο και ο
προσανατολισμός της αναζήτησής του (γενίκευση ή εξειδίκευση σε ένα
σημασιολογικό πεδίο) με βάση την πλοήγηση μέσα από τις σελίδες, δεν είναι
τόσο εύκολοι. Κάθε σελίδα περιέχει περισσότερες από μία έννοιες. Επιπλέον, η
επιλογή των αντιπροσωπευτικότερων είναι πολύπλοκη διαδικασία.
Σκοπός της παρούσας εργασίας είναι η παρουσίαση της μεθοδολογίας SOSACT.
Η
μεθοδολογία
SOSACT
αποτελεί
μια
σημασιολογική
μεθοδολογία
εξατομίκευσης που παρακολουθεί τις επιλογές του χρήστη κατά τη συνεδρία του
και καθορίζει αν ο χρήστης ειδικεύει ή γενικεύει την πλοήγηση του μέσα από τη
σημασιολογική ανάλυση των σελίδων,
σε ένα εννοιολογικό πεδίο.
Η
μεθοδολογία SOSACT ορίζει το σημασιολογικό προσανατολισμό της πλοήγησης
του χρήστη. Επιπλέον,
στην παρούσα εργασία προτείνεται ο αλγόριθμος
SOSACT, ο οποίος εντοπίζει το σημασιολογικό προσανατολισμό του χρήστη με
τη βοήθεια μίας ταξινομίας.
Η μεθοδολογία SOSACT υλοποιείται από το σύστημα SOSACT. Το σύστημα
SOSACT εφαρμόζει τον αλγόριθμο SOSACT και προτείνει χρήσιμες συστάσεις
προς το χρήστη για τη βελτίωση της διαδικτυακής αναζήτησής του . Το σύστημα
SOSACT αξιολογήθηκε με τη χρησιμοποίηση πραγματικής δραστηριότητας
χρηστών σε μια ιστοσελίδα, για ορισμένο χρονικό διάστημα.
Η μεθοδολογία SOSACT μπορεί να εφαρμοστεί και σε ένα σώμα κειμένων και
όχι μόνο σε διαδικτυακές πηγές. Μπορεί να γίνει ένα χρήσιμο εργαλείο για τη
βελτίωση της πλοήγησης στο διαδίκτυο. Επιπλέον, η προτεινόμενη μεθοδολογία
μπορεί να γεφυρώσει τις τεχνικές αποσαφήνισης του επερωτήματος στις
μηχανές αναζήτησης και τις τεχνικές αναδιαμόρφωσης του αντικειμένου
περιήγησης. Η μεθοδολογία SOSACT θα μπορούσε να χρησιμοποιηθεί σε μια
συγκριτική μελέτη μεταξύ των δύο αυτών τομέων και να οδηγήσει σε νέες
τεχνικές και στις δύο περιοχές έρευνας του Σημασιολογικού Ιστού. / In recent years, the spread of the World Wide Web, as well as the range of
information available to the user make the use of semantic personalization
techniques a necessity in order to enhance the user experience on the web. In search
engines, users refine their query by adding, removing or replacing the keywords in
their query. Thus, query refinement is easy to be detected and tell whether a user
generalizes or specializes his web search. Nevertheless, besides interaction with a
search engine, a user web search involves browsing and navigating through the
pages of a web site or a number of web sites while seeking the right information.
During this session the user reformulates his search. But, defining search orientation
(generalization or specialization) based on navigation through web pages is not that
easy. Each page contains more than one concept. Furthermore, the concepts may be
developed in the same extend and it is difficult to tell about the representative
semantics of a certain page and thus a user session’s orientation.
In order to define user navigation’s orientation a semantic web personalization
methodology is developed, the SOSACT methodology, which tracks user’s hits
through a session and defines whether a user specializes or generalizes his
navigation through semantics analysis of the pages in his session window. Moreover,
the SOSACT algorithm is proposed of capturing user session orientation based on
concept taxonomy.
The SOSACT methodology is implemented by the SOSACT system. The SOSACT
system applies the SOSACT algorithm and proposes useful recommendation to the
user to improve his web search. The SOSACT system is evaluated on real user
activity in a web site for a certain period of time. The experimental outcomes
satisfied the prospective results.
The SOSACT methodology could become a useful tool for navigation refinement.
Furthermore, this work is proved to bridge search engine query refinement and
browsing reformulation techniques. It could be a comparative study between these
two fields and lead to new techniques in both areas or migration techniques between
both areas.
|
13 |
Προς το Web 3.0 : διαδικασία ανάπτυξης και αρχιτεκτονική υποστήριξης εφαρμογών παγκόσμιου ιστού που συνδυάζουν τεχνολογίες Web 2.0 και semantic web / Towards Web 3.0 : development process and supporting architecture for web applications combining semantic web and Web 2.0 technologiesΠομόνης, Τζανέτος 21 March 2011 (has links)
Η παρούσα διατριβή έχει ως στόχο να συνεισφέρει στον τομέα του Web Engineering εισάγοντας τρόπους αντιμετώπισης αυτών των προβλημάτων που αντιμετωπίζουν οι Μηχανικοί Παγκόσμιου Ιστού κατά τη διάρκεια του κύκλου ζωής των Εφαρμογών και των Πληροφοριακών Συστημάτων
Παγκόσμιου Ιστού επόμενης γενιάς, και ειδικότερα κατά το σχεδιασμό, την ανάπτυξη και συντήρησή τους.
Ειδικά τα τελευταία χρόνια, η εξέλιξη των εφαρμογών Παγκόσμιου Ιστού στηρίζεται, κατά κύριο λόγο, σε δυο τεχνολογικούς “πυλώνες”: στις βασικές αρχές και τεχνολογίες του Web 2.0 και στο Semantic Web. Είναι ισχυρή η πεποίθηση πως αυτές οι δύο διαφορετικές “σχολές” στην εξέλιξη του Παγκόσμιου Ιστού δε βρίσκονται σε σύγκρουση μεταξύ τους, αλλά μπορούν να συνδυαστούν κατάλληλα ώστε να ξεπεράσουν τις όποιες εγγενείς αδυναμίες τους. Κατ' αυτόν τον τρόπο, οι εφαρμογές Παγκόσμιου Ιστού της επόμενης γενιάς θα είναι σε θέση να συνδυάζουν τις αρχές του Web 2.0, κυρίως αυτές που στοχεύουν στην ευχρηστία των εφαρμογών και στη συνεργατική ανάπτυξη, με το ισχυρό τεχνολογικό υπόβαθρο του Semantic Web που διευκολύνει σε μεγάλο βαθμό την ανταλλαγή και το διαμοιρασμό πληροφορίας μεταξύ των εφαρμογών Παγκόσμιου Ιστού.
Προσφάτως, έχει αρχίσει να χρησιμοποιείται ευρέως ο όρος Web 3.0 για να περιγράψει τη μελλοντική κατεύθυνση που τείνουν να ακολουθήσουν οι εφαρμογές Παγκόσμιου Ιστού. Το Web 3.0 προβλέπεται σαφώς να περιλαμβάνει τις αρχές του Semantic Web και του Web 2.0, αλλά οι ερευνητές πιστεύουν πως θα περιλαμβάνει επίσης και κάποια πιο εξειδικευμένα πεδία όπως η Τεχνητή Νοημοσύνη στον Παγκόσμιο Ιστό (Web AI). Σε κάθε περίπτωση πάντως, δεν έχει καταστεί ξεκάθαρο, όχι μόνο το ποια θα είναι τα πλήρη χαρακτηριστικά του Web 3.0, αλλά και το ποιες θα είναι οι κατάλληλες διαδικασίες και τεχνολογίες, με βάση τις οποίες θα μπορούν να δομηθούν και να αναπτυχθούν οι αντίστοιχες εφαρμογές επόμενης γενιάς, με αποτέλεσμα η πορεία προς το Web 3.0 να γίνεται προς το παρόν με αυθαίρετο και άναρχο τρόπο.
Σε αυτή την κατεύθυνση, μελετάται η παρούσα κατάσταση σχετικά με την υποστήριξη των εφαρμογών του Web 3.0, και γίνονται συγκεκριμένες προτάσεις για τη βελτίωσή της.
Σαν πρώτο βήμα προτείνεται μια αρχιτεκτονική τριών επιπέδων (3-tier), η οποία αφενός, στο χαμηλότερο επίπεδο, περιλαμβάνει μια ισχυρή υποδομή σημασιακής βάσης γνώσης που μπορεί να υποστηρίξει το συνδυασμό πολλαπλών διάσπαρτων πηγών δεδομένων, χωρίς να απαιτεί ένα ισχυρό προϋπάρχον σημασιακό υπόβαθρο, και αφετέρου, στα ψηλότερα επίπεδα, προσφέρει μεγάλη ευελιξία στο χρήστη κατά την αλληλεπίδραση με το υποκείμενο μοντέλο οντολογιών, και μπορεί να υποστηρίξει τη συνεργατική ανάπτυξη των εφαρμογών Παγκόσμιου Ιστού επόμενης γενιάς.
Επίσης, ένα από τα σημαντικότερα τμήματα της παρούσας διατριβής, είναι η πρόταση για μια συγκεκριμένη διαδικασία ανάπτυξης και ένα μοντέλο κύκλου ζωής των εφαρμογών του Web 3.0, όπου, λαμβάνοντας υπόψη τα ιδιαίτερα στοιχεία και τον διττό χαρακτήρα των εν λόγω εφαρμογών, δίνονται εμπεριστατωμένα βήματα για το πως μπορούν να ξεπεραστούν τα όποια εμπόδια και να υπάρξει η μέγιστη δυνατή απόδοση κατά το σχεδιασμό και την ανάπτυξη των εφαρμογών Παγκόσμιου Ιστού επόμενης γενιάς.
Με βάση τα παραπάνω, δίνεται η δυνατότητα για την ανάπτυξη κάποιων ενδεικτικών εφαρμογών Παγκόσμιου Ιστού, οι οποίες συνδυάζουν τη φιλοσοφία του Web 2.0 και το ισχυρό τεχνολογικό υπόβαθρο του Semantic Web. / --
|
14 |
Συστήματα διαχείρισης περιεχομένου και σημαντικός ιστός / Content management systems and semantic webΝάκος, Κωνσταντίνος 24 January 2012 (has links)
Ένα μεγάλο ποσοστό ιστότοπων παράγεται και συντηρείται με χρήση Συστημάτων Διαχείρισης Περιεχομένου (Content Management Systems – CMS), τα οποία, εκτός από περιεχόμενο κειμένου, διαχειρίζονται και δομημένα δεδομένα. Από την άλλη, ο Σημαντικός Ιστός αν και έχει αρχίσει να γίνεται πραγματικότητα παραμένει σε εμβρυϊκό στάδιο σε σχέση με τον παραδοσιακό Ιστό. Η σύγκλιση των δύο κόσμων θα μπορούσε να αποφέρει τεράστια οφέλη και να πυροδοτήσει την ταχύτερη εξάπλωση του Σημαντικού Ιστού. Στην παρούσα διπλωματική εργασία καταγράφονται και μελετώνται τα πιο διαδεδομένα εργαλεία Σημαντικού εμπλουτισμού CMS, καθώς και μια σειρά από CMS που φέρουν εγγενή χαρακτηριστικά Σημαντικού Ιστού. Τέλος, υλοποιείται μια πρότυπη δικτυακή πύλη με τη χρήση της έκδοσης 7 του CMS Drupal, η οποία ενσωματώνει χαρακτηριστικά Σημαντικού Ιστού στον πυρήνα της (όπως αυτόματη ενσωμάτωση στις σελίδες που παράγονται του νεοσύστατου πρότυπου RDFa). / Currently a large number of Web sites are driven by Content Management Systems (CMS), which manage not only textual content but also structured data. On the other hand, even though Semantic Web is beginning to materialize, it is still dwarfed by the traditional Web. The convergence of the two worlds could produce significant benefits and trigger a faster spread of the Semantic Web. In the current diploma thesis, prevalent CMS semantic enrichment tools and a series of Semantic CMS are thoroughly examined. Finally, an experimental web portal is developed using CMS Drupal’s version 7, which integrates Semantic Web features in its core (such as the automatic embedding of the emergent RDFa standard in the pages created).
|
15 |
Semantic annotation system for medical images / Σύστημα περιγραφής ιατρικών εικόνων με σημασιολογικά κριτήριαΚόλιας, Βασίλειος 10 August 2011 (has links)
Nowadays,hospitals are equipped with high resolution
medical
imaging
systems
such
as
MRI,
CT
that
help
the
radiologists
to
make
more
accurate
diagnosis.
However
these
systems
cannot
give
any
information
of
the
explicit
content
that
is
on
the
image
pixels.
The
vast
amount
of
images
that
are
produced
in
hospitals
is
processed
mainly
by
the
medical
domain
users.
Even
systems
such
as
PACS
cannot
retrieve
images
with
anatomical
or
disease-‐related
criteria.
The
integrating
of
semantic
web
technologies
in
health
care
can
provide
a
solution.
The
benefits
for
the
semantic
web
technologies
are
owed
to
the
core
element
of
the
semantic
web,
which
is
the
ontology.
The
ontology
sets
strict
relationships
between
its
entities.
The
main
goal
of
this
thesis
is
to
design
and
develop
an
online
approach
for
Semantic
Annotation
and
Retrieval
of
Medical
Images.
The
architecture
of
the
proposed
system
is
based
on
a
service
oriented
approach
that
enables
the
expandability
of
the
system
by
integrating
new
features
such
as
image
processing
algorithms
to
perform
Computer
Aided
Diagnosis
(CAD)
tasks
and
to
make
queries
with
low
-‐
level
image
characteristics.
Also
the
adopting
of
such
an
approach
for
the
architecture
allows
to
add
new
reference
ontologies
to
the
system
without
redesigning
the
core
architecture.
The
ontology
framework
of
the
system
includes
(a)
three
reference
ontologies,
namely
the
Foundational
Model
of
Anatomy
(FMA)
for
the
anatomy
annotation,
the
International
Classification
of
Disease
(ICD-‐10)
for
the
disease
annotation
and
the
RadLex
for
the
radiological
findings
and
(b)
an
application
ontology
that
connects
the
medical
document
with
the
concepts
of
the
medical
ontologies
(FMA,
ICD-‐10,
Radlex)
and
it
also
contains
information
about
patient,
hospital
and
image
modality.
Part
of
application
ontology
information
is
extracted
from
the
DICOM
header.
In
the
context
of
the
current
thesis,
the
system
was
used
to
annotate
and
retrieve
several
medical
images.
The
proposed
online
approach
for
annotation
and
retrieval
of
medical
images
system
can
enable
the
interoperability
between
different
Health
Information
Systems
(HIS)
and
can
constitute
a
tool
for
discovering
the
hidden
knowledge
in
medical
image
data. / -
|
16 |
Σημασιολογικές μηχανές αναζήτησης Παγκόσμιου Ιστού / Semantic web clustering enginesΚαναβός, Ανδρέας 11 June 2012 (has links)
Οι μηχανές αναζήτησης είναι ένα ανεκτίμητο εργαλείο για την ανάκτηση πληροφοριών από το διαδίκτυο. Απαντώντας στα ερωτήματα του χρήστη, επιστρέφουν μια λίστα με αποτελέσματα, ταξινομημένα κατά σειρά, με βάση τη συνάφεια του περιεχομένου τους προς το ερώτημα. Ωστόσο, αν και οι μηχανές αναζήτησης είναι σίγουρα αρκετά καλές στην αναζήτηση συγκεκριμένων ερωτημάτων, όπως είναι η εύρεση μιας συγκεκριμένης ιστοσελίδας, αντίθετα μπορούν να είναι λιγότερο αποτελεσματικές όσον αφορά την αναζήτηση ασαφών, προς αυτές, ερωτημάτων, όπως για παράδειγμα όταν συναντούμε το φαινόμενο της αμφισημίας, όπου μια λέξη μπορεί να πάρει περισσότερες από μία έννοιες μέσα στα συμφραζόμενα διαφορετικής πρότασης. Άλλο ένα παράδειγμα ερωτήματος είναι όταν υπάρχουν περισσότερες από δύο υποκατηγορίες και νοήματα σ’ ένα ερώτημα, πράγμα που σημαίνει ότι ο χρήστης θα πρέπει να διατρέξει έναν μεγάλο αριθμό αποτελεσμάτων για να βρει αυτά που τον ενδιαφέρουν. Στόχος της παρούσας διπλωματικής εργασίας είναι η ανάπτυξη ενός έμπειρου συστήματος, που θα μετά-επεξεργάζεται τις απαντήσεις μας κλασικής μηχανής αναζήτησης και θα ομαδοποιεί τα αποτελέσματα σε μια ιεραρχία από κατηγορίες με βάση το περιεχόμενο τους.
Οι σημαντικότερες σημερινές λύσεις πάνω στο πρόβλημα της αντιστοίχησης των αποτελεσμάτων σε συστάδες είναι τα συστήματα Vivisimo, Carrot, CREDO και SnakeT. Η συνεισφορά που προτείνεται στη παρούσα εργασία, είναι η χρήση μίας σειράς τεχνικών που βελτιώνουν την ποιότητα των ομάδων απάντησης. Μία πρωτότυπη τεχνική που χρησιμοποιήθηκε στην παρούσα εργασία είναι η αναδιατύπωση των ερωτημάτων (query reformulation) μέσω διαφόρων στρατηγικών. Ο λόγος που παρουσιάζονται τέτοιες στρατηγικές, είναι επειδή συχνά οι χρήστες τροποποιούν ένα προηγούμενο ερώτημα αναζήτησης ώστε να ανακτήσουν καλύτερα αποτελέσματα ή κι επειδή πολλές φορές δεν μπορούν να διατυπώσουν σωστά ένα ερώτημα λόγω της μη γνώσης επιθυμητών αποτελεσμάτων.
Επιπλέον, επωφεληθήκαμε από τη Wikipedia αντλώντας δεδομένα από τους τίτλους των σελίδων αλλά κι από τις κατηγορίες στις οποίες ανήκουν αυτές οι σελίδες. Αυτό γίνεται μέσω της σύνδεσης των συχνών όρων που ανήκουν στα κείμενα των αποτελεσμάτων αναζήτησης με τη σημασιολογική εγκυκλοπαίδεια Wikipedia, με σκοπό την εξαγωγή των διαφορετικών εννοιών και νοημάτων του κάθε όρου. Ειδικότερα, αναζητείται στη Wikipedia η ύπαρξη σελίδας (ή σελίδων για το φαινόμενο της αμφισημίας) που αντιστοιχίζονται στους όρους αυτούς με αποτέλεσμα τη χρησιμοποίηση του τίτλου και της κατηγορίας ως επιπρόσθετη πληροφορία. Τέλος η Wikipedia χρησιμοποιείται και στην ανάθεση ετικετών στις τελικές συστάδες ως επιπρόσθετη πληροφορία κάθε ξεχωριστού κειμένου που βρίσκεται στη συστάδα. / -
|
17 |
Γραμματειακή υποστήριξη σχολών πανεπιστημίων : Ανάπτυξη ιστοσελίδας με χρήση τεχνολογιών Σημασιολογικού Ιστού (Semantic Web)Φωτεινός, Γεώργιος 30 April 2014 (has links)
Ένα υποσύνολο του τεράστιου όγκου πληροφοριών του Ιστού αφορά τα Ανοικτά Δεδομένα (Open Data), τα οποία αποτελούν πληροφορίες, δημόσιες ή άλλες, στις οποίες ο καθένας μπορεί να έχει πρόσβαση και να τις χρησιμοποιεί περαιτέρω για οποιονδήποτε σκοπό με στόχο να προσθέσει αξία σε αυτές. Η δυναμική των ανοιχτών δεδομένων γίνεται αντιληπτή όταν σύνολα δεδομένων των δημόσιων οργανισμών μετατρέπονται σε πραγματικά ανοιχτά δεδομένα, δηλαδή χωρίς νομικούς, οικονομικούς ή τεχνολογικούς περιορισμούς για την περαιτέρω χρήση τους από τρίτους. Τα ανοικτά δεδομένα ενός Τμήματος ή Σχολής Πανεπιστημίου μπορούν να δημιουργήσουν προστιθέμενη αξία και να έχουν θετικό αντίκτυπο σε πολλές διαφορετικές περιοχές, στη συμμετοχή, την καινοτομία, τη βελτίωση της αποδοτικότητας και αποτελεσματικότητας των Πανεπιστημιακών υπηρεσιών, την παραγωγή νέων γνώσεων από συνδυασμό στοιχείων κ.α. Ο τελικός στόχος είναι τα ανοικτά δεδομένα να καταστούν Ανοικτά Διασυνδεδεμένα Δεδομένα. Τα Διασυνδεδεμένα Δεδομένα, αποκτούν νόημα αντιληπτό και επεξεργάσιμο από μηχανές, επειδή περιγράφονται σημασιολογικά με την χρήση οντολογιών. Έτσι τα δεδομένα γίνονται πιο «έξυπνα» και πιο χρήσιμα μέσα από την διάρθρωση που αποκτούν. Στην παρούσα διπλωματική εργασία, υλοποιείται μια πρότυπη δικτυακή πύλη με την χρήση του Συστήματος Διαχείρισης Περιεχομένου CMS Drupal, το οποίο ενσωματώνει τεχνολογίες Σημασιολογικού Ιστού στον πυρήνα του, με σκοπό την μετατροπή των δεδομένων ενός Τμήματος ή Σχολής Πανεπιστημίου σε Ανοικτά Διασυνδεδεμένα Δεδομένα διαθέσιμα στην τρίτη γενιά του Ιστού τον Σημασιολογικό Ιστό. / A subset of the vast amount of information of the web is concerned with open data, which is information, whether public or other, in which everyone can have access and use it for any purpose with a view to add value. The dynamics of open data becomes noticeable when datasets of public bodies are transformed into truly open data , i.e. without legal, financial or technological limitations for further use by third parties. The open data of a university department or faculty can add value and have a positive impact on many different areas such as participation, innovation, improvisation of the efficiency and effectiveness of university services, generating new knowledge from a combination of elements , etc. The ultimate goal is to transform open data into open linked data. The linked data , become meaningful and processable by machines, given that they are semantically described, using ontologies. Thus, the data become more " intelligent " and more useful through the structure they acquire. In this thesis , a prototype web portal is implemented using the content management system CMS Drupal, which incorporates semantic web technologies in the core, in order to convert the data of a University Department or School in open linked data available in the third generation web semantic web.
|
18 |
Αξιοποίηση τεχνολογιών ανοικτού κώδικα για την ανάπτυξη εφαρμογών σημασιολογικού ιστούΚασσέ, Παρασκευή 14 February 2012 (has links)
Τα τελευταία χρόνια υπάρχει εκθετική αύξηση του όγκου της πληροφορίας που δημοσιεύεται στο Διαδίκτυο. Καθώς όμως η πληροφορία αυτή δε συνδέεται με τη σημασιολογία της παρατηρείται δυσκολία στη διαχείρισή της και στην πρόσβαση σε αυτήν. Ο Σημασιολογικός Ιστός, λοιπόν, είναι μια ομάδα μεθόδων και τεχνολογιών που σκοπεύουν να δώσουν τη δυνατότητα στις μηχανές να κατανοήσουν τη “σημασιολογία” των πληροφοριών σχετικά με τον Παγκόσμιο Ιστό.
Ο Σημασιολογικός Ιστός (Semantic Web) αποτελεί επέκταση του Παγκοσμίου Ιστού. Στο Σημασιολογικό Ιστό οι πληροφορίες εμπλουτίζονται με μεταδεδομένα, τα οποία υπακουούν σε κοινά πρότυπα και επιτρέπουν την εξαγωγή γνώσεως από την ήδη υπάρχουσα, καθώς επίσης και το συνδυασμό της υπάρχουσας πληροφορίας με στόχο την εξαγωγή συμπερασμάτων. Απώτερος στόχος του Σημασιολογικού Ιστού είναι η βελτιωμένη αναζήτηση, η εκτέλεση σύνθετων διεργασιών και η εξατομίκευση της πληροφορίας σύμφωνα με τις ανάγκες του κάθε χρήστη.
Στην παρούσα διπλωματική εργασία μελετήθηκε η χρήση των τεχνολογιών του Σημασιολογικού Ιστού για τη βελτίωση της πρόσβασης σε πολιτισμικά δεδομένα. Συγκεκριμένα αρχικά έγινε εμβάθυνση στις τεχνολογίες και στις θεμελιώδεις έννοιες του Σημασιολογικού Ιστού. Παρουσιάστηκαν αναλυτικά οι βασικές γλώσσες σήμανσης: XML που επιτρέπει τη δημιουργία δομημένων εγγράφων με λεξιλόγιο καθορισμένο από το χρήστη, RDF που προσφέρει ένα μοντέλο δεδομένων για την περιγραφή πληροφοριών με τέτοιο τρόπο ώστε να είναι δυνατή η ανάγνωση και η κατανόησή τους από μηχανές. Αναφέρθηκαν, ακόμη, οι διάφοροι τρόποι σύνταξης της γλώσσας RDF καθώς και πως γίνεται αναζήτηση σε γράφους RDF με το πρωτόκολλο SPARQL. Στη συνέχεια ακολουθεί η περιγραφή της RDFS, που πρόκειται για γλώσσα περιγραφής του RDF λεξιλογίου. Έχοντας παρουσιαστεί σε προηγούμενο κεφάλαιο η έννοια της οντολογίας, γίνεται αναφορά στη σημασιολογική γλώσσα σήμανσης OWL, που χρησιμοποιείται για την έκδοση και διανομή οντολογιών στο Διαδίκτυο. Έπειτα ακολουθεί μια ανασκόπηση από επιλεγμένα έργα, ελληνικά, ευρωπαϊκά και διεθνή, των τελευταίων ετών που χρησιμοποιούν τις τεχνολογίες του Σημασιολογικού Ιστού στο τομέα του πολιτισμού και της πολιτισμικής κληρονομιάς. Τέλος στο έβδομο κεφάλαιο παρουσιάζεται μία εφαρμογή διαχείρισης αρχαιολογικών χώρων-μνημείων και μελετώνται σε βάθος οι τεχνολογίες και τα εργαλεία που χρησιμοποιήθηκαν για την υλοποίησή της. / Over the past few years there has been exponential increase of the volume of information published on the Internet. Since information is not connected to its semantics, it is difficult to manipulate and access it. Therefore, the Semantic Web consists of methods and technologies that aim to enable machines to understand information’s semantics.
The Semantic Web is an extension of the World Wide Web (WWW). Specifically, information is enriched with metadata, which are subject to common standards and permit knowledge extraction from the existing one and the combination of existing information in order to infer implicit knowledge, as well. Future goals of the Semantic Web are enhanced searching, complicated processes’ execution and information personalization according to each user’s needs.
This post-graduate diploma thesis researches the usage of Semantic Web technologies for the enhancement of the access to cultural data. More specifically, Semantic Web technologies and essential concepts were studied. Basic markup languages were presented analytically: XML that allows structured documents’ creation with user defined vocabulary, RDF that offers a data model for such information description that it is readable and understandable by machines. Also, various RDF syntaxes and how to search RDF graphs using SPARQL protocol were referred. Below RDFS description follows, that is a description language of RDF vocabulary. After having introduced the concept of ontology in previous chapter, the semantic markup language OWL is presented, that is used for ontology publishing and distribution on the Internet. A review of selected projects of the last years, Greek, European and international, which are characterized by the application of technologies of the Semantic Web in the sector of Culture and Cultural heritage, is presented. In the last chapter, an application that manages archaeological places- sites is presented and it is studied technologies and tools that were used for it.
|
19 |
Σημασιολογική μοντελοποίηση συμπεριφοράς και μηχανισμός πρόβλεψης απόδοσης εκπαιδευομένων σε συστήματα ανοικτής και εξ' αποστάσεως εκπαίδευσηςΜπουφαρδέα, Ευαγγελία 14 February 2012 (has links)
Η ραγδαία εξάπλωση του Internet έχει προκαλέσει σημαντικές αλλαγές σε πολλούς κλάδους της οικονομίας και της κοινωνίας παγκόσμια. Με τη ραγδαία ανάπτυξη των Τεχνολογιών της Πληροφορικής και της Τεχνολογίας, μια νέα μορφή εκπαίδευσης εμφανίστηκε, που δεν είναι άλλη από το e-learning (εκπαίδευση από απόσταση), που έφερε την επανάσταση στο εκπαιδευτικό γίγνεσθαι.
Επιπρόσθετα ο Παγκόσμιος Ιστός σταδιακά μετεξελίσσεται στο Σημασιολογικό Παγκόσμιο Ιστό (Semantic Web) νέα μοντέλα και πρότυπα (XML, RDF, OWL) αναπτύσσονται για την προώθηση αυτής της διαδικασίας. Η έκφραση, μετάδοση και αναζήτηση πληροφοριών με χρήση αυτών των προτύπων ανοίγει νέους ορίζοντες στη χρήση του Διαδικτύου. Οι οντολογίες κερδίζουν ολοένα έδαφος για την αναπαράσταση γνώσης.
Σε μια μεγάλη οντολογία που περιέχει χρήσιμα δεδομένα για ένα σύστημα εξ’ αποστάσεως εκπαίδευσης, αξίζει κάποιος να ερευνήσει την «κρυμμένη γνώση», δηλαδή να ανακαλύψει πιθανές συσχετίσεις ή συνειρμούς, να βρει πρότυπα ή μορφές που επαναλαμβάνονται ή ακραία φαινόμενα.
Η παρούσα διπλωματική εργασία αποτελεί μια επίδειξη τεχνολογίας για την έγκυρη και έγκαιρη πρόβλεψη της απόδοσης των φοιτητών σε ένα σύστημα εξ’ αποστάσεως εκπαίδευσης. Η βασική ιδέα προκύπτει από την ανάγκη να σχεδιαστεί μία οντολογία η οποία θα μπορεί να αποθηκεύσει τη γνώση σχετικά με τις ικανότητες φοιτητών (user profile) σε σχέση με ένα συγκεκριμένο εκπαιδευτικό αντικείμενο (ΠΛΗ23 – Τηλεματική, Διαδίκτυο του Ελληνικού Ανοικτού Πανεπιστημίου (ΕΑΠ) )η οποία έχει πολύ συγκεκριμένη ύλη και 4 υποχρεωτικές γραπτές εργασίες ανά έτος). Στη συνέχεια παρουσιάζονται τα αποτελέσματα μελέτης της ανάλυσης των δεδομένων των φοιτητών με τεχνικές εξόρυξης γνώσης. Η εύρεση των κανόνων πραγματοποιήθηκε μέσω του εργαλείου Weka. Το αποτέλεσμα που προέκυψε είναι μία βάση γνώσης βάσει της οποίας γίνεται έγκαιρα και έγκυρα η πρόβλεψη της συμπεριφοράς του φοιτητή, δηλαδή αν θα καταφέρει να ολοκληρώσει επιτυχώς ή μη τη Θεματική Ενότητα που έχει αναλάβει στο ΕΑΠ, ώστε ο διδάσκων να μπορεί από πολύ νωρίς να υποστηρίξει το φοιτητή με επιπλέον υλικό αν απαιτείται. / The rapid spread of Internet has caused significant changes in many sectors of the economy and society worldwide. From those changes could not be left out of education. With the rapid development of information technologies and technology, a new form of education appears, e-learning (distance education), which revolutionized the educational process.
Furthermore, while the World Wide Web gradually transforms into Semantic Web, new standards and models (XML, RDF, OWL) are evolving in order to launch this inquiry. The storage, presentation, transmission and search of information according to those standards open up new horizons in the utilization of the Web. Ontologies are increasingly get used for knowledge representation.
A large ontology contains useful data for a system of distance education, deserves someone to investigate the "hidden knowledge", i.e. to discover possible associations or to find patterns or forms that are repeated or extreme events.
This thesis is a demonstration of technology for accurate and timely prediction of the performance of students in a system of distance education. The basic idea was to design an ontology that can store knowledge about the students’ skills (user profile) in relation to a specific educational purpose (PLI23 - Telematics, Internet of the Hellenic Open University, which has a very specific matter and 4 mandatory projects per year). Then we present the results of a study analyzing student data mining techniques (data mining-classification). The discovery rules took place via the tool Weka. The result is a knowledge base which is the appropriate tool (Interface teacher) may provide that a student needs on a particular topic (in addition to material help from the teacher), etc.
|
20 |
Σχεδιασμός και υλοποίηση δημοσιογραφικού RDF portal με μηχανή αναζήτησης άρθρωνΧάιδος, Γεώργιος 11 June 2013 (has links)
Το Resource Description Framework (RDF) αποτελεί ένα πλαίσιο περιγραφής
πόρων ως μεταδεδομένα για το σημασιολογικό ιστό. Ο σκοπός του σημασιολογικού
ιστού είναι η εξέλιξη και επέκταση του υπάρχοντος παγκόσμιου ιστού, έτσι ώστε οι
χρήστες του να μπορούν ευκολότερα να αντλούν συνδυασμένη την παρεχόμενη
πληροφορία. Ο σημερινός ιστός είναι προσανατολισμένος στον άνθρωπο. Για τη
διευκόλυνση σύνθετων αναζητήσεων και σύνθεσης επιμέρους πληροφοριών, ο ιστός
αλλάζει προσανατολισμό, έτσι ώστε να μπορεί να ερμηνεύεται από μηχανές και να
απαλλάσσει το χρήστη από τον επιπλέον φόρτο. Η πιο φιλόδοξη μορφή
ενσωμάτωσης κατάλληλων μεταδεδομένων στον παγκόσμιο ιστό είναι με την
περιγραφή των δεδομένων με RDF triples αποθηκευμένων ως XML. Το πλαίσιο RDF
περιγράφει πόρους, ορισμένους με Uniform Resource Identifiers (URI’s) ή literals με
τη μορφή υποκείμενου-κατηγορήματος-αντικειμένου. Για την ορθή περιγραφή των
πόρων ενθαρρύνεται από το W3C η χρήση υπαρχόντων λεξιλογίων και σχημάτων ,
που περιγράφουν κλάσεις και ιδιότητες.
Στην παρούσα εργασία γίνεται υλοποίηση ενός δημοσιογραφικού RDF portal.
Για τη δημιουργία RDF/XML, έχουν χρησιμοποιηθεί τα λεξιλόγια και σχήματα που
συνιστούνται από το W3C καθώς και των DCMI και PRISM. Επίσης χρησιμοποιείται
για την περιγραφή typed literals to XML σχήμα του W3C και ένα σχήμα του portal. Η
δημιουργία των μεταδεδομένων γίνεται αυτόματα από το portal με τη χρήση των
στοιχείων που συμπληρώνονται στις φόρμες δημοσίευσης άρθρων και δημιουργίας
λογαριασμών. Για τον περιορισμό του χώρου αποθήκευσης τα μεταδεδομένα δεν
αποθηκεύονται αλλά δημιουργούνται όταν ζητηθούν. Στην υλοποίηση έχει δοθεί
έμφαση στην ασφάλεια κατά τη δημιουργία λογαριασμών χρήστη με captcha και
κωδικό ενεργοποίησης με hashing. Για τη διευκόλυνση του έργου του αρθρογράφου,
έχει εισαχθεί και επεκταθεί ο TinyMCE Rich Text Editor, o οποίος επιτρέπει τη
μορφοποίηση του κειμένου αλλά και την εισαγωγή εικόνων και media. Ο editor
παράγει αυτόματα HTML κώδικα από το εμπλουτισμένο κείμενο. Οι δυνατότητες του
editor επεκτάθηκαν κυρίως με τη δυνατότητα για upload εικόνων και media και με
την αλλαγή κωδικοποίησης για συμβατότητα με τα πρότυπα της HTML5. Για
επιπλέον συμβατότητα με την HTML5 εισάγονται από το portal στα άρθρα ετικέτες
σημασιολογικής δομής. Εκτός από τα άρθρα που δημιουργούνται με τη χρήση του
Editor, δημοσιοποιούνται και άρθρα από εξωτερικές πηγές. Στη διαδικασία που είναι
αυτόματη και επαναλαμβανόμενη, γίνεται επεξεργασία και αποθήκευση μέρους των
δεδομένων των εξωτερικών άρθρων.
Στον αναγνώστη του portal παρουσιάζεται ένα πρωτοσέλιδο και σελίδες ανά
κατηγορία με τα πρόσφατα άρθρα. Στο portal υπάρχει ενσωματωμένη μηχανή
αναζήτησης των άρθρων, με πεδία για φιλτράρισμα χρονικά, κατηγορίας,
αρθρογράφου-πηγής αλλά και λέξεων κλειδιών. Οι λέξεις κλειδιά προκύπτουν από
την περιγραφή του άρθρου στη φόρμα δημιουργίας ή αυτόματα. Όταν τα άρθρα
προέρχονται από εξωτερικές πηγές, η διαδικασία είναι υποχρεωτικά αυτόματη. Για
την αυτόματη ανεύρεση των λέξεων κλειδιών από ένα άρθρο χρησιμοποιείται η
συχνότητα της λέξης στο άρθρο, με τη βαρύτητα που δίνεται από την HTML για τη
λέξη (τίτλος, έντονη γραφή), κανονικοποιημένη για το μέγεθος του άρθρου και η
συχνότητα του λήμματος της λέξης σε ένα σύνολο άρθρων που ανανεώνεται. Για την
ανάκτηση των άρθρων χρησιμοποιείται η τεχνική των inverted files για όλες τις
λέξεις κλειδιά. Για τη μείωση του όγκου των δεδομένων και την επιτάχυνση
απάντησης ερωτημάτων, αφαιρούνται από την περιγραφή λέξεις που παρουσιάζουν
μεγάλη συχνότητα και μικρή αξία ανάκτησης πληροφορίας “stop words”. Η επιλογή
μιας αντιπροσωπευτικής λίστας με stop words πραγματοποιήθηκε με τη χρήση ενός
σώματος κειμένων από άρθρα εφημερίδων, τη μέτρηση της συχνότητας των λέξεων
και τη σύγκριση τους με τη λίστα stop words της Google. Επίσης για τον περιορισμό
του όγκου των δεδομένων αλλά και την ορθότερη απάντηση των ερωτημάτων, το
portal κάνει stemming στις λέξεις κλειδιά, παράγοντας όρους που μοιάζουν με τα
λήμματα των λέξεων. Για to stemming έγινε χρήση της διατριβής του Γεώργιου Νταή
του Πανεπιστημίου της Στοκχόλμης που βασίζεται στη Γραμματική της
Νεοελληνικής Γραμματικής του Μανώλη Τριανταφυλλίδη. Η επιστροφή των άρθρων
στα ερωτήματα που περιλαμβάνουν λέξεις κλειδιά γίνεται με κατάταξη εγγύτητας
των λέξεων κλειδιών του άρθρου με εκείνο του ερωτήματος. Γίνεται χρήση της
συχνότητας των λέξεων κλειδιών και της συχνότητας που έχουν οι ίδιες λέξεις σε ένα
σύνολο άρθρων που ανανεώνεται. Για την αναζήτηση γίνεται χρήση θησαυρού
συνώνυμων λέξεων. / The Resource Description Framework (RDF) is an appropriate framework for describing resources as metadata in the Semantic Web. The aim of semantic
web is the development and expansion of the existing web, so users can acquire more integrated the supplied information. Today's Web is human oriented. In order to
facilitate complex queries and the combination of the acquired data, web is changing orientation. To relieve the user from the extra burden the semantic web shall be interpreted by machines. The most ambitious form incorporating appropriate metadata on the web is by the description of data with RDF triples stored as XML. The RDF framework describes resources, with the use of Uniform Resource Identifiers (URI's) or literals as subject-predicate-object. The use of existing RDF vocabularies to describe classes and properties is encouraged by the W3C.
In this work an information-news RDF portal has been developed. The RDF / XML, is created using vocabularies and schemas recommended by W3C and the well known DCMI and PRISM. The metadata is created automatically with the use of data supplied when a new articles is published. To facilitate the journalist job, a Rich Text Editor, which enables formatting text and inserting images and media has been used and expanded. The editor automatically generates HTML code from text in a graphic environment. The capabilities of the editor were extended in order to support images and media uploading and media encoding changes for better compatibility with the standards of HTML5. Apart from uploading articles with the use of the editor the portal integrates articles published by external sources. The process is totally
automatic and repetitive. The user of the portal is presented a front page and articles categorized by theme. The portal includes a search engine, with fields for filtering time, category, journalist-source and keywords. The keywords can be supplied by the publisher or selected automatically. When the articles are integrated from external sources, the process is necessarily automatic. For the automatic selection of the keywords the frequency of each word in the article is used. Extra weight is given by the HTML for the words stressed (e.g. title, bold, underlined), normalized for the size of the article and stem frequency of the word in a set of articles that were already uploaded. For the retrieval of articles by the search engine the portal is using an index as inverted files for all keywords. To reduce the data volume and accelerate
the query processing words that have high frequency and low value information retrieval "stop words" are removed. The choice of a representative list of stop words is performed by using a corpus of newspaper articles, measuring the frequency of words and comparing them with the list of stop words of Google. To further reduce
the volume of data and increase the recall to questions, the portal stems the keywords. For the stemming the rule based algorithm presented in the thesis of George Ntais in the University of Stockholm -based Grammar was used. The returned articles
to the keywords queried by the search engine are ranked by the proximity
of the keywords the article is indexed. To enhance the search engine synonymous words are also included by the portal.
|
Page generated in 0.0519 seconds