Spelling suggestions: "subject:"batural anguage toolkit"" "subject:"batural anguage toolkits""
1 |
Μελέτη και έλεγχος του Python Natural Language Toolkit στην ελληνική γλώσσαΣταυλιώτης, Λεωνίδας 14 May 2012 (has links)
Στην παρούσα διπλωματική εργασία παρουσιάζεται ο έλεγχος του εργαλείου NLTK (Natural Language Toolkit) της Python. Συγκεκριμένα, το nltk είναι μια ανοιχτού κώδικα βιβλιοθήκη συναρτήσεων για επεξεργασία φυσικής γλώσσας και ανάπτυξη ανάλογων εφαρμογών. Έχει αναπτυχθεί σε γλώσσα Python με στόχο την ανάλυση και ανάπτυξη εφαρμογών κυρίως για την Αγγλική γλώσσα. Αντικείμενο αυτής της εργασίας είναι η συστηματική μελέτη και ο έλεγχος των συναρτήσεων του nltk για την Ελληνική γλώσσα, καθώς υπάρχουν ενδείξεις ότι σημαντικό μέρος αυτών δουλεύει σωστά. Αρχικά, έγινε η μελέτη για εισαγωγή ελληνικών κειμένων, καθώς και κατάλληλη επεξεργασία αυτών, ώστε να είναι σε επεξεργάσιμη μορφή από το εργαλείο. Έπειτα, ελέγχθησαν όλες οι εντολές και κατηγοριοποιήθηκαν με βάση τη λειτουργία τους. Τέλος, παρατηρώντας τα συγκεντρωτικά αποτελέσματα, εξάγεται το συμπέρασμα ότι οι υποψίες για σωστή λειτουργία μεγάλου αριθμού εντολών επαληθεύονται, καθώς το 87,9 % των εντολών φαίνεται να λειτουργεί σωστά. / This diploma dissertation presents the examination of Python NLTK (Natural Language Toolkit) tool. Particularly, nltk is an open source function library suitable for natural language processing and the development of respective applications. It has been developed into Python language in order to analyse and develop applications mostly for the English language. The present dissertation is concerned with the systematic study and the examination of nltk functions for the Greek language, given that there is evidence of the correct operation of some. At first, research for the input of Greek texts as well as their appropriate processing was conducted as a way of presenting these texts in a processable by the tool form. Thereupon, all functions were tested and categorised in terms of their operation. Finally, the observation of concentrated results leads to the conclusion that the initial hypothesis for the correct operation of a great number of order is confirmed, as 87,9% of the functions appears to be operating correctly.
|
2 |
Developing market sentiment indicators for commodity price forecasting using machine learningSohail, Tariq 13 January 2017 (has links)
The objective of this study is to develop a market sentiment model for financial markets using machine learning, and to illustrate these methods using commodity price data. A market sentiment model may capture the fundamental and crowd psychology of the market, through a variable that uses positive and negative words and phrases. The commodity price used is the daily price of the spot crude oil exchange-traded fund (ETF), United States Oil Fund (USO). The forecasting power of the market sentiment model is compared with a traditional autoregressive model. The results showed that the autoregressive models did not have significant forecasting power for the oil data over the time period examined and the addition of the sentiment model did not improve the forecasting power. Machine learning is a relatively new forecasting method. Therefore, further research on this topic is needed before any firm conclusions can be drawn regarding the effectiveness of this approach. / February 2017
|
Page generated in 0.0434 seconds