Spelling suggestions: "subject:"sentiment analysis"" "subject:"centiment analysis""
161 |
Practical Improvements in Applied Spectral LearningDrake, Adam C. 30 June 2010 (has links) (PDF)
Spectral learning algorithms, which learn an unknown function by learning a spectral representation of the function, have been widely used in computational learning theory to prove many interesting learnability results. These algorithms have also been successfully used in real-world applications. However, previous work has left open many questions about how to best use these methods in real-world learning scenarios. This dissertation presents several significant advances in real-world spectral learning. It presents new algorithms for finding large spectral coefficients (a key sub-problem in spectral learning) that allow spectral learning methods to be applied to much larger problems and to a wider range of problems than was possible with previous approaches. It presents an empirical comparison of new and existing spectral learning methods, showing among other things that the most common approach seems to be the least effective in typical real-world settings. It also presents a multi-spectrum learning approach in which a learner makes use of multiple representations when training. Empirical results show that a multi-spectrum learner can usually match or exceed the performance of the best single-spectrum learner. Finally, this dissertation shows how a particular application, sentiment analysis, can benefit from a spectral approach, as the standard approach to the problem is significantly improved by incorporating spectral features into the learning process.
|
162 |
Opinion analysis of microblogs for stock market prediction / Opinionsanalys av mikrobloggar för börsmarknadsprognosHolmqvist, Carl January 2018 (has links)
This degree project investigates if a company’s stock price development can be predicted using the general opinion expressed in tweets about the company. The project starts off with the model from a previous project and then tries to improve the results using state-of-the-art neural network sentiment analysis and more tweet data. This project also attempts to perform hourly predictions along with daily predictions in order to investigate the method further. The results show a decrease in accuracy compared to the previous project. The results also indicate that the neural network sentiment analysis improves the accuracy of the stock price development when compared to the baseline model under comparable conditions. / Detta examensarbete undersöker om ett företags aktievärdesutveckling kan förutspås genom att använda sig av den generella opinionen hos tweets skrivna om företaget. Examensarbetet utgår ifrån en model från ett tidigare projekt och försöker förbättra resultaten från denna genom att använda sig av dels state-of-the-art sentimentanalys med neurala nätverk, dels mer tweet data. Examensarbetet undersöker både prognoser timvis samt dygnsvis för att undersöka metoden djupare. Resultaten tyder på en minskad träffsäkerhet jämfört med det tidigare projektet. Resultaten indikerar också att sentimentanalys med neurala nätverk förbättrar träffsäkerheten hos aktievärdesprognosen jämfört med tidigare sentimentanalysmetod givet jämförbara förutsättningar.
|
163 |
JÄMFÖRELSE AV ATTITYDANALYS ALGORITMER FÖR SPELOMDÖMEN / COMPARISON OF SENTIMENT ANALYSIS ALGORITHMS FOR GAME REVIEWSGernandt, Niclas, Farhod, Jaser January 2019 (has links)
Idag finns det stora mängder användar-skapat data i form av texter från spelomdömen till åsikter i mikro-bloggar som Twitter. Att analysera detta data kan vara utav värde för både företag och akademisk forskning men är väldigt omfattande. Med hjälp av attitydanalysen kan detta utföras automatiskt och spara resurser, men vilka algoritmer presterar bäst? Med hjälp av en förstudie och ett par kvantitativa tester kunde dem mest populära tillvägagångsätten inom attitydanalysen genom att analysera spelomdömen från plattformen Steam. I testning har det visat sig att maskininlärningsalgoritmer både presterar bättre och är enklare att komma igång i jämförelse med lexikonbaserade algoritmer som knappast uppnår tröskelvärdet för pålitlighet vid klassifikation av omdömen som positiva eller negativa. Men det är fortfarande viktigt anpassa attitydanalysen för just det specifika problemet eftersom båda dessa har sina brister eftersom båda dessa tillvägagångsätt hade en dålig prestation i förhållande till sarkastiska omdömen. / Today there exist a huge amount of user created content in the shape of text from game reviews to opinions in microblogs like Twitter. To analyze this data could be of value for both companies and data scientists but remains to be very daunting. With the help of sentiment analysis this could be achieved automatically and save resources, but the question remains which algorithms have the best performance? With the help of a study and a couple of tests the most popular approaches in sentiment analysis could be compared by analyzing game reviews from the platform Steam. Through testing it has showed that machine learning based algorithms have the best performance and are easier to start with in comparison to lexicon-based approaches, which barely even reach the threshold for reliability in classifying reviews to be positive or negative. But it’s still important to plan and consider which algorithm one chooses for sentiment analysis as both approaches have their flaws and had a weak performance regarding sarcastic reviews.
|
164 |
Exploring the Potential of Twitter Data and Natural Language Processing Techniques to Understand the Usage of Parks in Stockholm / Utforska potentialen för användning av Natural Language Processing på Twitter data för att förstå användningen av parker i StockholmNorsten, Theodor January 2020 (has links)
Traditional methods used to investigate the usage of parks consists of questionnaire which is both a very time- and- resource consuming method. Today more than four billion people daily use some form of social media platform. This has led to the creation of huge amount of data being generated every day through various social media platforms and has created a potential new source for retrieving large amounts of data. This report will investigate a modern approach, using Natural Language Processing on Twitter data to understand how parks in Stockholm being used. Natural Language Processing (NLP) is an area within artificial intelligence and is referred to the process to read, analyze, and understand large amount of text data and is considered to be the future for understanding unstructured text. Twitter data were obtained through Twitters open API. Data from three parks in Stockholm were collected between the periods 2015-2019. Three analysis were then performed, temporal, sentiment, and topic modeling analysis. The results from the above analysis show that it is possible to understand what attitudes and activities are associated with visiting parks using NLP on social media data. It is clear that sentiment analysis is a difficult task for computers to solve and it is still in an early stage of development. The results from the sentiment analysis indicate some uncertainties. To achieve more reliable results, the analysis would consist of much more data, more thorough cleaning methods and be based on English tweets. One significant conclusion given the results is that people’s attitudes and activities linked to each park are clearly correlated with the different attributes each park consists of. Another clear pattern is that the usage of parks significantly peaks during holiday celebrations and positive sentiments are the most strongly linked emotion with park visits. Findings suggest future studies to focus on combining the approach in this report with geospatial data based on a social media platform were users share their geolocation to a greater extent. / Traditionella metoder använda för att förstå hur människor använder parker består av frågeformulär, en mycket tids -och- resurskrävande metod. Idag använder mer en fyra miljarder människor någon form av social medieplattform dagligen. Det har inneburit att enorma datamängder genereras dagligen via olika sociala media plattformar och har skapat potential för en ny källa att erhålla stora mängder data. Denna undersöker ett modernt tillvägagångssätt, genom användandet av Natural Language Processing av Twitter data för att förstå hur parker i Stockholm används. Natural Language Processing (NLP) är ett område inom artificiell intelligens och syftar till processen att läsa, analysera och förstå stora mängder textdata och anses vara framtiden för att förstå ostrukturerad text. Data från Twitter inhämtades via Twitters öppna API. Data från tre parker i Stockholm erhölls mellan perioden 2015–2019. Tre analyser genomfördes därefter, temporal, sentiment och topic modeling. Resultaten från ovanstående analyser visar att det är möjligt att förstå vilka attityder och aktiviteter som är associerade med att besöka parker genom användandet av NLP baserat på data från sociala medier. Det är tydligt att sentiment analys är ett svårt problem för datorer att lösa och är fortfarande i ett tidigt skede i utvecklingen. Resultaten från sentiment analysen indikerar några osäkerheter. För att uppnå mer tillförlitliga resultat skulle analysen bestått av mycket mer data, mer exakta metoder för data rensning samt baserats på tweets skrivna på engelska. En tydlig slutsats från resultaten är att människors attityder och aktiviteter kopplade till varje park är tydligt korrelerat med de olika attributen respektive park består av. Ytterligare ett tydligt mönster är att användandet av parker är som högst under högtider och att positiva känslor är starkast kopplat till park-besök. Resultaten föreslår att framtida studier fokuserar på att kombinera metoden i denna rapport med geospatial data baserat på en social medieplattform där användare delar sin platsinfo i större utsträckning.
|
165 |
Predicting Bitcoin price fluctuation with Twitter sentiment analysis / Förutspå Bitcoin prisändringar med hjälp av semantisk analys på Twitter dataStenqvist, Evita, Lönnö, Jacob January 2017 (has links)
Programmatically deriving sentiment has been the topic of many a thesis: it’s application in analyzing 140 character sentences, to that of 400-word Hemingway sentences; the methods ranging from naive rule based checks, to deeply layered neural networks. Unsurprisingly, sentiment analysis has been used to gain useful insight across industries, most notably in digital marketing and financial analysis. An advancement seemingly more excitable to the mainstream, Bitcoin, has risen in number of Google searches by three-folds since the beginning of this year alone, not unlike it’s exchange rate. The decentralized cryptocurrency, arguably, by design, a pure free market commodity – and as such, public perception bears the weight in Bitcoins monetary valuation. This thesis looks toward these public perceptions, by analyzing 2.27 million Bitcoin-related tweets for sentiment fluctuations that could indicate a price change in the near future. This is done by a naive method of solely attributing rise or fall based on the severity of aggregated Twitter sentiment change over periods ranging between 5 minutes and 4 hours, and then shifting these predictions forward in time 1, 2, 3 or 4 time periods to indicate the corresponding BTC interval time. The prediction model evaluation showed that aggregating tweet sentiments over a 30 min period with 4 shifts forward, and a sentiment change threshold of 2.2%, yielded a 79% accuracy. / Ämnet sentiment analysis, att programmatiskt härleda underliggande känslor i text, ligger som grund för många avhandlingar: hur det tillämpas bäst på 140 teckens meningar såväl som på 400-ords meningar a’la Hemingway, metoderna sträcker sig ifrån naiva, regelbaserade, till neurala nätverk. Givetvis sträcker sig intresset för sentiment analys utanför forskningsvärlden för att ta fram insikter i en rad branscher, men framförallt i digital marknadsföring och financiell analys. Sedan början på året har den digitala valutan Bitcoin stigit trefaldigt i sökningar på Google, likt priset på valutan. Då Bitcoins decentraliserade design är helt transparant och oreglerad, verkar den under ideala marknadsekonomiska förutsättningar. På så vis regleras Bitcoins monetära värde av marknadens uppfattning av värdet. Denna avhandling tittar på hur offentliga uppfattningar påverkar Bitcoins pris. Genom att analysera 2,27 miljoner Bitcoin-relaterade tweets för sentiment ändringar, föutspåddes ändringar i Bitcoins pris under begränsade förhållningar. Priset förespåddes att gå upp eller ner beroende på graden av sentiment ändring under en tidsperiod, de testade tidsperioderna låg emellan 5 minuter till 4 timmar. Om en förutspånning görs för en tidsperiod, prövas den emot 1, 2, 3 och 4 skiftningar framåt i tiden för att ange förutspådd Bitcoin pris interval. Utvärderingen av förutspåningar visade att aggregerade tweet-sentiment över en 30-minutersperiod med 4 skift framåt och ett tröskelvärde för förändring av sentimentet på 2,2 % gav ett resultat med 79 % noggrannhet.
|
166 |
A sentiment analysis approach to manage the new item problem of Slope One / En ansats att använda attitydsanalys för att hantera problemet med nya föremål i Slope oneJohansson, Jonas, Runnman, Kenneth January 2017 (has links)
This report targets a specific problem for recommender algorithms which is the new item problem and propose a method with sentiment analysis as the main tool. Collaborative filtering algorithms base their predictions on a database with users and their corresponding ratings to items. The new item problem occurs when a new item is introduced in the database because the item has no ratings. The item will therefore be unavailable as a recommendation for the users until it has gathered some ratings. Products that can be rated by users in the online community often has experts that get access to these products before its release date for the consumers, this can be taken advantage of in recommender systems. The experts can be used as initial guides for predictions. The method that is used in this report relies on sentiment analysis to translate written reviews by experts into a rating based on the sentiment of the text. This way when a new item is added it is also added with the ratings of experts in the field. The result from this study shows that the recommender algorithm slope one can generate more reliable recommendations with a group of expert users than without when a new item is added to the database. The expert users that is added must have ratings for other items as well as the ratings for the new item to get more accurate recommendations. / Denna rapport studerar påverkan av problemet med nya objekt i rekommendationsalgoritmen Slope One och en metod föreslås i rapporten för att lösa det specifika problemet. Problemet uppstår när ett nytt objekt läggs till i en databas då det inte finns några betyg som getts till objektet/produkten. Då rekommendationsalgoritmer som Slope One baserar sina rekommendationer på relationerna mellan användares betyg av filmer så blir träffsäkerheten låg för en rekommendation av en film med få betyg. Metoden som föreslås i rapporten involverar attitydanalys som det huvudsakliga verktyget för att få information som kan ersätta faktiska betyg som användare gett en produkt. När produkter kan bli betygsatta av användare på olika forum på internet så finns det ofta experter får tillgång till produkten innan den släpps till omvärlden, den information som dessa experter har kan användas för att fylla det informationsgap som finns när ett nytt objekt läggs till. Dessa experter kommer då initiellt att användas som guide för rekomendationssystemet. Så när ett nytt objekt läggs till så görs det tillsammans med betyg från experter för att få mer träffsäkra rekomendationer. Resultatet från denna studie visar att Slope One genererar mer träffsäkra rekommendationer då en ny produkt läggs till i databasen med ett antal betyg som genererats genom attitydanalysanalys på experters textrecensioner. Det är värt att notera att ett betyg enbart för dessa expertanvändare inte håller utan experterna måste ha betyg av andra produkter inom samma område för kunna influera rekommendationer för den nya produkten.
|
167 |
Sentiment analysis of tweets in comparison to a company’s financial performance / Sentimentanalys av tweets i jämförelse med ett företags finansiella resultatLewerentz, Eric, Westerberg, Ellinor January 2018 (has links)
This study analyzes peoples reactions in social media to the release of a company’s quarterly report. Sentiment analysis was performed on tweets about a company both from a short-and long-term perspective. On the long-term perspective, a two year period of sentiment was studied in relation to its quarter’s percental change of net income and revenues. Three companies was investigated in this process. On the short-term perspective, a linear regression was conducted based the quarter’s percental change of net income and revenues and on sentiment score, ranging from release day to 2 days after the release of a company’s quarterly report, in total five companies were studied. The result inferred that there was no correlation between the company’s net income and the reaction on Twitter on both long and short-term. Our conclusion is that the attitude towards a company is influenced by other factors than net income and revenues. The study also indicates that sentiments found in Twitter messages regarding a company name are related to a positive or negative expectation of the company. Findings suggest future studies to focus on companies greatly dependent on one product and analyze sentiment regarding that product instead, as the product is likely to impact financial results. / Denna studie undersöker hur människors reaktioner utspelas på sociala medier efter att ett företags kvartalsrapport släppts. En sentimentanalys utfördes på tweets angående ett företag ur både ett kortsiktigt och ett långsiktigt perspektiv. I det långsiktiga perspektivet jämfördes sentimenten från en tvåårsperiod med resultatet från kvartalsrapporterna under samma tid. Tre företag undersöktes. I det kortsiktiga perspektivet utfördes en linjär regression baserat på förändringen av rörelseresultatet och intäkterna, samt sentimentet med ett tidsintervall på 2 dagar från det att bolagets kvartalsrapport publiceras, detta utfördes på fem bolag. Resultaten från både det långsiktiga och det kortsiktiga perspektivet tyder på att det inte finns någon korrelation mellan företagets rörelseresultat och intäkter, samt sentimentet på Twittermeddelanden innehållande bolagets namn. Vår slutsats är att inställningen till ett företag påverkas av andra faktorer än rörelseresultatet och intäkterna. Studien indikerar också att inställningen på Twitter till ett företagsnamn är baserat på en positiv eller negativ förväntan. Vi föreslår att framtida studier fokuserar på företag som är starkt beroende av en produkt och analyserar sentiment för den specifika produkten istället eftersom produkten i detta läge har en stor inverkan på kvartalsrapportens resultat.
|
168 |
A Performance Survey of Text-Based Sentiment Analysis Methods for Automating Usability EvaluationsVan Damme, Kelsi 01 June 2021 (has links) (PDF)
Usability testing, or user experience (UX) testing, is increasingly recognized as an important part of the user interface design process. However, evaluating usability tests can be expensive in terms of time and resources and can lack consistency between human evaluators. This makes automation an appealing expansion or alternative to conventional usability techniques.
Early usability automation focused on evaluating human behavior through quantitative metrics but the explosion of opinion mining and sentiment analysis applications in recent decades has led to exciting new possibilities for usability evaluation methods.
This paper presents a survey of modern, open-source sentiment analyzers’ usefulness in extracting and correctly identifying moments of semantic significance in the context of recorded mock usability evaluations. Though our results did not find a text-based sentiment analyzer that could correctly parse moments as well as human evaluators, one analyzer was found to be able to parse positive moments found through audio-only cues as well as human evaluators. Further research into adjusting settings on current sentiment analyzers for usability evaluations and using multimodal tools instead of text-based analyzers could produce valuable tools for usability evaluations when used in conjunction with human evaluators.
|
169 |
Chaos or Clarity: A Corpus-Assisted Analysis of Top Comments on Jordan Peterson's Controversial YouTube VideosBaharmand, Behnam January 2023 (has links)
This thesis endeavors to make sense of how Jordan Peterson, a highly controversial public figure—who is rapidly becoming academia’s equivalent to a rock star—is perceived by his online audience. To that end, the study adopts an analytical approach while integrating several theoretical frameworks, including the concept of echo chambers. It concentrates on Peterson’s two most viewed videos on YouTube, found on British GQ (@BritishGQ) and Channel 4 News (@Channel4News), examining the comments section for insights. Besides being the most popular entries with a combined total of over one hundred million views, these videos are also of particular interest since they both involve a one-on-one interview format with a host questioning Peterson about similar yet different topics. While Peterson has been the subject of various research in different disciplines, little attention has been paid to how his audience in social media generally perceives him as a public figure. The primary objective is to discover more about his online following by evaluating their comments, particularly those that receive the most likes and appear at the top. The data is intricate and encompasses various inquiries that call for clarification. The investigation employs corpus linguistics, computational methods, and sentiment analysis to gain deeper insight into the data. The analysis revealed that the majority of influential commenters expressed favorable opinions about the interviewee, with subjective language and direct quotes from the interview being prevalent. There were also distinct themes and echo chambers present, and comments with polarized sentiments tended to be more popular among viewers. In addition to discussing the technical aspects and limitations that must be considered when interpreting the findings, this study emphasizes the promise of social media and new media as powerful tools for effecting social change and promoting public discourse on various issues. The study concludes that employing various methods simultaneously to paint a comprehensive picture from a dataset seems exciting and that the choice of approach comes down to the research questions and the resources available. The paper calls for further research to determine the extent to which the findings can be applied to similar ventures and explore the implications of echo chambers on public perception and discourse.
|
170 |
Designing and evaluating an algorithm to pick out minority comments onlineLiu, Elin January 2022 (has links)
Social media and online discussion forums have allowed people to hide behind a veil of anonymity, which has made the platforms feel unsafe for people with a different opinion than the majority. Recent research on robots and bots have found that they are a good option when it comes to inducing cooperation or acting as a conversation partner to encourage critical thinking. These robots and bots are based on an algorithm that is able to identify and classify comments, usually into positive and negative comments, left by users. The problem attended to in this thesis is to explore the possibility of creating an algorithm that can classify and pick out a minority opinion with an accuracy of at least 90%. The purpose is to create one of the vital algorithms for a larger project. The goal of this thesis is to provide a functioning algorithm with an accuracy of at least 90% for future implementations. In this thesis, the research approach is quantitative. The results show that it is possible to create an algorithm with the ability to classify and identify comments that also can pick out a minority opinion. Furthermore, the algorithm also achieved an accuracy of at least 90% when it comes to classification of comments, which makes the search for a minority opinion much easier. / Sociala medier och diskussionsforum online har tillåtit människor att gömma sig bakom sin datorskärm och vara anonym. Detta har gjort sociala medier till en osäker plats för människor som inte delar samma åsikt som majoriteten om olika diskussionsämnen. Ny forskning om robotar och sociala botar har funnit att dem är effektiva med att få människor att samarbeta samt att dem är en bra konversationspartner som framkallar mer kritiskt tänkande. Dessa robotar och sociala botar är baserade på en algoritm som kan identifiera och klassificera kommentarer, oftast till positiva eller negativa kommentarer som användare av sociala medier har lämnat. Problemet som avhandlingen försöker lösa är om det är möjligt att skapa en algoritm som kan identifiera och klassificera kommentarer, men även hitta och ta fram en åsikt som inte är en del av majoriteten med en träffsäkerhet på minst 90%. Ändamålet är att skapa en viktig byggsten för ett större forskningsprojekt. Målet med avhandlingen är att skapa en funktionerande algoritm för framtida undersökning som förhoppningsvis kan motarbeta partiskhet i sociala medier. Avhandlingens ståndpunkt är kvantitativ. Resultaten från avhandlingen visar att det är möjligt att skapa en algoritm som kan klassificera samt hitta en åsikt som inte är en del av majoriteten. Dessutom har algoritmen hög noggrannhet när det gäller klassificeringen vilket underlättar sökandet av en åsikt.
|
Page generated in 0.0723 seconds