• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 61
  • 40
  • Tagged with
  • 101
  • 101
  • 56
  • 31
  • 31
  • 23
  • 23
  • 22
  • 20
  • 20
  • 18
  • 17
  • 17
  • 15
  • 13
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
41

Förekomstmodell för bombmurkla (Sarcosoma globosum) i Norrtälje kommun

Lund, Viktor January 2023 (has links)
Med flest kända fyndplatser i världen av den globalt rödlistade vårsvampen bombmurkla (Sarcosoma globosum) åligger det Sverige ett internationellt ansvar för artens bevarande. På senare tid bedöms dock många av svampens växtplatser ha förstörts på grund av granbarkborreangrepp till följd av höga sommartemperaturer, något som befaras bli allt vanligare i och med klimatförändringarna. För att långsiktigt bevara arten tror jag därför att riktade eftersök kan bli aktuella. I denna studie undersöks vilka miljödata som är användbara för att prognostisera bombmurklans förekomst på landskapsnivå och möjligheterna med att använda GIS-baserad förekomstmodellering för att upptäcka nya växtplatser. Beståndsmedelålder, skogsslag och jordart, samt i viss mån lutning och väderstreck (aspekt) bedöms vara goda förklaringsvariabler för svampens förekomst. Under fältarbetet upptäcktes 1 ny växtplats förbombmurkla och det finns indikationer, om än inte statistiskt styrkta, på att bombmurklan oftare påträffas i områdena med god modellerad prognos för förekomst än i andra gran- eller barrblandskogar. / With most known occurrences of the threatened Sarcosoma globosum globally, Sweden bears international responsibility for this fungus’ survival. Lately, many of the previously known sites for the species have expired due to bark beetle attacks caused by high summer temperatures, which in future may occur even more frequently because of climate change. Therefore, I find targeted search for new occurrences necessary for future conservation. In this study I investigate which variables are useful for predicting occurrence on landscape-scale and the potential of using species distribution modelling forfinding S. globosum. Mean tree age, forest type and sediment, and to some degree slope and aspect, are useful variables for predicting occurrence. During field work 1 new site was discovered and there are indications, although not statistically significant, that S. globosum is more common in areas with high modelled prognosis for occurrence than in other spruce- or mixed coniferous forests.
42

Är olika välfärdstyper en bro eller en barriär för mellanmänsklig tillit? : En jämförande kvantitativ studie av mellanmänsklig tillit i universella, liberala och konservativa välfärdsstater.

Isufi, Aurora, Nelin, Klara January 2024 (has links)
En hög tillitsnivå i samhället för med sig en rad olika positiva effekter. Det är därför av intresse att undersöka vilka faktorer som gör att två personer som inte känner varandra kan uppleva vad denna studie kallar generell tillit. Studien syftar till att undersöka hur olika välfärdstyper främjar varierande nivåer av mellanmänsklig tillit. Detta görs genom att dela in sex idealtypiska länder efter Esping-Andersens tre olika välfärdstyper; universella-, liberala-, och konservativa välfärdsstater. Studien utgår även från Bo Rothsteins perspektiv om hur olika nivåer av tillit i välfärdsstaterna kan härledas från olika socialförsäkringsprocesser, där universella socialförsäkringar antas leda till högre tillit medan selektiva socialförsäkringar antas leda till lägre tillit. För att besvara studiens syfte genomförs en logistisk regression med data från World Value Survey och European Value Survey. Resultatet från analysen är i linje med den tidigare forskningen och visar att den universella välfärdsstaten har den största sannolikheten att ha generell tillit, följt av den konservativa välfärdsstaten och till sist den liberala välfärdsstaten. Vid kontroll för andra variabler har variabeln välfärdsstat fortsatt den största effekten på sannolikheten att ha generell tillit. Även andra variabler visade en signifikant effekt där förtroende för statsförvaltningen har en större effekt   än organisationsdeltagande. Därutöver visar test för sociodemografiska faktorer som ålder, kön och klass att personer med lägre socioekonomisk klass tenderar att ha lägre sannolikhet att lita på andra. Till sist visar studien att liberala eller konservativa värderingar inte har någon större påverkan på individers sannolikhet att lita på andra oberoende av välfärdstyp. Resultatet visar att neoliberala förändringar i samhället inte har förändrat den generella tilliten 2022 för vuxna invånare i de olika välfärdsstaterna. Det finns möjligheter att förbättra studien genom att kontrollera för fler detaljerade variabler och inkludera flernivås analys så att sambanden kan förtydligas även på olika nivåer.
43

Framgångsrik IPO : - En kvantitativ undersökning av faktorer som påverkar resultatet av företags IPO-processer på Nasdaq First North Growth Market

Svanberg, Elliot, Elin, Bäckström January 2024 (has links)
Syfte: Studien syftar till att utvärdera vilka faktorer som bidrar till att olika tillväxtbolag misslyckas eller lyckas med en IPO. Teoretisk referensram: Den teoretiska referensramen bygger på tidigare forskning om misslyckandet med börsnoteringar. Företagsspecifika variabler som ska undersökas presenteras. Dessutom redogörs för studiens hypoteser. Metod: Studien har använt en kvantitativ metod i form av logistisk regression. I den logistiska regressionen härleds samtliga variabler som presenterats i den teoretiska referensramen.  Empiri: Studien identifierade totalt 152 stycken IPOs på Nasdaq First North Growth Market under 2014-2018.  Analys och slutsats: Studien visar att äldre bolag tenderar att lyckas med en IPO i större utsträckning än yngre bolag. Med hjälp av sensitivitetsanalysen kunde vi påvisa ett signifikant samband mellan bruttomarginal och resultatet av IPO genom att utesluta fyra företag. Däremot lyckades vi inte påvisa något signifikant samband mellan resterande oberoende variabler: avkastning under första handelsdagen, ROA, soliditet och den beroende variabeln lyckad respektive misslyckad IPO.
44

Klassificering av köp på betalda sökannonser / Classification of purchases in paid search advertising

Åkesson, Lisa, Henningsson, Denise January 2016 (has links)
Datakonsultföretaget Knowit AB har en kund som annonserar på Google AdWords. Denna uppsats fokuserar huvudsakligen på att hitta de olika inställningarna i AdWords som genererar köp av kundens produkt. Om en inställning ofta genererar klick men sällan köp av produkten är den inställningen inte lönsam.Responsvariabeln i denna uppsats är binär och indikerar på om ett klick på annonsen lett till köp av produkten eller inte. Eftersom responsvariabelns fördelning var skev har samplingstekniken SMOTE använts för att skapa fler observationer i minoritetsklassen. De statistiska metoder som använts och presenterats i uppsatsen är logistisk regression, neurala nätverk och beslutsträd.Resultatet gav att de fyra undersökta inställningarna påverkar sannolikheten för köp. Den första inställningen resulterade i att om dator används vid sökning på Google är sannolikheten att ett klick leder till köp betydligt högre än för mobil och surfplatta. Den andra inställningen resulterar i att en ”exakt matchning” för sökordet ger högst sannolikhet till köp och ”bred matchning” ger lägst sannolikhet. Den tredje inställningen visar att vilken veckodag annonsen klickas på påverkar sannolikheten för köp. På söndag är sannolikheten högst att ett klick leder till köp, och de två dagar som har lägst sannolikhet är lördag och tisdag. Slutligen har det undersökts om annonsens genomsnittsposition påverkar sannolikheten att produkten köps. Resultatet som gavs är att ju högre värde på genomsnittsposition, desto högre blir sannolikheten för köp. / The data consultancy company Knowit AB has a client who advertises on Google AdWords. This thesis focuses mainly on finding which settings in AdWords generate purchases of the client’s product. If a setting frequently contributes to clicks but rarely to purchases of the product, the setting is not profitable.The target variable in this thesis is binary and indicates whether a click on the advertisement led to purchase of the product or not. Since the target variable’s distribution was skewed, the sampling technique SMOTE was used to create more observations in the minority class. The classification methods researched and presented in this thesis are logistic regression, neural networks and decision trees.The results showed that all four factor had significant affect on the probability of purchase. First, if a desktop or laptop computer was used to search on Google, the likelihood that a click leads to purchase is substantially higher compared to if a mobile or tablet was used. Second, an “exact match” setting for the keywords gives the highest probability of purchase and a “broad match” gives the lowest probability. Third, purchase rates are also affected by the day of the week. Sunday has the highest probability of purchase while Saturday and Tuesday have the lowest probability. Finally, an advertisement´s average position affects the likelihood of the product being purchased. The higher value of average position, the higher the likelihood of purchase.
45

En webbundersökning med panel : Vilka variabler påverkar om, hur tidigt och vad panelmedlemmar svarar? / A web panel survey : Which variables influence if, how early and what panel members respond?

Elmdahl, Martin, Tärnemark, Jonas January 2014 (has links)
Denna rapport ger en bakgrundsbeskrivning av datainsamlingsföretaget Norstat och hur de genomför en tracking-undersökning med panel via internet. Vidare analyseras samband mellan variabler som beskriver personer som ingår i undersökningen och hur dessa personer besvarar undersökningen. I rapporten tas också reda på hur länge en undersökning behöver vara igång och om inkomna svar skiljer sig åt beroende på när en person har svarat. En ingående beskrivning av bearbetning och de variabler som ingår i det använda datamaterialet kommer också att ges. Tidigare forskning med anknytning till paneler och webbundersökningar tas upp för att ge läsaren en nyanserad bild av för- och nackdelar med webbundersökningar. Logistiska regressionsmetoder har använts för att utreda vilka variabler som påverkar om en person besvarar undersökningen eller ej, samt vilka variabler som gör att en person besvarar undersökningen tidigt eller sent. Andra metoder som har använts är deskriptiv statistik och χ2-test. Resultaten visar att faktorer som påverkar hur mycket fritid en person har får störst betydelse för om och hur tidigt undersökningen besvaras. Vidare konstateras att det ofta räcker med en fältperiod t.o.m. 6 dagar efter att inbjudan till undersökningen skickats ut för att alla kategorier av personer ska vara relativt lika representerade. Den optimala fältperioden skiljer sig åt beroende på om en undersökning syftar till att ge en bild av hela rikets befolkning eller enbart specifika kategorier av denna. För en speciell kategori av personer kan det ibland räcka att fältperioden sträcker sig t.o.m. dagen efter inbjudan till enkäten skickats ut för att tillräckligt många svar ska ha inkommit. / This report gives a background description of the data collection company Norstat and how they implement a tracking survey with a panel via the internet. Furthermore connections between variables describing persons in the survey and the way these persons answer the survey will be investigated. The report also intends to find out how long a survey needs to be running and if there are differences between received answers depending on when a person has answered. A detailed description of the processing and variables included in the data material being used will also be given. Earlier research concerning panels and web surveys are covered to give the reader a nuanced picture of the pros and cons with opinion surveys. Logistic regression methods have been used to examine which variables influence whether a person will answer the survey or not, and the variables that make a person answer the survey early or late. Other methods used are descriptive statistics and a χ2-test. The results show that factors influencing how much spare time a person has give the greatest impact on whether and how early the survey gets completed. It can be noted that it is often enough with a field period up to 6 days after the invitation to the survey has been sent out until all categories of persons are relatively equally represented. The optimal field period differs depending on whether a study is aimed at providing a picture of the entire country's population or only specific categories of this. For a special category of the persons, it can sometimes be enough to let the field period run until the day after the invitation to the survey had been sent out for enough answers to be submitted.
46

Prognostiska faktorer för att inte fullfölja multimodal smärtrehabilitering / Prognostic factors for not completing multimodal painrehabilitation

Lamers, Petrus, Sagnérius, Linda January 2019 (has links)
Bakgrund: Långvarig smärta är vanligt förekommande och orsakar stort lidande. Multimodal rehabilitering (MMR) är en behandlingsmetod som erbjuds patienter med komplexa rehabiliteringsbehov. Behandlingsföljsamhet definieras hur väl patientens beteende överensstämmer med de rekommendationer patienten kommit överens med sin vårdgivare och har betydelse för behandlingsresultatet. Lite är känt idag om prognostiska faktorer för behandlingsföljsamheten vid MMR. Identifiering av hinder som kan förklara varför patienter inte slutför behandling är därför viktigt för att kunna optimera behandlingseffekterna. Syfte: Att undersöka vilka faktorer som hade betydelse för att inte fullfölja ett MMR 2 program hos patienter med komplex långvarig smärta. Metod: Projektet var en prospektiv kohortstudie. Studiepopulation var patienter mellan 18– 67 år med långvarig smärta, som påbörjade ett MMR program mellan 2009–2016, registrerade i det Nationella Registret över Smärtrehabilitering (NRS). Trettiosex variabler fanns tillgängliga, utfallsmåttet var fullfölja eller ej fullfölja MMR. För att identifiera variabler med störst betydelse för behandlingsföljsamhet skapades regressionsmodeller med logistisk regression. Modellens diskriminativa förmåga testades och goodness of fit bedömdes. Resultat: De tre viktigaste faktorerna som ökade odds för att inte slutföra MMR 2 var patienter med hög smärtintensitet, patienter i yngre ålderskategori och låg motivation. Modellens diskriminativa förmåga var undermålig, goodness of fit var inte signifikant. Slutsats: Modellen kan inte predicera utfall för enskilda individer men ger informationen om vilka faktorer som historiskt har varit viktiga. På sikt kan identifiering av faktorer som försämrar följsamheten bidra till att anpassa MMR program och därmed skapa bättre förutsättningar så att flera patienter fullföljer rehabiliteringen. / Background: Prolonged pain is common and causes great suffering. Multimodal rehabilitation (MMR) is a treatment method that is offered to patients with complex rehabilitation needs. Treatment adherence is defined how well the patient's behavior is consistent with the recommendations the patient has agreed with his / her health care provider and is of importance for the treatment outcome. Little is known today about prognostic factors for treatment adherence at MMR. Identification of obstacles that can explain why patients do not complete treatment is therefore important in order to be able to optimize the treatment effects. Purpose: To investigate which factors were important for the prognosis to not completing MMR 2 treatment in patients with complex long-term pain. Method: The project was a prospective cohort study. Study population were patients aged 18–67 years with long-term pain who started an MMR 2 program between 2009–2016, registered in the National Register for Pain Rehabilitation (NRS). Thirty-six variables were available, the outcome measure was to complete or not complete MMR. To identify variables with the greatest importance for treatment adherence, regression models were created with logistic regression. The model's discriminatory ability was tested, and goodness of fit was assessed Results: The three most important factors that increased odds of not completing MMR were high MPI-PI, patients in the younger age category and low motivation. The model's discriminatory ability was substandard, goodness of fit was not significant. Conclusion: The model cannot predict outcomes on individual level but provides information on which factors historically have been important. In the long term, identification of factors that impair adherence can contribute to adapting MMR programs and thereby create better conditions so that several patients complete the rehabilitation.
47

Cryptosporidiumutbrottet i Östersunds kommun 2010 : Påverkan på kommunens barn

Jansson, Nils-Henrik, Pavlov, Patrik January 2013 (has links)
Målet med den här studien är att undersöka hur barn under 15 år påverkades av Cryptosporidiumutbrottet i slutet av år 2010 i Östersunds kommun. Datamaterialet utgörs av svar på en enkätundersökning från 514 barn rörande deras hälsa relaterad till utbrottet. Dessa enkäter togs fram av svenska Smittskyddsinstitutet kort efter utbrottet och det är i uppdrag av denna myndighet som studien utförs. Analys av riskfaktorer och följdsymptom utförs med logistiska regressionsmodeller utifrån både ett Bayesianskt och ett frekventistiskt tillvägagångssätt för att på så sätt betrakta datamaterialet från fler synvinklar och samtidigt identifiera skillnader mellan dessa två tillvägagångssätten. En annan del av arbetet presenterar bortfallskalibrerade skattningar av antalet Cryptosporidiumfall både totalt och månadsvis men också skattningar av fallprevalensen i olika redovisningsgrupper. Slutligen analyseras sambanden mellan följdsymptomen med logistisk regression. Dessutom utförs variabelklustring av följdsymptom med metoden fuzzy clustering för att se hur dessa kan grupperas. Resultaten visar att Glas vatten, Inom VA. område, Tidigare lös avföring och Kön identifieras som riskfaktorer medan de bäst förklarande följdsymptomen är Vattnig diarré, Buk- eller magsmärtor, Feber och Trött/utmattad. / The purpose of this study is to analyze how children under the age of 15 years were affected by the 2010 Östersund Cryptosporidium outbreak. The data consists of responses to a questionnaire from 514 children concerning their health related to the outbreak. The questionnaire was developed by the Swedish Institute for Infectious Disease Control shortly after the outbreak. The analysis of risk factors and the analysis of symptoms associated with infection were performed using logistic regression models based on both a Bayesian and a frequentist approach. Using the two different approaches we thus consider the dataset from different angels and at the same time try to identify the differences between these two approaches. Another part of the paper presents estimates calibrated for nonresponse of the number of Cryptosporidium infections both totally and on a monthly basis. Additionally estimates of the prevalence of cases in various domain groups are presented. Finally, associations between the symptoms are investigated using logistic regression. With the same goal we performed variable clustering of the symptoms using the fuzzy clustering approach. The results shows that higher water intake, getting water thru the municipal water distribution system, Former loose stools and Gender could be identified as risk factors while the best-explanatory symptoms were watery diarrhea, abdominal or stomach pain, fever and tiredness/exhaustion.
48

Probability Modelling of Alpine Permafrost Distribution in Tarfala Valley, Sweden

Alm, Micael January 2017 (has links)
Datainsamling har genomförts i Tarfaladalen under 5 dagar vid månadsskiftet mellan mars och april 2017. Insamlingen resulterade i 36 BTS-mätningar (Bottom Temperature of Snow cover) som därefter har använts tillsammans med data från tidigare insamlingar, till att skapa en sammanställd modell över förekomsten av permafrost omkring Tarfala. En statistisk undersökning syftade till att identifiera meningsfulla parametrar som permafrost beror av, genom att testa de oberoende variablerna mot BTS i en stegvis regression. De oberoende faktorerna höjd över havet, aspekt, solinstrålning, vinkel och gradient hos sluttningar producerades för varje undersökt BTS-punkt i ett geografiskt informationssystem.                 Den stegvisa regressionen valde enbart höjden som signifikant variabel, höjden användes i en logistisk regression för att modellera permafrostens utbredning. Den slutliga modellen visade att permafrostens sannolikhet ökar med höjden. För att skilja mellan kontinuerlig, diskontinuerlig och sporadisk permafrost delades modellen in i tre zoner med olika sannolikhetsspann. Den kontinuerliga permafrosten är högst belägen och därav den zon där sannolikheten för permafrost är störst, denna zon gränsar till den diskontinuerliga permafrosten vid en höjd på 1523 m. Den diskontinuerliga permafrosten har en sannolikhet mellan 50–80 % och dess undre gräns på 1108 m.ö.h. separerar den diskontinuerliga zonen från den sporadiska permafrosten / A field data collection has been carried out in Tarfala valley at the turn of March to April 2017. The collection resulted in 36 BTS-measurements (Bottom Temperature of Snow cover) that has been used in combination with data from earlier surveys, to create a model of the occurrence of permafrost around Tarfala. To identify meaningful parameters that permafrost relies on, independent variables were tested against BTS in a stepwise regression. The independent variables elevation, aspect, solar radiation, slope angle and curvature were produced for each investigated BTS-point in a geographic information system.                 The stepwise regression selected elevation as the only significant variable, elevation was applied to a logistic regression to model the permafrost occurrence. The final model showed that the probability of permafrost increases with height. To distinguish between continuous, discontinuous and sporadic permafrost, the model was divided into three zones with intervals of probability. The continuous permafrost is the highest located zone and therefore has the highest likelihood, this zone delimits the discontinuous permafrost at 1523 m a.s.l. The discontinuous permafrost has probabilities between 50-80 % and its lower limit at 1108 m a.s.l. separates the discontinuous zone from the sporadic permafrost.
49

Bayesiansk flernivåanalys för att undersöka variationen i elevers trygghet i skolan : En studie baserad på enkäten Om mig

Enoksson, Josefin, Olausson, Sofia January 2017 (has links)
According to chapter 5, section 3 of the Swedish School Law (2010: 800), it is written that "The education should be designed in such a way that all pupils are assured of a school environment characterized by safety and education". Today's school students are our future and it is therefore important to analyze puplis’ safety at school. This study investigates whether there is variation between schools, between municipalities and between schools within municipalities in Östergötland regarding pupils' safety at school. This study also investigates which variables that can affect school safety. The reason for this study is to provide a basis for further work to improve puplis’ school safety. The study is based on survey responses from the survey Om mig, which was sent to secondary grade in elementary school and grade 2 in upper secondary school. Data is divided into three parts, where respondents from primary school are in one, respondents from upper secondary school in one and finally one data for the whole of Östergötland, which contains both respondents for elementary school and upper secondary school. The response variable is the question How often do you feel safe at school?, Where students could answer, Always, Often, Sometimes, Rarely or Never. The explanatory variables are variables related to the school and to the student's health, such as trustworthy friend, bullying, stress, support and help developing. In Bilaga1, all of the variables examined are described. This study uses a multilevel logistic regression. Parameters are estimated using Bayesian inferences with noninformative prior distributions. The response variable is converted to a binary variable, where Always and Often was merged, and Sometimes, Rarely and Never was merged. The result showed that there is a small variation in puplis’ safety at school between schools, between municipalities and between schools within municipalities for primary school, upper secondary school and the whole of Östergötland. It was also investigated which variables affect school safety, it proved to be very similar between elementary school and upper secondary school, including bullying, how often students experience good mood at school, and if the students feel that they are treated equally by the teachers have an effect on the puplis’ safety at school. / Enligt 5 kapitlet 3 § i skollagen (2010:800) står det skrivet att ”Utbildningen ska utformas på ett sådant sätt att alla elever tillförsäkras en skolmiljö som präglas av trygghet och studiero”. Dagens skolelever är vår framtid och det är därför viktigt att analysera elevers trygghet i skolan. Denna studie undersöker om det finns variation mellan skolor, mellan kommuner samt mellan skolor inom kommuner i Östergötland vad gäller elevers trygghet i skolan. Studien undersöker även vilka variabler som kan ha effekt på tryggheten i skolan. Anledning till att denna studie genomförs är för att ha ett underlag i fortsatt arbete för att förbättra tryggheten i skolan. Studien bygger på enkätsvar från enkäten Om mig, som skickas ut till årskurs 8 i grundskolan samt årskurs 2 på gymnasiet. Datamaterialet är uppdelat i tre delar, där respondenter från grundskolan finns i ett, respondenter från gymnasiet i ett och till sist ett datamaterial för hela Östergötland som innehåller båderespondenter från grundskolan och gymnasieskolan. Responsvariabeln är frågan Hur ofta känner du dig trygg i skolan?, där eleverna kunde svara, Alltid, Ofta, Ibland, Sällan eller Aldrig. Förklaringsvariablerna är variabler som är relaterade till skolan och till elevens hälsa, till exempelpålitlig vän, mobbning, stress, stöd och hjälp att utvecklas. I bilaga 1 finns samtliga undersökta variabler beskrivna. Studien använder sig av en logistisk regression med flera nivåer. Parametrarna skattas med hjälp av Bayesiansk inferens med icke-informativa priorfördelningar. Responsvariabeln kodas om till en binärvariabel, där Alltid och Ofta slås ihop samt Ibland, Sällan och Aldrig slås ihop. Resultatet visade att det finns en liten variation i trygghet mellan skolor, mellan kommuner och mellan skolor inom kommuner, för grundskolan, gymnasiet och för hela Östergötland. Det undersökts även vilka variabler som har effekt på tryggheten i skolan, det visade sig vara väldigt lika mellan grundskolan och gymnasiet där bland annat mobbning, hur ofta eleverna upplever bra stämning i skolan samt om eleverna upplever att de blir rättvist behandlade av lärarna har en effekt på tryggheten i skolan.
50

Machine Learning Based Sentiment Classification of Text, with Application to Equity Research Reports / Maskininlärningsbaserad sentimentklassificering av text, med tillämpning på aktieanalysrapporte

Blomkvist, Oscar January 2019 (has links)
In this thesis, we analyse the sentiment in equity research reports written by analysts at Skandinaviska Enskilda Banken (SEB). We provide a description of established statistical and machine learning methods for classifying the sentiment in text documents as positive or negative. Specifically, a form of recurrent neural network known as long short-term memory (LSTM) is of interest. We investigate two different labelling regimes for generating training data from the reports. Benchmark classification accuracies are obtained using logistic regression models. Finally, two different word embedding models and bidirectional LSTMs of varying network size are implemented and compared to the benchmark results. We find that the logistic regression works well for one of the labelling approaches, and that the best LSTM models outperform it slightly. / I denna rapport analyserar vi sentimentet, eller attityden, i aktieanalysrapporter skrivna av analytiker på Skandinaviska Enskilda Banken (SEB). Etablerade statistiska metoder och maskininlärningsmetoder för klassificering av sentimentet i textdokument som antingen positivt eller negativt presenteras. Vi är speciellt intresserade av en typ av rekurrent neuronnät känt som long short-term memory (LSTM). Vidare undersöker vi två olika scheman för att märka upp träningsdatan som genereras från rapporterna. Riktmärken för klassificeringsgraden erhålls med hjälp av logistisk regression. Slutligen implementeras två olika ordrepresentationsmodeller och dubbelriktad LSTM av varierande nätverksstorlek, och jämförs med riktmärkena. Vi finner att logistisk regression presterar bra för ett av märkningsschemana, och att LSTM har något bättre prestanda.

Page generated in 0.0722 seconds