• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • Tagged with
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Övervakad namntaggning med domänspecifik träningsdata / Supervised named-entity recognition with domain-specific training data

Persson, Adam January 2016 (has links)
Övervakad maskininlärning har gett goda resultat för automatisk namntaggning. Detta kräver dock manuellt annoterad träningsdata, vilket är krävande att ta fram. Studier har visat att likhet mellan träningsdata och testdata är viktigt för att uppnå bra resultat, men normalt sett tränas system alltid med så mycket data som möjligt, utan hänsyn till dess relevans. Syftet med denna studie är att undersöka om bättre namntaggning kan uppnås genom att utesluta de delar av träningsdatan som inte tillhör samma textdomän som testdatan. För att genomföra detta konstrueras ett system med multinomial logistisk regression som tränas och testas på Stockholm-Umeå Corpus enligt både traditionell och föreslagen metod. Undersökningen visar en liten men signifikant försämring vid användning av enbart domänspecifik träningsdata, ett resultat som dock inte är genomgående för alla delar av undersökningen. Den stora fördelen av att reducera träningsdatan är dock att det ökar maskininlärningens hastighet. För att kunna utnyttja detta föreslås att namntaggning föregås av textklassificering.
2

Analys och modellering av sannolikheterna för utfallen i en fotbollsmatch utifrån matchstatistik / Analysis and modeling of the probabilities of the outcomes in a football match based on match statistics

Wikblad, Filip, Hansson, Oskar January 2022 (has links)
Studien undersöker vilken modell som bäst modellerar matchutfallet (1,X,2 - Hemmavinst, Oavgjort, Bortavinst) på en fotbollsmatch utifrån matchstatistik. Datan som analyserats är sammanställd från den engelska fotbollens tre högsta divisioner från 2005 och framåt. Multinomial logistisk regression tillämpas för att modellera responsvariabeln utifrån förklaringsvariablerna. Med hjälp av best subset regression undersöks alla kombinationer av variabler och modellerna jämförs utifrån Akaike Information Criterion (AIC). Tillsammans med resultatet från regressionerna och en analys över multikollinearitet väljs den bästa modellen.  Resultatet visar på både väntade och oväntade effekter vilket skapar grund för framtida studier. Förbättringsområden för framtida studier innefattar fler förklaringsvariabler, jämförelser med spelbolagens odds och test på ny testdata. Tillämpningsområden för modellen är inom spelbranschen där modellen kan användas för att värdera kombinationsspel och liveodds. / This study aims to find the best model to predict the outcome of football (1,X,2 - Home Win, Draw, Away Win) games by looking at match data. The data used is put together from the three highest football divisions in England and go back to the year 2005. Multinomial logistic regression is used to model the response variable from the regressors. A best subset regression is used to find the models with the lowest Akaike Information Criterion (AIC). By doing a multicollinearity analysis these models are further examined and the best one is chosen.  The results show both expected and unexpected effects that create foundation for future studies. Areas for model improvement include more variables, comparison with the bookmaker’s odds and tests on new test data. The application of the model is in sports betting where it can be used to value multi bets and live odds.

Page generated in 0.1236 seconds