Spelling suggestions: "subject:"klusteranalys"" "subject:"clusteranalys""
21 |
Hillary Rodham Clinton - En polariserande kvinna : En studie av genus i retoriken & retoriken i genusJohansson, Malin January 2012 (has links)
Uppsatsen undersöker huruvida Hillary Rodham Clinton förkvinnligat sitt retoriska tillvägagångssätt eller om hennes retorik passar bättre in i den manliga senatorsrollen. Med hjälp av klusteranalys och neo-aristotelisk analysmetod, görs en jämförande analys för att söka efter skillnader och likheter i Clintons retoriska tillvägagångssätt. Materialet består av två tal som hölls vid det demokratiska konventet; 1996 (i egenskap av first lady) och 2008 (i egenskap av senator). Resultatet diskuteras sedan utifrån det genusrelaterade begreppet double bind. Analysresultatet visar på en utveckling i Clintons retorik, som generat ett stärkt primärt ethos. Clinton har, istället för att anpassa sitt språkbruk till ett mer kvinnligt, snarare anpassat sig till den nya rollen som senator.
|
22 |
Likaviktade aktieportföljer : En studie av aktieportföljer innehållandes de ingående aktierna i OMXS30 under tidsperioden 2003 - 2016.Enders, William January 2017 (has links)
I denna studie undersöks fyra olika typer av likaviktade aktieportföljer innehållande aktierna som historiskt ingått i OMXS30 under tidsperioden 2003 - 2016. Tre av fyra portföljer vilka konstruerats i studien genererar över hela undersökningsperioden en högre ackumulerad avkastning samt högre riskjusterad avkastning än OMXS30. De tre bäst presterande portföljerna består av en enkel likaviktad portfölj och två typer av portföljer baserade på klusteranalys med momentumstrategi. Resultaten ger belägg för att välja likaviktade porföljer framför kapitalviktade, sett ur ett investeringsperspektiv. / In this study, four different types of equally weighted stock portfolios are examined containing the stocks which historically have been included in OMXS30 from 2003 to 2016. Three out of four portfolios constructed in the study generates a higher accumulated return and a higher risk-adjusted return than OMXS30. These three best-performing portfolios consist of a simple equally weighted portfolio and two types of portfolios based on cluster analysis with momentum strategy. The results provide evidence that from an investing perspective it is preferable to choose equally weighted portfolios instead of capitalization-weighted.
|
23 |
Klusteranalys av individers självbildMunkby, Carl, Henning, Tove January 2020 (has links)
DISC-assessment is a tool used to evaluate the communication styles and behaviour of people by profiling based on four different reaction types. These profiles are usually represented by four different colours; Red, Yellow, Green and Blue. This colour division became a widely known phenomenon in Sweden after Thomas Eriksons' book \emph{Omgiven av idioter} was released 2014. The theory of DISC was shortly thereafter subject to strong criticism due to the simplicity of the model and the lack of research around it. The aim of this study is to explore if a categorization of people into the four groups, based on the theory, can be supported by the data. In an attempt to answer the research problem, two cluster analyses were performed using the \emph{k}-modes algorithm. The best cluster solution that was found showed similarities to the four groups based on the DISC-assessment. This could be seen as an indication of support for the profiling system. However, it is shown that several different cluster solutions are possible, severely limiting the possible conclusions that could be drawn from this study.
|
24 |
Finding time-based listening habits in users music listening history to lower entropy in data / Hitta tidsbaserade musiklyssningsvanor i användares lyssningshistorik för att sänka entropi i dataMagnusson, John January 2021 (has links)
In a world where information, entertainment and e-commerce are growing rapidly in terms of volume and options, it can be challenging for individuals to find what they want. Search engines and recommendation systems have emerged as solutions, guiding the users. A typical example of this is Spotify, a music streaming company that utilises users listening data and other derived metrics to provide personalised music recommendation. Spotify has a hypothesis that external factors affect users listening preferences and that some of these external factors routinely affect the users, such as workout routines and commuting to work. This work aims to find time- based listening habits in users’ music listening history to decrease the entropy in the data, resulting in a better understanding of the users. While this work primarily targets listening habits, the method can, in theory, be applied on any time series-based dataset. Listening histories were split into hour vectors, vectors where each element represents the distribution of a label/genre played during an hour. The hour vectors allowed for a good representation of the data independent of the volume. In addition, it allowed for clustering, making it possible to find hours where similar music was played. Hour slots that routinely appeared in the same cluster became a profile, highlighting a habit. In the final implementation, a user is represented by a profile vector allowing different profiles each hour of a week. Several users were profiled with the proposed approach and evaluated in terms of decrease in Shannon entropy when profiled compared to when not profiled. On average, user entropy dropped by 9% with highs in the 50% and a small portion of users not experiencing any decrease. In addition, the profiling was evaluated by measuring cosine similarity across users listening history, resulting in a correlation between gain in cosine similarity and decrease in entropy. In conclusion, users become more predictable and interpretable when profiled. This knowledge can be used to understand users better or as a feature for recommender systems and other analysis. / I en värld där information, underhållning och e-handel har vuxit kraftig i form av volym och alternativ, har individer fått det svårare att hitta det som de vill ha. Sökmotorer och rekommendationssystem har vuxit fram som lösningar till detta problem och hjälpt individer att hitta rätt. Ett typexempel på detta är Spotify, en musikströmningstjänst som använder sig av användares lyssningsdata för att rekommendera musik och annan personalisering. Spotify har en hypotes att externa faktorer påverkar användares lyssningspreferenser, samt att vissa av dessa faktorer påverkar användaren rutinmässigt som till exempel träningsrutiner och pendlade till jobbet. Målet med detta arbete är att hitta tidsbaserade lyssningsvanor i användares musiklyssningshistorik för att sänka Shannon entropin i data, resulterande i en bättre förståelse av användarna. Arbetet är primärt gjort för att hitta lyssningsvanor, men metoden kan i teorin appliceras på valfri godtycklig tidsserie dataset. Lyssningshistoriken delades in i timvektorer, radvektorer med längden x där varje element representerar fördelningen av en etikett/ genre som spelas under en timme. Timvektorerna skapade möjligheten till att använda klusteranalys som användes för att hitta timmar där liknande musik spelats. Timvektorer som rutinmässigt hamnade i samma kluster blev profiler, som användes för att markera vanor. I den slutgiltiga produkten representeras en användare av en profilvektor som tillåter en användare att ha en profil för varje timme i veckan. Ett flertal användare blev profilerade med den föreslagna metoden och utvärderade i form av sänkning i entropi när de blev profilerade gentemot när de inte blev profilerade. I genomsnitt sänktes användarnas entropi med 9%, med några över användare 50%, samt ett fåtal som inte fick någon sänknings alls. Profilering blev även utvärderad genom att mäta cosinuslikhet över en användares lyssningshistorik. Detta resulterade i en korrelation mellan ökning i cosinuslikhet och sänkning i entropi vid användandet av profilering. Slutsatsen som kan dras är att användare blir mera förutsägbara och tolkbara när de har blivit profilerade. Denna kunskap kan användas till att förstå användare bättre eller användas som en del av ett rekommendationssystem eller annan analys.
|
25 |
A Multi-Variate Regression Analysis on Telecommunication Sites in a Sub-Saharan Country / En regressionsanalys i flera variabler på telekommunikationsmaster i ett land i subsahariska AfrikaBerisha, Elza, Holma, Hampus January 2023 (has links)
The purpose of this bachelor thesis is to investigate how different variables impact voice and data traffic for a telecom operator that operates in an undisclosed Sub-Saharan African country. The data has been provided by said company. The models, generated by using multivariate linear regression analysis, have a high explanatory power, as evidenced by high coefficients of determination. However, it is important to recognize the persistence of certain systematic issues, which are most likely due to the absence of key explanatory variables. Addressing these limitations in future research efforts will lead to a more comprehensive understanding of the subject and more robust findings to determine which factors drive voice and data traffic. In the report, the telecommunication sites are segmented based on generated income. Two segmentation models were created to categorize sites based on their data and voice revenue quartiles. A color matrix was used to depict the results. The hypothesis that nearby sites are more likely to perform similarly was tested using a quartile-based scoring method. The regression analysis uncovered significant variables and revealed information about the relationship between various factors and data and voice traffic. The regression residuals were analyzed using qualitative cluster analysis, which revealed distinct clustering patterns. Overall, the study provides useful insights into data and voice traffic segmentation and performance analysis in the analyzed region. / Syftet med detta kandidatarbete är att undersöka hur olika variabler påverkar röst- och datatrafik för en telekom-operatör som är verksam i ett Subsahariskt afrikanskt land. Studien använder sig av linjär regressionsanalys för att utveckla modeller som visar med en bra förklaringsgrad. Förklaringsgraden visas genom höga determinationskoefficienter. Men, trots ett bra resultat är det viktigt att ta hänsyn till systematiska problem hos modellerna. problemen beror troligtvis på att viktiga förklarande variabler saknas i datan. Framtida forskningsinsatse bör därför sträva efter att åtgärda dessa begränsningar, och på så sätt uppnå en mer omfattande förståelse av ämnet och mer korrekt resultat. I rapporten segmenteras telekommunikationsmasterna baserat på genererad inkomst. Två segmenteringsmodeller har utvecklats för att kategorisera masterna enligt deras kvartiler för data- och röstintäkter. Resultaten visas visuellt med hjälp av en färgmatris. Dessutom prövades hypotesen att närliggande master uppvisar liknande prestanda med hjälp av en kvartilsbaserad poängmetod. Regressionsanalysen identifierar signifikanta variabler och ger insikter i relationen mellan olika faktorer mellan data- och rösttrafik. Vidare upptäcks, via kvalitativ klusteranalys av regressionsresterna, tydliga klustringsmönster i resultatet. Sammantaget ger denna studie värdefulla insikter i data- och rösttrafiksegmentering samt prestandaanalys i den analyserade regionen.
|
26 |
Analys av effektivitet hos en oddsmarknad medmultinominal logistisk regression och klusteranalys / Analysis of the odds-market efficiency by multinominallogistic regression and cluster algorithmEvén, Oliver, Sönnerborg, Oscar January 2021 (has links)
Studien undersökte marknadseffektiviteten i oddsmarknaden för fotboll. Två statistiskamodeller formulerades och implementerades med tillhörande test för att undersöka omoddsmarknaden var svagt marknadseffektiv. Den första modellen var multinominal logistiskregression vilken utvärderades med ett klassiskt Likelihood-ratio test. Den andra modellenvar ”K-means” klusteralgoritm med icke-parametriskt klustersignifikanstest, ”unimodal nonparametric cluster index” (UNPCI), som värderade klusterlösningen. Testerna kunde inteförkasta noll-hypotesen om svag marknadseffektivitet på 5% signifikansnivå. Resultatet liggeri linje med ett flertal andra publicerade studier.
|
27 |
Probleminventering av några forskares informationshantering : En fråga för biblioteket? / An inventory of problems found in researchers’ information management processes : A question for the Library?Egevad, Per January 2009 (has links)
The aim of this Master’s thesis is to investigate if the library can be a real partner for researchers in managing and dealing with their research information. In this study, six researchers have been interviewed about their problems with information management. This study uses the method Critical Incident Technique for the interviews with the researchers. This method focuses mainly on problems and what happens around those problems. The interview results have been prepared with automatic clustering and analysed with the help of a theoretical model from Minnesota University Library. This is a model of the scholarly research process described in four overlapping areas: 1) Discover, 2) Gather, 3) Create and 4) Share. The studies result gives that there seems to be no problem with accessing full text information, the problem is rather narrowing down the search to get enough time to read it all. The researchers do not find any search skills in the library that match their own search skills. On the question if the library works well as a partner, the answer in this study is no. The researchers do not see the library as a partner in working with research information, but only as a supplier of documents. When they need assistance, they turn to colleagues, students, email, and as a last resort, the library.
|
28 |
Energy Use as a Consequence of Everyday Life / Energianvändning som konsekvens av vardagslivetHellgren, Mattias January 2015 (has links)
Energy use is a part of everyday life and the use of energy is a part of the global climate change. Policy makers urge individuals to change their daily behaviour in order to mitigate climate change and care for our common environment. The dissertation regards daily behaviour as activities performed by individuals. The theoretical base is the time-geographic approach wherein everyday life is regarded as a sequence of interlinked activities performed by indivisible individuals. The dissertation investigates individuals’ energy use as an outcome of the activities they perform in everyday life. The empirical base of the dissertation is time-diaries from the Swedish time use survey 2010/2011. The diary data is explored as sequences of daily activities by using sequence analysis and clustering. The results show that individuals’ energy use is closely interweaved with how they live their everyday lives in terms of activity sequences. The results imply that changing an activity affects both the intricate web of interaction in the household and the interdependence of activities in everyday life. Change does not only affect the singular activity that was the object for the change, but rather major parts of the sequence of activities. In order to address energy conservation in information campaigns considerations ought to be taken on how everyday life is shaped and formed by the individual, by negotiations between the individuals in households, and societal structures. Information can be targeted to groups of individuals with similar activity sequences as they are revealed by cluster analysis. / Energianvändningen är en del av vardagen likaväl som användningen av energi är en del av den globala klimatförändringen. För att mildra effekterna på vår gemensamma miljö uppmanas människor av politiker och andra beslutsfattare att förändra sitt vardagsbeteende. I avhandlingen betraktas vardagsbeteendet som människors dagliga aktiviteter. Avhandlingens teoretiska grund är den tidsgeografiska ansatsen, där människors vardag betraktas som en sekvens av de aktiviteter som utförs av odelbara individer. Människors dagliga sekvens av aktiviteter undersöks för att ta reda på vilken energianvändning som genomförandet av aktiviteterna ger upphov till. Den empiriska grunden för avhandlingen är tidsdagboksdata från den svenska tidsanvändningsstudien från 2010/2011 och avhandlingen utforskar tidsdagböckerna som sekvenser av aktiviteter med hjälp av sekvens- och klusteranalys. Resultaten visar att individers energianvändning är nära sammanvävd med de aktivitetssekvenser som visar hur vardagslivet levs. Resultaten pekar vidare på att förändringar av enskilda aktiviteter också påverkar andra aktiviteter i det dagliga livet. Förändringar av en aktivitet påverkar således hela den dagliga sekvensen av aktiviteter. I utformningen av information som syftar till att minska hushållens energianvändning bör hänsyn tas till hur vardagslivets aktivitetssekvens formas av den enskilde i samspelet både med andra individer i hushållet och med samhällsstrukturerna. Målgruppsinriktad information kan utformas med utgångspunkt from människors likartade aktivitetsmönster så som de framgår genom klusteranalys.
|
29 |
Klusteranalys av språkgenrerNorrbin, Victor, Sintring, Love January 2017 (has links)
Målet med denna uppsats är att dela och undersöka 31 språkgenrer med hjälp av en klusteranalys. Hypotesen är att modernare genrer sprungna ur den senaste digitala utvecklingen är mer lika talspråk trots att de är skrivna. Av detta kommer resultaten från genrerna SMS, Supersynkron chatt och Chattforum att lyftas fram i studien. För att besvara frågeställningen används fem hierarkiska metoder Average-, Complete- och Single-Linkage, Centroid, Ward´s och en icke-hierarkisk metod. Uppsatsen tar avstamp i tidigare forskning från Biber (1988), Jonsson (2013) och Berber (2014) där även datamaterial för alla genrerna förutom SMS hämtas ifrån. Resultaten från de olika metoderna skiljer sig något åt varvid Single-Linkage inte bedöms vara relevant för studien. Inledningsvis stämmer den uppsatta hypotesen. Vid en djupare analys visar det sig att de tre genrerna inte bara är väldigt olika de 28 andra genrerna utan även skiljer sig åt sinsemellan. För att förklara varför behövs en viss lingvistisk förståelse och till det används både tidigare forskningsresultat och bakgrundsfakta om genrerna. Skillnaderna kan bl.a. troligtvis förklaras av att personerna som för konversationerna har olika slags relationer till varandra och att chattarna respektive SMS används för olika ändamål.
|
30 |
Comparing performance of K-Means and DBSCAN on customer support queriesKästel, Arne Morten, Vestergaard, Christian January 2019 (has links)
In customer support, there are often a lot of repeat questions, and questions that does not need novel answers. In a quest to increase the productivity in the question answering task within any business, there is an apparent room for automatic answering to take on some of the workload of customer support functions. We look at clustering corpora of older queries and texts as a method for identifying groups of semantically similar questions and texts that would allow a system to identify new queries that fit a specific cluster to receive a connected, automatic response. The approach compares the performance of K-means and density-based clustering algorithms on three different corpora using document embeddings encoded with BERT. We also discuss the digital transformation process, why companies are unsuccessful in their implementation as well as the possible room for a new more iterative model. / I kundtjänst förekommer det ofta upprepningar av frågor samt sådana frågor som inte kräver unika svar. I syfte att öka produktiviteten i kundtjänst funktionens arbete att besvara dessa frågor undersöks metoder för att automatisera en del av arbetet. Vi undersöker olika metoder för klusteranalys, applicerat på existerande korpusar innehållande texter så väl som frågor. Klusteranalysen genomförs i syfte att identifiera dokument som är semantiskt lika, vilket i ett automatiskt system för frågebevarelse skulle kunna användas för att besvara en ny fråga med ett existerande svar. En jämförelse mellan hur K-means och densitetsbaserad metod presterar på tre olika korpusar vars dokumentrepresentationer genererats med BERT genomförs. Vidare diskuteras den digitala transformationsprocessen, varför företag misslyckas avseende implementation samt även möjligheterna för en ny mer iterativ modell.
|
Page generated in 0.0824 seconds