Spelling suggestions: "subject:"linearregression"" "subject:"multilinearregression""
611 |
Predicting Workforce in Healthcare : Using Machine Learning Algorithms, Statistical Methods and Swedish Healthcare Data / Predicering av Arbetskraft inom Sjukvården genom Maskininlärning, Statistiska Metoder och Svenska SjukvårdsstatistikDiskay, Gabriel, Joelsson, Carl January 2023 (has links)
Denna studie undersöker användningen av maskininlärningsmodeller för att predicera arbetskraftstrender inom hälso- och sjukvården i Sverige. Med hjälp av en linjär regressionmodell, en Gradient Boosting Regressor-modell och en Exponential Smoothing-modell syftar forskningen för detta arbete till att ge viktiga insikter för underlaget till makroekonomiska överväganden och att ge en djupare förståelse av Beveridge-kurvan i ett sammanhang relaterat till hälso- och sjukvårdssektorn. Trots vissa utmaningar med datan är målet att förbättra noggrannheten och effektiviteten i beslutsfattandet rörande arbetsmarknaden. Resultaten av denna studie visar maskininlärningspotentialen i predicering i ett ekonomiskt sammanhang, även om inneboende begränsningar och etiska överväganden beaktas. / This study examines the use of machine learning models to predict workforce trends in the healthcare sector in Sweden. Using a Linear Regression model, a Gradient Boosting Regressor model, and an Exponential Smoothing model the research aims to grant needed insight for the basis of macroeconomic considerations and to give a deeper understanding of the Beveridge Curve in the healthcare sector’s context. Despite some challenges with data, the goal is to improve the accuracy and efficiency of the policy-making around the labor market. The results of this study demonstrates the machine learning potential in the forecasting within an economic context, although inherent limitations and ethical considerations are considered.
|
612 |
Using Regression Analysis to Evaluate KPI Implementation at Volvo Penta North America / Användning av regressionsanalys för att utvärdera implementeringen av en ny KPI på Volvo Penta North AmericaH. Granlund, Gustav, Söderholm, Marcus January 2022 (has links)
Most companies want to measure the performance of various areas of their operations. By doing so, it is easier to identify weaknesses or problems and take action to improve the performance in those areas. This study is conducted in collaboration with Volvo Penta North America and seeks to evaluate the possibilities of implementing a performance indicator for their dealers. The aim of this thesis is to investigate if there is a correlation between Volvo Penta’s evaluation system for their dealers, their Dealer Operating Standard score (DOS-Score) and their respective Sales Revenue, as well as the individual segments of the DOS and the Sales Revenue. In other words, if the evaluation system can be used as a performance indicator for how good the financial performance of a dealer is. The analysis is based on first-party data from Penta regarding the operation of Penta’s dealers. By using Linear Regression, it was found that the Adjusted R-Squared of the model with Aggregated DOS against Sales Revenue was 0.1403 and the Adjusted R-Squared for the model with the Segmented DOS against Sales Revenue was 0.1983. Thus, there is no significant correlation between the Aggregated DOS and Sales Revenue. However the results from the Segmented DOS-score against Sales Revenue indicates that it is possible to improve on the current DOS algorithm. Further research with more confounders considered is required to improve the model. / De flesta företag vill mäta resultatet av olika delar av verksamheten. På så sätt är det lättare att identifiera svagheter eller problem och vidta åtgärder för att förbättra resultaten inom dessa områden. Den här studien genomförs i samarbete med Volvo Penta North America och syftar till att utvärdera möjligheterna att införa en performance indicator för deras återförsäljare. Syftet med denna studie är att undersöka om det finns ett samband mellan Volvo Pentas utvärderingssystem, Dealer Operating Standard (DOS), för sina återförsäljare och deras respektive försäljningsintäkter, samt de enskilda segmenten av DOS och försäljningsintäkterna. Med andra ord, om utvärderingssystemet kan användas som en performance indicator för hur bra en återförsäljares ekonomiska resultat är. Analysen bygger på förstahandsdata från Penta om verksamheten hos återförsäljarna. Genom att använda linjär regression fann man att Adjusted R-Squared för modellen med Aggregerad DOS mot försäljningsintäkter var 0,1403 och Adjusted R-Squared för modellen med Segmenterad DOS mot försäljningsintäkter var 0,1983. Det finns alltså ingen signifikant korrelation mellan Aggregated DOS och försäljningsintäkter. Resultaten från det segmenterade DOS-värdet mot försäljningsintäkterna visar dock att det är möjligt att förbättra den nuvarande DOS-algoritmen. Det krävs ytterligare forskning där fler utomstående faktorer beaktas för att förbättra modellen.
|
613 |
Assessing the Operational Value Creation by the Private Equity Industry in the Nordics / Utvärdering av Private Equity Industrins Påverkan på Operationell Effektivitet i Nordiska PortföljbolagWuilmart, Adam, Harrysson, Erik January 2020 (has links)
More and more capital is being directed towards the private equity industry. As a result, private equity owned firms make up an increasingly large share of the economy. Therefore, it is becoming more important to understand the nature of how the operational performance of firms change under private equity ownership. This study looked at how the operational efficiency in terms of EBIT-margin changed over a three-year period after a private equity acquisition in the Nordic market. The study found that companies which had an initial positive EBIT margin behaved differently from companies with an initial negative EBIT margin and therefore two separate models where created. It was found that in the case where the company had a positive EBIT margin before being bought by a private equity firm saw an average decrease in EBIT margin of 1.14% units. In the case of a firm with initial negative EBIT-margin a private equity acquisition led to an average increase in EBIT margin by 1.99% units compared to the reference data. This study thus shows that private equity ownership affects the operational efficiency of companies. Moreover, it shows that one should make a distinction between PE ownership in profitable growth cases and turn-around cases of inefficient companies and that the impact of PE ownership in terms of effect on operational profitability can be vastly different depending on the nature of the acquisition in this regard. / Private Equity industrin ser ökande inströmning av investeringskapital, vilket resulterat i att en allt större del av ekonomin utgörs av private equity-ägda företag. Därmed ökar vikten av att förstå hur private equity firmor påverkar sina portföljbolag under ägandeperioden. Denna studie undersöker hur EBIT-marginalen i företag förändrats över en treårsperiod efter att företagen blivit förvärvade av ett nordiskt private equity-bolag. Studien hittade en signifikant skillnad mellan hur företag med initialt positiv, respektive negativ EBIT-marginal påverkades under treårsperioden och två separata modeller skapades för att utvärdera effekten. Resultaten påvisade med signifikans att företag med initial positiv EBIT-marginal minskade sin EBIT-marginal med 1.14% relativt jämförbara företag efter ett private equity förvärv. För företag med initialt negativ EBIT-marginal påvisades med signifikans en ökning av EBIT-marginalen med 1.99% relativt jämförbara företag efter ett private equity förvärv. Studien påvisar därmed att private equity ägande har en påverkan på operationell lönsamhet och att den skiljer sig markant beroende på ifall företaget initialt är operativt lönsamt eller ej.
|
614 |
Determining the impact of ESG metrics on the financial performance of public Nordic companies / Betydelsen av ESG-mått på finansiell prestation för publika Nordiska företagHagéus, Tom, Nyhrén, Malin January 2021 (has links)
The use of sustainability within the investment community is becoming increasingly common. More specifically, investors are now more than ever leaning towards ESG scores as a way of incorporating a more holistic approach when making investment decisions. However, the evidence for a relationship between financial performance and ESG scores is inconsistent. Besides, a recent study has also shown a large divergence between ESG scores. Together this urges a need for a more in-depth understanding of which, if any, non-financial metrics have an impact on financial performance. Therefore, this study investigated if there is any relationship between ESG metrics and financial performance for Nordic public companies by performing a multiple linear regression analysis. Our results concluded that such a relationship exists, both for accounting-based ROA and market-based Tobin’s Q between 2017-2018. This study also shows that there is an overall concentration towards social metrics for both models. Secondly, it shows that some metrics such as “Percentage of Female Employees” are positively significant for ROA but not valued by the market model. The opposite outcome also exists where “Code of Conduct/Ethics Policy” is positively significant for Tobin’s Q but not for ROA. Lastly, it is also shown that some important metrics are negative significant for ROA and therefore urging for inclusion of non-financial measurements when making strategic decisions. / Användandet av hållbarhet inom investeringssfären blir allt vanligare. Investerare förlitar sig allt mer på ESG-betyg som ett sätt att integrera en helhetssyn när de fattar investeringsbeslut. Bevisen för ett samband mellan finansiell prestation och ESG-betyg är dock inkonsekventa. Dessutom har en ny studie också påvisat stora skillnader mellan ESG-betyg. Tillsammans skapar detta ett behov av mer fördjupad förståelse för vilka, om ens några, icke finansiella mått som har en inverkan på den finansiella prestationen. Därför undersökte denna studie om det finns något samband mellan ESG-mått och finansiell prestation för nordiska börsnoterade företag genom att utföra en multipel linjär regressionsanalys. Resultaten konkluderade att en sådan relation existerar, både för det bokföringsbaserade måttet ROA och marknadsbaserade måttet Tobin’s Q mellan 2017-2018. Studien visar också att det finns en övergripande koncentration mot sociala mått för båda modellerna. Efter det visas det även att mått som exempelvis “Percentage of Female Employees” är positivt signifikanta för ROA men inte signifikanta alls för Tobin’s Q. Ett liknande men motsatt resultat finns också då måttet “Code of Conduct/Ethics Policy” är positivt signifikant för Tobin’s Q men inte för ROA. Slutligen visar också denna studie på att det finns viktiga mått som visar en negativ signifikans med ROA och att det därför är viktigt att även inkludera icke-finansiella mått när strategiska beslut ska fattas.
|
615 |
ANATOMY OF FLOOD RISK AND FLOOD INSURANCE IN THE U.S.Arkaprabha Bhattacharyya (9182267) 13 November 2023 (has links)
<p dir="ltr">The National Flood Insurance Program (NFIP), which is run by the U.S. Federal Emergency Management Agency (FEMA), is presently under huge debt to the U.S. treasury. The debt is primarily caused by low flood insurance take-up rate, low willingness to pay for flood insurance, and large payouts after major disasters. Addressing this insolvency problem requires the NFIP to understand (1) what drives the demand for flood insurance so that it can be increased, (2) how risk factors contribute towards large flood insurance payouts so that effective risk reduction policies can be planned, and (3) how to predict the future flood insurance payouts so that the NFIP can be financially prepared. This research has answered these three fundamental questions by developing empirical models based on historical data. To answer the first question, this research has developed a propensity score-based causal model that analyzed one of the key components that influences the demand for flood insurance – the availability of post-disaster government assistance. It was found that the availability of the federal payout in a county in a year increased the number of flood insurance policies by 5.2% and the total insured value of the policies by 4.6% in the following year. Next, this research has developed Mixed Effects Regression model that quantified the causal relationships between the annual flood insurance payout in a county and flood related risk factors such as flood exposure, infrastructure vulnerability, social vulnerability, community resilience, and the number of mobile homes in the county. Based on the derived causal estimates, it was predicted that climate change, which is expected to increase flood exposure in coastal counties, will increase the annual NFIP payout in New Orleans, Louisiana by $2.04 billion in the next 30 years. Lastly, to make the NFIP financially prepared for future payouts, this research has developed a predictive model that can predict the annual NFIP payout in a county with adequate predictive accuracy. The predictive model was used to predict the NFIP payout for 2021 and it was able to predict that with a 9.8% prediction error. The outcomes of this research create new knowledge to inform policy decisions and strategies aimed at fortifying the NFIP. This includes strategies such as flood protection infrastructure, tailored disaster assistance, and other interventions that can bolster flood insurance uptake while mitigating the risk of substantial payouts. Ultimately, this research contributes to sustaining the NFIP's ability to provide vital flood insurance coverage to millions of Americans.</p>
|
616 |
Adapting Psychotherapeutic Interventions to Major and Minor Image-Distorting Defense MechanismsGlobe, Michelle 07 July 2023 (has links)
No description available.
|
617 |
[pt] DESENVOLVIMENTO DE MODELOS PARA PREVISÃO DE QUALIDADE DE SISTEMAS DE RECONHECIMENTO DE VOZ / [en] DEVELOPMENT OF PREDICTION MODELS FOR THE QUALITY OF SPOKEN DIALOGUE SYSTEMSBERNARDO LINS DE ALBUQUERQUE COMPAGNONI 12 November 2021 (has links)
[pt] Spoken Dialogue Systems (SDS s) são sistemas baseados em computadores desenvolvidos para fornecerem informações e realizar tarefas utilizando o diálogo como forma de interação. Eles são capazes de reconhecimento de voz, interpretação, gerenciamento de diálogo e são capazes de ter uma voz como saída de dados, tentando reproduzir uma interação natural falada entre um usuário humano e um sistema. SDS s provém diferentes serviços, todos através de linguagem falada com um sistema. Mesmo com todo o
desenvolvimento nesta área, há escassez de informações sobre como avaliar a qualidade de tais sistemas com o propósito de otimização do mesmo. Com dois destes sistemas, BoRIS e INSPIRE, usados para reservas de restaurantes e gerenciamento de casas inteligentes, diversos experimentos foram conduzidos
no passado, onde tais sistemas foram utilizados para resolver tarefas específicas. Os participantes avaliaram a qualidade do sistema em uma série de questões. Além disso, todas as interações foram gravadas e anotadas por um especialista.O desenvolvimento de métodos para avaliação de performance é um tópico aberto de pesquisa na área de SDS s. Seguindo a idéia do modelo PARADISE (PARAdigm
for DIalogue System Evaluation – desenvolvido pro Walker e colaboradores na AT&T em 1998), diversos experimentos foram conduzidos para desenvolver modelos de previsão de performance de sistemas de reconhecimento de voz e linguagem falada. O objetivo desta dissertação de mestrado é desenvolver
modelos que permitam a previsão de dimensões de qualidade percebidas por um usuário humano, baseado em parâmetros instrumentalmente mensuráveis utilizando dados coletados nos experimentos realizados com os sistemas BoRIS e INSPIRE , dois sistemas de reconhecimento de voz (o primeiro para busca de
restaurantes e o segundo para Smart Homes). Diferentes algoritmos serão utilizados para análise (Regressão linear, Árvores de Regressão, Árvores de Classificação e Redes Neurais) e para cada um dos algoritmos, uma ferramenta diferente será programada em MATLAB, para poder servir de base para análise de experimentos futuros, sendo facilmente modificado para sistemas e parâmetros novos em estudos subsequentes.A idéia principal é desenvolver ferramentas que possam ajudar na otimização de um SDS sem o envolvimento direto de um usuário humano ou servir de ferramenta para estudos futuros na área. / [en] Spoken Dialogue Systems (SDS s) are computer-based systems developed to provide information and carry out tasks using speech as the interaction mode. They are capable of speech recognition, interpretation, management of dialogue and have speech output capabilities, trying to reproduce a more or less natural
spoken interaction between a human user and the system. SDS s provide several different services, all through spoken language. Even with all this development, there is scarcity of information on ways to assess and evaluate the quality of such systems with the purpose of optimization. With two of these SDS s ,BoRIS and INSPIRE, (used for Restaurant Booking Services and Smart Home Systems), extensive experiments were conducted in the past, where the systems were used to resolve specific tasks. The evaluators rated the quality of the system on a multitude of scales. In addition to that, the interactions were recorded and annotated by an expert. The development of methods for performance evaluation
is an open research issue in this area of SDS s. Following the idea of the PARADISE model (PARAdigm for DIalogue System Evaluation model, the most well-known model for this purpose (developed by Walker and co-workers at AT&T in 1998), several experiments were conducted to develop predictive
models of spoken dialogue performance. The objective of this dissertation is to develop and assess models which allow the prediction of quality dimensions as perceived by the human user, based on instrumentally measurable variables using all the collected data from the BoRIS and INSPIRE systems. Different types of
algorithms will be compared to their prediction performance and to how generic they are. Four different approaches will be used for these analyses: Linear regression, Regression Trees, Classification Trees and Neural Networks. For each of these methods, a different tool will be programmed using MATLAB, that can
carry out all experiments from this work and be easily modified for new experiments with data from new systems or new variables on future studies. All the used MATLAB programs will be made available on the attached CD with an operation manual for future users as well as a guide to modify the existing
programs to work on new data. The main idea is to develop tools that would help on the optimization of a spoken dialogue system without a direct involvement of the human user or serve as tools for future studies in this area.
|
618 |
Predicting PV self-consumption in villas with machine learningGALLI, FABIAN January 2021 (has links)
In Sweden, there is a strong and growing interest in solar power. In recent years, photovoltaic (PV) system installations have increased dramatically and a large part are distributed grid connected PV systems i.e. rooftop installations. Currently the electricity export rate is significantly lower than the import rate which has made the amount of self-consumed PV electricity a critical factor when assessing the system profitability. Self-consumption (SC) is calculated using hourly or sub-hourly timesteps and is highly dependent on the solar patterns of the location of interest, the PV system configuration and the building load. As this varies for all potential installations it is difficult to make estimations without having historical data of both load and local irradiance, which is often hard to acquire or not available. A method to predict SC using commonly available information at the planning phase is therefore preferred. There is a scarcity of documented SC data and only a few reports treating the subject of mapping or predicting SC. Therefore, this thesis is investigating the possibility of utilizing machine learning to create models able to predict the SC using the inputs: Annual load, annual PV production, tilt angle and azimuth angle of the modules, and the latitude. With the programming language Python, seven models are created using regression techniques, using real load data and simulated PV data from the south of Sweden, and evaluated using coefficient of determination (R2) and mean absolute error (MAE). The techniques are Linear Regression, Polynomial regression, Ridge Regression, Lasso regression, K-Nearest Neighbors (kNN), Random Forest, Multi-Layer Perceptron (MLP), as well as the only other SC prediction model found in the literature. A parametric analysis of the models is conducted, removing one variable at a time to assess the model’s dependence on each variable. The results are promising, with five out of eight models achieving an R2 value above 0.9 and can be considered good for predicting SC. The best performing model, Random Forest, has an R2 of 0.985 and a MAE of 0.0148. The parametric analysis also shows that while more input data is helpful, using only annual load and PV production is sufficient to make good predictions. This can only be stated for model performance for the southern region of Sweden, however, and are not applicable to areas outside the latitudes or country tested. / I Sverige finns ett starkt och växande intresse för solenergi. De senaste åren har antalet solcellsanläggningar ökat dramatiskt och en stor del är distribuerade nätanslutna solcellssystem, dvs takinstallationer. För närvarande är elexportpriset betydligt lägre än importpriset, vilket har gjort mängden egenanvänd solel till en kritisk faktor vid bedömningen av systemets lönsamhet. Egenanvändning (EA) beräknas med tidssteg upp till en timmes längd och är i hög grad beroende av solstrålningsmönstret för platsen av intresse, PV-systemkonfigurationen och byggnadens energibehov. Eftersom detta varierar för alla potentiella installationer är det svårt att göra uppskattningar utan att ha historiska data om både energibehov och lokal solstrålning, vilket ofta inte är tillgängligt. En metod för att förutsäga EA med allmän tillgänglig information är därför att föredra. Det finns en brist på dokumenterad EA-data och endast ett fåtal rapporter som behandlar kartläggning och prediktion av EA. I denna uppsats undersöks möjligheten att använda maskininlärning för att skapa modeller som kan förutsäga EA. De variabler som ingår är årlig energiförbrukning, årlig solcellsproduktion, lutningsvinkel och azimutvinkel för modulerna och latitud. Med programmeringsspråket Python skapas sju modeller med hjälp av olika regressionstekniker, där energiförbruknings- och simulerad solelproduktionsdata från södra Sverige används. Modellerna utvärderas med hjälp av determinationskoefficienten (R2) och mean absolute error (MAE). Teknikerna som används är linjär regression, polynomregression, Ridge regression, Lasso regression, K-nearest neighbor regression, Random Forest regression, Multi-Layer Perceptron regression. En additionell linjär regressions-modell skapas även med samma metodik som används i en tidigare publicerad rapport. En parametrisk analys av modellerna genomförs, där en variabel exkluderas åt gången för att bedöma modellens beroende av varje enskild variabel. Resultaten är mycket lovande, där fem av de åtta undersökta modeller uppnår ett R2-värde över 0,9. Den bästa modellen, Random Forest, har ett R2 på 0,985 och ett MAE på 0,0148. Den parametriska analysen visar också att även om ingångsdata är till hjälp, är det tillräckligt att använda årlig energiförbrukning och årlig solcellsproduktion för att göra bra förutsägelser. Det måste dock påpekas att modellprestandan endast är tillförlitlig för södra Sverige, från var beräkningsdata är hämtad, och inte tillämplig för områden utanför de valda latituderna eller land.
|
619 |
PV self-consumption: Regression models and data visualizationTóth, Martos January 2022 (has links)
In Sweden the installed capacity of the residential PV systems is increasing every year. The lack of feed-in-tariff-scheme makes the techno-economic optimization of the PV systems mainly based on the self-consumption. The calculation of this parameter involves hourly building loads and hourly PV generation. This data cannot be obtained easily from households. A predictive model based on already available data would be preferred and needed in this case. The already available machine learning models can be suitable and have been tested but the amount of literature in this topic is fairly low. The machine learning models are using a dataset which includes real measurement data of building loads and simulated PV generation data and the calculated self-consumption data based on these two inputs. The simulation of PV generation can be based on Typical Meteorological Year (TMY) weather file or on measured weather data. The TMY file can be generated quicker and more easily, but it is only spatially matched to the building load, while the measured data is matched temporally and spatially. This thesis investigates if the usage of TMY file leads to any major impact on the performance of the regression models by comparing it to the measured weather file model. In this model the buildings are single-family houses from south Sweden region. The different building types can have different load profiles which can affect the performance of the model. Because of the different load profiles, the effect of using TMY file may have more significant impact. This thesis also compares the impact of the TMY file usage in the case of multifamily houses and also compares the two building types by performance of the machine learning models. The PV and battery prices are decreasing from year to year. The subsidies in Sweden offer a significant tax credit on battery investments with PV systems. This can make the batteries profitable. Lastly this thesis evaluates the performance of the machine learning models after adding the battery to the system for both TMY and measured data. Also, the optimal system is predicted based on the self-consumption, PV generation and battery size. The models have high accuracy, the random forest model is above 0.9 R2for all cases. The results confirm that using the TMY file only leads to marginal errors, and it can be used for the training of the models. The battery model has promising results with above 0.9 R2 for four models: random forest, k-NN, MLP and polynomial. The prediction of the optimal system model has promising results as well for the polynomial model with 18% error in predicted payback time compared to the reference. / I Sverige ökar den installerade kapaciteten för solcellsanläggningarna för bostäder varje år. Bristen på inmatningssystem gör att den tekniska ekonomiska optimeringen av solcellssystemen huvudsakligen bygger på egen konsumtion. Beräkningen av denna parameter omfattar byggnadsbelastningar per timme och PV-generering per timme. Dessa uppgifter kan inte lätt erhållas från hushållen. En prediktiv modell baserad på redan tillgängliga data skulle vara att föredra och behövas i detta fall. De redan tillgängliga maskininlärningsmodellerna kan vara lämpliga och redan testade men mängden litteratur i detta ämne är ganska låg. Maskininlärningsmodellerna använder en datauppsättning som inkluderar verkliga mätdata från byggnader och simulerad PV-genereringsdata och den beräknade egenförbrukningsdata baserad på dessa två indata. Simuleringen av PV-generering kan baseras på väderfilen Typical Meteorological Year (TMY) eller på uppmätta väderdata. TMY-filen kan genereras snabbare och enklare, men den anpassas endast rumsligt till byggnadsbelastningen, medan uppmätta data är temporärt och rumsligt. Denna avhandling undersöker om användningen av TMY-fil leder till någon större påverkan på prestandan genom att jämföra den med den uppmätta väderfilsmodellen. I denna modell är byggnaderna småhus från södra Sverige. De olika byggnadstyperna kan ha olika belastningsprofiler vilket kan påverka modellens prestanda. På grund av dessa olika belastningsprofiler kan effekten av att använda TMY-fil ha mer betydande inverkan. Den här avhandlingen jämför också effekten av TMY-filanvändningen i fallet med flerfamiljshus och jämför också de två byggnadstyperna efter prestanda för maskininlärningsmodellerna. PV- och batteripriserna minskar från år till år. Subventionerna i Sverige ger en betydande skattelättnad på batteriinvesteringar med solcellssystem. Detta kan göra batterierna lönsamma. Slutligen utvärderar denna avhandling prestandan för maskininlärningsmodellerna efter att ha lagt till batteriet i systemet för både TMY och uppmätta data. Det optimala systemet förutsägs också baserat på egen förbrukning, årlig byggnadsbelastning, årlig PV-generering och batteristorlek. Modellerna har hög noggrannhet, den slumpmässiga skogsmodellen är över 0,9 R2 för alla fall. Resultaten bekräftar att användningen av TMY-filen endast leder till marginella fel, och den kan användas för träning av modellerna. Batterimodellen har lovande resultat med över 0,9 R2 för fyra modeller: random skog, k-NN, MLP och polynom. Förutsägelsen av den optimala systemmodellen har också lovande resultat för polynommodellen med 18 % fel i förutspådd återbetalningstid jämfört med referensen.
|
620 |
Effect of polysemy and homography on sentiment analysis / Effekten av polysemi och homografi på sentimentanalysLjung, Oskar January 2024 (has links)
This bachelor's thesis studied the difference in sentiment between different homographic or polysemous senses of individual words. It did this by training a linear regression model on a version of the British National corpus that had been disambiguated along WordNet word senses (synsets) and analysing sentiment data from SentiWordNet. Results were partial, but indicated that word senses differ somewhat in sentiment. In the process of this study, a new and improved version of the Lesk disambiguation algorithm was also developed, named Nomalised Lesk. The validation of that algorithm compared to the regular Lesk algorithm is presented here as well.
|
Page generated in 0.082 seconds