• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 11
  • 7
  • Tagged with
  • 18
  • 14
  • 10
  • 6
  • 6
  • 6
  • 5
  • 5
  • 5
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Modellering av åtgärdsintervall för vägar med tung trafik

Brännmark, My, Fors, Ellen January 2019 (has links)
In Sweden, there has been an long term effort to allow as heavy traffic as possible, provided thatthe road network can handle it. This is because heavy traffic offers a competitive advantage withsocio-economic gains. In July 2018, the Swedish Transport Administration made 12 percent ofthe Swedish road network avaliable for the new maximum vehicle weight of 74 tonnes, basedon a legislative change from 2017. It is known that heavy traffic has a negative effect on thedegradation of the road, but it prevails divided opinions on whether 74 tonnes have a greaterimpact on the degradation rate compared to previous maximum gross weights of 64 tonnes.The 74 tonne vehicles have the same allowed axle load, which means more axles per vehicle. Some argue that an increased total load and more axles affect the degradation associated withtime-dependent material properties, while others argue that 74 tonnes mean fewer heavy vehiclesoverall, and thus should have a positive impact on the road’s lifespan. The construction companySkanska therefore requests a statistical analysis that enables to nuance the effects that heavytraffic has on the Swedish state road network. Since there is very limited data on the effect of 74 tonne traffic, this Master thesis instead focuseson modeling heavy traffic in general in order to be able to draw conclusions on which variablesare significant for a road’s lifetime. The method used is survival analysis where the lifetimeof the road is defined as the time between two maintenance treatments. The model selectedis the semi-parametric ’Cox Proportional Hazard Model’. The model is fitted with data froman open source database called LTPP (Long Term Pavement Performance) which is providedby the National Road and Transport Research Institute (VTI). The result of the modeling ispresented with hazard ratios, which is the relative risk that a road will require maintance atthe next time stamp compared to a reference category. The covariates that turned out to besignificant for a road’s lifetime and thus are included in the model are; lane width, undergroundtype, speed limit, asphalt layer thickness, bearing layer thickness and proportion of heavy traffic. Survival curves estimated by the model are also presented. In addition, a sensitivity analysis ismade by exploring survival curves estimated for different scenarios, with different combinationsof covariate levels.The results is then compared with previous studies on the subject. The most interesting finding isa case study from Finland since Finland allow 76 tonne vehicles since 2013. In the comparison,the model’s significant variables are confirmed, but the significance of precipitation and thenumber of axes for a roads lifetime is also highlighted
12

Are You Staying? : A Study of In-movers to Northern Sweden and the Factors Influencing Migration and Duration of Stay

Andersson, Erika January 2017 (has links)
The distribution of the population has multiple implications on regional development and planning. In-migration is frequently seen as the only possible solution in order to rejuvenate the population and stimulate regional development in sparsely populated regions. A population increase results in greater tax revenues, meaning that local authorities can plan for their inhabitants and expenditures in a more sufficient way. In addition, certain professionals are needed in order to support essential local services such as schools and hospitals. Place marketing with the intention of attracting in-movers has become increasingly popular, especially for rural, sparsely populated Swedish municipalities. Still, the outcome from place marketing efforts are dubious and in addition, migration has a temporal aspect and individual migration propensity usually fluctuates over time. This begs the question – how long do in-movers stay? Is there potential for long lasting development in sparsely populated regions connected to in-movers or is it temporary? This study focuses on the duration of time until an in-mover re-migrates from Region 8 in northern Sweden and which socioeconomic and demographic factors that influences the out- migration. This is studied by applying an event history method with discrete-time logistic regressions. The study follows individuals in working age that moved to any of nine specified municipalities in Västerbotten and Norrbotten County, sometime between 2000 and 2011. Questions posed for the study is: i) On average, how long did people who moved to Region 8 between the years 2000-2011 stay in the region? ii) What are the socioeconomic and demographic factors that influence the out-migration from the region? iii) Do the influencing factors differ between women and men? The results show that the time perspective matters as the risk of moving out was highest in the initial years and that it declines with time. 30 % of the sampled in-movers had moved out again within the time of observation, and on average the in-movers stayed for nine years. The regression results indicated that the factors that had the greatest influence on the out- migration was unemployment, being between 20-26 years old, high education, having and unemployed partner, and having children below school age. Women had a slightly lower likelihood of moving out compared to men, and the most prominent influential factor to outmigration that varied between women and men was unemployment.
13

Bostad till salu : En analys av tid-till-försäljning på Uppsalas bostadsmarknad

Eriksson, Fabian, Ajdert, Alexander January 2022 (has links)
Denna uppsats har undersökt tid-till-försäljning på Uppsala kommuns bostadsmarknad för lägenheter under året 2021. För att analysera tid-till-försäljning har metoder från överlevnadsanalys använts. Överlevnadsfunktionen och den kumulativa hasardfunktionen har skattats med Kaplan-Meier-skattningen och Nelson-Aalen-skattningen. Därutöver har tre modeller skattats; en Cox proportionell hasardmodell och två 'Accelerated Failure Time'-modeller varav en var en Weibullmodell och en var en Loglogistiskmodell. Resultaten indikerar att tid-till-försäljning har en hög hasard efter två veckor på marknaden varefter en avtagande hasard. Resultaten indikerar att kovariat har en statistisk signifikant effekt på tid-till-försäljning. Grafiska tester indikerar att antagandet om proportionalitet för Cox proportionella hasardmodell och antagandet om den underliggande hasardfunktionen för Weibullmodellen är orimliga. Antagandet om den underliggande hasardfunktionen för loglogistiskamodellen verkar rimlig. Goodness-of-fit indikerar att Weibullmodellen och loglogistiskamodellen var mer välanpassade till datamaterialet än Cox proportionella hasardmodell. / This bachelor's thesis has investigated time-to-sale on the Uppsala municipality property market for apartments during 2021. Analysis has been performed utilising methods from survival analysis. Both the survival function and cumulative hazard function were estimated using the Kaplan-Meier estimate and the Nelson-Aalen estimate respectively. Furthermore, three models were estimated; a Cox Proportional Hazards model as well as two Accelerated Failure Time models of which one was a Weibullmodell and the other was a loglogistic model. The results indicate that time-to-sale has a high hazard after two weeks on the market followed by a decreasing hazard. The results also indicate that covariates have a statistically significant effect on time-to-sale. Graphical tests indicate that the assumption of proportionality for the Cox Proportional Hazards model and the assumption of the underlying hazard function for the Weibullmodell are unreasonable. The assumed hazardfunction of the loglogistic model was found to be reasonable. Goodness of fit indicates that the Weibull model and loglogistic model were a better fit to the data than the Cox proportional Hazardsmodel.
14

Development of a Machine Learning Survival Analysis Pipeline with Explainable AI for Analyzing the Complexity of ED Crowding : Using Real World Data collected from a Swedish Emergency Department / Utveckling av en maskin inlärningsbaserad överlevnadsanalys pipeline med förklarbar AI för att analysera komplexiteten av överbefolkning på akuten : Genom verklig data från en svensk akutmottagning

Haraldsson, Tobias January 2023 (has links)
One of the biggest challenges in healthcare is Emergency Department (ED)crowding which creates high constraints on the whole healthcare system aswell as the resources within and can be the cause of many adverse events.Is is a well known problem were a lot of research has been done and a lotof solutions has been proposed, yet the problem still stands unsolved. Byanalysing Real-World Data (RWD), complex problems like ED crowding couldbe better understood. Currently very few applications of survival analysis hasbeen adopted for the use of production data in order to analyze the complexityof logistical problems. The aims for this thesis was to apply survival analysisthrough advanced Machine Learning (ML) models to RWD collected at aSwedish hospital too see how the Length Of Stay (LOS) until admission ordischarge were affected by different factors. This was done by formulating thecrowding in the ED for survival analysis through the use of the LOS as thetime and the decision regarding admission or discharge as the event in order tounfold the clinical complexity of the system and help impact clinical practiceand decision making.By formulating the research as time-to-event in combination with ML, thecomplexity and non linearity of the logistics in the ED is viewed from a timeperspective with the LOS acting as a Key Performance Indicator (KPI). Thisenables the researcher to look at the problem from a system perspective andshows how different features affect the time that the patient are processedin the ED, highlighting eventual problems and can therefore be useful forimproving clinical decision making. Five models: Cox Proportional Hazards(CPH), Random Survival Forests (RSF), Gradient Boosting (GB), ExtremeGradient Boosting (XGB) and DeepSurv were used and evaluated using theConcordance index (C-index) were GB were the best performing model witha C-index of 0.7825 showing that the ML models can perform better than thecommonly used CPH model. The models were then explained using SHapleyAdaptive exPlanations (SHAP) values were the importance of the featureswere shown together with how the different features impacted the LOS. TheSHAP also showed how the GB handled the non linearity of the features betterthan the CPH model. The five most important features impacting the LOS wereif the patient received a scan at the ED, if the visited and emergency room,age, triage level and the label indicating what type of medical team seemsmost fit for the patient. This is clinical information that could be implementedto reduce the crowding through correct decision making. These results show that ML based survival analysis models can be used for further investigationregarding the logistic challenges that healthcare faces and could be furtherused for data analysis with production data in similar cases. The ML survivalanalysis pipeline can also be used for further analysis and can act as a first stepin order to pinpoint important information in the data that could be interestingfor deeper data analysis, making the process more efficient. / En av de största utmaningarna inom vården är trängsel på akuten som skaparstora ansträngninar inom vårdsystemet samt på dess resurser och kan varaorsaken till många negativa händelser. Det är ett välkänt problem där mycketforskning har gjorts och många lösningar har föreslagits men problemetär fortfarande olöst. Genom att analysera verklig data så kan komplexaproblem som trängsel på akuten bli bättre förklarade. För närvarande harfå tillämpningar av överlevnadsanalys applicerats på produktionsdata för attanalysera komplexiteten av logistiska problem. Syftet med denna avhandlingvar att tillämpa överlevnadsanalys genom avancerade maskininlärningsmetoderpå verklig data insamlat på ett svenskt sjukhust för att se hur vistelsens längdför patienten fram till inläggning påverkades av olika faktorer. Detta gjordesgenom att applicera överlevnadsnanalys på trängsel på akuten genom attanvända vistelsens längd som tid och beslutet om intagning eller utskrivningsom händelsen. Detta för att kunna analysera systemets kliniska komplexitetoch bidra till att påverka klinisk praxis och beslutsfattande.Genom att formulera forskningsfrågan som en överlevnadsanalys i kombinationmed maskininlärning kan den komplexitet och icke-linjäritet som logistikenpå akuten innebär studeras genom ett tidsperspektiv där vistelsens längdfungerar som ett nyckeltal. Detta gör det möjligt för forskaren att ävenstudera problemet från ett systemperspektiv och visar hur olika egenskaperoch situationer påverkar den tid som patienten bearbetas på akuten. Detta uppmärksammar eventuella problem och kan därför vara användbart för attförbättra det kliniska beslutsfattandet. Fem olika modeller: CPH, RSF, GB,XGB och DeepSurv användes och utvärderades med hjälp av C-index där GBvar den bäst presterande modellen med ett C-index på 0.7825 vilket visar attmaskininlärningsmetoderna kan prestera bättre än den klassiska och vanligtförekommande CPH modellen. Modellerna förklarades sedan med hjälp utavSHAP värden där vikten utav de olika variablerna visades tillsammmans med deras påverkan. SHAP visade även att GB modellen hanterade icke-linjäriteten bättre än CPH modellen. De fem viktigaste variablerna som påverkade vistelsens längd till intagning var om patienten blev scannad påakutmottagningen, om de blev mottagna i ett akutrum, ålder, triagenivå ochvilket medicinskt team som ansågs bäst lämpat för patienten. Detta är kliniskinformation som skulle kunna implementeras genom beslutsfattande för attminska trängseln på akuten. Dessa resultat visar att maskininlärningsmetoderför överlevnadsanalys kan användas för vidare undersökning angående de logistiska utmaningar som sjukvården står inför och kan även användas ytterligareför datanalys med produktionsdata i liknande fall. Processen med överlevnadsanalys och ML kan även användas för vidare analys och kan agera som ett förstasteg för att framhäva viktig information i datan som skulle vara intressant fördjupare data analys. Detta skulle kunna göra processen mer effektiv.
15

Statistical Modelling of Price Difference Durations Between Limit Order Books: Applications in Smart Order Routing / Statistisk modellering av varaktigheten av prisskillnader mellan orderböcker: Tillämpningar inom smart order routing

Backe, Hannes, Rydberg, David January 2023 (has links)
The modern electronic financial market is composed of a large amount of actors. With the surge in algorithmic trading some of these actors collectively behave in increasingly complex ways. Historically, academic research related to financial markets has been focused on areas such as asset pricing, portfolio management and financial econometrics. However, the fragmentation of the financial market has given rise to a different set of problems, namely the order allocation problem, as well as smart order routers as a tool to comply with these. In this thesis we consider price discrepancies between order books, trading the same instruments, as a proxy for order routing opportunities. A survival analysis framework for these price differences is developed. Specifically, we consider the two widely used Kaplan-Meier and Cox Proportional Hazards models, as well as the somewhat less known Random Survival Forest model, in order to investigate whether such a framework is effective for predicting the survival times of price differences. The results show that the survival models outperform random models and fixed routing decisions significantly. Thus suggesting that such models could beneficially be incorporated into existing SOR environments. Furthermore, the implementation of order book parameters as covariates in the CPH and RSF models add additional performance. / Den moderna elektroniska marknaden består av ett stort antal aktörer som, till följd av ökningen av algoritmisk handel, beter sig alltmer komplext. Historiskt sett har akademisk forskning inom finans i huvudsak fokuserat på områden som prissättning av tillgångar, portföljförvaltning och finansiell ekonometri. Fragmentering av finansiella marknader har däremot gett upphov till nya sorters problem, däribland orderplaceringsproblemet. Följdaktligen har smart order routers utvecklats som ett verktyg för att tillmötesgå detta problem. I detta examensarbete studerar vi prisskillnader mellan orderböcker som tillhandhåller handel av samma instrument. Dessa prisskillnader representerar möjligheter för order routing. Vi utvecklar ett ramverk inom överlevnadsanalys för dessa prisskillnader. Specifikt används de välkända Kaplan-Meier- och Cox Proportional Hazards-modellerna samt den något mindre kända Random Survival Forest, för att utvärdera om ett sådant ramverk kan användas för att förutspå prisskillnadernas livstider. Våra resultat visar att dessa modeller överträffar slumpmässiga modeller samt deterministiska routingstrategier med stor marginal och antyder därmed att ett sådant ramverk kan integreras i SOR-system. Resultaten visar dessutom att användning av orderboksparametrar som variabler i CPH- och RSF-modellerna ökar prestandan.
16

Går det att prediktera konkurs i svenska aktiebolag? : En kvantitativ studie om hur finansiella nyckeltal kan användas vid konkursprediktion / Is it possible to predict bankruptcy in swedish limited companies? : A quantitative study regarding the usefullness of financial ratios as bankruptcy predictors

Persson, Daniel, Ahlström, Johannes January 2015 (has links)
Från 1900-talets början har banker och låneinstitut använt nyckeltal som hjälpmedel vid bedömning och kvantifiering av kreditrisk. För dagens investerare är den ekonomiska miljön mer komplicerad än för bara 40 år sedan då teknologin och datoriseringen öppnade upp världens marknader mot varandra. Bedömning av kreditrisk idag kräver effektiv analys av kvantitativa data och modeller som med god träffsäkerhet kan förutse risker. Under 1900-talets andra hälft skedde en snabb utveckling av de verktyg som används för konkursprediktion, från enkla univariata modeller till komplexa data mining-modeller med tusentals observationer. Denna studie undersöker om det är möjligt att prediktera att svenska företag kommer att gå i konkurs och vilka variabler som innehåller relevant information för detta. Metoderna som används är diskriminantanalys, logistisk regression och överlevnadsanalys på 50 aktiva och 50 företag försatta i konkurs. Resultaten visar på en träffsäkerhet mellan 67,5 % och 75 % beroende på vald statistisk metod. Oavsett vald statistisk metod är det möjligt att klassificera företag som konkursmässiga två år innan konkursens inträffande med hjälp av finansiella nyckeltal av typerna lönsamhetsmått och solvensmått. Samhällskostnader reduceras av bättre konkursprediktion med hjälp av finansiella nyckeltal vilka bidrar till ökad förmåga för företag att tillämpa ekonomistyrning med relevanta nyckeltal i form av lager, balanserad vinst, nettoresultat och rörelseresultat. / From the early 1900s, banks and lending institutions have used financial ratios as an aid in the assessment and quantification of credit risk. For today's investors the economic environment is far more complicated than 40 years ago when the technology and computerization opened up the world's markets. Credit risk assessment today requires effective analysis of quantitative data and models that can predict risks with good accuracy. During the second half of the 20th century there was a rapid development of the tools used for bankruptcy prediction. We moved from simple univariate models to complex data mining models with thousands of observations. This study investigates if it’s possible to predict bankruptcy in Swedish limited companies and which variables contain information relevant for this cause. The methods used in the study are discriminant analysis, logistic regression and survival analysis on 50 active and 50 failed companies. The results indicate accuracy between 67.5 % and 75 % depending on the choice of statistical method. Regardless of the selected statistical method used, it’s possible to classify companies as bankrupt two years before the bankruptcy occurs using financial ratios which measures profitability and solvency. Societal costs are reduced by better bankruptcy prediction using financial ratios which contribute to increasing the ability of companies to apply financial management with relevant key ratios in the form of stock , retained earnings , net income and operating income.
17

Customer churn prediction in a slow fashion e-commerce context : An analysis of the effect of static data in customer churn prediction

Colasanti, Luca January 2023 (has links)
Survival analysis is a subfield of statistics where the goal is to analyse and model the data where the outcome is the time until the occurrence of an event of interest. Because of the intrinsic temporal nature of the analysis, the employment of more recently developed sequential models (Recurrent Neural Network (RNN) and Long Short Term Memory (LSTM)) has been paired with the use of dynamic temporal features, in contrast with the past reliance on static ones. Such an abrupt shift of policy has left open the challenge of understanding how those two kinds of features influence the predictive capabilities of models. This thesis aims at assessing the effect of combining static and dynamic features on the most commonly used models in survival analysis. In doing so, we compare the error measurements of such models with dataset composed of purely dynamic features or a combination of static and dynamic ones. Empirical measurements have shown that models respond differently to the addition of static features to the analysis, with more complex, sequential models like the LSTM struggling to deal with the added data complexity (with a 12% increase in error), while non sequential models see reductions of up to 14.7% in error. The thesis also includes a clusterization task aimed at aiding the interpretation of survival analysis outcomes. / Överlevnadsanalys är ett delområde inom statistiken där målet är att analysera och modellera data där utfallet är tiden fram till dess att en händelse av intresse inträffar. På grund av analysens inneboende tidsmässiga karaktär har användningen av mer nyligen utvecklade sekventiella modeller (RNN och LSTM) kombinerats med användningen av dynamiska tidsmässiga egenskaper, i motsats till den tidigare förlitningen på statiska sådana. En sådan drastisk förändring av ansatsen har lämnat öppet för utmaningen att förstå hur dessa två typer av egenskaper påverkar modellernas förutsägande förmåga. Syftet med denna uppsats är att bedöma effekten av att kombinera statiska och dynamiska egenskaper på de vanligaste modellerna för överlevnadsanalys. I detta syfte jämför vi felmätningar av sådana modeller med dataset som består av rent dynamiska egenskaper eller en kombination av statiska och dynamiska egenskaper. Empiriska mätningar har visat att modellerna reagerar olika på tillägget av statiska egenskaper till analysen, där mer komplexa, sekventiella modeller som LSTM kämpar för att hantera den ökade datakomplexiteten (med en ökning av felet med 12 %), medan icke-sekventiella modeller ser en minskning av felet med upp till 14,7 %. Uppsatsen innehåller också en klusteruppgift som syftar till att underlätta tolkningen av resultaten av överlevnadsanalyser. / L’analisi della sopravvivenza è una branca della statistica il cui obiettivo è l’analisi e la modellazione di dati il cui risultato è il tempo che intercorre fino al verificarsi di un evento di interesse. A causa dell’intrinseca natura temporale dell’analisi, l’impiego di modelli sequenziali di più recente sviluppo (RNN e LSTM) è stato abbinato all’uso di attributi temporali dinamici, a differenza dell’uso più diffuso in passato di attributi statici. Questo brusco cambiamento ha lasciato aperta la sfida di capire come questi due tipi di attributi influenzino le capacità predittive dei modelli. Questa tesi si propone di valutare l’effetto della combinazione di attributi statici e dinamici sui modelli più comunemente utilizzati nell’analisi della sopravvivenza. A tal fine, confrontiamo le misure di errore di tali modelli con set di dati composti da attributi puramente dinamici o da una combinazione di statici e dinamici. I risultati empirici hanno mostrato che i modelli rispondono in modo diverso all’aggiunta di attrbiuti statici, con i modelli sequenziali più complessi, come l’LSTM, che faticano a gestire la complessità dei dati aggiunti (con un aumento dell’errore del 12%), mentre i modelli non sequenziali registrano riduzioni dell’errore fino al 14,7%. La tesi comprende anche una clusterizzazione volta a facilitare l’interpretazione dei risultati dell’analisi di sopravvivenza.
18

Survival Comparison of Open and Endovascular Repair Using Machine Learning / Överlevnadsjämförelse av öppen och endovaskulär kirurgi med maskininlärning

Brunnberg, Aston, Holte, Gustaf January 2021 (has links)
Today there exists two types of preventive surgical treatment procedures for Abdominal Aortic Aneurysm. In order to make an informed choice of treatment, the clinician needs to have a clear picture of how the choice will affect the patients chances of survival. In this master thesis, machine learning techniques are used to predict survival probabilities after respective treatment procedure and the performance is compared to the more conventional Kaplan-Meier estimator.  Using Danish patient data, different machine learning models for survival predictions were trained and evaluated by their performance. Administrative Brier Score was used as performance metric as the data was administratively censored. An Ensemble model consisting of one Random Survival Forest and one Neural Multi Task Logistic Regression model was shown to achieve the best performance and significantly outperformed the conventional Kaplan-Meier model. Furthermore, an approach to investigate the predicted effects of choice of treatment was introduced. It showed that on average the Ensemble model predicted the choice of treatment to have less effect on the long term survival than what the corresponding prediction using the Kaplan-Meier estimator suggested. This applies to the full patient group as well as for patients of age between 70 and 79 years. In the latter case this prediction was also shown to be more accurate. / Idag finns det två typer av förebyggande kirurgiska behandlingsmetoder för abdominal aortaaneurysm. För att göra ett välgrundat val av behandlingsmetod måste läkaren ha en tydlig bild av hur valet kommer att påverka patienternas överlevadschanser. I detta examensarbete används maskininlärningstekniker för att förutsäga överlevnadssannolikheten efter respektive behandlingsmetod och prestandan jämförs mot den mer konventionella Kaplan-Meier-estimatorn. Med hjälp av dansk patientdata tränades olika maskininlärningsmodeller avsedda för överlevnadanalys och utvärderades utifrån deras prestanda. Administrativt Brier Score användes som mätvärde då censureringen i datan skett administrativt. En Ensemble-modell bestående av en Random Survival Forest- och en Neural Multi-Task Logistic Regression-modell visade sig uppnå bäst prestanda och överträffade signifikant den konventionella Kaplan-Meier-estimatorn.  Dessutom introducerades ett tillvägagångssätt för att undersöka de predikterade effekterna av valet av behandling. Resultaten visade att Ensemble-modellen i genomsnitt förutspådde valet av behandling att ha mindre effekt på den långsiktiga överlevnaden än vad motsvarande förutsägelse med Kaplan-Meier-estimatorn föreslog. Detta både för alla patienter såväl som för patienter i åldern mellan 70 och 79 år. I det senare fallet visade sig denna förutsägelse också vara mer träffsäker.

Page generated in 0.0838 seconds