Spelling suggestions: "subject:"ensembleinlärning"" "subject:"ensembleinlärning""
1 |
Assessment of building renovations using Ensemble LearningLieutier, Paul January 2023 (has links)
In the context of global warming, to reduce energy consumption, an unavoidable policy is to renovate badly-isolated buildings. However, most studies concerning efficiency of renovation work do not rely on energy data from smart meters but rather on estimates. To develop a precise tool to assess the quality of renovation work, several ensemble models were tested and compared with existing ones. Each model learns the consumption habits before the date of the works and then predicts what the energy load curve would have been if the works had not been realized. The prediction is finally compared to the actual energy load to infer the savings over the same dataset. The models were compared using precision and time complexity metrics. The best ensemble model’s precision scores are equivalent to the state-of-the-art. Moreover, the developed model is 32 times quicker to fit and predict. / I samband med den globala uppvärmningen är det oundvikligt att renovera dåligt isolerade byggnader för att minska energiförbrukningen. De flesta studier om renoveringsarbetenas effektivitet bygger dock inte på energidata från smarta mätare utan snarare på uppskattningar. För att utveckla ett exakt verktyg för att bedöma kvaliteten på renoveringsarbeten har flera ensemblemodeller testats och jämförts med befintliga modeller. Varje modell lär sig förbrukningsvanorna före arbetena och förutspår sedan hur energibelastningskurvan skulle ha sett ut om arbetena inte hade genomförts. Prognosen jämförs slutligen med den faktiska energilasten för att härleda besparingarna för samma dataset. Modellerna jämfördes med hjälp av precision och tidskomplexitet. Den bästa ensemblemodellens precisionspoäng är likvärdig med den bästa modellen. Dessutom är den utvecklade modellen 32 gånger snabbare att anpassa och förutsäga
|
2 |
Using Satellite Images And Self-supervised Deep Learning To Detect Water Hidden Under Vegetation / Använda satellitbilder och Självövervakad Deep Learning Till Upptäck vatten gömt under VegetationIakovidis, Ioannis January 2024 (has links)
In recent years the wide availability of high-resolution satellite images has made the remote monitoring of water resources all over the world possible. While the detection of open water from satellite images is relatively easy, a significant percentage of the water extent of wetlands is covered by vegetation. Convolutional Neural Networks have shown great success in the task of detecting wetlands in satellite images. However, these models require large amounts of manually annotated satellite images, which are slow and expensive to produce. In this paper we use self-supervised training methods to train a Convolutional Neural Network to detect water from satellite images without the use of annotated data. We use a combination of deep clustering and negative sampling based on the paper ”Unsupervised Single-Scene Semantic Segmentation for Earth Observation”, and we expand the paper by changing the clustering loss, the model architecture and implementing an ensemble model. Our final ensemble of self-supervised models outperforms a single supervised model, showing the power of self-supervision. / Under de senaste åren har den breda tillgången på högupplösta satellitbilder möjliggjort fjärrövervakning av vattenresurser över hela världen. Även om det är relativt enkelt att upptäcka öppet vatten från satellitbilder, täcks en betydande andel av våtmarkernas vattenutbredning av vegetation. Lyckligtvis kan radarsignaler tränga igenom vegetation, vilket gör det möjligt för oss att upptäcka vatten gömt under vegetation från satellitradarbilder. Under de senaste åren har Convolutional Neural Networks visat stor framgång i denna uppgift. Tyvärr kräver dessa modeller stora mängder manuellt annoterade satellitbilder, vilket är långsamt och dyrt att producera. Självövervakad inlärning är ett område inom maskininlärning som syftar till att träna modeller utan användning av annoterade data. I den här artikeln använder vi självövervakad träningsmetoder för att träna en Convolutional Neural Network-baserad modell för att detektera vatten från satellitbilder utan användning av annoterade data. Vi använder en kombination av djup klustring och kontrastivt lärande baserat på artikeln ”Unsupervised Single-Scene Semantic Segmentation for Earth Observation”. Dessutom utökar vi uppsatsen genom att modifiera klustringsförlusten och modellarkitekturen som används. Efter att ha observerat hög varians i våra modellers prestanda implementerade vi också en ensemblevariant av vår modell för att få mer konsekventa resultat. Vår slutliga ensemble av självövervakade modeller överträffar en enda övervakad modell, vilket visar kraften i självövervakning.
|
3 |
Utilizing Primary Health Care Data for Early Detection of Colorectal Cancer: A Machine Learning Approach / Användning av primärvårdsdata för tidig upptäckt av kolorektalcancer: Ett maskininlärningsperspektivEivinsson, Tova January 2024 (has links)
Colorectal cancer (CRC) is a health challenge worldwide and early detection of the disease is crucial to improve patient prognosis. It is common for the first contact with care to occur in primary care centers where general practitioners often face the challenge of distinguishing CRC from other diseases with similar symptoms. In this master thesis, patient records from primary care were used to create, optimize, and evaluate a machine learning model that classifies patients with CRC for early detection of the disease. The data used in the project included parts of electronic health records (EHRs) from both public (SLSO) and privately run (Capio and Praktikertjänst) primary care centers in the Stockholm region. The available dataset was cleaned and pre- processed, and then tested on four separate models. After selecting and optimizing the most promising model, LightGBM, a detailed evaluation of the model was performed. To simulate realistic clinical conditions, data from the three months prior to diagnosis were excluded from two of the datasets. The results were then compared with a baseline machine learning model that utilized ICD codes extracted from EHRs in primary care for early detection of CRC.The results showed that the final developed model had a generally good performance with an AUROC score of a maximum of 85.8%, which indicates very good ability to distinguish between the classes. The performance dropped when using the datasets with 3 months of data removed, but the ROC curves still showed a better ability than random classification to distinguish between the classes with a AUROC score of maximum 60,8%. The results also showed that the model developed in this master thesis outperforms the baseline model, which was based on ICD codes, from a performance perspective. For future development and before a possible clinical implementation, a larger data set should be used for training and testing. / Tjock- och ändtarmscancer, kolorektal cancer (KRC) är en hälsoutmaning över hela världen och tidig upptäckt av sjukdomen är avgörande för att förbättra patientens prognos. Det är vanligt att den första kontakten med vården inträffar på vårdcentraler där allmänläkare ofta står inför utmaningen att skilja KRC från andra sjukdomar med liknande symtom. I denna masteruppsats kommer patientjournaler från primärvården att användas för att skapa, optimera och utvärdera en maskininlärningsmodell som klassificerar patienter med KRC för tidig upptäckt av sjukdomen.De data som använts i projektet omfattade delar av elektroniska patientjournaler (EHR) från både offentliga (SLSO) och privatägda (Capio och Praktikertjänst) primärvårdscentraler i Stockholmsregionen. Den tillgängliga datamängden städades och förbehandlades, och testades sedan på fyra separata modeller. Efter att ha valt ut och optimerat den mest lovande modellen, LightGBM, utfördes en detaljerad utvärdering av modellen. För att simulera realistiska kliniska tillstånd utvärderades modellen på två datamängder där data från tre månader före diagnos uteslöts. Resultaten jämfördes sedan med en baslinjemodell som använde ICD-koder som hämtats från journalsystem inom primärvården för tidig upptäckt av CRC.Resultaten visade att den slutliga utvecklade modellen hade en generellt bra prestanda med en AUROC-poäng på högst 85,8%, vilket indikerar mycket god förmåga att skilja mellan klasserna. Prestandan sjönk vid användning av datasatserna med 3 månaders data borttagen, men ROC-kurvorna visade fortfarande en bättre förmåga än slumpmässig klassificering att skilja mellan klasserna med en AUROC-poäng på högst 60,8%. Resultaten visade också att den modell som utvecklats i denna masteruppsats överträffar baslinjemodellen, som baserades på ICD-koder, ur ett prestationsperspektiv. För framtida utveckling och före en eventuell klinisk implementation bör en större datamängd användas för träning och testning av modellen.
|
Page generated in 0.063 seconds