Breast cancer continues to be a major cause of mortality among women. In recent years, machine learning has emerged as a potential tool in detecting and grading cancer. Using machine learning techniques in computational pathology has the potential to improve precision medicine, enabling more personalized and more accurate treatment plans. The machine learning models can even detect structures that cannot be seen with human eyes. The first step is often to identify tissue areas with cancerous cells using machine learning models. Those models often rely solely on Haematoxylin and Eosin slides for training due to the time-consuming and costly nature of annotations by pathologists. Because of that, valuable information for training might be lost since some cancerous cells are more visible in the immunohistochemistry slides. In this thesis, Haematoxylin and Eosin slide annotations are registered to immunohistochemistry slides for training singlestain and multi-stain models. The registration of the annotations is not straightforward since the tissue of the slides is not necessarily from consecutive cuts, and they are sometimes applied to the slide at different angles. An algorithm evaluated during the ACROBAT challenge was used to register the slides. Using the transferred annotations, individual models are trained for each stain (K167, HER2, PGR, ER). Of the single-stain model, the HER2 stain model is showing the most promising results. As a second step, a multistain model is trained using all stains. The multi-stain model performs equally well as the single-stain models specializing in individual stains. This shows that there is no need to train specialized single-stain models. Thus being able to train one model for four different stains makes it possible to detect cancer in whole slide images stained with one of those four stains without the need to train a specialized model and only needing annotations in one stain. While the multi-stain model is a nice addition this thesis shows that it is possible to reuse annotations, which reduces the amount of manual labour from pathologists and allows for training models on immunohistochemistry slides with only having annotations from one stain. / Bröstcancer fortsätter att vara en vanlig orsak till dödlighet bland kvinnor. På senare år har maskininlärning visat sig vara ett värdefullt verktyg för att upptäcka och gradera cancer. Att använda maskininlärningstekniker inom beräkningspatologi har potential att förbättra precisionsmedicinen och möjliggöra mer individanpassade och exakta behandlingsplaner. Maskininlärningsmodellerna kan till och med upptäcka strukturer som inte kan ses med mänskliga ögon. Det första steget är ofta att identifiera vävnadsområden med cancerceller med hjälp av maskininlärningsmodeller. Dessa modeller är ofta helt beroende av hematoxylin- och eosin-slidebilder för träning eftersom det är tidsödande och kostsamt för patologer att göra annoteringar. På grund av detta kan värdefull information för träning gå förlorad eftersom vissa cancerceller är mer synliga på immunohistokemiska objektglas. I den här avhandlingen registreras annoteringar från objektglas med hematoxylin och eosin på immunohistokemiska objektglas för träning av modeller med en och flera infärgningar. Registreringen av annoteringarna är inte okomplicerad eftersom vävnaden på objektglasen inte nödvändigtvis kommer från på varandra följande snitt, och de appliceras ibland på objektglaset i olika vinklar. En algoritm som utvecklades under ACROBAT-utmaningen användes för att registrera bilderna. Med hjälp av de registrerade objektglasen tränas individuella modeller för varje infärgning (K167, HER2, PGR, ER). Av modellerna för enstaka infärgningar visar modellen för HER2-infärgning de mest lovande resultaten. I ett andra steg tränas en modell med flera infärgningar med hjälp av alla infärgningar. Multi-stain-modellen presterar lika bra som single-stain-modellerna som är specialiserade på enskilda infärgningar. Detta visar att det inte finns något behov av att träna specialiserade modeller för enstaka infärgningar. Att kunna träna en modell för fyra olika färgämnen gör det alltså möjligt att upptäcka cancer i hela objektglasbilder som färgats med ett av dessa fyra färgämnen utan att behöva träna en specialiserad modell och utan att behöva göra annoteringar. Möjligheten att endast använda en modell för att förutsäga fyra olika immunohistokemiska helbilder minskade datorkostnaderna för träning och underhåll av modellen.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-347935 |
Date | January 2024 |
Creators | Sartor, Viktoria |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2024:77 |
Page generated in 0.0028 seconds