Spelling suggestions: "subject:"bildbaserade""
1 |
Bildbaserad rendering : Implementation och jämförelse av två algoritmerHärdling, Peter January 2010 (has links)
Det här arbetet har gått ut på att jämföra två algoritmer för bildbaserad rendering. Båda algoritmerna använder två bilder som spelats in med formatet MultiView plus depth för att rendera nya mellanliggande vyer av en tredimensionell scen. De tvådimensionella bilderna är kompletterade med djupvärden för varje bildpunkt. Renderingen kan då utföras genom perspektivriktiga transformationer där alla bildpunkters nya positioner projiceras individuellt. I samband med renderingen behöver bland annat mätfel i de ursprungliga bilderna samt skymda partier hanteras. Algoritm I gör det delvis genom utjämning av skarvararna mellan bildernas bidrag till den nya vyn. Algoritm II bygger på att bilderna delas upp i lager där de lager som ansetts vara säkra prioriteras framför lager som har bedömts vara mer riskabla. Algoritmerna har implementerats i Matlab och algoritm II har modifierats genom kompletteringar av dess regler för prioriteringen av lagren till mer komplicerade scener. Algoritm II har visat sig vara bättre på att bevara detaljer i de renderade vyerna och håller en jämnare hastighet vid renderingarna. Den ger även högre och jämnare resultat vid jämförelse med kvalitetsmåttet PSNR men vid jämförelser med MSSIM har den däremot fått något lägre värden. De ytterligare stegen vid renderingen har även ökat renderingstiderna med upp till 40 % jämfört med algoritm I. Författaren ger förslag på områden för fortsatt utveckling av algoritm II. Till exempel bör algoritmen testas vidare för att avgöra om de använda gränsvärdena är generella eller om de måste anpassas till olika scener. / This thesis has been aimed at comparing two algorithms for image-based renderings. Both algorithms uses two images recorded with the MultiView plus depth format, to render new intermediate views of a three-dimensional scene. The two-dimensional images extensions with depth values for each pixel, makes it possible to perform the image warping as perspective projections of all individually pixels to their new positions. During rendering, such as measurement error in the original images and occlusions has to be handled. Algorithm I is partly based on smoothening the joints between the contributions from the two images to the novel view. Algorithm II divides the images into layers, in which layers consid-ered safe has priority over layers that have been defined as more risky. The algorithms have been implemented in Matlab and algorithm II has been modified through additions to the priority rules for the layers to more complex scenes. Algorithm II has proven to be better at preserving the details in the rendered views, and maintains a less varying speed when rendering. It also provides higher and more consistent PSNR values, but in comparison using MSSIM the values are slightly lower. The additional steps have also increased the rendering times by up to 40 % compared to algorithm I. The author suggests areas for further development of algorithm II. For example, the algorithm should be tested further to determine if the used thresholds are general or whether they must be adapted to different scenes.
|
2 |
Bildbaserad skanning och laserskanning av kulturhistoriska byggnader : En fallstudie på gasklockorna i GävleOjamäe, Andreas January 2017 (has links)
Laserskanning och bildbaserad skanning är två metoder för insamling av geodata i 3D. Detta kan sedan användas för att exempelvis skapa punktmoln och triangelmodeller. Båda metoderna har många användningsområden, exempelvis inom samhällsplanering, byggbranschen, brottsutredning och industrin. Ett vanligt användningsområde är dokumentation av kulturhistoriska byggnader. I denna studie har gasklockorna i Gävle, ett område med högt kulturvärde, dokumenterats med både bildbaserad skanning och laserskanning. Syftet med denna studie är att genom olika tester utvärdera de båda metoderna. Framför allt hur väl de presterar rent mätningstekniskt men även handhavande, tidsaspekten och kostnader har jämförts. Datainsamling genomfördes på flera sätt. Laserskanningen genomfördes med multistationen Leica Nova MS50 och den bildbaserade skanningen med systemkameran Nikon D7000 samt UAS Smartplanes Smartone C. Punktmolnen från laserskanning sammankopplades automatiskt i Leica Cyclone (med 5 och 10 mm punkttäthet). I Agisoft Photoscan bearbetades bilderna från den bildbaserade skanningen. Blockutjämning utfördes och sedan skapades ett tätt punktmoln, en triangelmodell och sist en textur. Punktmoln från båda metoderna har därefter jämförts i programvarorna CloudCompare och 3D-reshaper. Resultatet när endast väggarna jämförs visar på en medelavvikelse mellan punktmolnen på 0,028 m med en standardosäkerhet på 0,032 m. Dessutom jämfördes 12 stickprov och fem referensplan för att utvärdera skillnader lokalt. Skillnaden mellan triangelmodellerna gav en medelavvikelse på 0,008 m med standardosäkerheten 0,042 m. I 3D-reshaper blev medelavvikelsen mellan punktmolnen 0,050 m med en standardosäkerhet på 0,072 m. Laserskanning ger generellt sett ett punktmoln med högre kvalitet, korrekt form och lägre osäkerhet. Bildbaserad skanning har däremot fördelarna att vara enklare att genomföra, billigare, lättare vikt samt är potentiellt mer tidseffektivt. Dessutom får andra studier resultat nästan i nivå med laserskanning. Dock är dess stora nackdel att kantiga objekt så som hörn blir avrundade. Det är svårt att bestämma vilken metod som är bäst. I slutändan beror det på vilket objekt som ska dokumenteras samt hur låga osäkerheter som krävs.
|
3 |
Bild- och punktmolnsbaserad 3D-modellering : Från datainsamling till visualiseringLarsen, Fredrik, Gruvberg, Markus January 2017 (has links)
Intresset för och användningen av 3D-modeller har de senaste åren haft en uppåtgående trend, samtidigt har teknikerna för att skapa dem blivit fler. Utöver krav på noggrannhet läggs även fokus på nytta och funktion, vilket bestämmer kostnad och detaljeringsgrad av 3D-modellen. I denna studie har tre 3D-modeller skapats och utvärderats, där modellernas noggrannhet och tiden det tog att skapa dem kontrollerades. De möjliga användningsområdena för de olika 3D-modellerna undersöktes genom litteraturstudie. Tre tillvägagångssätt har använts för att ta fram 3D-modeller av en byggnad. Kritererna för valet av byggnad var huvudsakligen att byggnaden skulle vara belägen i aktiv stadsmiljö, där de naturliga hindren skulle vara närvarande. Två modeller är bildbaserade, där den ena skapats i Agisoft Photoscan som till stor del utför justering och modellering automatiskt. Det andra bildbaserademodellen har tagits fram i Trimble Sketchup, där modellering är helt manuell med stöd av bilder tagna diagonalt mot byggnadshörn. För jämförelse med en mer traditionell metod har byggnaden också laserskannats för att sedan modelleras i Autodesk Revit. Byggnaden har kontrollmätts med totalstation där 62 referensmått valdes runtom byggnaden, både vertikala och horisontella. Dessa har använts som sanna värden i jämförelse med de tre 3D-modellerna. Modellerna utvärderas med hjälp av referensmåtten. Resultatet visar att modellen skapad genom laserskanning hade minst avvikelse jämfört med referensmåtten, däremot var modellen tätt följd av den bildbaserade modellen från Photoscan. Som väntat var modellen från Sketchup den med störst avvikelser från de sanna måtten, men presterade bättre än förväntat. Avseende tidsåtgång stod det klart att laserskanning med tillhörande modellering i Revit var den mest tidskrävande metoden, men även här var den tätt följd av modellen i Photoscan. Till skillnad från Revitmodellen så är modellering i Photoscan bestående av till största del oövervakade processer, vilket medger att operatören att kan utföra andra arbetsuppgifter under tiden. Med manuell bildmodellering var Sketchup den modell som upptog minst total tid, med kraftigt reducerad arbetstid både i fält och vid modellering.
|
4 |
Maximizing performance gain of Variable Rate Shading tier 2 while maintaining image quality : Using post processing effects to mask image degradationLind, Fredrik, Diaz Escalante, Andrés January 2021 (has links)
Background. Performance optimization is of great importance for games as it constrains the possibilities of content or complexity of systems. Modern games support high resolution rendering but higher resolutions require more pixels to be computed and solutions are needed to reduce this workload. Currently used methods include uniformly lowering the shading rates across the whole screen to reduce the amount of pixels needing computation. Variable Rate Shading is a new hardware supported technique with several functionality tiers. Tier 1 is similar to previous methods in that it lowers the shading rate for the whole screen. Tier 2 supports screen space image shading. With tier 2 screen space image shading, various different shading rates can be set across the screen which gives developers the choice of where and when to set specific shading rates. Objectives. The aim of this thesis is to examine how close Variable Rate Shading tier 2 screen space shading can come to the performance gains of Variable Rate Shading tier 1 while trying to maintain an acceptable image quality with the help of commonly used post processing effects. Methods. A lightweight scene is set up and Variable Rate Shading tier 2 methods are set to an acceptable image quality as baseline. Evaluation of performance is done by measuring the times of specific passes required by and affected by Variable Rate Shading. Image quality is measured by capturing sequences of images with no Variable Rate Shading on as reference, then with Variable Rate Shading tier 1 and several methods with tier 2 to be compared with Structural Similarity Index. Results. Highest measured performance gains from tier 2 was 28.0%. The result came from using edge detection to create the shading rate image in 3840x2160 resolution. This translates to 36.7% of the performance gains of tier 1 but with better image quality with SSIM values of 0.960 against tier 1’s 0.802, which corresponds to good and poor image quality respectively. Conclusions. Variable Rate Shading tier 2 shows great potential in increasing performance while maintaining image quality, especially with edge detection. Postprocessing effects are effective at maintaining a good image quality. Performance gains also scale well as they increase with higher resolutions. / Bakgrund. Prestandaoptimering är väldigt viktigt för spel eftersom det kan begränsa möjligheterna av innehåll eller komplexitet av system. Moderna spel stödjer rendering för höga upplösningar men höga upplösningar kräver beräkningar för mera pixlar och lösningar behövs för att minska arbetsbördan. Metoder som för närvarande används omfattar bland annat enhetlig sänkning av skuggningsförhållande över hela skärmen för att minska antalet pixlar som behöver beräkningar. Variable Rate Shading är en ny hårdvarustödd teknik med flera funktionalitetsnivåer. Nivå 1 är likt tidigare metoder eftersom skuggningsförhållandet enhetligt sänks över hela skärmen. Nivå 2 stödjer skärmrymdsbildskuggning. Med skärmrymdsbildskuggning kan skuggningsförhållanden varieras utspritt över skärmen vilket ger utvecklare valmöjligheter att bestämma var och när specifika skuggningsförhållanden ska sättas. Syfte. Syftet med examensarbetet är att undersöka hur nära Variable Rate Shading nivå 2 skärmrymdsbildskuggning kan komma prestandavinsterna av Variable Rate Shading nivå 1 samtidigt som bildkvaliteten behålls acceptabel med hjälp av vanligt använda efterbearbetningseffekter. Metod. En simpel scen skapades och metoder för Variable Rate Shading nivå 2 sattes till en acceptabel bildkvalitet som utgångspunkt. Utvärdering av prestanda gjordes genom att mäta tiderna för specifika pass som behövdes för och påverkades av Variable Rate Shading. Bildkvalitet mättes genom att spara bildsekvenser utan Variable Rate Shading på som referensbilder, sedan med Variable Rate Shading nivå 1 och flera metoder med nivå 2 för att jämföras med Structural Similarity Index. Resultat. Högsta uppmätta prestandavinsten från nivå 2 var 28.0%. Resultatet kom ifrån kantdetektering för skapandet av skuggningsförhållandebilden, med upplösningen 3840x2160. Det motsvarar 36.7% av prestandavinsten för nivå 1 men med mycket bättre bildkvalitet med SSIM-värde på 0.960 gentemot 0.802 för nivå 1, vilka motsvarar bra och dålig bildkvalitet. Slutsatser. Variable Rate Shading nivå 2 visar stor potential i prestandavinster med bibehållen bildkvalitet, speciellt med kantdetektering. Efterbearbetningseffekter är effektiva på att upprätthålla en bra bildkvalitet. Prestandavinster skalar även bra då de ökar vid högre upplösningar.
|
5 |
Towards Adaptive Image Resolution for Visual SLAM on Resource-constrained Devices / Mot anpassning av bildupplösning för bildbaserad SLAM på enheter med begränsade resurserBlenneros, Herman January 2023 (has links)
Today, a large number of devices with small form factors and limited resources are being integrated with processes to perform complex tasks such as localization and mapping. One example of this are headsets used for Extended Reality. These devices are expected to perform under changing conditions in the environment and in the available resources, which require sophisticated control policies. In this thesis project, we start investigating the feasibility of online control of the image resolution of the camera sensor used for Visual Localization, for the purpose of minimizing the requirements of the process without decreasing the performance. Specifically, we perform extensive experiments on two Visual Simultaneous Localization and Mapping systems and a Visual Odometry system on two platforms with limited resources to see how the performance metrics are affected by the image resolution. Moreover, we model the localization error of ORB-SLAM3 with the use of feature matching statistics and the camera velocity. Our experimental results show that savings in terms of the execution time of Visual Localization by adapting the image resolution is possible in some situations. But we did not find significant potential savings in terms of the power consumption of the devices. We also found that the feature matching statistics improve predictions about the localization error of ORB-SLAM3 in several situations compared to only using the camera velocity. But the results are limited to a set of known scenarios, which highlights the difficulty of the modelling problem. Nevertheless, this thesis provides valuable insights into how sensor parameters affect the performance of Visual Localization, and how the localization error relates to tracking statistics inside the localization process. / Idag utrustas fler resursbegränsade enheter med förmågan att utföra komplicerade uppgifter, såsom lokalisering och kartläggning i realtid. Efterfrågan av att små enheter med begränsade resurser ska kunna lokalisera i realtid styrs bland annat av intresset för virtuella upplevelser, till exempel med hjälp av smarta glasögon. Men för att leva upp till förväntningarna krävs en nogrann avvägning mellan prestanda och resurseffektivitet, något som försvåras av en föränderlig omgivning. I det här examensarbetet så utreds möjligheten att påverka prestandan och resurskraven av bildbaserad lokalisering i realtid genom att anpassa bildupplösningen av kameran. Att minska resurskraven för denna processen gör att det blir enklare att uppnå acceptabel prestanda på resursbegränsade enheter och underlättar avlastning av delar av processen med hjälp av molntjänster. I samband med utredningen så modelleras felet av ORB-SLAM3 med hjälp av interna mätetal som karakteriserar lokaliseringsprocessen för att i framtiden kunna informera beslut om bildupplösningen. Resultaten tyder på att det i vissa fall är möjligt att minska resurskraven av bildbaserad lokalisering utan att försämra prestandan. Vad gäller modelleringen av felet, så tyder resultaten på att de valda mätetalen inte är nog för att förutspå felet med någon vidare säkerhet. Men genom att kombinera mätetalen med kamerans hastighet så kan man till viss mån förutspå felet av ORB-SLAM3 i ett urval av kända scenarion. Däremot visar sig resultaten inte vara generaliserbara till nya scenarion som modellerna inte har tränats på, vilket understryker svårigheten av problemet. Genom detta arbetet har vi bidragit med värdefulla insikter som kan leda forskningen inom området vidare.
|
6 |
The Multimodal Communication Screening Test for Persons with Aphasia (MCST-A) - Översättning och anpassning till svenska : En jämförelse med resultatet på MCST-A och förmåga att kommunicera med AKKNilsson, Emanuel, Pichler, Petra January 2018 (has links)
Personer med afasi lider ofta av sina språkliga svårigheter och upplever dem som ett allvarligt problem. När förmågan till effektiv kommunikation genom talat språk inte räcker till kan ett Alternativt och Kompletterande Kommunikationssätt (AKK) behövas. Det möjliggör att personen, förutom med tal, kommunicerar med till exempel bilder, gester eller tecken. Proceduren att välja ett passande AKK är komplicerad och det händer att ett hjälpmedel som inte passar individens behov sätts in av logoped, eller att ett hjälpmedel inte sätts in alls. För att utveckla och förbättra möjligheten att avgöra om och i så fall vilket hjälpmedel som bör användas har Lasker och Garrett utvecklat bedömningsverktyget The Multimodal Communication Screening Test for persons with Aphasia (MCST-A). Denna studies huvudsyfte var att översätta MCST-A till svenska. Studien delades upp i tre delar; 1) översättning och anpassning av MCST-A till svenska, 2) prövning av översättningen på personer utan afasi samt 3) en första testning på personer med måttlig till grav kronisk afasi där deras resultat på MCST-A jämfördes med en skattning av deras förmåga att kommunicera med AKK i vardagen. Översättningen och anpassningen ledde till en fungerande version på svenska. Resultatet från testningen på personer med afasi går i linje med tidigare forskning, där resultatet på MCST-A speglar personers skattade förmåga att kommunicera med AKK i vardagen. MCST-A kan således vara ett användbart instrument för att avgöra om och på vilken nivå ett hjälpmedel kan användas av en person med afasi. Det är dock inte möjligt att dra en generaliserbar slutsats utifrån denna studies resultat då urvalet var begränsat. / Individuals with aphasia often suffer from their language difficulties and experience them as a serious problem. When the ability to communicate effectively through spoken language is insufficient, an Augmentative and Alternative Communication (AAC) may be required. This allows the person, in addition to speech, to communicate with for example pictures, gestures or body language. The procedure for choosing a suitable AAC is complicated, sometimes an aid that doesn’t suit the needs of the individual is provided by speech-language pathologists and sometimes an aid isn’t provided at all. In order to develop and improve the ability to determine if and what aids should be used, Garrett and Lasker developed the assessment tool The Multimodal Communication Screening Test for Individuals with Aphasia (MCST-A). The main purpose of this study was to translate MCST-A into Swedish. The study was divided into three parts; 1) translation and adaptation of MCST-A to Swedish, 2) testing the translation on persons without aphasia, and 3) a first test on persons with moderate to severe chronic aphasia, where their results on MCST-A were compared with an estimate of their ability to communicate with AAC in daily life. The translation and adaptation led to a working version in Swedish. The results from the persons with aphasia is in line with previous research, where the results on MCST-A reflects the estimated ability to communicate with AAC in their daily lives. Thus, MCST-A can be a useful tool to determine whether if and on what level aids can be used by a person with aphasia. However, it’s not possible to draw a generalizable conclusion based on the results of this study as the sample was small.
|
Page generated in 0.0632 seconds