Spelling suggestions: "subject:"positionsuppskattning"" "subject:"positionsuppskattningen""
1 |
SANDBUNKERSEGMENTERING FÖR SMARTPHONES : Automatisk positionsuppskattning av sandbunkrar för smartphone som golfcaddie / SEGMENTATION OF SANDBUNKERS FOR SMARTPHONES : Automatic position estimate of sandbunkers for smartphone as golfcaddieAndersson, Martin January 2011 (has links)
Ett av många nya användningsområden för smartphones är att använda dem som caddie på golfbanan. Golfaren kan få hjälp med avståndsuppskattning till intressanta punkter på banan genom att dessa punkter programmeras in och jämförs med smartphonens inbyggda positioneringssystem. Den här rapporten visar hur det med en bildsegmenteringsalgoritm går att slippa det manuella arbetet med att lägga in positioner för sandbunkrar på golfbanan. Algoritmen som tagits fram arbetar på satellitbilder som smartphonen kan ladda ned via dess Internetanslutning. Golfaren kan i ett tänkt scenario ge sig ut på en godtycklig golfbana och få hjälp med avståndsbedömning enbart med hjälp av satellitbilder och smartphonens gps. I snitt hittar den framtagna segmenteringsalgoritmen cirka 70 % av sandbunkrarna på en satellitbild, en siffra som i en verklig applikation skulle behöva ökas och förslag på hur detta kan göras ges i slutet av rapporten. Tre olika upplösningar på satellitbilderna har utvärderats och testkörts i en nyare smartphone. Även om den högsta upplösningen används tar en hel golfbana endast cirka 15 sekunder att segmentera vilket bör hinnas med under loppet av en vanlig golfrunda som i regel tar 3 till 5 timmar. I ett vidare perspektiv går det att tänka sig helt andra tillämpningar där det finns behov av positionsuppskattning av objekt i en satellitbild i sin smartphone. Det bör på ett förhållandevis enkelt sätt gå att utvidga slutsatserna som dragits i rapporten till att gälla annat än enbart sandbunkrar, t.ex. sjöar, fält, åkrar och givetvis andra delar av golfbanan som vattenhinder och greener.
|
2 |
En jämförelse av inlärningsbaserade lösningar för mänsklig positionsuppskattning i 3D / A comparison of learning-based solutions for 3D human pose estimationLange, Alfons, Lindfors, Erik January 2019 (has links)
Inom områden som idrottsvetenskap och underhållning kan det finnas behov av att analysera en människas kroppsposition i 3D. Dessa behov kan innefatta att analysera en golfsving eller att möjliggöra mänsklig interaktion med spel. För att tillförlitligt uppskatta kroppspositioner krävs det idag specialiserad hårdvara som ofta är dyr och svårtillgänglig. På senare tid har det även tillkommit inlärningsbaserade lösningar som kan utföra samma uppskattning på vanliga bilder. Syftet med arbetet har varit att identifiera och jämföra populära inlärningsbaserade lösningar samt undersöka om någon av dessa presterar i paritet med en etablerad hårdvarubaserad lösning. För detta har testverktyg utvecklats, positionsuppskattningar genomförts och resul- tatdata för samtliga tester analyserats. Resultatet har visat att lösningarna inte pre- sterar likvärdigt med Kinect och att de i nuläget inte är tillräckligt välutvecklade för att användas som substitut för specialiserad hårdvara. / In fields such as sports science and entertainment, there’s occasionally a need to an- alyze a person's body pose in 3D. These needs may include analyzing a golf swing or enabling human interaction with games. Today, in order to reliably perform a human pose estimation, specialized hardware is usually required, which is often expensive and difficult to access. In recent years, multiple learning-based solutions have been developed that can perform the same kind of estimation on ordinary images. The purpose of this report has been to identify and compare popular learning-based so- lutions and to investigate whether any of these perform on par with an established hardware-based solution. To accomplish this, tools for testing have been developed, pose estimations have been conducted and result data for each test have been ana- lyzed. The result has shown that the solutions do not perform on par with Kinect and that they are currently not sufficiently well-developed to be used as a substitute for specialized hardware.
|
3 |
Noggrannhet inom projicerad förstärkt verklighet / Accuracy within projected augmented realityRizal, Richie, Bouyaji, Raffi January 2022 (has links)
Interaktiv projicerad förstärkt verklighet är ett delområde inom projicerad förstärktverklighet, där interaktiviteten handlar om att projicera virtuelldata på en entitet somär rörlig. Denna projektion kan åstadkommas genom att använda en kalibrerad projektor-djupkamerasystem som detekterar entitet med hjälp av datorseende. Dettainteraktiva system har varierande antal tillämpningsområden, dock framkommer enkritisk problemformulering, vilket är noggrannheten för dessa system. Noggrannheten i detta fall är hur korrekt projektionen sker på den specifika entiteten, noggrannheten är därför en viktig aspekt för att validera ifall vissa tillämpningar är möjliga implementera. Lösningen för detta problem är att implementera interaktiv projicerad förstärkt verklighet och utföra prototyptester med det implementerade systemet och sedan vidare analysera noggrannheten med testdata. Prototypen kalibrerasmed befintliga verktyg från tidigare studier, detekterar med hjälp av positionsuppskattning och kan sedan projicera punkter på specifika kroppsdelar som även följerpersonen vid rörelse. Resultatet som framkom blev en prototyp som testades för noggrannheten. Testernasker med hjälp av datorseende för att extrahera mätdata såsom projicerade punktenoch förväntade punkten. Från analysen av testdata framkom det att projektionensnoggrannhet är lämplig för tillämpningar som inte kräver exceptionell noggrannhet,såsom nöje, konst, spel och med mera. Ytterligare forskning krävs för användningsområden som kräver exceptionell noggrannhet som tillämpningar inom sjukvård ochkirurgi. / Interactive projected augmented reality is a subfield within projected augmented reality, where the interactivity is about projecting virtual data onto an entity that canpotentially be in movement. This projection can be accomplished by using a calibrated projector-depth camera system that detects entities using computer vision.This interactive system has a varying number of application areas; however, a criticalproblem emerges, which is the accuracy of these systems. The accuracy in this caseis how correctly the projection takes place on the specific entity, the accuracy istherefore an important aspect to validate if certain applications are possible to implement correctly. The solution for this problem is by implementing interactive projectedaugmented reality and perform prototype tests with the implemented system andthen further analyzing the accuracy with test data. The prototype is calibrated withexisting tools from previous studies, detects using pose detection, which can thenproject points on specific body parts that also follows the person during movement.The result that got developed was a prototype that was tested for accuracy. The testsare done using computer vision to extract measurement data such as the projectedpoint and the expected point. The result from the analysis of the test data showedthat the accuracy of the projection is suitable for applications that do not requireexceptional accuracy, such as entertainment, art, games and so on. Further research is required for applications that require exceptional accuracy such ashealthcare and surgical applications.
|
4 |
Modulating Depth Map Features to Estimate 3D Human Pose via Multi-Task Variational Autoencoders / Modulerande djupkartfunktioner för att uppskatta människans ställning i 3D med multi-task-variationsautoenkoderMoerman, Kobe January 2023 (has links)
Human pose estimation (HPE) constitutes a fundamental problem within the domain of computer vision, finding applications in diverse fields like motion analysis and human-computer interaction. This paper introduces innovative methodologies aimed at enhancing the accuracy and robustness of 3D joint estimation. Through the integration of Variational Autoencoders (VAEs), pertinent information is extracted from depth maps, even in the presence of inevitable image-capturing inconsistencies. This concept is enhanced through the introduction of noise to the body or specific regions surrounding key joints. The deliberate introduction of noise to these areas enables the VAE to acquire a robust representation that captures authentic pose-related patterns. Moreover, the introduction of a localised mask as a constraint in the loss function ensures the model predominantly relies on pose-related cues while disregarding potential confounding factors that may hinder the compact representation of accurate human pose information. Delving into the latent space modulation further, a novel model architecture is devised, joining a VAE and fully connected network into a multi-task joint training objective. In this framework, the VAE and regressor harmoniously influence the latent representations for accurate joint detection and localisation. By combining the multi-task model with the loss function constraint, this study attains results that compete with state-of-the-art techniques. These findings underscore the significance of leveraging latent space modulation and customised loss functions to address challenging human poses. Additionally, these novel methodologies pave the way for future explorations and provide prospects for advancing HPE. Subsequent research endeavours may optimising these techniques, evaluating their performance across diverse datasets, and exploring potential extensions to unravel further insights and advancements in the field. / Human pose estimation (HPE) är ett grundläggande problem inom datorseende och används inom områden som rörelseanalys och människa-datorinteraktion. I detta arbete introduceras innovativa metoder som syftar till att förbättra noggrannheten och robustheten i 3D-leduppskattning. Genom att integrera variationsautokodare (eng. variational autoencoder, VAE) extraheras relevant information från djupkartor, trots närvaro av inkonsekventa avvikelser i bilden. Dessa avvikelser förstärks genom att applicera brus på kroppen eller på specifika regioner som omger viktiga leder. Det avsiktliga införandet av brus i dessa områden gör det möjligt för VAE att lära sig en robust representation som fångar autentiska poseringsrelaterade mönster. Dessutom införs en lokaliserad mask som en begränsning i förlustfunktionen, vilket säkerställer att modellen främst förlitar sig på poseringsrelaterade signaler samtidigt som potentiella störande faktorer som hindrar den kompakta representationen av korrekt mänsklig poseringsinformation bortses ifrån. Genom att fördjupa sig ytterligare i den latenta rumsmoduleringen har en ny modellarkitektur tagits fram som förenar en VAE och ett fullständigt anslutet nätverk i en fleruppgiftsmodell. I detta ramverk påverkar VAE och det fullständigt ansluta nätverket de latenta representationerna på ett harmoniskt sätt för att uppnå korrekt leddetektering och lokalisering. Genom att kombinera fleruppgiftsmodellen med förlustfunktionsbegränsningen uppnår denna studie resultat som konkurrerar med toppmoderna tekniker. Dessa resultat understryker betydelsen av att utnyttja latent rymdmodulering och anpassade förlustfunktioner för att hantera utmanande mänskliga poser. Dessutom banar dessa nya metoder väg för framtida utveckling inom uppskattning av HPE. Efterföljande forskningsinsatser kan optimera dessa tekniker, utvärdera deras prestanda över olika datamängder och utforska potentiella tillägg för att avslöja ytterligare insikter och framsteg inom området.
|
Page generated in 0.083 seconds