Return to search

Matching handwritten notes using computer vision and pattern matching

What people take for granted is not as easy for computers. Being able tojudge whether an image is the same even though it has a differentresolution or is taken from a different angle or light condition is easyfor humans but much more difficult for computers. Today’s mobiles aremore powerful than ever, which has opened up for more hardware-demandingalgorithms to be processed. How to effectively match handwritten notesto eliminate duplicates in an application. Are there better or worsemethods and approaches, and how do they compare to each other? Can youachieve both accuracy and speed? By analyzing images taken at differentangles, distances, and lighting conditions, different methods andapproaches have been developed and analyzed. The methods are representedin various tables where time and accuracy are represented. Eightdifferent methods were evaluated. The methods were tuned on one datasetconsisting of 150 post-it notes, each imaged under four conditions,leading to 600 images and 1800 possible pair-wise matches. The methodswere thereafter evaluated on an independent dataset consisting of 250post-it notes, each imaged under four conditions, leading to 1000 imagesand 3000 possible pair-wise matches. The best method found 99.7%, andthe worst method found 62.9% of the matching pairs. Seven of the eightevaluated matches did not make any incorrect matches. / Det människor tar för givet är inte lika lätt för datorer. Att kunna bedöma om en bild är den samma fast den har annan upplösning eller är tagen från en annan vinkel eller ljusförhållande är lätt för människor men betydligt svårare för datorer. Dagens mobiler är kraftfullare än någonsin vilket har öppnat upp för att mer hårdvaru krävande algoritmer kan processas. Hur matchar man handskrivna lappar på ett effektivt sätt för att eliminera kopior i en applikation. Finns det bättre eller sämre metoder och tillvägagångssätt, och hur står de gentemot varandra? Kan man uppnå både träffsäkerhet samt snabbhet? Genom att analysera bilder tagna får olika vinklar, avstånd samt ljusförhållanden har olika metoder och tillvägagångssätt utvecklats och analyserats. Metoderna är representerade i olika tabeller där tid, samt träffsäkerhet redovisas. Åtta olika metoder utvärderades. Metoderna ställdes in på ett dataset bestående av 150 post-it-lappar, var och en fotograferade under fyra förhållanden, vilket ledde till 600 bilder och 1800 möjliga matchningar. Metoderna utvärderades därefter på ett oberoende dataset bestående av 250 post-it-lappar, var och en fotograferade under fyra förhållanden, vilket ledde till 1000 bilder och 3000 möjliga matchningar. Den bästa metoden fann 99,7% och den sämsta metoden hittade 62,9% av de matchande paren. Sju av de åtta utvärderade metoderna gjorde inga felaktiga matchningar.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:uu-466840
Date January 2022
CreatorsÅslund, Conrad
PublisherUppsala universitet, Avdelningen för visuell information och interaktion
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationUPTEC IT, 1401-5749 ; 22002

Page generated in 0.0021 seconds