Return to search

Real-time Object Detection on Raspberry Pi 4 : Fine-tuning a SSD model using Tensorflow and Web Scraping

Edge AI is a growing area. The use of deep learning on low cost machines, such as the Raspberry Pi, may be used more than ever due to the easy use, availability, and high performance. A quantized pretrained SSD object detection model was deployed to a Raspberry Pi 4 B to evaluate if the throughput is sufficient for doing real-time object recognition. With input size of 300x300, an inference time of 185 ms was obtained. This is an improvement as of the previous model; Raspberry Pi 3 B+, 238 ms with a input size of 96x96 which was obtained in a related study. Using a lightweight model is for the benefit of higher throughput as a trade-off for lower accuracy. To compensate for the loss of accuracy, using transfer learning and tensorflow, a custom object detection model has been trained by fine-tuning a pretrained SSD model. The fine-tuned model was trained on images scraped from the web with people in winter landscape. The pretrained model was trained to detect different objects, including people in various environments. Predictions shows that the custom model performs significantly better doing detections on people in snow. The conclusion from this is that web scraping can be used for fine-tuning a model. However, the images scraped is of bad quality and therefore it is important to thoroughly clean and select which images that is suitable to keep, given a specific application. / Användning av djupinlärning på lågkostnadsmaskiner, som Raspberry Pi, kan idag mer än någonsin användas på grund av enkel användning, tillgänglighet, och hög prestanda. En kvantiserad förtränad SSD-objektdetekteringsmodell har implementerats på en Raspberry Pi 4 B för att utvärdera om genomströmningen är tillräcklig för att utföra realtidsobjektigenkänning. Med en ingångsupplösning på 300x300 pixlar erhölls en periodtid på 185 ms. Detta är en stor förbättring med avseende på prestanda jämfört med den tidigare modellen; Raspberry Pi 3 B+, 238 ms med en ingångsupplösning på 96x96 som erhölls i en relaterad studie. Att använda en kvantiserad modell till förmån för hög genomströmning bidrar till lägre noggrannhet. För att kompensera för förlusten av noggrannhet har, med hjälp av överföringsinlärning och Tensorflow, en skräddarsydd modell tränats genom att finjustera en färdigtränad SSD-modell. Den finjusterade modellen tränas på bilder som skrapats från webben med människor i vinterlandskap. Den förtränade modellen var tränad att känna igen olika typer av objekt, inklusive människor i olika miljöer. Förutsägelser visar att den skräddarsydda modellen detekterar människor med bättre precision än den ursprungliga. Slutsatsen härifrån är att webbskrapning kan användas för att finjustera en modell. Skrapade bilder är emellertid av dålig kvalitet och därför är det viktigt att rengöra all data noggrant och välja vilka bilder som är lämpliga att behålla gällande en specifik applikation.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:miun-39455
Date January 2020
CreatorsFerm, Oliwer
PublisherMittuniversitetet, Institutionen för elektronikkonstruktion
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.002 seconds