Return to search

Speech recognition in construction equipment : Creating a voice assistant for an autonomous wheel loader

This thesis sets out to explore possible applications of speech recognition in construction equipment and autonomous machines. Advancements in autonomous vehicle technology mean that soon, vehicles like wheel loaders will be able perform tasks without human operators. Those vehicles still require a method of interaction with humans and recent improvements in speech recognition mean that it is possible for a natural voice-based interface to be used. The research question of this thesis is the extent to which voice control can replace hand-operated controls in an intelligent autonomous machine. Interviews and observation sessions took place in order to identify the requirements such a speech interface would have to fulfill. Next, a design process took place in order to build a prototype of such system, followed by test sessions to evaluate it. The prototype demonstrated positive attributes, with great learnability and ease of operation, but speech recognition errors meant low performance, and overall user satisfaction. / Detta examensarbete ämnar utforska möjliga tillämpningar av taligenkänning i byggutrustning samt självstyrande fordon. Framsteg i självstyrande fordonsteknologi visar att fordon som hjullastare kommer kunna utföra uppgifter själv, utan operatörer, inom kort framtid. I nuläget krävs ännu människor för att interagera med maskinen. Men nya framsteg i röststyrning visar att röstbaserade gränssnitt kan tillämpas. Forskningsfrågan i detta arbete är: Till vilken utsträckning kan röststyrning ersätta handmanövrerade instrument i ett intelligent självstyrt fordon? En etnografisk forskning ägde rum för att identifiera de krav som ett sådant gränssnitt skulle behöva uppfylla. En designprocess ägde rum för att utveckla en prototyp för ett sådant system. Prototypen utvärderades genom tester och påvisade positiva egenskaper. Den visade sig vara både lätt att lära samt enkel vid användning. Teknologin i taligenkänning påvisade dock brister genom dålig prestanda samt låg användarnöjdhet.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:uu-356208
Date January 2018
CreatorsKartalidis, Nikolaos
PublisherUppsala universitet, Institutionen för informatik och media
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageEnglish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.003 seconds