<p>Arbeidet bak denne rapporten har omhandlet analysering av egendefinerte taleegenskapers potensial ved detektering av lydenheter (attributter). Et HTK-basert simuleringsverktøy har blitt utviklet for å kunne kartlegge egenskapenes evne til å frembringe gode gjenkjenningsresultater. En har undersøkt muligheten for forbedring av feilraten ved å representere talesignalet vha egenskapsvektorer som er tilpasset hver attributtdetektor. Utvelgelsen av vektorene er gjort ved subjektiv inspeksjon av attributtenes fordelingshistogram og kan dermed medføre menneskelige feilantagelser. Undersøkelsene som er blitt utført viser, som forventet, underlegne resultater sammenlignet med referansen, MFCC. En beskjeden forbedring oppnås ved tilegnelse av utvalgte subsett av egenskaper til hver attributtdeteksjon. Nærmere tester bekrefter usikkerheten rundt potensialet til de egendefinerte egenskapsvektorene. Det er dermed anbefalt å redefinere egenskapene og eventuelt velge ut et nytt sett med attributter. En bør i tillegg vurdere å utvikle en bedre teknikk for utvelgelse av egenskapene for å optimalisere gjenkjenningen.</p>
Identifer | oai:union.ndltd.org:UPSALLA/oai:DiVA.org:ntnu-10349 |
Date | January 2007 |
Creators | Fasseland, Claus |
Publisher | Norwegian University of Science and Technology, Department of Electronics and Telecommunications, Institutt for elektronikk og telekommunikasjon |
Source Sets | DiVA Archive at Upsalla University |
Language | Norwegian |
Detected Language | Norwegian |
Type | Student thesis, text |
Page generated in 0.0016 seconds