Return to search

Hur ser framtiden ut för OCR?

Examensarbetet handlar om OCR (Optical Character Recognition). OCR-tekniken går utpå att konvertera inskannade bilder från maskinskriven eller handskriven text (siffror, bokstäver och symboler) till datorformat.Syftet med detta examensarbete är att utforska OCRs framtid och vilka användningsområden som finns idag för tekniken. Det intressanta är att se hur OCR klarar sig när mer och mer material är digitala.Genomförandet till detta examensarbete har gjorts med information från böcker, Internet,mejl och genom att tittat närmare på ett företag inom den grafiska branschen som använder sig av OCR, nämligen Aftonbladet. Jag har även testat ett OCR-program, ABBYYsFineReader 8 och gjort tester med några testteman, exempelvis matematiktest och olikatester på artiklar från några tidningar.Mina slutsatser är att OCR har en framtid men tekniken har en del förbättringsmöjligheter,exempelvis tolkning av handskrivna texter. OCR kan finnas kvar även när mer och mermaterial blir digitala om det integreras i befintliga tekniker, som i ett spam-filter för att tolka texten i bilden. Den nuvarande OCR-tekniken fungerar bra om materialet ärmaskinskrivet och i bra skick men den måste bli bättre på att tolka handskrivna texter för att kunna användas vid arkiveringsbehov av sådana texter. / My examination subject is about OCR (Optical Character Recognition). The idea of OCRtechnology is to convert scanned images of machine-printed or handwritten text (numerals, letters and symbols) into a computer-processable format.The purpose of my examination subject is to explore the future of OCR and why to use it today. It’s interesting to see if OCR survives when more and more material is digital.The implementations to the examination subject have been made from books, Internet, e-mail and I have discovered how a company in the graphic industry are using OCR, namely Aftonbladet.I have also tested an OCR-program, ABBYYs FineReader 8, and done some testing with some testthemes, for example mathematics test and different tests on articles from a few magazines.My conclusions are that OCR has a future but the technology needs some improvements, forexample interpreting handwritten texts. OCR can exist, even when more and more material is digital, if its integrated with existing technologies, for example with a spam-filter to interpret the text within in the picture. The current OCR-technology works fine with machine-printed material, and when the document quality is good. However it needs to be on handwritten text to be used forarchiving needs.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:mau-20561
Date January 2007
CreatorsLund, Mikael
PublisherMalmö högskola, Fakulteten för teknik och samhälle (TS), Malmö högskola/Teknik och samhälle
Source SetsDiVA Archive at Upsalla University
LanguageSwedish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0017 seconds