Rekenaars kan ’n nuttige rol speel in vertaling. Twee benaderings
is vertaalgeheuestelsels en masjienvertaalstelsels. By
hierdie twee tegnologieë word ’n vertaalgeheue gebruik—’n
tweetalige versameling vorige vertalings. Hierdie proefskrif
bied metodes aan om die kwaliteit van ’n vertaalgeheue te verbeter.
’n Masjienleerbenadering word gevolg om foutiewe inskrywings
in ’n vertaalgeheue te identifiseer. ’n Verskeidenheid leerkenmerke
in drie kategorieë word aangebied: kenmerke wat
verband hou met tekslengte, kenmerke wat deur kwaliteittoetsers
soos vertaaltoetsers, ’n speltoetser en ’n grammatikatoetser
bereken word, asook statistiese kenmerke wat met behulp van
eksterne data bereken word.
Die evaluasie van vertaalgeheuestelsels is nog nie gestandaardiseer
nie. In hierdie proefskrif word ’n verskeidenheid
probleme met bestaande evaluasiemetodes uitgewys, en ’n verbeterde
evaluasiemetode word ontwikkel.
Deur die foutiewe inskrywings uit ’n vertaalgeheue te verwyder,
is ’n kleiner, skoner vertaalgeheue beskikbaar vir toepassings.
Eksperimente dui aan dat so ’n vertaalgeheue beter
prestasie behaal in ’n vertaalgeheuestelsel. As ondersteunende
bewys vir die waarde van ’n skoner vertaalgeheue word ’n
verbetering ook aangedui by die opleiding van ’n masjienvertaalstelsel. / Computers can play a useful role in translation. Two approaches
are translation memory systems and machine translation
systems. With these two technologies a translation memory
is used— a bilingual collection of previous translations.
This thesis presents methods to improve the quality of a translation
memory.
A machine learning approach is followed to identify incorrect
entries in a translation memory. A variety of learning features
in three categories are presented: features associated with text
length, features calculated by quality checkers such as translation
checkers, a spell checker and a grammar checker, as well
as statistical features computed with the help of external data.
The evaluation of translation memory systems is not yet standardised.
This thesis points out a number of problems with existing
evaluation methods, and an improved evaluation method
is developed.
By removing the incorrect entries in a translation memory, a
smaller, cleaner translation memory is available to applications.
Experiments demonstrate that such a translation memory results
in better performance in a translation memory system.
As supporting evidence for the value of a cleaner translation
memory, an improvement is also achieved in training a machine
translation system. / School of Computing / Ph. D. (Rekenaarwetenskap)
Identifer | oai:union.ndltd.org:netd.ac.za/oai:union.ndltd.org:unisa/oai:uir.unisa.ac.za:10500/24961 |
Date | 10 1900 |
Creators | Wolff, Friedel |
Contributors | Pretorius, Laurette, Buitelaar, Paul |
Source Sets | South African National ETD Portal |
Language | Afrikaans |
Detected Language | Unknown |
Type | Thesis |
Format | 1 online resource (xiv, 155 leaves) : color illustrations, color graphs |
Page generated in 0.0021 seconds