Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Comunicação e Expressão, Programa de Pós-Graduação em Estudos da Tradução, Florianópolis, 2010 / Made available in DSpace on 2012-10-25T10:30:38Z (GMT). No. of bitstreams: 1
287945.pdf: 1464687 bytes, checksum: 7b4311863f125aaecc56e7ef3f481b63 (MD5) / A criação de tradutores automáticos por muito tempo foi considerada uma tarefa impossível dentro da linguística computacional e de um modelo vigente de linguagem. Inspirado na argumentação de Callude (2003), Villar et al (2006) e Ribeiro (2006), esta dissertação investiga os resultados gerados a partir de duas abordagens diferentes de tradução automática, uma baseada em análise de dados estatísticos (Google Translate®) e outra baseada em regras (Systran®), levando-se em conta os erros presentes nos dados de saída dos mecanismos a partir dos textos utilizados neste estudo dentro do par liguístico inglês-português. Através do aparato metodológico utilizado, baseado em linguagem de marcação, é possível discutir o real valor de utilização dos dois tradutores utilizados nesta investigação a partir de uma análise dos tipos de erros e de sua distribuição em diferentes tipos de textos. Os resultados apresentados nesta investigação indicam um rápido avanço da tradição automática baseada em estatística e mostram que apenas uma análise concreta de dados obtidos em diferentes tarefas de tradução permite a avaliação do real valor e da qualidade das abordagens de tradução automática utilizadas e seu uso como ferramenta de acesso a informação. / The development of machine translation systems has for long been regarded as an impossible achievement in the field of computational linguistics and our current language model. Supported by Callude#s (2003), Villar#s et al (2006) and Ribeiro#s (2006) argument, this dissertation investigates the translations generated from two different approaches of machine translation systems, one statistical-based (Google Translate®) and one rule-based (Systran®), taking into account the errors in the output of these mechanisms from five different texts investigated in this study in the linguistic pair English- Portuguese. Through the methodological apparatus used, based on markup language, it is possible to speculate upon the alidity of the two automatic translator used in this experiment by means of an analysis of error types and their distribution throughout different types of text. The results obtained in the investigation proved a rapid development egarding the statistical machine translation tradition and that only by means of a concrete databased investigation from different translations one can visualize the real quality value of the translation approaches used to carry out this research and their use as an information access tool.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufsc.br:123456789/94472 |
Date | 25 October 2012 |
Creators | Silva, Fernando da |
Contributors | Universidade Federal de Santa Catarina, Weininger, Markus |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | 140 p.| il., grafs. |
Source | reponame:Repositório Institucional da UFSC, instname:Universidade Federal de Santa Catarina, instacron:UFSC |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0022 seconds