• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 51
  • Tagged with
  • 51
  • 51
  • 39
  • 24
  • 21
  • 18
  • 18
  • 18
  • 15
  • 15
  • 15
  • 15
  • 12
  • 12
  • 12
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Tradução de textos especializados : unidades fraseológicas especializadas e técnicas tradutórias

Waquil, Marina Leivas January 2013 (has links)
Considerando o contexto expressivamente globalizado que vivenciamos hoje em dia, a tradução de textos especializados assume papel cada vez cada vez mais importante, mediando a comunicação entre especialistas e interessados das mais diversas áreas do conhecimento humano. É com o objetivo de contribuir para os estudos em Tradução e Terminologia que esta pesquisa foi realizada, buscando oferecer resultados que facilitem a comunicação especializada em contextos de tradução na direção espanhol-­‐português, auxiliando profissionais a produzirem textos adequados e precisos. Para isso, selecionamos como objeto de estudo as Unidades Fraseológicas Especializadas (UFEs), importantes porque são estruturas inerentes aos textos especializados e porque costumam representar dificuldade para processo tradutório, tanto no seu reconhecimento como uma unidade fraseológica, quanto na sua transposição para uma outra língua. Além disso, este trabalho se justifica pelo fato de que os estudos em Fraseologia Especializada são ainda muito recentes e carecem de pesquisas mais aprofundadas, principalmente no que diz respeito à sua interface com a tradução. Como base teórica, valemo-­‐nos dos pressupostos da Teoria Comunicativa da Terminologia (TCT), segundo os quais seus objetos de estudo, analisados em situações reais de comunicação, são unidades das línguas naturais que são ativadas pragmaticamente, isto é, adquirem caráter especializado de acordo com seu uso em um âmbito específico. Buscando coerência em nossa fundamentação teórica, tomamos a contribuição de Hurtado Albir (2001), considerando a tradução como um processo comunicativo, além de textual e cognitivo, no qual se deve levar em conta o contexto no qual se insere e a finalidade que comporta. O corpus para extração das UFEs foi formado por oito livros da área da Educação e suas respectivas traduções para o português, totalizando, aproximadamente, um milhão de palavras em cada língua. Através da ferramenta AntConc, extraímos as UFEs dos corpora de originais e traduções a partir dos termos listados nos glossários apresentados ao final de cada livro e do critério de frequência de aparição nos corpora. Para a realização de nosso objetivo principal, decidimos analisar as unidades originais e suas traduções, identificando as técnicas empregadas pelos tradutores para o estabelecimento de um equivalente, a partir de quatro propostas de categorizações que se destacam nos estudos tradutórios por sua relevância e importância: Vinay e Darbelnet (1958), Barbosa (1990), Aubert (1998) e Hurtado Albir (2001). A partir desta análise, propusemos uma nova categorização de técnicas, de acordo com a revisão realizada chegando às seguintes técnicas: tradução literal, tradução palavra por palavra, transposição, modulação, equivalência consagrada, ampliação linguística, compressão linguística e variação lexical. Por fim, destacamos a confirmação de que as UFEs são Unidades de Tradução e que a equivalência estabelecida entre estas unidades é dinâmica, flexível e relativa. / Considerando el contexto expresivamente globalizado en el que nos encontramos hoy en día, la traducción de textos especializados asume un rol cada vez más importante, mediando la comunicación entre expertos e interesados de las más diversas áreas del conocimiento humano. Es con el objetivo de contribuir para los estudios en Traducción y Terminología que esta investigación ha sido realizada, buscando ofrecer resultados que faciliten la comunicación especializada en contextos de traducción en la dirección español-­‐portugués, auxiliando profesionales a producir textos adecuados y precisos. Para ello, seleccionamos como objeto de estudio las Unidades Fraseológicas Especializadas (UFEs), importantes porque son estructuras inherentes a los textos especializados y porque suelen representar dificultad para el proceso de traducción, tanto en su reconocimiento como unidad fraseológica como en su transposición para otro idioma. Además de eso, este trabajo se justifica por el hecho de que los estudios en Fraseología Especializada son todavía muy recientes y carecen de investigaciones más profundizadas, principalmente en su interfaz con la traducción. Como base teórica nos valemos de los principios de la Teoría Comunicativa de la Terminología (TCT), según los cuales sus objetos de estudio, analizados en situaciones reales de comunicación, son unidades de las lenguas naturales que se activan pragmáticamente, es decir, adquieren carácter especializado de acuerdo con su uso en un ámbito específico. Buscando coherencia en nuestra fundamentación teórica, tomamos los aportes de Hurtado Albir (2001), considerando la traducción como un proceso comunicativo, además de textual y cognitivo, en el que se debe tener en cuenta el contexto en el que se inserta y la finalidad que comporta. A través de la herramienta AntConc, extrajimos las UFEs de los corpus de originales y traducciones a partir de los términos listados en los glosarios presentados al final de cada libro y del criterio de frecuencia de aparición en los corpus. Decidimos, entonces, analizar las unidades originales y sus traducciones, identificando las técnicas empleadas por los traductores para establecer un equivalente, desde cuatro propuestas de categorizaciones que se destacan en los estudios traductológicos por su relevancia e importancia: Vinay e Darbelnet (1958), Barbosa (1990), Aubert (1998) y Hurtado Albir (2001). Con este análisis, propusimos una nueva categorización de técnicas, llegando a las siguientes: traducción literal, traducción palabra por palabra, transposición, modulación, equivalencia cuñada, ampliación lingüística, comprensión lingüística y variación lexical. Finalmente, destacamos la confirmación de que las UFEs son Unidades de Traducción y que la equivalencia establecida entre estas unidades es dinámica, flexible y relativa.
2

Verblexpor : um recurso léxico com anotação de papéis semânticos para o português

Zilio, Leonardo January 2015 (has links)
Esta tese propõe um recurso léxico de verbos com anotação de papéis semânticos, denominado VerbLexPor, baseado em recursos como VerbNet, PropBank e FrameNet. As bases teóricas da proposta são interdisciplinares e retiradas da Linguística de Corpus e do Processamento de Linguagem Natural (PLN), visando-se a contribuir para a Linguística e para a Computação. As hipóteses de pesquisa são: a) um mesmo conjunto de papéis semânticos pode ser aplicado a diferentes gêneros textuais; e b) as diferenças entre esses gêneros se destacam no ranqueamento dos papéis semânticos. O desenvolvimento do VerbLexPor se apoia em dois corpora: um especializado, com mais de 1,6 milhão de palavras, composto por artigos científicos de Cardiologia de três periódicos brasileiros; e um não especializado, com mais de 1 milhão de palavras composto por artigos do jornal popular Diário Gaúcho. Os corpora foram anotados com o parser PALAVRAS, e as informações de sentenças, verbos e argumentos foram extraídas e armazenadas em um banco de dados. O VerbLexPor tem 192 verbos e mais de 15 mil argumentos anotados distribuídos em mais de 6 mil sentenças. Observou-se que o corpus do Diário Gaúcho privilegia uma sintaxe direta e pouco uso de voz passiva e adjuntos, enquanto o corpus de Cardiologia apresenta mais voz passiva e um maior uso de INSTRUMENTOS na posição de sujeito, além de uma menor incidência de AGENTES. Foram realizados também alguns experimentos paralelos, como a anotação de papéis semânticos por vários anotadores e o agrupamento automático de verbos. Na tarefa de múltiplos anotadores, cada um anotou exatamente as mesmas 25 orações. Os anotadores receberam um manual de anotação e um treinamento básico (explicação sobre a tarefa e dois exemplos de anotação). Usou-se o cálculo de multi-π para avaliar a concordância entre os anotadores, e o resultado foi de π = 0,25. Os motivos para essa concordância baixa podem estar na falta de um treinamento mais completo. A tarefa de agrupamento de verbos mostrou que a sintaxe e a semântica são igualmente importantes para o agrupamento. Este estudo contribui para a área de Linguística, com um léxico de verbos anotados semanticamente, e também para a Computação, com dados que podem ser consultados e processados para diversas aplicações do PLN, principalmente por estarem disponíveis nos formatos XML e SQL. / This dissertation aims at developing a lexical resource of verbs annotated with semantic roles, called VerbLexPor, and based on other resources, such as VerbNet, PropBank, and FrameNet. The theoretical bases of this study lies in Corpus Linguistics and Natural Language Processing (NLP), so that it aims at contributing to both Linguistics and Computer Science. The hypotheses are: a) one set of semantic roles can be applied to different genres; and b) the differences among genres are shown by the ranking of semantic roles. The development of VerbLexPor has two corpora at the basis: a specialized one, with more than 1.6 million words, composed by scientific papers in the field of Cardiology from three Brazilian journals; and a non-specialized one, with more than 1 million words, composed by newspaper articles from Diário Gaúcho. The corpora were analyzed with the parser PALAVRAS, and sentence, verb and argument information was extracted and stored in a database. VerbLexPor has 192 verbs and more than 15 thousand arguments annotated with semantic roles, distributed among more than 6 thousand sentences. We observed that Diário Gaúcho has a more direct syntax, with less passive voice and adjuncts, while Cardiology has more passive voice and more INSTRUMENTS for subjects, and fewer AGENTS. We also conducted some parallel experiments, such as semantic role labeling with multiple annotators and automatic verbal clustering. In the multiple annotators task, each of them annotated exactly the same 25 sentences. They received an annotation manual and basic training (explanation on the task and two annotation examples). We used multi-π to evaluate agreement among annotators, and results were π = 0,25. Reasons for this low agreement may be a lack of a thoroughly developed training. The verbal clustering task showed that syntax and semantics are equally important for verbal clustering. This study contributes to Linguistics, with a verbal lexicon annotated with semantic roles, and also to Computer Science, with data that can be assessed and processed for various NLP applications, especially because the data are available in both XML and SQL formats.
3

Tradução de textos especializados : unidades fraseológicas especializadas e técnicas tradutórias

Waquil, Marina Leivas January 2013 (has links)
Considerando o contexto expressivamente globalizado que vivenciamos hoje em dia, a tradução de textos especializados assume papel cada vez cada vez mais importante, mediando a comunicação entre especialistas e interessados das mais diversas áreas do conhecimento humano. É com o objetivo de contribuir para os estudos em Tradução e Terminologia que esta pesquisa foi realizada, buscando oferecer resultados que facilitem a comunicação especializada em contextos de tradução na direção espanhol-­‐português, auxiliando profissionais a produzirem textos adequados e precisos. Para isso, selecionamos como objeto de estudo as Unidades Fraseológicas Especializadas (UFEs), importantes porque são estruturas inerentes aos textos especializados e porque costumam representar dificuldade para processo tradutório, tanto no seu reconhecimento como uma unidade fraseológica, quanto na sua transposição para uma outra língua. Além disso, este trabalho se justifica pelo fato de que os estudos em Fraseologia Especializada são ainda muito recentes e carecem de pesquisas mais aprofundadas, principalmente no que diz respeito à sua interface com a tradução. Como base teórica, valemo-­‐nos dos pressupostos da Teoria Comunicativa da Terminologia (TCT), segundo os quais seus objetos de estudo, analisados em situações reais de comunicação, são unidades das línguas naturais que são ativadas pragmaticamente, isto é, adquirem caráter especializado de acordo com seu uso em um âmbito específico. Buscando coerência em nossa fundamentação teórica, tomamos a contribuição de Hurtado Albir (2001), considerando a tradução como um processo comunicativo, além de textual e cognitivo, no qual se deve levar em conta o contexto no qual se insere e a finalidade que comporta. O corpus para extração das UFEs foi formado por oito livros da área da Educação e suas respectivas traduções para o português, totalizando, aproximadamente, um milhão de palavras em cada língua. Através da ferramenta AntConc, extraímos as UFEs dos corpora de originais e traduções a partir dos termos listados nos glossários apresentados ao final de cada livro e do critério de frequência de aparição nos corpora. Para a realização de nosso objetivo principal, decidimos analisar as unidades originais e suas traduções, identificando as técnicas empregadas pelos tradutores para o estabelecimento de um equivalente, a partir de quatro propostas de categorizações que se destacam nos estudos tradutórios por sua relevância e importância: Vinay e Darbelnet (1958), Barbosa (1990), Aubert (1998) e Hurtado Albir (2001). A partir desta análise, propusemos uma nova categorização de técnicas, de acordo com a revisão realizada chegando às seguintes técnicas: tradução literal, tradução palavra por palavra, transposição, modulação, equivalência consagrada, ampliação linguística, compressão linguística e variação lexical. Por fim, destacamos a confirmação de que as UFEs são Unidades de Tradução e que a equivalência estabelecida entre estas unidades é dinâmica, flexível e relativa. / Considerando el contexto expresivamente globalizado en el que nos encontramos hoy en día, la traducción de textos especializados asume un rol cada vez más importante, mediando la comunicación entre expertos e interesados de las más diversas áreas del conocimiento humano. Es con el objetivo de contribuir para los estudios en Traducción y Terminología que esta investigación ha sido realizada, buscando ofrecer resultados que faciliten la comunicación especializada en contextos de traducción en la dirección español-­‐portugués, auxiliando profesionales a producir textos adecuados y precisos. Para ello, seleccionamos como objeto de estudio las Unidades Fraseológicas Especializadas (UFEs), importantes porque son estructuras inherentes a los textos especializados y porque suelen representar dificultad para el proceso de traducción, tanto en su reconocimiento como unidad fraseológica como en su transposición para otro idioma. Además de eso, este trabajo se justifica por el hecho de que los estudios en Fraseología Especializada son todavía muy recientes y carecen de investigaciones más profundizadas, principalmente en su interfaz con la traducción. Como base teórica nos valemos de los principios de la Teoría Comunicativa de la Terminología (TCT), según los cuales sus objetos de estudio, analizados en situaciones reales de comunicación, son unidades de las lenguas naturales que se activan pragmáticamente, es decir, adquieren carácter especializado de acuerdo con su uso en un ámbito específico. Buscando coherencia en nuestra fundamentación teórica, tomamos los aportes de Hurtado Albir (2001), considerando la traducción como un proceso comunicativo, además de textual y cognitivo, en el que se debe tener en cuenta el contexto en el que se inserta y la finalidad que comporta. A través de la herramienta AntConc, extrajimos las UFEs de los corpus de originales y traducciones a partir de los términos listados en los glosarios presentados al final de cada libro y del criterio de frecuencia de aparición en los corpus. Decidimos, entonces, analizar las unidades originales y sus traducciones, identificando las técnicas empleadas por los traductores para establecer un equivalente, desde cuatro propuestas de categorizaciones que se destacan en los estudios traductológicos por su relevancia e importancia: Vinay e Darbelnet (1958), Barbosa (1990), Aubert (1998) y Hurtado Albir (2001). Con este análisis, propusimos una nueva categorización de técnicas, llegando a las siguientes: traducción literal, traducción palabra por palabra, transposición, modulación, equivalencia cuñada, ampliación lingüística, comprensión lingüística y variación lexical. Finalmente, destacamos la confirmación de que las UFEs son Unidades de Traducción y que la equivalencia establecida entre estas unidades es dinámica, flexible y relativa.
4

Tradução de textos especializados : unidades fraseológicas especializadas e técnicas tradutórias

Waquil, Marina Leivas January 2013 (has links)
Considerando o contexto expressivamente globalizado que vivenciamos hoje em dia, a tradução de textos especializados assume papel cada vez cada vez mais importante, mediando a comunicação entre especialistas e interessados das mais diversas áreas do conhecimento humano. É com o objetivo de contribuir para os estudos em Tradução e Terminologia que esta pesquisa foi realizada, buscando oferecer resultados que facilitem a comunicação especializada em contextos de tradução na direção espanhol-­‐português, auxiliando profissionais a produzirem textos adequados e precisos. Para isso, selecionamos como objeto de estudo as Unidades Fraseológicas Especializadas (UFEs), importantes porque são estruturas inerentes aos textos especializados e porque costumam representar dificuldade para processo tradutório, tanto no seu reconhecimento como uma unidade fraseológica, quanto na sua transposição para uma outra língua. Além disso, este trabalho se justifica pelo fato de que os estudos em Fraseologia Especializada são ainda muito recentes e carecem de pesquisas mais aprofundadas, principalmente no que diz respeito à sua interface com a tradução. Como base teórica, valemo-­‐nos dos pressupostos da Teoria Comunicativa da Terminologia (TCT), segundo os quais seus objetos de estudo, analisados em situações reais de comunicação, são unidades das línguas naturais que são ativadas pragmaticamente, isto é, adquirem caráter especializado de acordo com seu uso em um âmbito específico. Buscando coerência em nossa fundamentação teórica, tomamos a contribuição de Hurtado Albir (2001), considerando a tradução como um processo comunicativo, além de textual e cognitivo, no qual se deve levar em conta o contexto no qual se insere e a finalidade que comporta. O corpus para extração das UFEs foi formado por oito livros da área da Educação e suas respectivas traduções para o português, totalizando, aproximadamente, um milhão de palavras em cada língua. Através da ferramenta AntConc, extraímos as UFEs dos corpora de originais e traduções a partir dos termos listados nos glossários apresentados ao final de cada livro e do critério de frequência de aparição nos corpora. Para a realização de nosso objetivo principal, decidimos analisar as unidades originais e suas traduções, identificando as técnicas empregadas pelos tradutores para o estabelecimento de um equivalente, a partir de quatro propostas de categorizações que se destacam nos estudos tradutórios por sua relevância e importância: Vinay e Darbelnet (1958), Barbosa (1990), Aubert (1998) e Hurtado Albir (2001). A partir desta análise, propusemos uma nova categorização de técnicas, de acordo com a revisão realizada chegando às seguintes técnicas: tradução literal, tradução palavra por palavra, transposição, modulação, equivalência consagrada, ampliação linguística, compressão linguística e variação lexical. Por fim, destacamos a confirmação de que as UFEs são Unidades de Tradução e que a equivalência estabelecida entre estas unidades é dinâmica, flexível e relativa. / Considerando el contexto expresivamente globalizado en el que nos encontramos hoy en día, la traducción de textos especializados asume un rol cada vez más importante, mediando la comunicación entre expertos e interesados de las más diversas áreas del conocimiento humano. Es con el objetivo de contribuir para los estudios en Traducción y Terminología que esta investigación ha sido realizada, buscando ofrecer resultados que faciliten la comunicación especializada en contextos de traducción en la dirección español-­‐portugués, auxiliando profesionales a producir textos adecuados y precisos. Para ello, seleccionamos como objeto de estudio las Unidades Fraseológicas Especializadas (UFEs), importantes porque son estructuras inherentes a los textos especializados y porque suelen representar dificultad para el proceso de traducción, tanto en su reconocimiento como unidad fraseológica como en su transposición para otro idioma. Además de eso, este trabajo se justifica por el hecho de que los estudios en Fraseología Especializada son todavía muy recientes y carecen de investigaciones más profundizadas, principalmente en su interfaz con la traducción. Como base teórica nos valemos de los principios de la Teoría Comunicativa de la Terminología (TCT), según los cuales sus objetos de estudio, analizados en situaciones reales de comunicación, son unidades de las lenguas naturales que se activan pragmáticamente, es decir, adquieren carácter especializado de acuerdo con su uso en un ámbito específico. Buscando coherencia en nuestra fundamentación teórica, tomamos los aportes de Hurtado Albir (2001), considerando la traducción como un proceso comunicativo, además de textual y cognitivo, en el que se debe tener en cuenta el contexto en el que se inserta y la finalidad que comporta. A través de la herramienta AntConc, extrajimos las UFEs de los corpus de originales y traducciones a partir de los términos listados en los glosarios presentados al final de cada libro y del criterio de frecuencia de aparición en los corpus. Decidimos, entonces, analizar las unidades originales y sus traducciones, identificando las técnicas empleadas por los traductores para establecer un equivalente, desde cuatro propuestas de categorizaciones que se destacan en los estudios traductológicos por su relevancia e importancia: Vinay e Darbelnet (1958), Barbosa (1990), Aubert (1998) y Hurtado Albir (2001). Con este análisis, propusimos una nueva categorización de técnicas, llegando a las siguientes: traducción literal, traducción palabra por palabra, transposición, modulación, equivalencia cuñada, ampliación lingüística, comprensión lingüística y variación lexical. Finalmente, destacamos la confirmación de que las UFEs son Unidades de Traducción y que la equivalencia establecida entre estas unidades es dinámica, flexible y relativa.
5

Verblexpor : um recurso léxico com anotação de papéis semânticos para o português

Zilio, Leonardo January 2015 (has links)
Esta tese propõe um recurso léxico de verbos com anotação de papéis semânticos, denominado VerbLexPor, baseado em recursos como VerbNet, PropBank e FrameNet. As bases teóricas da proposta são interdisciplinares e retiradas da Linguística de Corpus e do Processamento de Linguagem Natural (PLN), visando-se a contribuir para a Linguística e para a Computação. As hipóteses de pesquisa são: a) um mesmo conjunto de papéis semânticos pode ser aplicado a diferentes gêneros textuais; e b) as diferenças entre esses gêneros se destacam no ranqueamento dos papéis semânticos. O desenvolvimento do VerbLexPor se apoia em dois corpora: um especializado, com mais de 1,6 milhão de palavras, composto por artigos científicos de Cardiologia de três periódicos brasileiros; e um não especializado, com mais de 1 milhão de palavras composto por artigos do jornal popular Diário Gaúcho. Os corpora foram anotados com o parser PALAVRAS, e as informações de sentenças, verbos e argumentos foram extraídas e armazenadas em um banco de dados. O VerbLexPor tem 192 verbos e mais de 15 mil argumentos anotados distribuídos em mais de 6 mil sentenças. Observou-se que o corpus do Diário Gaúcho privilegia uma sintaxe direta e pouco uso de voz passiva e adjuntos, enquanto o corpus de Cardiologia apresenta mais voz passiva e um maior uso de INSTRUMENTOS na posição de sujeito, além de uma menor incidência de AGENTES. Foram realizados também alguns experimentos paralelos, como a anotação de papéis semânticos por vários anotadores e o agrupamento automático de verbos. Na tarefa de múltiplos anotadores, cada um anotou exatamente as mesmas 25 orações. Os anotadores receberam um manual de anotação e um treinamento básico (explicação sobre a tarefa e dois exemplos de anotação). Usou-se o cálculo de multi-π para avaliar a concordância entre os anotadores, e o resultado foi de π = 0,25. Os motivos para essa concordância baixa podem estar na falta de um treinamento mais completo. A tarefa de agrupamento de verbos mostrou que a sintaxe e a semântica são igualmente importantes para o agrupamento. Este estudo contribui para a área de Linguística, com um léxico de verbos anotados semanticamente, e também para a Computação, com dados que podem ser consultados e processados para diversas aplicações do PLN, principalmente por estarem disponíveis nos formatos XML e SQL. / This dissertation aims at developing a lexical resource of verbs annotated with semantic roles, called VerbLexPor, and based on other resources, such as VerbNet, PropBank, and FrameNet. The theoretical bases of this study lies in Corpus Linguistics and Natural Language Processing (NLP), so that it aims at contributing to both Linguistics and Computer Science. The hypotheses are: a) one set of semantic roles can be applied to different genres; and b) the differences among genres are shown by the ranking of semantic roles. The development of VerbLexPor has two corpora at the basis: a specialized one, with more than 1.6 million words, composed by scientific papers in the field of Cardiology from three Brazilian journals; and a non-specialized one, with more than 1 million words, composed by newspaper articles from Diário Gaúcho. The corpora were analyzed with the parser PALAVRAS, and sentence, verb and argument information was extracted and stored in a database. VerbLexPor has 192 verbs and more than 15 thousand arguments annotated with semantic roles, distributed among more than 6 thousand sentences. We observed that Diário Gaúcho has a more direct syntax, with less passive voice and adjuncts, while Cardiology has more passive voice and more INSTRUMENTS for subjects, and fewer AGENTS. We also conducted some parallel experiments, such as semantic role labeling with multiple annotators and automatic verbal clustering. In the multiple annotators task, each of them annotated exactly the same 25 sentences. They received an annotation manual and basic training (explanation on the task and two annotation examples). We used multi-π to evaluate agreement among annotators, and results were π = 0,25. Reasons for this low agreement may be a lack of a thoroughly developed training. The verbal clustering task showed that syntax and semantics are equally important for verbal clustering. This study contributes to Linguistics, with a verbal lexicon annotated with semantic roles, and also to Computer Science, with data that can be assessed and processed for various NLP applications, especially because the data are available in both XML and SQL formats.
6

Verblexpor : um recurso léxico com anotação de papéis semânticos para o português

Zilio, Leonardo January 2015 (has links)
Esta tese propõe um recurso léxico de verbos com anotação de papéis semânticos, denominado VerbLexPor, baseado em recursos como VerbNet, PropBank e FrameNet. As bases teóricas da proposta são interdisciplinares e retiradas da Linguística de Corpus e do Processamento de Linguagem Natural (PLN), visando-se a contribuir para a Linguística e para a Computação. As hipóteses de pesquisa são: a) um mesmo conjunto de papéis semânticos pode ser aplicado a diferentes gêneros textuais; e b) as diferenças entre esses gêneros se destacam no ranqueamento dos papéis semânticos. O desenvolvimento do VerbLexPor se apoia em dois corpora: um especializado, com mais de 1,6 milhão de palavras, composto por artigos científicos de Cardiologia de três periódicos brasileiros; e um não especializado, com mais de 1 milhão de palavras composto por artigos do jornal popular Diário Gaúcho. Os corpora foram anotados com o parser PALAVRAS, e as informações de sentenças, verbos e argumentos foram extraídas e armazenadas em um banco de dados. O VerbLexPor tem 192 verbos e mais de 15 mil argumentos anotados distribuídos em mais de 6 mil sentenças. Observou-se que o corpus do Diário Gaúcho privilegia uma sintaxe direta e pouco uso de voz passiva e adjuntos, enquanto o corpus de Cardiologia apresenta mais voz passiva e um maior uso de INSTRUMENTOS na posição de sujeito, além de uma menor incidência de AGENTES. Foram realizados também alguns experimentos paralelos, como a anotação de papéis semânticos por vários anotadores e o agrupamento automático de verbos. Na tarefa de múltiplos anotadores, cada um anotou exatamente as mesmas 25 orações. Os anotadores receberam um manual de anotação e um treinamento básico (explicação sobre a tarefa e dois exemplos de anotação). Usou-se o cálculo de multi-π para avaliar a concordância entre os anotadores, e o resultado foi de π = 0,25. Os motivos para essa concordância baixa podem estar na falta de um treinamento mais completo. A tarefa de agrupamento de verbos mostrou que a sintaxe e a semântica são igualmente importantes para o agrupamento. Este estudo contribui para a área de Linguística, com um léxico de verbos anotados semanticamente, e também para a Computação, com dados que podem ser consultados e processados para diversas aplicações do PLN, principalmente por estarem disponíveis nos formatos XML e SQL. / This dissertation aims at developing a lexical resource of verbs annotated with semantic roles, called VerbLexPor, and based on other resources, such as VerbNet, PropBank, and FrameNet. The theoretical bases of this study lies in Corpus Linguistics and Natural Language Processing (NLP), so that it aims at contributing to both Linguistics and Computer Science. The hypotheses are: a) one set of semantic roles can be applied to different genres; and b) the differences among genres are shown by the ranking of semantic roles. The development of VerbLexPor has two corpora at the basis: a specialized one, with more than 1.6 million words, composed by scientific papers in the field of Cardiology from three Brazilian journals; and a non-specialized one, with more than 1 million words, composed by newspaper articles from Diário Gaúcho. The corpora were analyzed with the parser PALAVRAS, and sentence, verb and argument information was extracted and stored in a database. VerbLexPor has 192 verbs and more than 15 thousand arguments annotated with semantic roles, distributed among more than 6 thousand sentences. We observed that Diário Gaúcho has a more direct syntax, with less passive voice and adjuncts, while Cardiology has more passive voice and more INSTRUMENTS for subjects, and fewer AGENTS. We also conducted some parallel experiments, such as semantic role labeling with multiple annotators and automatic verbal clustering. In the multiple annotators task, each of them annotated exactly the same 25 sentences. They received an annotation manual and basic training (explanation on the task and two annotation examples). We used multi-π to evaluate agreement among annotators, and results were π = 0,25. Reasons for this low agreement may be a lack of a thoroughly developed training. The verbal clustering task showed that syntax and semantics are equally important for verbal clustering. This study contributes to Linguistics, with a verbal lexicon annotated with semantic roles, and also to Computer Science, with data that can be assessed and processed for various NLP applications, especially because the data are available in both XML and SQL formats.
7

Conceptualização metafórica da anatomia em português : artérias, veias e nervos

Malaszkiewicz, Paula Fernanda January 2013 (has links)
D’abord uniquement considérée comme un outil rhétorique et une figure littéraire liée à la poésie et la littérature, la métaphore a ensuite commencé à être étudiée du point de vue conceptuel à partir des années 1980. En plus d’être présente dans la vie quotidienne, la métaphore conceptuelle a, depuis, été aussi reconnue dans les sciences. L’une des manières de saisir la conceptualisation métaphorique d’un domaine de connaissance est le repérage des indices de conceptualisation métaphorique, entendus comme des unités lexicales permettant de conceptualiser métaphoriquement un des leurs actants sur le plan cognitif grâce à une impression de dissonance lieé à la coexistence des représentations fictives et factives. La connaissance des indices et des modes de conceptualisation est fondamentale pour comprendre la spécificité d’un domaine spécialisé, car elle est liée à la phraséologie de ce domaine. Dans ce sens, elle a de l’influence sur la traduction, qui ne se résume pas à une recherche d'équivalence, mais qui tient plutôt compte de la finalité et de la fonction, ainsi que du contexte socioculturel dans lequel se situe le texte. Partant de là, les objectifs de la recherche sont les suivants : identifier et décrire les indices de conceptualisation métaphorique utilisés en anatomie dans la description du positionnement des artères, des veines et des nerfs et les classer afin de repérer des modèles ou les spécificités liées à chacune de ces structures. Le corpus est composé d’ouvrages de référence d’anatomie topographique et descriptive rédigés directement en portugais ou traduits par des anatomistes, et qui contiennent des descriptions de la tête, du cou, de l’épaule, du bras et de la cuisse. Il s’agissait de rechercher les descriptions des vaisseaux – artères et veines – et des nerfs au-dessus et en-dessous du coeur, pour ensuite d Puis ces indices ont été répartis dans des catégories de représentations fictives, selon les modes de conceptualisation identifiés. Les résultats obtenus sont un outil de réflexion pour le traducteur ce quelle que soit sa langue de départ, car la connaissance des indices et modes de conceptualisation métaphorique en langue portugaise rend le texte d’arrivée plus idiomatique et mieux accepté par les lecteurs de cette langue. / Anteriormente considerada apenas como uma ferramenta de retórica e uma figura literária, ligada à poesia e à literatura, a metáfora passou a ser estudada também do ponto de vista conceptual a partir dos anos 1980. Além de sua presença na vida cotidiana, a metáfora conceptual também teve, desde então, sua presença e importância reconhecidas nas ciências. Uma maneira de apreender a conceptualização metafórica que rege uma área especializada é a identificação dos índices de conceptualização metafórica, entendidos como unidades léxicas que permitem conceptualizar metaforicamente um de seus actantes no plano cognitivo graças a uma impressão de dissonância ligada à coexistência das representações factivas e fictícias. O conhecimento dos índices e do modo de conceptualização é fundamental para compreender a especificidade de uma área especializada, pois, está diretamente ligado à fraseologia dessa área. Assim sendo, ele tem influência na tradução, que não se reume a uma busca da equivalência, mas sobretudo leva em conta a finalidade e a função, assim como o contexto sociocultural em que o texto está inserido. Dessa maneira, este trabalho tem como objetivos: identificar e descrever os índices de conceptualização metafórica utilizados em Anatomia na descrição do posicionamento das artérias, das veias e dos nervos e categorizá-los, a fim de buscar padrões ou especificidades relacionadas a cada uma das estruturas acima mencionadas. Para a realização deste trabalho, foi montado um corpus composto por obras de referência de Anatomia Topográfica e Descritiva, escritas originalmente em português ou traduzidas por anatomistas, contendo descrições da cabeça, pescoço, ombro, braço e coxa, a fim de buscar descrições relativas aos vasos – artérias e veias – e nervos acima e abaixo do coração. A partir dessas descrições, foram buscados os índices de conceptualização metafórica em língua portuguesa. Em seguida, esses índices foram distribuídos em categorias de representação fictícia, conforme os modos de conceptualização identificados. Esses resultados são uma ferramenta de reflexão para o tradutor, independentemente da sua língua de partida, visto que o conhecimento dos índices e dos modos de conceptualização metafórica em língua portuguesa vai tornar o texto de chegada mais idiomático e mais facilmente aceito pelos leitores dessa língua.
8

A variação morfossintática na terminologia

Diegues, Cléo de Souza January 2013 (has links)
A presente pesquisa propõe um estudo acerca das variações lingüísticas presentes no âmbito das linguagens especializadas. Especificamente, realizou-se o estudo das variações denominativas, entendidas como formas linguísticas diferentes cujo significado é equivalente, em CLEs (Combinatórias Lexicais Especializadas), isto é, expressões linguísticas polilexicais, formadas por um núcleo terminológico e respectivos coocorrentes. Procedeu-se à classificação e consideração de todos os tipos de variações encontradas para tais combinatórias, a saber: gráfica, morfossintática, lexical e redução. O foco de análise, no entanto, esteve calcado na variação morfossintática. O objetivo da análise foi a busca de elementos contextuais que estivessem condicionando ou indicando a presença da variação morfossintática. A partir da detecção das causas da variação e posterior busca por elementos formais que refletissem tais causas, realizou-se a sistematização de tais elementos, com o intuito de fornecer subsídios para o estabelecimento de regras informatizadas que pudessem auxiliar na criação futura de um programa de extração automática de variações. A análise foi efetuada a partir de quatro corpora pertencentes às áreas de Cardiologia, Gestão Ambiental, Enfermagem e Informática que pudessem estar equiparados quanto à situação comunicativa e contribuir para a sistematização da variação especializada em diferentes âmbitos do conhecimento. Toda a pesquisa foi orientada pelas correntes teóricas atuais da Terminologia Comunicativa, que direcionam o olhar para a caracterização das diferentes situações em que dada comunicação se estabelece para levar a cabo o estudo de termos e CLEs. A partir dos dados coletados e de sua análise, verificou-se que uma sistematização da variação morfossintática terminológica é possível. Encontraram-se elementos formais presentes no contexto imediato em que as CLEs ocorreram que poderão servir de indícios para a detecção automatizada de CLEs. / La presente investigación propone un estudio acerca de las variaciones lingüísticas presentes en el ámbito de los lenguajes especializados. Específicamente, se realizó el estudio de las variaciones denominativas, comprendidas como formas lingüísticas diferentes de significado equivalente, en las CLEs (Combinatorias Léxicas Especializadas), es decir, expresiones lingüísticas poliléxicas, formadas por un núcleo terminológico y sus respectivos coucurrentes. Se efectuó la clasificación y consideración de todos tipos de variaciones encontradas para estas combinatorias: gráfica, morfosintáctica, léxica y reducciones. Sin embargo, el centro de análisis estuvo sobre la variación morfosintáctica. El reto del análisis fue la búsqueda de elementos contextuales que condicionan o indican la existencia de variación morfosintáctica. A partir de la detección de las causas de variación y posterior búsqueda por elementos formales que reflejaran tales causas, se buscó la sistematización de estos elementos para el establecimiento de subsidios para la creación de reglas informatizadas que pudieran auxiliar en la construcción futura de un programa de extracción automática de variaciones. El análisis se llevó a cabo a partir de cuatro corpora pertenecientes a las áreas de Cardiología, Gestión Ambiental, Enfermería e Informática que pudieran equipararse respecto a la situación comunicativa y contribuir para la sistematización de la variación especializada en diferentes ámbitos del conocimiento. Toda la investigación se basó en las actuales corrientes de la Terminología Comunicativa, que miran hacia la caracterización de las diferentes situaciones en que una comunicación se establece para entender el funcionamiento de términos y CLEs. Con la recolección de los datos y su análisis, se verificó que una sistematización de la variación morfosintáctica terminológica es posible. Fue posible encontrar elementos formales presentes en el contexto inmediato donde las CLEs ocurrieron que resultan en indicios para la detección automática de las CLEs.
9

Configurações morfológicas e sintáticas do vocabulário brasileiro de ginástica artística

Furian, Ediméia January 2012 (has links)
Os expressivos resultados obtidos nos últimos anos por ginastas brasileiros em campeonatos de ginástica artística de nível mundial têm favorecido a divulgação desse esporte no Brasil, mas ainda é escassa a produção de materiais terminográficos, como glossários ou dicionários, que promovam uma aproximação do público com a linguagem especializada da área. Este trabalho quer indicar bases para a produção desse tipo de material, através do estudo dos nomes atribuídos, no português brasileiro, a movimentos, aparelhos e tudo mais que compõe o universo da modalidade. Obedecendo aos pressupostos da Teoria Comunicativa da Terminologia e da Socioterminologia, esta pesquisa se propôs a recolher uma lista de unidades terminológicas brasileiras da ginástica artística e a analisar a constituição morfológica e sintática dessas unidades, investigando a possibilidade de se indicar alguma recorrência em seus processos de formação, bem como a analisar as variantes terminológicas desse léxico. A observação dos dados mostrou a) menor influência do que a suposta em relação aos empréstimos linguísticos; b) predomínio de palavras primitivas sobre as derivadas ou compostas e, entre as derivadas, prevalência da derivação sufixal e da derivação regressiva; c) predomínio das variantes do tipo concorrentes. / In the past few years Brazilian gymnasts have been achieving outstanding results in worldwide artistic gymnastics championships favoring the spreading of the sport in Brazil, but the production of terminological materials, such as glossaries and dictionaries, which approach the public to the specialized language, is still insufficient. This research aims at offering some bases for the building of these materials by studying the Brazilian Portuguese terms regarding this sport modality. Based on the Communicative Theory of Terminology and on the Socioterminology, this research gathers a list of artistic gymnastics terms and analyzes their morphological construction in order to point out any recurrence in their processes of formation, as well as analyze the terminological variants of this lexicon. The data showed a) less influence than expected concerning linguistic borrowing; b) predominance of primitive words in comparison with derived words and, among the derived ones, prevalence of agglutination and conversion; c) preponderance of concurrent variants.
10

Conceptualização metafórica da anatomia em português : artérias, veias e nervos

Malaszkiewicz, Paula Fernanda January 2013 (has links)
D’abord uniquement considérée comme un outil rhétorique et une figure littéraire liée à la poésie et la littérature, la métaphore a ensuite commencé à être étudiée du point de vue conceptuel à partir des années 1980. En plus d’être présente dans la vie quotidienne, la métaphore conceptuelle a, depuis, été aussi reconnue dans les sciences. L’une des manières de saisir la conceptualisation métaphorique d’un domaine de connaissance est le repérage des indices de conceptualisation métaphorique, entendus comme des unités lexicales permettant de conceptualiser métaphoriquement un des leurs actants sur le plan cognitif grâce à une impression de dissonance lieé à la coexistence des représentations fictives et factives. La connaissance des indices et des modes de conceptualisation est fondamentale pour comprendre la spécificité d’un domaine spécialisé, car elle est liée à la phraséologie de ce domaine. Dans ce sens, elle a de l’influence sur la traduction, qui ne se résume pas à une recherche d'équivalence, mais qui tient plutôt compte de la finalité et de la fonction, ainsi que du contexte socioculturel dans lequel se situe le texte. Partant de là, les objectifs de la recherche sont les suivants : identifier et décrire les indices de conceptualisation métaphorique utilisés en anatomie dans la description du positionnement des artères, des veines et des nerfs et les classer afin de repérer des modèles ou les spécificités liées à chacune de ces structures. Le corpus est composé d’ouvrages de référence d’anatomie topographique et descriptive rédigés directement en portugais ou traduits par des anatomistes, et qui contiennent des descriptions de la tête, du cou, de l’épaule, du bras et de la cuisse. Il s’agissait de rechercher les descriptions des vaisseaux – artères et veines – et des nerfs au-dessus et en-dessous du coeur, pour ensuite d Puis ces indices ont été répartis dans des catégories de représentations fictives, selon les modes de conceptualisation identifiés. Les résultats obtenus sont un outil de réflexion pour le traducteur ce quelle que soit sa langue de départ, car la connaissance des indices et modes de conceptualisation métaphorique en langue portugaise rend le texte d’arrivée plus idiomatique et mieux accepté par les lecteurs de cette langue. / Anteriormente considerada apenas como uma ferramenta de retórica e uma figura literária, ligada à poesia e à literatura, a metáfora passou a ser estudada também do ponto de vista conceptual a partir dos anos 1980. Além de sua presença na vida cotidiana, a metáfora conceptual também teve, desde então, sua presença e importância reconhecidas nas ciências. Uma maneira de apreender a conceptualização metafórica que rege uma área especializada é a identificação dos índices de conceptualização metafórica, entendidos como unidades léxicas que permitem conceptualizar metaforicamente um de seus actantes no plano cognitivo graças a uma impressão de dissonância ligada à coexistência das representações factivas e fictícias. O conhecimento dos índices e do modo de conceptualização é fundamental para compreender a especificidade de uma área especializada, pois, está diretamente ligado à fraseologia dessa área. Assim sendo, ele tem influência na tradução, que não se reume a uma busca da equivalência, mas sobretudo leva em conta a finalidade e a função, assim como o contexto sociocultural em que o texto está inserido. Dessa maneira, este trabalho tem como objetivos: identificar e descrever os índices de conceptualização metafórica utilizados em Anatomia na descrição do posicionamento das artérias, das veias e dos nervos e categorizá-los, a fim de buscar padrões ou especificidades relacionadas a cada uma das estruturas acima mencionadas. Para a realização deste trabalho, foi montado um corpus composto por obras de referência de Anatomia Topográfica e Descritiva, escritas originalmente em português ou traduzidas por anatomistas, contendo descrições da cabeça, pescoço, ombro, braço e coxa, a fim de buscar descrições relativas aos vasos – artérias e veias – e nervos acima e abaixo do coração. A partir dessas descrições, foram buscados os índices de conceptualização metafórica em língua portuguesa. Em seguida, esses índices foram distribuídos em categorias de representação fictícia, conforme os modos de conceptualização identificados. Esses resultados são uma ferramenta de reflexão para o tradutor, independentemente da sua língua de partida, visto que o conhecimento dos índices e dos modos de conceptualização metafórica em língua portuguesa vai tornar o texto de chegada mais idiomático e mais facilmente aceito pelos leitores dessa língua.

Page generated in 0.4929 seconds