171 |
Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro /Di Felippo, Ariani. January 2008 (has links)
Orientador: Bento Carlos Dias da Silva / Banca: Stella Esther Ortweiller Tagnin / Banca: Cláudia Zavaglia / Banca: Beatriz Nunes de Oliveira Longo / Banca: Rosane de Andrade Berlinck / Resumo: Devido a vários fatores, como saliência perceptual e relevância semiótica, as línguas apresentam repertórios diferentes de conceitos lexicalizados (isto é, conceitos expressos por unidades lexicais). As divergências léxico-conceituais dificultam o tratamento computacional das línguas naturais em tarefas como tradução automática e recuperação de informação multilíngüe. Assim, a construção de base de dados lexicais bilíngües e multilíngües em que as unidades de línguas distintas estão inter-relacionadas por meio do conceito a elas subjacente tem recebido muita atenção no Processamento Automático das Línguas Naturais (PLN). Para o português brasileiro (PB), faz-se urgente a construção desse tipo de recurso. Nesse cenário, esta tese visa a investigar os padrões de lexicalização do PB e a construir um recurso léxicoconceitual, ainda que de extensões reduzidas, que possa auxiliar o processamento automático dessa língua em meio escrito. Assumindo-se a concepção de PLN enquanto "uma engenharia da linguagem humana", utilizou-se uma metodologia tripartida que divide as atividades nos domínios: lingüístico, lingüístico-computacional e computacional. Este trabalho, em especial, não realizou as atividades previstas no terceiro domínio, pois estas não fazem parte do escopo desta pesquisa. No domínio lingüístico, um conjunto de conceitos lexicalizados no inglês norte-americano (AmE), extraído da WordNet de Princeton (WN.Pr), foi delimitado por meio da análise manual de recursos estruturados (base de dados e dicionários) e não-estruturados (corpora textuais). Na seqüência, as expressões do PB (em especial, as unidades lexicais) que materializam tais conceitos foram manualmente extraídas de dicionários bilíngües (AmE-PB), dicionários monolíngües e thesaurus e de corpora textuais do PB. No domínio lingüístico-computacional... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: Because of several factors, including, for instance, perceptual salience and semiotic relevance, languages have different inventories of lexicalized concepts (i.e. concepts expressed by lexical units). The lexical-conceptual divergences are a hindrance to computational treatment of natural languages in tasks such as machine translation and cross-language information retrieval. Therefore, the construction of bilingual and multilingual lexical databases, in which the lexical units of different languages are aligned by their underlying concepts, has become a very important research topic in Natural Language Processing (NLP). For Brazilian Portuguese (BP), in particular, the construction of such resources is urgent. In this scenario, this thesis aims to investigate lexicalization patterns of BP and to develop a lexical-conceptual resource for the automatic processing of written BP language. Assuming a compromise between NLP and Linguistics, this work follows a three-domain approach methodology, which claims that the research activities should be divided into the linguistic, linguisticcomputational, and computational domains. In particular, this research does not perform the last step, since it is not in the scope of this work. Accordingly, in the linguistic domain, a set of lexicalized concepts of North-American English (AmE) extracted from Princeton WordNet (WN.Pr) was selected through manual analysis of the structured (lexical databases and standard dictionaries) and unstructured resources (textual corpora). Given those concepts, their lexical and phrasal expressions in BP were manually compiled from bilingual dictionaries, with the help of standard monolingual dictionaries, thesauri, and textual corpora. In the linguistic-computational domain, the lexicalized concepts of AmE and BP previously identified were aligned by means of a semantic structured interlingua (or ontology)... (Complete abstract click electronic access below) / Doutor
|
172 |
Lexicografia, metalexicografia e natureza da iconicidade da Língua de Sinais Brasileira (Libras) / Lexicography, Metalexicography and the Nature of Iconicity in Brazilian Sign Language (Libras)Martins, Antonielle Cantarelli 09 June 2017 (has links)
Esta tese de doutorado deriva do programa de Pesquisa e Desenvolvimento em Geração de Dicionários da Língua de Sinais Brasileira (Libras) conduzido pelo Professor Capovilla no último quarto de século. A tese pertence aos campos da lexicologia, lexicografia e metalexicografia. A tese foca na pesquisa lexicográfica que a autora conduziu como coautora do Dic-Brasil: Dicionário da Língua de Sinas do Brasil (Capovilla, Raphael, Temoteo, & Martins, 2017a, 2017b, 20917c) nos estados do Rio Grande do Sul, Santa Catarina, Paraná e no Distrito Federal . Ela descreve as estratégias usadas para estudar o léxico de Libras, e compara as estratégias lexicográficas usadas em seis dicionários clássicos, três dos quais d e Libras e os outros três da Língua de Sinais Americana. A tese analisa o papel que a iconicidade do sinal desempenha nos dicionários de sinais, e compara diferentes modos com que a iconicidade é tratada nesses seis dicionários clássicos de língua de sinai s. De modo a aumentar a eficácia pragmática com que os dicionários representam sinais, esta tese analisa o papel desempenhado pelas ilustrações e descrições, tanto da forma do sinal quanto de seu significado; bem como da iconicidade, etimologia e morfologi a do sinal. A tese descreve um estudo sobre a iconicidade dos sinais, e analisa a relação entre o grau em que a forma de um sinal pode ser considerada admissível para representar um dado significado e o grau em que esse significado pode ser efetivamente ad ivinhado. Sinais icônicos têm significado admissível e adivinhável. O paradoxo na bibliografia é que sinais não adivinháveis são considerados admissíveis. No estudo analisando relação entre admissibilidade e adivinhabilidade, 70 sujeitos ingênuos (Grupos 1 e 2) observaram 201 sinais (Conjuntos A e B). Sujeitos do Grupo 1 julgavam a admissibilidade dos sinais do Conjunto A (atribuindo nota numa escala Likert: - 2, - 1, +1, +2) e adivinhavam o significado dos sinais do Conjunto B. Sujeitos do Grupo 2 faziam o o posto: julgavam a admissibilidade dos sinais do Conjunto B e adivinhavam significado dos sinais do Conjunto A. Resultados revelaram que s ujeitos julgaram 28 sinais como inadmissíveis (Adm M - 1), 77 como admissíveis (+1 Adm M ), e 96 como neutros ( - 1,00< Adm M <+1,00). Dos 201 sinais, adivinharam somente 24 (+1 Adv M ), todos os quais haviam sido previamente considerados admissíveis pelo outro grupo. Nenhum sinal que foi considerado inadmissíve l por um grupo chegou a ser adivinhado pelo outro. Logo, a admissibilidade de um sinal parece ser condição necessária para a adivinhabilidade desse sinal, e correlacionada positivamente com essa adivinhabilidade. O estudo sugere que, aparentemente, a admis sibilidade só passa a predizer fortemente a adivinhabilidade quando essa admissibilidade ultrapassar certo limiar de forte admissibilidade, que está localizado em algum ponto entre 1,50 e 1,75 (i.e., 1,50 Adm M 1,75) na escala Likert / This doctoral dissertation springs from the Research and Development Program on Brazilian Sign Language (Libras) Dictionaries conducted by Professor Capovilla and students at the University of Sao Paulo over the last 25 years. The dissertation pertains to Libras lexicology, lexicography, and metalexicography. The dissertation centers on the lexicographic research that the author has conducted as coauthor of the Dic-Brasil: Libras Dictionary (Capovilla, Raphael, Temoteo, & Martins, 2017a, 2017b, 20917c). It describes the strategies used for studying Libras lexicon, and compares lexicographic strategies used in six classic dictionaries, three of which on Libras, and the other three on American Sign Language. The dissertation analyzes the role of sign iconicity in sign dictionaries. It compares different ways in which iconicity is dealt with in six classic sign language dictionaries. In order to increase the pragmatic efficacy with which dictionaries represent signs, the present dissertation analyzes the role played by both illustration and description of both sign form and sign meaning, as well as by descriptions of sign iconicity, etymology and morphology. The dissertation describes a study on sign iconicity that analyzes the relationship between sign admissibility and sign guessability. Signs are iconic when their meaning is admissible and can be guessed. Paradoxically, while only 10% of sign meaning can be guessed, the remaining 90% of signs that cannot be guessed are considered admissible, once the observer is informed about what they mean. In the study, 70 naive subjects (Groups 1 and 2) examined 201 signs (Sets A and B). Group 1 subjects rated the admissibility of Set A signs (using a Likert scale: -2, -1, +1, +2) and guessed the meaning of Set B signs. Group 2 did the opposite. Results showed that: Subjects rated 28 signs as inadmissible (average rating -1), 77 signs as admissible (average rating +1), and 96 signs as neutral (-.99 average rating +.99). Only 24 of 201 signs were effectively guessed (average rating +1), all of which had been regarded as being admissible by the other group subjects. No sign that had been regarded as inadmissible ended up being guessed. Therefore, admissibility seemed necessary for guessability and positively correlated with it. Yet it seemed insufficient for guessability. The data suggests that, apparently, sign admissibility can only predict sign guessability when admissibility surpasses a given threshold of strong admissibility, which is located somewhere in between 1.5 and 1.75 point (1,50 average rating 1,75) in the Likert scale
|
173 |
Reflexões sobre a variação terminológica na lexicografia corrente no Brasil e a construção das bases teórico-metodológicas para o dicionário de lexicografia brasileira /Costa, Lucimara Alves da Conceição January 2015 (has links)
Orientador: Claudia Zavaglia / Banca: Maria Teresa Cabré Castellví / Banca: Maria da Graça Krieger / Banca: Paula Tavares Pinto / Banca: Maria Cristina Parreira da Silva / Resumo: Esta pesquisa tem por objetivo refletir sobre o fenômeno da variação terminológica em uso na Lexicografia no Brasil. Tendo como base os pressupostos da Teoria Comunicativa da Terminologia (TCT), entendemos que os termos, como unidades inseridas em um contexto e discurso especializado, são mutáveis e passíveis de variação, tanto na denominação (variação denominativa), quanto no conceito (variação conceitual). Entretanto, neste trabalho, detemonos apenas na variação denominativa sem e com consequências cognitivas. Para análise dos dados, elaboramos um córpus especializado constituído de 300 textos de tipologia variada do domínio da Lexicografia, escritos em português do Brasil. Por meio da utilização dos programas computacionais Wordsmith Tools e Terminus, foi-nos possível extrair os candidatos a termos do córpus, selecionar os contextos definitórios apresentados dos mesmos e analisar como se verificava o fenômeno da variação. Por fim, organizamos e apresentamos as informações obtidas na proposta do Dicionário de Lexicografia Brasileira - DLB -, que tem como objetivo apresentar uma organização macro e microestrutural que possa auxiliar as atividades de compreensão, produção e comunicação de um público-alvo direcionado a estudantes e especialistas dessa área de estudo / Abstract: This research aims at reflecting on the phenomenon of terminological variation in use in Lexicography, in Brazil. Relying on the premise of the Communicative Theory of Terminology (CTT), we understand that the terms, as units inserted in a specialized context and discourse, are mutable and prone to variation, both in terms of denomination (denominative variation), and concept (conceptual variation). However, our study focuses only on the denominative variation with and without cognitive consequences. In order to analyze the data, we have built a specialized corpus constituted of 300 texts, with varying typology in the domain of Lexicography, written in Brazilian Portuguese. By resorting to computational softwares such as Wordsmith Tools and Terminus, it was feasible to retrieve eligible terms in our corpus, and select their defining contexts and analyze how the phenomenon of variation unfolds. Lastly, we organized and showed the obtained information as a proposal for a Dictionary of Brazilian Lexicography - DBL -, which aims at showing a macro and microstructural organization as a resource for comprehension, production and communication activities of a target audience made up of students and experts in this field of study / Resumen: Esta investigación tiene por objetivo reflexionar acerca del fenómeno de la variación terminológica en uso en la Lexicografía de Brasil. Basándonos en los postulados de la Teoría Comunicativa de la Terminología (TCT), entendemos que los términos, unidades insertadas en un contexto y discurso especializado, son cambiables y susceptibles a la variación, tanto en la denominación (la variación denominativa), como en el concepto (la variación conceptual). No obstante, en ese estudio nos detendremos únicamente en la variación denominativa sin y con consecuencias cognitivas. Para análisis de los datos elaboramos un corpus técnico compuesto por 300 textos de tipología variada del dominio de la Lexicografía, escritas en portugués de Brasil. A través de la utilización de los programas computacionales Wordsmith Tools y Terminus, ha sido posible extraer los candidatos a términos del corpus, seleccionar los contextos definitorios presentados y analizar cómo se verificaba el fenómeno de la variación. Por fin, hemos organizado y hemos presentado las informaciones obtenidas en la propuesta de Diccionario de Lexicografía Brasileña - DLB-, que plantea presentar una organización macro y micro estructural que auxilie en las actividades de compresión, producción y comunicación direccionado a un público de estudiantes y expertos en esa área de estudio / Doutor
|
174 |
Proposta de um dicionário da cardiopatia congênita /Galdiano, Isabela. January 2016 (has links)
Orientador: Claudia Zavaglia / Banca: Érika Nogueira de Andrade Stupiello / Banca: Maria José Bocorny Finatto / Resumo: O presente trabalho tem como objetivo a investigação do léxico específico da cardiopatia congênita, subárea da Cardiologia, com vistas à elaboração de um dicionário de cardiopatia congênita direcionado para o público leigo (não especialista), o qual contém como entradas unidades lexicais especializadas (ULEs) em língua portuguesa, e que apresenta definições redigidas especificamente para esses usuários. Com o propósito de confeccionar tal dicionário, foi elaborado um corpus formado por textos em português (variante brasileira) da área da cardiopatia congênita, extraídos de sites da Web, capítulos de livros, teses e dissertações, monografias, trabalhos de conclusão de curso, artigos acadêmicos e de divulgação científica, notícias e resumos de artigos científicos e eventos. Para processar e analisar o corpus, foi utilizada a ferramenta WordSmith Tools, amplamente empregada em pesquisas do gênero. A análise da definição lexicográfica e terminográfica, conforme descritas na bibliografia de estudos da área, foi o embasamento para atender aos propósitos do dicionário, partindo da hipótese de que é possível elaborar, mesmo num âmbito especializado, definições de ULEs apropriadas para um leitor não especialista. Com foco na busca de estratégias e de modelos de definição, e com base na revisão bibliográfica realizada, foram eleitas as estratégias mais apropriadas para a redação de nossas definições. O produto lexicográfico conta com 70 verbetes, cada um com uma definição simplificada, exemplo de uso, sinônimos (se encontrados) e remissivas (se necessário) / Abstract: The aim of the present work is to investigate the lexical items of the area of Congenital Cardiopathy, a subarea of Cardiology, in order to compile a dictionary of Congenital Cardiopathy targeted especially at lay people (non-specialists), containing entries with specialised lexical units (SLUs) in Portuguese, and definitions specifically written for that kind of user. In order to develop the dictionary, a corpus was compiled with texts in Portuguese (Brazilian variety) about congenital cardiopathy extracted from websites, book chapters, theses, monographs, final year dissertations, academic papers, popular science magazines, newspaper articles and abstracts from academic papers and presentations. The software WordSmith Tools, broadly used in similar researches, was adopted to process and analyze the corpus. A study was conducted on lexicographic and terminological definitions as described in Lexicography and Terminology bibliography, looking for a basis to support the dictionary's purposes, and with the hypothesis that it is possible to develop, even within a specialized field and lexicon, definitions of specialized lexical units appropriate for non-specialized readers. Focusing on search strategies and models of definition, a bibliographic review was conducted, from which the most appropriate strategies for writing our definitions were chosen. The dictionary has 70 entries, each of them with a simplified definition, an example sentence, synonyms (if found) and cross references (if necessary) / Mestre
|
175 |
Proposta de uma base de conhecimento multilíngue on-line de expressões cromáticas da fauna e da flora /Martins, Sabrina de Cássia. January 2016 (has links)
Orientador: Claudia Zavaglia / Banca: Maria Teresa Cabré Castellví / Banca: Márcio Sales Santiago / Banca: Gládis Maria de Barcellos Almeida / Banca: Eliane Gonçalves de Freitas / Resumo: A presente tese tem como objeto de estudo a terminologia da Fauna e da Flora cuja formação envolve o uso do vocabulário das cores. Nosso estudo abrange dois temas gerais: por um lado, a contribuição dos nomes de cores para a variação denominativa em terminologia a partir de uma perspectiva interlinguística; por outro, a descrição de tais variantes em uma obra lexicográfica especializada e multilíngue. A fim de delimitar a nossa pesquisa, concentramo-nos na análise de dois subdomínios da Biologia: a Botânica, especificamente as Angiospermas (monocotiledôneas e eudicotiledôneas), e a Zoologia, exclusivamente os Vertebrados (peixes, anfíbios, répteis, aves e mamíferos). Dessa forma, visamos, em primeiro lugar, ampliar o Dicionário Onomasiológico de Expressões Cromáticas da Fauna e Flora por meio da inserção em sua microestrutura dos correspondentes das palavras-entrada em línguas inglesa e italiana. Seguindo a metodologia proposta em nosso Mestrado (MARTINS, 2013), utilizamos o Corpus Web para a busca e validação dos correspondentes. Em segundo, uma vez verificada a existência de correspondentes para cada entrada, realizamos sua análise estrutural, observando o papel desses itens para a divulgação dos conceitos da Fauna e da Flora em outras culturas. Em terceiro, examinamos as possíveis causas que atuam na formação de tais unidades e que propiciam ou não a escolha do item cor nas línguas em estudo, isto é, português, inglês e italiano. Por último, ainda em relação à obra lexicografia... / Abstract: The present thesis has as its object of study the terminology of Fauna and Flora composed by color names. Hence, it deals with two major themes: on one hand, the contribution of color names to the denominative variation in Terminology from a interlinguistic perspective; on the other, the description of such variants in a multilingual and specialized lexicographical work. In order to delimit our research, we concentrate our analysis on two subdomains of Biology: Botany, specifically the Angiosperms (monocotyledons and dicotyledons), and Zoology, specifically the Vertebrates (fish, amphibians, reptiles, birds and mammals). In this manner, it aims, firstly, to extend the Onomasiological Dictionary of Chromatic Phrases of Fauna and Flora by inserting in the microstructure the equivalents of the entries in English and Italian languages. Following the methodology proposed in a prior research (MARTINS, 2013), we use the Corpus Web to collect and validate the equivalents. Secondly, once checked the existence of equivalents for each entry, it intends to realize their structural analysis, observing the role of these denominative variants to the propagation of Fauna and Flora concepts in other cultures. Thirdly, examining the probable causes that actuate in the formation of such units and that propitiate or not the choice of the color name in the languages in study, i.e., Portuguese, English and Italian. Finally, still regarding the lexicographical work, we propose to formulate an appropriate methodology for the implementation of an on-line platform that will contribute to minimize terminological variances in this area, to concepts normalization, as well as to the communication among cultures. We would like to emphasize that our interest is motivated by the active role of color names in the expansion of the lexicon and the study of this vocabulary demonstrates the importance of color ... / Doutor
|
176 |
Sistematização semântico-ontológica computacional do vocabulário técnico da indústria de artefatos de borracha /Batista, Abner Maicon Fortunato. January 2012 (has links)
Orientador: Claudia Zavaglia / Banca: Rogério Aparecido Sá Ramalho / Banca: Maria Cristina Parreira da Silva / Resumo: Ontologias têm diversas aplicações em sistemas de Processamento Automático de Línguas Naturais (PLN), tais como tradutores automáticos e sistemas de recuperação e de extração de informação. Ontologias são também o alicerce da chamada Web Semântica, um novo conceito de Web que permite a interoperabilidade entre recursos, fornecendo significado aos sistemas que operam com grandes contingentes de dados na Web, a rede mundial de computadores. Gruber (1993) define ontologia como uma especificação formal de uma conceitualização, ou seja, uma descrição formal dos conceitos e das relações existentes entre esses conceitos em um determinado domínio do conhecimento. No caso de uma ontologia linguística, abordam-se apenas os conceitos lexicalizados em uma língua. Desse modo, a estruturação de um domínio em uma ontologia linguística se concentra em uma dimensão semântico-conceitual. Este trabalho propõe a construção de ontologia linguisticamente motivada para o domínio da Indústria de Artefatos de Borracha (IAB), uma área de grande interesse à indústria e à pesquisa no Brasil, porém pouco explorada quanto aos recursos informacionais que esse setor demanda. Para estruturar o conhecimento do domínio da IAB, estabelecendo as relações entre os conceitos, lançou-se mão de um córpus em língua portuguesa para o referido domínio de onde são extraídos e analisados os termos. A análise dos termos e de suas relações de sentido foi fundamentada a partir da Teoria do Léxico Gerativo de Pustejovsky (1995), valendo-se, sobretudo, da Estrutura Qualia, que especifica quatro aspectos essenciais do sentido de uma palavra, a saber: constitutivo, formal, télico e agentivo. Em seguida, o modelo conceito obtido foi implementado em OWL (Ontology Web Language), uma linguagem computacional voltada para a Web Semântica. O resultado obtido com essa pesquisa foi uma... / Abstract: Ontologies have several applications on Natural Language Processing (NLP) such as machine translators and retrieval and extraction information systems. Ontologies are also the foundation of the so-called Semantic Web, a new concept of the Web that allows interoperability among resources, providing meaning to systems that operate with a large number of data on the Web. Gruber (1993) defines ontology as a formal specification of a conceptualization, i.e., a formal description of concepts and the relationships among these concepts in a given field of knowledge. In the case of a linguistic ontology, only lexicalized concepts in a natural language are approached. Thus, the structuring of a domain in a linguistic ontology focuses on a semantic-conceptual dimension. This research proposes the construction of a linguistically motivated ontology for the domain of Rubber Artifacts Industry (RAI), an area of great interest to industry and research in Brazil, but little explored with regard to the information resources that this industry demands. In order to structure knowledge of the field of RAI, establishing relationships among concepts, a Portuguese corpus was used for that domain from which the terms are extracted and analyzed. The analysis of the terms and their semantic relationships was based on the Generative Lexicon Theory by Pustejovsky (1995), mainly with the use of the Qualia Structure, which specifies four essential aspects of word meaning, namely, constitutive, formal, telic and agentive. Then, the conceptual model obtained was implemented in OWL (Ontology Web Language), a Semantic Web-oriented computer language. The results obtained from this research were a computational semanticontological systematization of the technical vocabulary of Rubber Artifacts Industry (including translations of technical terms in English and French) that can generate a number of useful ... / Résumé: Les ontologies ont plusieurs applications sur le traitement automatique du langage naturel (TALN) tels que les traducteurs automatiques et des systèmes d'information et de récupération d'extraction. Les ontologies sont aussi à la base de la Web Sémantique que l'on appelle, un nouveau concept du Web qui permet l'interopérabilité entre les ressources, donner un sens à des systèmes qui fonctionnent avec un grand nombre de données sur le Web. Gruber (1993) définit l'ontologie comme une spécification formelle d'une conceptualisation, c'est à dire, une description formelle des concepts et des relations entre ces concepts dans un certain domaine de la connaissance. Dans le cas d'une ontologie linguistique, seulement les concepts lexicalisés dans une langue naturelle sont abordés. Ainsi, la structuration d'un domaine dans une ontologie linguistique met l'accent sur une dimension sémantique et conceptuelle. Cette recherche propose la construction d'une ontologie linguistique motivée pour le domaine de l'industrie d'artifacts de caoutchouc (IAC), une zone d'un grand intérêt pour l'industrie et la recherche au Brésil, mais peu explorée en ce qui concerne les sources d'information que ce secteur exige. Afin de structurer les connaissances du domaine de la IAC, l'établissement de relations entre les concepts, un corpus portugais a été utilisé pour ce domaine à partir duquel les termes sont extraits et analysés. L'analyse des termes et leurs relations sémantiques a été basée sur la Théorie Du Lexique Génératif de Pustejovsky (1995), principalement avec l'utilisation de la structure Qualia, qui spécifie quatre aspects essentiels du sens des mots, à savoir, constitutifs, formel, télique et agentif. Ensuite, le modèle conceptuel obtenu a été mis en œuvre dans le langage OWL (Ontology Web Language), un langage informatique orienté à Web ... / Mestre
|
177 |
Atos de fala em dicionários híbridos italiano>português-brasileiro: sugestão para dicionarização de ilocuções via corpora / Speech acts in Italian>Brazilian-Portuguese hybrid dictionaries: a suggestion for lexicographical records of illocutionary acts through Corpus linguisticsRibeiro, Renato Railo 25 September 2015 (has links)
O objetivo do estudo foi sugerir a inserção, em dicionários híbridos italiano>portuguêsbrasileiro tais como o Parola Chiave (2012), de informações acerca da dimensão pragmático-ilocucionária de ambas as línguas, a partir do uso de corpora eletrônicos. A metodologia empregada foi a seguinte: (a) fundamentação teórica, baseada: no conceito de Lexicografia de Krieger (2008) e no de dicionário híbrido de Höfling, Silva e Tosqui (2004); no de Pragmática Linguística e no de atos de fala de Bianchi (2008) e Sbisà (2009); no de Linguística de Corpus de Berber-Sardinha (2000), (2003) e (2004) e Tagnin (2004) e (2013); (b) estabelecimento de critérios para a investigação de ilocuções em corpora italiano e português-brasileiro, a saber: adoção da teoria dos atos de fala proposta por Austin (1990[1975]) (em função de seu critério para reconhecimento de ilocuções, a forma verbal na primeira pessoa do singular do presente do indicativo na voz ativa, e de sua associação ilocuções-verbos); adoção de dois corpora online, Corpus Paisà e Corpus do Português (o primeiro do italiano, o segundo do português-brasileiro, escolhidos em função da extensão de cada um, o que os torna representativos de suas respectivas línguas); adoção de cinco verbos ilocucionários comissivos do italiano, promettere, giurare, assicurare, impegnarsi, garantire (em função da mútua relação sinonímica que possuem entre si, segundo o dicionário Sinonimi e contrari minore (2009)); adoção de cinco verbos ilocucionários comissivos do português-brasileiro, prometer, jurar, assegurar, comprometer-se, garantir (em função de serem semanticamente equivalentes aos respectivos verbos italianos, segundo o Parola Chiave); adoção da forma verbal citada acima como sintaxe de busca para pesquisa em corpora; (c) análise qualitativa e quantitativa: obtiveram-se os números totais de ocorrências de cada ilocução; realizou-se uma análise qualitativa de modo a excluir casos anômalos, cujos critérios de exclusão foram: casos de homonímia, negação, repetição e ininteligibilidade; após obtenção dos números reais, excluíram-se da pesquisa as ilocuções mi impegno e comprometo-me/ me comprometo (em função da baixa frequência); (d) discussão acerca das possibilidades de dicionarização de ilocuções a partir dos resultados de corpora. Como resultado final, a sugestão foi a de inserir: na microestrutura, marcas de uso referentes às classes de ilocução; na micromedioestrutura, remissivas de modo a conduzir o leitor a um texto externo à nomenclatura; na macroestrutura, um texto externo à nomenclatura que contenha: (i) explicações referentes às classes de ilocuções e lista de respectivas espécies convencionalmente recorrentes do italiano dispostas segundo frequência; (ii) espécies de ilocuções equivalentes do português-brasileiro dispostas segundo frequência; (iii) exemplos de uso, retirados dos corpora, de tais verbos ilocucionários desempenhando sua função ilocucionária convencional. / This study aims to suggest a method of inserting, in hybrid Italian>Brazilian-Portuguese dictionaries such as Parola Chiave (2012), information about the pragmaticillocutionary dimension of both languages, through electronic corpora. The methodology used was as follows: (a) theoretical foundation based on: Krieger\'s concept of Lexicography (2008) and Höfling, Silva & Tosqui\'s hybrid dictionary (2004); Bianchi (2008) and Sbisà\'s (2009) Pragmalinguistics and speech acts; Berber- Sardinha (2000, 2003, 2004) and Tagnin\'s (2004, 2013) Corpus Linguistics; (b) establishing criteria for illocution research in corpora, namely: adopting the theory of speech acts proposed by Austin (1990[1995]) as research paradigm (due to its criteria for recognizing illocutions, the verb form in the first-person singular of the present indicative in active voice and its illocution-verbs association); adopting two online corpora, Corpus Paisà and Portuguese Corpus (due to the length of each one, which makes them representative of their languages); adopting five Italian illocutionary verbs of commissive class, promettere, giuare, assicurare, impegnarsi, garantire (due to the mutual synonymy relation they have one to each other, according to Sinonimi e contrari minore (2009)); adopting five illocutionary verbs of Brazilian-Portuguese, as known: prometer, jurar, assegurar, comprometer-se, garantir (for being semantically equivalent to their corresponding verb in Italian, according to Parola Chiave (2009)); adopting the verb form mentioned above as syntax search to corpora research; (c) quantitative and qualitative analysis: the total number of occurrences of each illocution was obtained; a qualitative analysis was conducted in order to exclude anomalous cases, of which exclusion criteria were: cases of homonyms, denial, occurrences repetition and unintelligibility; a quantitative analysis was conducted in order to exclude the illocutions mi impegno and comprometo-me / me comprometo (due to their low frequency); (d) discussion around the possibilities of lexicographical records of illocutions from the results of corpora. As a final result, the suggestion was to insert: in the dictionary microstructure, signs of usage referring to illocution classes; in its micromediumstructure: cross references in order to conduct the reader to a section out of nomenclature; in its macrostructure: a text, external to the nomenclature, containing: (i) explanations related to illocution classes and a list of conventionally recurring species of Italian arranged by frequency; (ii) equivalent illocutions species of Portuguese- Brazilian arranged by frequency; (iii) examples of usage, taken from the corpora, of illocutionary verbs performing their conventional illocutionary function.
|
178 |
Mil e um verbos árabes: uma proposta lexicográfica / A thousand and one Arabic verbs: A lexicographical proposalGomes, Elias Mendes 13 September 2011 (has links)
Embora a língua árabe com a poesia altamente desenvolvida na época da Jahiliyya (período que antecede ao Islã) tivesse seu indiscutível lugar na Península Arábica, foi somente com o advento e expansão do Islamismo que ela ganhou a projeção que a levou para além de suas fronteiras linguísticas históricas. Através dos séculos, a religião continuou a desempenhar um papel primordial na expansão da língua árabe, visto ser esta a língua litúrgica do islamismo, entretanto, ultimamente, outros fatores têm contribuído para um interesse maior pelo idioma, pouco, porém, tem sido feito para facilitar a sua aprendizagem, especialmente entre os lusófonos. Esta pesquisa, preocupada com a falta de apoio didático para a aprendizagem e o aprofundamento no conhecimento linguístico que, via de regra, se adquire com a decodificação de textos no idioma almejado, propõe a elaboração de um dicionário monodirecional de verbos árabe-português. O dicionário proposto nessa dissertação singulariza os mil e um verbos mais frequentes nos corpora jornalístico e literário e será compilado tendo por base princípios descritivos científicos da lexicografia moderna, não estando limitado a uma teoria particular, entretanto, privilegiando a lexicografia pedagógica de Welker (2004 e 2008). Em seu trabalho, Welker (2008) discute a lexicografia pedagógica (LP), apresentando técnicas que, se seguidas, auxiliarão os consulentes em sua tarefa de compreensão e decodificação de textos em língua estrangeira. Esse arcabouço teórico é interpretado sob a ótica da Escola de Filologia de Kufa que considerava o verbo como o originador do universo léxical árabe. Essa posição é sustentada por vários arabistas modernos que reconhecem que, embora nem todas as palavras possam ser rastreadas a uma raiz verbal, a maioria de seus lexemas deriva-se de um verbo simples. O levantamento do corpus verbal será primordialmente baseado nos trabalhos de Moshe Brill (1940) e Jacob Landau (1959) que, seguindo os parâmetros da linguística de corpus, compilaram as palavras mais frequentes na mídia e literatura árabes. Devido ao escopo do árabe padrão moderno como a lingua franca entre todos os países árabes, e por ser esta a vertente mais usada no ensino de árabe para estrangeiros, escolheu-se essa variante para este trabalho. / Even though the Arabic language with the poetry highly developed during the Age of Jahiliyya (period that precedes the coming of Islam) had its indisputable place in the Arabian Peninsula, it was only with the advent and expansion of Islam that it gained the projection to beyond its historical borders. Through the centuries, religion continued to play a primordial role in the expansion of the Arabic language, as this is the liturgical language of Islam, but, recently, other factors have contributed to a greater interest in the language, few things, however, have been done to facilitate its learning, especially among the Brazilians. This research, concerned with lack of didactic support for the learning and deepening of linguistic knowledge that, as a general rule, is acquired with the decoding of texts in the desired language, proposes the elaboration of a mono-directional dictionary of Arabic-Portuguese verbs. The dictionary proposed in this thesis singles out the most frequent one thousand and one verbs in the journalistic and literary corpora and will be compiled according to the scientific descriptive principles of modern lexicography, not limited to particular theory, but the pedagogical lexicography of Welker (2004; 2008) will be favoured. Welker (2008) discusses the pedagogical lexicography (PL), presenting techniques that, if followed, will help the dictionary user in the task of comprehending and decoding texts in foreign language. This theoretical background is interpreted through the view of the Philological School of Kufa that considered the verb as the originator of the Arabic lexical universe. This position is undertaken by several modern Arabists who acknowledge that, although not all words can be traced back to a verbal root, the majority of the languages lexemes come from a simple verb. The verbal corpus will be based on the works of Moshe Brill (1940) and Jacob Landau (1959) who, following the parameters of the corpus linguistics, compiled a list of the most frequent words in the Arabic media and literature. Due to the scope of the Modern Standard Arabic as the lingua franca in all Arab countries, and because this is the most used variety in the teaching of Arabic to foreigners, it was chosen as the variant for this research.
|
179 |
Edição semidiplomática e estudo lexicográfico de habilitações à herança setecentistas do Juízo de Órfãos de São Paulo / Semidiplomatic editing and lexicographical study of enable to heritage the eighteenth century of the Orphan Court of São PauloGimenez, Fabio 28 January 2015 (has links)
Os objetivos deste trabalho são apresentar a transcrição semidiplomática justalinear, fidedigna, numerada a cada cinco linhas, de cinco autos cíveis de habilitação à herança lavrados no século XVIII, na cidade de São Paulo, pelo Juízo dos Órfãos, que poderá ser lida sem perdas de informação dos documentos originais, sendo de interesse para o estudioso acadêmico que pesquise tanto dados históricos quanto linguísticos; estruturar o vocabulário de todas as palavras que constam nesses documentos, usando como ferramenta o software AntConc3.2.4w; e traçar um panorama da história interna dos documentos, do Juízo de Órfãos, das leis orfanológicas vigentes e trazer uma breve análise tipológica. / The objectives of this work are present semidiplomatic justalinear transcription, reliable, numbered every five lines, five civil cases enable the inheritance drawn up in the eighteenth century, the city of São Paulo, by the Orphans Court, which can be read without loss of information from the original documents, being of interest to the academic scholar who search for both historical and linguistic data; structure the vocabulary of all the words contained in these documents, using as a tool the AntConc3.2.4w software; and draw a picture of the inside story of the documents, the Orphan Court, the existing orfanológicas laws and bring a brief typological analysis.
|
180 |
Edição de documentos e estudo do vocabulário do Charque na região sul do Brasil: contribuição à história do português brasileiro / Editing documents and vocabulary study of jerked beef in southern Brazil: a contribution to the history of Brazilian PortugueseSchreiner, Cátia 28 June 2012 (has links)
Esta pesquisa tem como objetivo geral estudar o vocabulário do charque no Sul do Brasil, propondo uma discussão sobre as influências e contribuições desse léxico na formação e expansão da variedade do português brasileiro. Para a realização deste estudo, de caráter exploratório e descritivo, são utilizados documentos manuscritos e impressos, antigos e modernos, material oral, dicionários de Língua Portuguesa e atlas linguísticos. A metodologia empregada parte da Filologia, por meio de edições facsimilar e/ou semidiplomática dos documentos escritos, das quais emerge o vocabulário do charque, culminando num estudo lexicográfico. Os atlas linguísticos e suas metodologias são utilizados como base comparativa à pesquisa de campo realizada, permitindo a análise do uso da lexia charque nas comunidades investigadas. Os objetivos específicos deste estudo são definir um glossário a partir do vocabulário charque selecionado dos documentos, dos atlas e da pesquisa de campo, e desenvolver uma análise diacrônica do conteúdo deste glossário, comparando as acepções das lexias listadas às encontradas em dicionários dos séculos XVIII, XIX, XX e XXI. O exame desses dados é feitos à luz de estudos filológicos, lexicográficos e lexicológicos. A partir desta pesquisa, será possível suscitar uma discussão sobre o grau de influência do dialeto caipira paulista no sul do Brasil, considerando os movimentos bandeirante, monçoeiro e tropeiro com a economia do charque. / This research seeks to study the charque jerked beef vocabulary in southern Brazil, proposing a discussion over influences and contributions of such lexicon and in forming and expanding the variety of Brazilian portuguese. For this study, which was both exploratory and descriptive, it was used manuscripts and printed documents, both ancient and modern, oral material, portuguese dictionaries as well as linguistic atlases. The methodology employed starts off from philology, through facsimile and/or semidiplomatic editings of written documents, from which the charque vocabulary arises, reaching its lexicographic study. The linguistic atlases and their methodologies are the basis for a field research, analyzing the lexia charque in the investigated communities. From the list of the charque vocabulary, collected in the documents, atlases and field research, the study aims, specifically, to compose a glossary and to develop a diachronical analysis of its content, comparing the meaning of the listed lexia to those found on dictionaries from 18th, 19th, 20th and 21st century. The analysis of these data is made in light of philological, lexicographical and geolinguistical studies. This research can also raise a discussion about the level of influence of the dialeto caipira rustic dialect of São Paulo in southern Brazil, considering the bandeirante, monçoeiro and tropeiro muleteer movement with the charque economy.
|
Page generated in 0.0306 seconds