• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 53
  • 19
  • 3
  • 2
  • 1
  • 1
  • Tagged with
  • 80
  • 40
  • 20
  • 14
  • 13
  • 12
  • 12
  • 10
  • 10
  • 9
  • 9
  • 9
  • 9
  • 9
  • 8
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

H. VAN RIEMSDIJK AND EDWIN WILLIAMS, /ntroduction to the Theory of Grammar, Cambridge. (The MIT Press) 1986, xvi + 366 pp.

Montalbetti, Mario 25 September 2017 (has links)
Con la publicación en 1981 de sus Lectures on Government and Binding (Dordrecht, Foris) Noam Chomsky inauguró (al menos editorialmente ya que las ideas se venían discutiendo hacía dos o tres años) el nuevo modelo generativo.Este nuevo modelo (denominado GB, las iniciales de los dos procesos aludidos en el título del libro de Chomsky) supone un cambio fundamental de enfoques y concepción de la teoría gramatical respecto de los modelos generativos anteriores.
2

UM ESTUDO SOBRE AS RELAÇÕES SINTÁTICOSEMÂNTICAS DO VERBO PASSAR PARA IDENTIFICAÇÃO DE VERBO-SUPORTE

DANTAS, J. N. 15 August 2011 (has links)
Made available in DSpace on 2016-08-29T15:08:49Z (GMT). No. of bitstreams: 1 tese_5062_Dissertação de JULIENE DO NASCIMENTO DANTAS20151207-180901.pdf: 820244 bytes, checksum: 58b5825a01b832beba82608b39df73bb (MD5) Previous issue date: 2011-08-15 / Neste trabalho estudam-se as estruturas compostas pelo verbo Passar+SN a fim de identificar seu uso como verbo-suporte. São observadas 90 estruturas com o objetivo de desenvolver um estudo descritivo dos tipos de estruturas constituídas com o verbo Passar + SN (sintagma nominal), levando em consideração as propriedades distribucionais que estão relacionadas à natureza dos seus complementos, tendo em vista a grande ocorrência dessas formações e seu uso no espaço da linguagem, a fim de identificar as estruturas que se comportam como verbo-suporte. Para isso, utilizam-se alguns princípios da gramática de valências, dos estudos funcionalistas, dos estudos do léxico e dos critérios de identificação propostos pelo Léxico-gramática.
3

El papel de la memoria operativa, la inferencia y la competencia gramatical en la comprensión lectora

Inga Arias, Miguel Gerardo January 2009 (has links)
La tesis está presentada en cuatro capítulos. El primero, aborda el marco teórico. En él se precisa el concepto de comprensión lectora como actividad multivariada, compleja y cognitiva, por lo cual dilucida la naturaleza de la competencia gramatical, incidiendo en los aportes de Chomsky y Lorenzo. También, se esclarece el concepto de inferencia como estrategia cognitiva, entendiéndola como un proceso natural que sirve para obtener la información implícita de un texto, pues si no podríamos recuperar la información “escondida” la lectura comprensiva sería inviable. Igualmente, se dilucida el concepto de memoria operativa o memoria de trabajo, como el sistema de capacidad limitada que permite almacenar y manipular información necesaria para las tareas complejas, como la comprensión de lectura. El segundo capítulo presenta la formulación del problema a investigar. Sabemos que la comprensión de la lectura pone en juego una serie de factores como: perceptivos, emocionales y cognitivos, es respecto a estos últimos donde centramos nuestra pesquisa. Nuestra pregunta se orienta a determinar el papel que desempeñan la competencia gramatical, la memoria operativa y las estrategias inferenciales. En este capítulo, también se plantean la hipótesis general y específicas. El capítulo tercero, presenta el marco metodológico desarrollado para este trabajo de investigación. Enuncia el diseño de la muestra, alumnos de la Facultad de Educación de la UNMSM; el diseño del instrumento, las pruebas de competencia gramatical, memoria operativa y de inferencias, así como el test de comprensión de lectura; y el diseño del análisis comparativo, para lo cual hemos trabajado con la tabla de correlación de Pearson. El capítulo cuatro, aborda los resultados y la discusión. Se analiza los instrumentos utilizados y su aplicación; luego, los resultados de la aplicación de los instrumentos, aquí se muestran los resultados de la correlación entre la competencia gramatical, la memoria operativa y las estrategias inferenciales. Ella pone el evidencia que la mayor correlación está dada entre comprensión de lectura y la aptitud inferencial, con lo cual la hipótesis quedaría demostrada. Luego, presentamos las conclusiones, entre las que destaca la necesidad de desarrollar una actitud comunicativa que permita una lectura dialogada e interpretativa; y las recomendaciones, podemos mencionar , entre otras, la necesidad de elaborar un programa de comprensión de lectura inferencial sistemático y graduado, de acuerdo al desarrollo cognitivo del joven estudiante. Finalmente, se adjuntan tres anexos: el primero, aborda una propuesta de sesión de aprendizaje para promover estrategias inferenciales en el aula, clase y lectura dialogada que haga del estudiante un agente comunicativo; el segundo, una propuesta de programa de lectura inferencial sistemático y graduado, a partir de experiencias de Miguel de Zubiría; y el último, el solucionario de los test aplicados en la presente investigación. / Tesis
4

Tipología del género en lenguas indígenas de América del Sur

Regúnaga, María Alejandra 04 November 2011 (has links)
Esta investigación se centra en la categoría gramatical de género, uno de los posibles sistemas de clasificación nominal que se basa fundamentalmente en los criterios de animacidad y sexo y se caracteriza por presentar concordancia. El análisis de la manifestación y funcionamiento del género gramatical se realiza desde la perspectiva del funcionalismo tipológico sobre un corpus de catorce lenguas indígenas de América del Sur, cuyas ubicaciones se extienden desde Venezuela hasta el sur de Argentina. En la descripción y cotejo de los sistemas del género se contemplaron tres aspectos fundamentales: la motivación semántica de la asignación y su vínculo con la animacidad; los patrones de concordancia, principalmente dentro de la frase nominal; y la marcación de género en el sustantivo. En varias de las lenguas del corpus se detallaron esas facetas con respecto a otros sistemas de categorización nominal coexistentes con el de género: clases nominales y cla-sificadores. Al contrastar los sistemas de clasificación nominal de las diferentes lenguas se pudo comprobar que estos cumplen funciones de determinación; por otro lado, se hizo evidente la correlación que existe con la jerarquía de animaci-dad, así como las posibilidades de extensión metafórica/meto-nímica de las diferentes categorías de clasificación, hechos que demuestran que el estudio de la categorización nominal constituye una valiosa fuente de información acerca de la cosmovisión y las creencias culturales comprendidas en las lenguas. / This research focuses on the grammatical category of gender, one of the possible systems of noun classification. Gender is mainly based on the criteria of animacy and sex and is cha-racterized by presenting an agreement system. The analysis of the expression and function of grammatical gender is per-formed from the perspective of typological functionalism on a corpus of fourteen indigenous languages located in South America, and ranging from Venezuela to Southern Argentina. In the description and collation of gender systems three fun-damental aspects were considered: semantic motivation for assignment and its link with animacy; patterns of agreement, primarily within the noun phrase, and gender marking on the noun. In several of the languages of the corpus these as-pects were detailed with respect to other systems of nominal categorization coexisting with gender: noun classes and classifiers. By contrasting the noun classification systems of different languages we could verify that they realize the function of noun determination; on the other hand, it became obvious the correlation gender systems have with the anima-cy hierarchy as well as their possibilities for metaphoric/meto-nymic extensions of different categories of classification. These facts demonstrate that the study of noun categori-zation is a valuable source of information about the worldview and cultural beliefs among the languages.
5

A nomenclatura gramatical brasileira na sala de aula / The Brazilian Grammatical Nomenclature in the classroom

Silva, Fernando de Souza Pereira da 22 November 2016 (has links)
Em todas as disciplinas do currículo escolar são utilizados termos específicos nas aulas. No caso da disciplina de Língua Portuguesa, a terminologia gramatical é utilizada para referir-se à própria língua. Essa terminologia é tradicionalmente denominada Nomenclatura Gramatical Brasileira e conhecida como NGB. Esta pesquisa discute a terminologia gramatical da Língua Portuguesa utilizada na sala de aula do ensino fundamental II e tem como objetivo geral verificar como o aluno, ao chegar no 9.º ano, compreende essa terminologia. Com a finalidade de se chegar ao objetivo geral, por meio de pesquisa de campo, foi aplicado um questionário com termos gramaticais referentes às classes de palavras, a fim de verificar como os estudantes definiriam tais termos, pois são palavras que fazem parte do universo escolar dos alunos, estão inseridas no discurso didático e pedagógico da sala de aula e constam dos livros didáticos utilizados por eles ao longo dos anos escolares. O questionário apresentado trouxe os termos e um espaço em branco para os alunos colocarem o significado de cada um, da maneira como eles os entendem. O trabalho seguiu um percurso semasiológico, ou seja, partiu da designação já estabelecida para o conceito. As definições deles foram analisadas, de forma a averiguar se expressam adequadamente os conceitos observados. Para verificar o que se esperaria dos alunos, foram analisadas as definições presentes nas gramáticas, nos livros didáticos, bem como os conceitos etimológicos dos termos. Como esta pesquisa faz parte de um programa de Mestrado Profissional, ela tem a pretensão de oferecer propostas para o trabalho em sala de aula com essa terminologia, de modo a levar os contributos dos estudos lexicológicos e terminológicos à escola. Os resultados apontam que os alunos têm dificuldade para entender a terminologia gramatical usada nas aulas. Nesse sentido, a pesquisa demonstra a necessidade de se produzir materiais voltados ao ensino e intervenções didáticas que propiciem, de maneira mais eficaz, o entendimento e a apropriação pelos estudantes dos conceitos estudados e utilizados por eles. / In all subjects of the curriculum are used specific terms in class. In the case of discipline of Portuguese Language, grammatical terminology is used to refer to own language.This terminology is traditionally called Brazilian Grammatical Nomenclature, known as NGB. This research discusses the terminology of the Portuguese language used in the classroom of elementary school II and has the general objective to verify how the student to reach the 9th grade, understand this terminology. In order to reach the overall goal, through field research, a questionnaire was applied with grammatical terms referring to the words classes in order to verify how the students would define such terms, because these words are part of the school context and student context. They are inserted in the didactic and pedagogical discourse of the classroom and they are found in textbooks used by them over the years. The questionnaire presented brought the terms and a blank space for the students to put the meaning of each one, the way they understand them. The work followed a semasiological route, therefore from designation already established for the concept. The definitions of students were analyzed to see if express adequately the concepts analyzed. To verify what the would expected of students, additionally, it were analyzed the definitions presents in the grammar books, in textbooks, as well as the etymological concepts of terms. As this research is part of a Professional Master\'s program purports to offer proposals for work in the classroom with this terminology, to take contributions from lexicological and terminological studies to school. The results show that students have trouble understanding the grammatical terminology used in class. In this sense, the research demonstrates the need to produce materials geared to teaching and educational interventions that provide, more effectively, understanding and ownership by the students of the concepts studied and used by them.
6

A nomenclatura gramatical brasileira na sala de aula / The Brazilian Grammatical Nomenclature in the classroom

Fernando de Souza Pereira da Silva 22 November 2016 (has links)
Em todas as disciplinas do currículo escolar são utilizados termos específicos nas aulas. No caso da disciplina de Língua Portuguesa, a terminologia gramatical é utilizada para referir-se à própria língua. Essa terminologia é tradicionalmente denominada Nomenclatura Gramatical Brasileira e conhecida como NGB. Esta pesquisa discute a terminologia gramatical da Língua Portuguesa utilizada na sala de aula do ensino fundamental II e tem como objetivo geral verificar como o aluno, ao chegar no 9.º ano, compreende essa terminologia. Com a finalidade de se chegar ao objetivo geral, por meio de pesquisa de campo, foi aplicado um questionário com termos gramaticais referentes às classes de palavras, a fim de verificar como os estudantes definiriam tais termos, pois são palavras que fazem parte do universo escolar dos alunos, estão inseridas no discurso didático e pedagógico da sala de aula e constam dos livros didáticos utilizados por eles ao longo dos anos escolares. O questionário apresentado trouxe os termos e um espaço em branco para os alunos colocarem o significado de cada um, da maneira como eles os entendem. O trabalho seguiu um percurso semasiológico, ou seja, partiu da designação já estabelecida para o conceito. As definições deles foram analisadas, de forma a averiguar se expressam adequadamente os conceitos observados. Para verificar o que se esperaria dos alunos, foram analisadas as definições presentes nas gramáticas, nos livros didáticos, bem como os conceitos etimológicos dos termos. Como esta pesquisa faz parte de um programa de Mestrado Profissional, ela tem a pretensão de oferecer propostas para o trabalho em sala de aula com essa terminologia, de modo a levar os contributos dos estudos lexicológicos e terminológicos à escola. Os resultados apontam que os alunos têm dificuldade para entender a terminologia gramatical usada nas aulas. Nesse sentido, a pesquisa demonstra a necessidade de se produzir materiais voltados ao ensino e intervenções didáticas que propiciem, de maneira mais eficaz, o entendimento e a apropriação pelos estudantes dos conceitos estudados e utilizados por eles. / In all subjects of the curriculum are used specific terms in class. In the case of discipline of Portuguese Language, grammatical terminology is used to refer to own language.This terminology is traditionally called Brazilian Grammatical Nomenclature, known as NGB. This research discusses the terminology of the Portuguese language used in the classroom of elementary school II and has the general objective to verify how the student to reach the 9th grade, understand this terminology. In order to reach the overall goal, through field research, a questionnaire was applied with grammatical terms referring to the words classes in order to verify how the students would define such terms, because these words are part of the school context and student context. They are inserted in the didactic and pedagogical discourse of the classroom and they are found in textbooks used by them over the years. The questionnaire presented brought the terms and a blank space for the students to put the meaning of each one, the way they understand them. The work followed a semasiological route, therefore from designation already established for the concept. The definitions of students were analyzed to see if express adequately the concepts analyzed. To verify what the would expected of students, additionally, it were analyzed the definitions presents in the grammar books, in textbooks, as well as the etymological concepts of terms. As this research is part of a Professional Master\'s program purports to offer proposals for work in the classroom with this terminology, to take contributions from lexicological and terminological studies to school. The results show that students have trouble understanding the grammatical terminology used in class. In this sense, the research demonstrates the need to produce materials geared to teaching and educational interventions that provide, more effectively, understanding and ownership by the students of the concepts studied and used by them.
7

Aprimorando o corretor gramatical CoGrOO / Refining the CoGrOO Grammar Checker

Silva, William Daniel Colen de Moura 06 March 2013 (has links)
O CoGrOO é um corretor gramatical de código aberto em uso por milhares de usuários de uma popular suíte de escritório de código aberto. Ele é capaz de identificar erros como: colocação pronominal, concordância nominal, concordância sujeito-verbo, uso da crase, concordância nominal e verbal e outros erros comuns de escrita em Português do Brasil. Para tal, o CoGrOO realiza uma análise híbrida: inicialmente o texto é anotado usando técnicas estatísticas de Processamento de Linguagens Naturais e, em seguida, um sistema baseado em regras é responsável por identificar os possíveis erros gramaticais. O objetivo deste trabalho é reduzir a quantidade de omissões e intervenções indevidas e, ao mesmo tempo, aumentar a quantidade de verdadeiros positivos sem, entretanto, adicionar novas regras de detecção de erros. A última avaliação científica do corretor gramatical foi realizada em 2006 e, desde então, não foram realizados estudos detalhados quanto ao seu desempenho, apesar de o código do sistema ter passado por substancial evolução. Este trabalho contribuirá com uma detalhada avaliação dos anotadores estatísticos e os resultados serão comparados com o estado da arte. Uma vez que os anotadores do CoGrOO estão disponíveis como software livre, melhorias nesses módulos gerarão boas alternativas a sistemas proprietários. / CoGrOO is an open source Brazilian Portuguese grammar checker currently used by thousands of users of a popular open source office suite. It is capable of identifying Brazilian Portuguese mistakes such as pronoun placement, noun agreement, subject-verb agreement, usage of the accent stress marker, subject-verb agreement, and other common errors of Brazilian Portuguese writing. To accomplish this, it performs a hybrid analysis; initially it annotates the text using statistical Natural Language Processing (NLP) techniques, and then a rule-based check is performed to identify possible grammar errors. The goal of this work is to reduce omissions and false alarms while improving true positives without adding new error rules. The last rigorous evaluation of the grammar checker was done in 2006 and since then there has been no detailed study on how it has been performing. This work will also contribute a detailed evaluation of low-level NLP modules and the results will be compared to state-of-the-art results. Since the low-level NLP modules are available as open source software, improvements on their performance will make them robust, free and ready-to-use alternatives for other systems.
8

An?lise da rela??o entre os aspectos gramatical e lexical sob o prisma de uma teoria composicional

Rocha, Ricardo Coimbra da 16 March 2018 (has links)
Submitted by PPG Letras (letraspg@pucrs.br) on 2018-10-09T16:57:33Z No. of bitstreams: 1 Disserta??o Ricardo Coimbra da Rocha.pdf: 1269148 bytes, checksum: 18eacd11e36d4e02bd0bdacf601e7dd5 (MD5) / Approved for entry into archive by Caroline Xavier (caroline.xavier@pucrs.br) on 2018-10-09T17:41:04Z (GMT) No. of bitstreams: 1 Disserta??o Ricardo Coimbra da Rocha.pdf: 1269148 bytes, checksum: 18eacd11e36d4e02bd0bdacf601e7dd5 (MD5) / Made available in DSpace on 2018-10-09T17:49:14Z (GMT). No. of bitstreams: 1 Disserta??o Ricardo Coimbra da Rocha.pdf: 1269148 bytes, checksum: 18eacd11e36d4e02bd0bdacf601e7dd5 (MD5) Previous issue date: 2018-03-16 / The aim of this work is to investigate the lexical aspect based on telicity and to observe whether this property operates independently in relation to the grammatical aspect through an analysis of the representation of time and events in Brazilian Portuguese (BP). The main question of this research is to investigate our language ability to describe an event using both the perfective and the imperfective aspect without affecting the telicity of this event when we change its tense in terms of verbal inflection and periphrases. The function of providing information about the point where this event ends, or its telos, belongs to the semantic-lexical properties of the verb and its relationship with its internal argument, since the information regarding the telicity of the event depends on the form in which this relation is established. We start with the analysis of the morphosyntactic realizations of the perfective, imperfective and progressive aspect in Portuguese, using the system developed by Reinhart (1986), which modifies the theory of Reichenbach (1947) in order to describe how time and grammatical aspect are realized in a more precise way, through an analysis of interval relations between R, E and S. We begin by analyzing these intervals, some of them realized in Portuguese, through the perfect preterite of the indicative, imperfect preterite of the indicative and compound imperfect preterite of the indicative. Subsequently, we use non-stative verbs which indicate process or transition, to find out if a predicate is telic or atelic through tests of identification of telicity and the analysis of the interaction between the verb and its argument. As a result, we present semantic definitions of the lexical properties of these verbs in terms of process, transition and telicity for the subsequent use of these definitions and properties in an integrated way, although the systems responsible for encoding time, intervals and lexical aspect still operate independently. For this analysis, we propose an approximation between Verkuyl's theoretical proposals (1999, 2002), where we have the lexical definition of the verb through the property [+ -ADD TO] ? which according to Arsenijevic (2006) introduces the potential of an event being mapped towards a scalar structure where we can understand this mapping through the relation between the semantic properties of the verb and the information that is contained in its argument [+ -SQA] ? and Pustejovsky's (1992) approach, in which we have the semantic information of the verb presented through the transition (E1, ?E2) and process (E1, En) properties. The motivation for the approximation of these theories is based on the fact that, in order to understand how the unfolding of an event occurs, it is important to observe the quantificational properties contained in the verb and what would be the values of n indicated by its argument, since we need at least two points for an event to unfold, and when we get the value of n and integrate it with the lexical properties of the verb, we could observe how the telicity of this event occurs and whether its unfolding actually happens independently of the interval where this event is inserted. / O objetivo deste trabalho ? investigar o aspecto lexical baseado na telicidade e observar se essa propriedade opera independentemente em rela??o ao aspecto gramatical, por meio de uma an?lise da representa??o do tempo e de eventos no Portugu?s Brasileiro (PB). A quest?o principal desta pesquisa ? investigar a habilidade da nossa linguagem para descrever um evento, utilizando tanto o aspecto perfectivo como o aspecto imperfectivo, sem afetar a telicidade desse evento quando mudamos o tempo em termos de inflex?o verbal e per?frases. A fun??o de fornecer informa??es sobre o ponto em que esse evento termina, ou seu telos, pertence ?s propriedades sem?ntico-lexicais do verbo e sua rela??o com seu argumento interno, uma vez que a informa??o referente ? telicidade do evento depende da forma em que esta rela??o ? estabelecida. Partimos da an?lise das realiza??es morfossint?ticas do aspecto perfectivo, imperfeito e progressivo em portugu?s, utilizando o sistema desenvolvido por Reinhart (1986), que modifica a teoria de Reichenbach (1947), para descrever como o tempo e o aspecto gramatical se realizam. De maneira mais precisa, por uma an?lise das rela??es de intervalo entre R, E e S. Come?amos por analisar esses intervalos, alguns deles realizados em portugu?s, por meio do pret?rito perfeito do indicativo, pret?rito imperfeito do indicativo e composto imperfeito do pret?rito do indicativo. Posteriormente, usamos verbos n?o-estativos que indicam processo ou transi??o, a fim de descobrir se um predicado ? t?lico ou at?lico por meio de testes de identifica??o de telicidade e a an?lise da intera??o entre o verbo e seu argumento. Como resultado, apresentamos defini??es sem?nticas das propriedades lexicais desses verbos em termos de processo, transi??o e telicidade para o uso subsequente dessas defini??es e propriedades de forma integrada, embora os sistemas respons?veis por codificar tempo, intervalos e aspecto lexical ainda operarem de forma independente. Para esta an?lise, propomos uma aproxima??o entre as propostas te?ricas de Verkuyl (1999, 2002) e Pustejovsky (1992). Em Verkuyl, temos a defini??o lexical do verbo por meio da propriedade [+ -ADD TO], que, segundo Arsenijevic (2006), introduz o potencial de um evento sendo mapeado para uma estrutura escalar, onde podemos entender esse mapeamento pela rela??o entre as propriedades sem?nticas do verbo e da informa??o que est? contida em seu argumento [+ -SQA]. Na abordagem de Pustejovsky (1992), temos a informa??o sem?ntica do verbo apresentado atrav?s das propriedades de transi??o (E1, ?E2) e processo (E1, En). A motiva??o para a aproxima??o dessas teorias baseia-se no fato de que, para entender como ocorre o desdobramento de um evento, ? importante observar as propriedades quantificacionais contidas no verbo e quais seriam os valores de n indicados pelo seu argumento, uma vez que precisamos de pelo menos dois pontos para um evento se desdobrar. Quando obtemos o valor de n e o integramos com as propriedades lexicais do verbo, podemos observar como a telicidade desse evento ocorre e se o seu desdobramento realmente acontece independentemente do intervalo em que esse evento ? inserido.
9

Aprimorando o corretor gramatical CoGrOO / Refining the CoGrOO Grammar Checker

William Daniel Colen de Moura Silva 06 March 2013 (has links)
O CoGrOO é um corretor gramatical de código aberto em uso por milhares de usuários de uma popular suíte de escritório de código aberto. Ele é capaz de identificar erros como: colocação pronominal, concordância nominal, concordância sujeito-verbo, uso da crase, concordância nominal e verbal e outros erros comuns de escrita em Português do Brasil. Para tal, o CoGrOO realiza uma análise híbrida: inicialmente o texto é anotado usando técnicas estatísticas de Processamento de Linguagens Naturais e, em seguida, um sistema baseado em regras é responsável por identificar os possíveis erros gramaticais. O objetivo deste trabalho é reduzir a quantidade de omissões e intervenções indevidas e, ao mesmo tempo, aumentar a quantidade de verdadeiros positivos sem, entretanto, adicionar novas regras de detecção de erros. A última avaliação científica do corretor gramatical foi realizada em 2006 e, desde então, não foram realizados estudos detalhados quanto ao seu desempenho, apesar de o código do sistema ter passado por substancial evolução. Este trabalho contribuirá com uma detalhada avaliação dos anotadores estatísticos e os resultados serão comparados com o estado da arte. Uma vez que os anotadores do CoGrOO estão disponíveis como software livre, melhorias nesses módulos gerarão boas alternativas a sistemas proprietários. / CoGrOO is an open source Brazilian Portuguese grammar checker currently used by thousands of users of a popular open source office suite. It is capable of identifying Brazilian Portuguese mistakes such as pronoun placement, noun agreement, subject-verb agreement, usage of the accent stress marker, subject-verb agreement, and other common errors of Brazilian Portuguese writing. To accomplish this, it performs a hybrid analysis; initially it annotates the text using statistical Natural Language Processing (NLP) techniques, and then a rule-based check is performed to identify possible grammar errors. The goal of this work is to reduce omissions and false alarms while improving true positives without adding new error rules. The last rigorous evaluation of the grammar checker was done in 2006 and since then there has been no detailed study on how it has been performing. This work will also contribute a detailed evaluation of low-level NLP modules and the results will be compared to state-of-the-art results. Since the low-level NLP modules are available as open source software, improvements on their performance will make them robust, free and ready-to-use alternatives for other systems.
10

Gênero gramatical e biológico de substantivos do português brasileiro: uma análise baseada em corpus

Leão, Daniel de Almeida 28 April 2016 (has links)
Submitted by Filipe dos Santos (fsantos@pucsp.br) on 2016-08-18T11:53:56Z No. of bitstreams: 1 Daniel de Almeida Leão.pdf: 1416276 bytes, checksum: ba4bc8cff6ad87ee22845be2197eedfb (MD5) / Made available in DSpace on 2016-08-18T11:53:56Z (GMT). No. of bitstreams: 1 Daniel de Almeida Leão.pdf: 1416276 bytes, checksum: ba4bc8cff6ad87ee22845be2197eedfb (MD5) Previous issue date: 2016-04-28 / This study has as its main goal to investigate the relation between the grammatical system of gender classification for the nouns of the Portuguese language in Brazil and the biological gender of their referents from the perspective of language as a probabilistic system (Halliday, 1991, 1993). More specifically, the investigation extracted the frequencies for the grammatical gender of the nouns (masculine and/or feminine) for the Portuguese language in Brazil and the relation between the grammatical gender and the biological sex of the nouns. For such, this study has as its basis the Corpus Linguistics, a theoretical-scientific methodology which sees the language as a probabilistic system, through the observation of empirical data (Berber Sardinha, 2004). Although the grammatical gender is an aspect of the language approached throughout the grammars of the Portuguese language and its study constantly discussed among scholars and researchers of the field, the great majority of these studies have as basis a traditional perspective of the language, brought by the use of norms (Bechara, 2013). This means that, possibly, there is no other study about this subject which is based on the language in use, in a probabilistic approach (Halliday, 1991, 1993), following the principles of Corpus Linguistics (Berber Sardinha, 2004). In order to accomplish this goal, this work was executed as the following: (i) all the nouns of a corpus (The Brazilian Corpus of Register Variation – CBVR) were extracted; (ii) the nouns were transferred to a database in which they could be classified; (iii) the nouns were classified manually in respect to their grammatical gender and biological gender, following the criteria described in this work’s methodology; (iv) after classifying the nouns, they were accounted according to each of the categories described in the methodology, (v) after that, for each research question, the frequencies were extracted and the probabilities were calculated and; (vi) the research questions were answered based on how the frequencies and probabilities had been revealed. In bringing up the results, it is expected that this research has been able to contribute for offering a new perspective about this subject, one that takes into account the current Portuguese language in Brazil for the 21st century. It is also expected that the methodology designed for the execution of this study could be adapted and applied to several other studies of similar goals, bringing new perspectives for other aspects of the language / O trabalho teve como objetivo principal investigar a relação entre o sistema gramatical de gênero dos substantivos do português Brasil e o gênero biológico de seus referentes a partir da visão da linguagem como sistema probabilístico (Halliday, 1991,1993). Mais especificamente, foi investigada a frequência dos gêneros dos substantivos (masculinos e femininos) na língua portuguesa escrita e falada no Brasil e a relação entre o sistema de gênero gramatical e o gênero biológico dos substantivos. Para tal, o estudo realizado tem como base a Linguística de Corpus, metodologia teórico-científica que vê a língua como sistema probabilístico por meio da observação de dados empíricos (Berber Sardinha, 2004). Embora o gênero gramatical dos substantivos seja um aspecto abordado em todas as gramáticas da língua e seja discutido por acadêmicos e pesquisadores da área constantemente, a grande maioria dos estudos possui base em uma visão tradicional, fixada pelo uso da norma (Bechara, 2013). Isso significa que, possivelmente, não haja estudo acerca do tema que reflete a língua em uso de maneira probabilística (Halliday 1991, 1993), conforme os pressupostos da Linguística de Corpus (Berber Sardinha, 2004).Para a consecução desse objetivo, a pesquisa se sucedeu da seguinte maneira: (i) foram extraídos todos os substantivos de um corpus (o Corpus Brasileiro de Variação de Registros - CBVR); (ii) os substantivos foram transferidos para uma base de dados sob a qual puderam ser classificados; (iii) foi feita a classificação manual de cada um dos substantivos quanto ao gênero gramatical e gênero biológico, seguindo os critérios descritos na metodologia deste trabalho; (iv) ao final da classificação, foi feita contagem de quantos substantivos foram classificados para cada uma as categorias descritas; (v) foram extraídas as frequências e calculadas as probabilidades para cada uma das perguntas de pesquisa e; (vi) as perguntas foram respondidas com base nas frequências e probabilidades reveladas. Ao trazer os resultados, espera-se que esta pesquisa tenha contribuído para oferecer uma nova perspectiva acerca do tema, uma que leve em consideração o português do Brasil em uso corrente no século XXI. Espera-se também que a metodologia desenhada para a execução deste estudo possa ser adaptada e aplicada em diversos outros de cunho similar, trazendo novas perspectivas para outros aspectos da língua

Page generated in 0.0938 seconds