• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 14
  • Tagged with
  • 16
  • 16
  • 9
  • 6
  • 5
  • 5
  • 5
  • 5
  • 5
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Propriedades sintáticas das orações adverbiais causais e explicativas em português brasileiro

Hobold, Aline Freiberger January 2017 (has links)
Orientador : Profª Drª Patrícia de Araújo Rodrigues / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Humanas, Programa de Pós-Graduação em Letras. Defesa: Curitiba, 22/08/2017 / Inclui referências : f. 100-103 / Resumo:Essa dissertação tem por objetivo comparar os estudos sobre as orações subordinadas adverbiais causais em comparação com as orações coordenadas sindéticas explicativas. Tal comparação se justifica porque suas definições são semelhantes e, muitas vezes, se confundem. Por exemplo, ambas expressam a ideia de razão, motivo causa. As conjunções associadas as essas orações também são outro problema: são as mesmas para os dois tipos. Outro fator a ser analisado é a possibilidade de as SAC serem orações fechadas, no sentido de que não funcionam como argumento da sentença, mas como adjuntos. Como as definições apresentadas sobre essas orações pela gramática tradicional (GT) não são suficientes, serão analisadas as visões apresentadas em gramáticas descritivas (GD), assim como as apresentadas em estudos gerativistas. Sendo assim, para realizar a comparação entre tais sentenças, é necessário discutir (i) a distinção entre subordinação e coordenação e (ii) a diferença entre causa e explicação. Além disso, serão analisados os comportamentos das conjunções que, pois e porque presentes tanto em orações explicativas quanto em orações causais. Serão, então, exploradas as hipóteses de as orações causais e explicativas com porque serem subordinadas (defendida por Lobo (2003), a qual afirma que afirma que é necessário basear-se em critérios formais para distinguir os dois tipos de oração e, para isso, propõe diversos testes com o objetivo de diferenciar causais e explicativas) e de as orações explicativas serem, de fato, coordenadas (defendida por Colaço e Matos (2016), as quais assumem que as orações explicativas são um tipo de parentéticas). A partir da análise dos testes e das hipóteses, a conclusão dessa dissertação indica que as orações causais são analisadas, sem controvérsia, como orações subordinadas. Já para as orações explicativas não há um consenso na análise: Lobo (2003) assume que as explicativas são coordenadas; Matos (2003; 2006) assume que essas orações são subordinadas de tipo periférico (enquanto as causais seriam subordinadas integradas); e Colaço e Matos (2016) analisam as explicativas como coordenadas especificantes. Palavras-chave: Subordinação. Coordenação. Oração causal. Oração explicativa. / Abstract: The purpose of this dissertation is to compare the studies on causal subordinate adverbial clauses in comparison with explicative coordinate clauses. Such a comparison is justified because their definitions are similar and often confused. For example, both express the idea of reason, cause. The conjunctions associated with these sentences are also another problem: they are the same for the two types. Another factor to be analyzed is the possibility of causal subordinate adverbial clauses being closed sentences, in the sense that they do not function as an argument of the sentence, but as adjuncts. As the definitions presented in these clauses by traditional grammar are not sufficient, the visions presented in descriptive grammar will be analyzed, as well as those presented in generative studies. Thus, to make a comparison between such sentences, it is necessary to discuss (i) the distinction between subordination and coordination and (ii) the difference between cause and explanation. In addition, we will analyze the behaviors of the conjunctions that, therefore and because present in both explanatory sentences and causal sentences. The hypothesis of the causal and explanatory sentences with which they are subordinated will be explored (defended by LOBO, 2003, which affirms that it is necessary to be based on formal criteria to distinguish the two types of sentence and, for this, proposes several tests with the objective of differentiating causal and explicative) and explicative sentences are in fact coordinated (defended by Colaço and Matos, 2016, which they see assume that explicative sentences are a type of parenthetical). From the analysis of the tests and the hypotheses, the conclusion of this dissertation indicates that the causal sentences are analyzed, without controversy, as subordinate clauses. For the explicative sentences, there is no consensus in the analysis. Lobo (2003) assumes that the explicative clauses are coordinated; Matos (2003; 2006) assumes that these sentences are subordinate of a peripheral type (while the causal ones would be subordinate integrated); And Colaço and Matos (2016) analyze explicative as specifying coordinates. Key words: Subordination. Coordination. Causal sentence. Explicative sentence.
2

A gramática da sentença em português: uma descrição formal com um "olho" na implementação computacional

Othero, Gabriel de Ávila January 2008 (has links)
Made available in DSpace on 2013-08-07T19:00:55Z (GMT). No. of bitstreams: 1 000410050-Texto+Completo-0.pdf: 1300754 bytes, checksum: a8930e4fa82c505a7f105c92bb96468b (MD5) Previous issue date: 2008 / We study the syntactic structure of the sentence in Brazilian Portuguese (BP), in its canonical order, SVO. We formulate categorial phrase structure rewrite rules of the sentence and of the phrases in BP (both lexical and functional XPs), using standard X-bar theory. We continue the work we began in Othero (2004), when we analyzed some structures of the simple sentence in BP. Now we also analyze complex sentences, including embedded sentences and sentences with two or more verbs (complex predicate sentences and structures with auxiliary verbs). We formulate grammar rules to describe the structure of the sentence in Portuguese and present a grammar that can be computationally implemented, in a way similar to the one we showed in Othero (2006), for example. / Estudamos a estrutura sintática da sentença do português brasileiro (PB) em sua ordem canônica, SVO, formulando regras de reescrita para a descrição da sentença e dos sintagmas que a formam, tanto sintagmas lexicais quanto funcionais. Adotamos como formalismo sintático uma phrase structure grammar livre de contexto, seguindo de perto alguns princípios fundamentais propostos pela teoria X-barra standard. Damos continuidade ao trabalho de Othero (2004), em sua análise formal da estrutura sintática da sentença simples em PB. Agora, formalizamos também as regras de boa formação de sentenças complexas do PB, incluindo estruturas com sentenças encaixadas, com locuções verbais e com predicados complexos. Propomos regras categoriais de reescrita que descrevem adequadamente a estrutura sintática da frase em PB e que são passíveis de implementação computacional, como demonstrado por Othero (2006), por exemplo.
3

Teoria e aplicação : uma visão critica de um modelo de reconhecimento de sentença

Lopez, Doraci Kalvon 14 July 2018 (has links)
Orientador: Angela Kleiman / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem / Made available in DSpace on 2018-07-14T21:35:35Z (GMT). No. of bitstreams: 1 Lopez_DoraciKalvon_M.pdf: 6711068 bytes, checksum: 19541c314efbe31769b4c242451c08ee (MD5) Previous issue date: 1981 / Resumo: O objetivo inicial deste trabalho era a identificação de aspectos sintáticos que pudessem ser causadores de problemas de leitura. Para essa tarefa, tomou-se como base teórica os modelos de reconhecimento de sentença de Bever (1970) e Fodor et all (1974) que destacam a relevância da seqüência NVN na percepção de sentenças. Utilizando este subsídio teórico, realizamos uma análise comparativa da freqüência daquela estrutura na linguagem escrita e na linguagem falada, especifica mente no discurso didático. Esta investigação levou a um questionamento de três aspectos fundamentais do modelo teórico adotado: a) a postulação de estrutura NVN, correspondendo a ator-ação-objeto, como nuclear, b) a utilização de resultados obtidos em testes formais de compreensão e; c) a extrapolação de resultados obtidos, na compreensão de sentenças isoladas, para explicar problemas de compreensão na situação dialógica. A análise funcional, proposta aqui, evidencia inadequação de uma série de estudos que se propõem a oferecer subsídios para explicar problemas de compreensão. Este trabalho, questionando a adequação de um modelo de reconhecimento de sentença, discutindo seus pressupostos e bases experimentais é, por extensão, uma critica à literatura que oferece subsídios para a elaboração de trabalhos dentro da Lingüística Aplicada, e que utiliza os mesmos tipos de experimentos e que adota, básicas, as mesmas pressuposições / Abstract: Not informed. / Mestrado / Mestre em Linguística
4

A subordinação no português brasileiro: da tradição gramatical à visão lingüística

Moreira, Edelvira Aída da Silva January 2007 (has links)
Made available in DSpace on 2013-08-07T19:02:59Z (GMT). No. of bitstreams: 1 000400601-Texto+Completo-0.pdf: 13181921 bytes, checksum: 33ca7a1be68ed3f097c69406211a9cad (MD5) Previous issue date: 2007 / The present paper has as its main goal to investigate the subordinated process in jornalistic editorials, with a focus on the prescriptive approach, as a whole, spread by the traditional grammars, and in the functionalistic theories to explain the manifestations and interference of the functional level of the language in the choice of verbal forms and of the indicative in the building of subordinate sentences in texts which express opinion. Twenty three texts are used in the sample, text which were taken from the main Brazilian newspapers. From the data collected, it is possible to verify the occurrences in subordinate sentences of the verbal forms and the indicative form and to analyse the peculiarities found by these linguistic elements in the building of subordinate sentences. The analyses results evidence that the verb is presented in the infinitive in the different syntactive structures and that the sentences predominance reduced of participle, in an indicative manner of the adjective sentence implies the language functionality, established by the different use contexts in which it is inserted. This way, the subordination does not follow the grammatical standards in the building of the subordinate sentence and has as principal the functional level of the language as determinant in the choice of the forms and verbal manners in texts expressing opinions. / Este trabalho tem como objetivo investigar a sentença subordinativa em editoriais jornalísticos, detendo-se, no estudo prescritivista, como um todo, difundido pelas gramáticas tradicionais, e nas teorias funcionalistas, para explicar as manifestações e interferência do nível funcional da língua na escolha das formas verbais e do modo indicativo para a instituição da oração subordinada nos textos de opinião. A amostra é constituída por 23 textos de editoriais veiculados pelos principais jornais brasileiros. A partir dos dados levantados, é possível constatar as ocorrências em orações subordinadas das formas verbais e do modo indicativo e analisar as peculiaridades encontradas por esses elementos lingüísticos na composição das sentenças subordinativas. Os resultados das análises evidenciam que o verbo se apresenta no infinitivo em diferentes estruturas sintáticas e que o predomínio das orações reduzidas de particípio, do modo indicativo e da oração adjetiva implica funcionalidade da língua, estabelecida nos diferentes contextos de uso em que está inserido o editorial jornalístico. Assim, a subordinação não segue os padrões gramaticais tradicionais na instituição da sentença subordinativa e tem como princípio que a escolha das formas e dos modos verbais, em textos de opinião, tem como determinante o nível funcional da língua.
5

Monitoramento de idosos em ambientes internos por meio da análise sintática de dados visuais

Silva, José do Patrocínio dos Santos, 92-98153-4760 05 April 2017 (has links)
Submitted by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2017-08-21T14:44:13Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação - José P. S. Silva.pdf: 4310537 bytes, checksum: a6569eccdd783164dbb2be973c780ac0 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2017-08-21T14:44:25Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação - José P. S. Silva.pdf: 4310537 bytes, checksum: a6569eccdd783164dbb2be973c780ac0 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2017-08-21T14:44:37Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação - José P. S. Silva.pdf: 4310537 bytes, checksum: a6569eccdd783164dbb2be973c780ac0 (MD5) / Made available in DSpace on 2017-08-21T14:44:37Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação - José P. S. Silva.pdf: 4310537 bytes, checksum: a6569eccdd783164dbb2be973c780ac0 (MD5) Previous issue date: 2017-04-05 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Systems for monitoring human activities are used to detect risk situation that may compromise one’s physical integrity or health. These systems support more efficient actions from people responsible for guarding and monitoring the elderly, children, or ill through identification of dangerous activities. This work aims to perform fall recognition of elderly people indoors properly monitored by a camera system. The developed approach uses syntactic descriptions of primitives extracted and characterized from the movements of the elderly. The recognition is given by finite-state automata governed by pre-established grammatical rules. This methodology was applied in several daily situations of elderly people who eventually suffer a fall indoors. The results obtained prove to be satisfactory and point to the feasibility and integration of the methodology in the monitoring systems of elderly activities. / Nos dias atuais, os sistemas para monitoramento de atividades humanas são utilizados para detectar situações de risco ou atividades que possam comprometer a integridade física ou a saúde das pessoas. Esses sistemas favorecem a atuação ou intervenção mais rápida e eficiente de profissionais responsáveis pela guarda e monitoramento de pessoas idosas, crianças ou enfermos a partir da detecção e reconhecimento de ações ou atividades de risco. Este trabalho objetiva realizar o monitoramento e reconhecimento de queda de pessoas idosas em ambiente interno provido por um sistema de câmeras. A grande incidência de queda de idosos tem sido considerada um dos principais problemas de saúde pública e afeta diretamente a economia devido aos custos consideráveis de internação, tratamento e assistenciais. A abordagem desenvolvida utiliza descrições sintáticas de primitivas extraídas e caracterizadas a partir de movimentos de idosos. Esta metodologia foi aplicada em diversas situações cotidianas de pessoas idosas que eventualmente sofrem uma queda em ambientes internos. Os resultados obtidos demonstram-se satisfatórios e apontam para a viabilidade e integração da metodologia aos sistemas de monitoramento de atividades de pessoas idosas.
6

Um analisador sintático neural multilíngue baseado em transições

Costa, Pablo Botton da 24 January 2017 (has links)
Submitted by Ronildo Prado (ronisp@ufscar.br) on 2017-08-23T18:26:08Z No. of bitstreams: 1 DissPBC.pdf: 1229668 bytes, checksum: 806b06dd0fbdd6a4076384a7d0f90456 (MD5) / Approved for entry into archive by Ronildo Prado (ronisp@ufscar.br) on 2017-08-23T18:26:15Z (GMT) No. of bitstreams: 1 DissPBC.pdf: 1229668 bytes, checksum: 806b06dd0fbdd6a4076384a7d0f90456 (MD5) / Approved for entry into archive by Ronildo Prado (ronisp@ufscar.br) on 2017-08-23T18:26:21Z (GMT) No. of bitstreams: 1 DissPBC.pdf: 1229668 bytes, checksum: 806b06dd0fbdd6a4076384a7d0f90456 (MD5) / Made available in DSpace on 2017-08-23T18:26:28Z (GMT). No. of bitstreams: 1 DissPBC.pdf: 1229668 bytes, checksum: 806b06dd0fbdd6a4076384a7d0f90456 (MD5) Previous issue date: 2017-01-24 / Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) / A dependency parser consists in inducing a model that is capable of extracting the right dependency tree from an input natural language sentence. Nowadays, the multilingual techniques are being used more and more in Natural Language Processing (NLP) (BROWN et al., 1995; COHEN; DAS; SMITH, 2011), especially in the dependency parsing task. Intuitively, a multilingual parser can be seen as vector of different parsers, in which each one is individually trained on one language. However, this approach can be a really pain in the neck in terms of processing time and resources. As an alternative, many parsing techniques have been developed in order to solve this problem (MCDONALD; PETROV; HALL, 2011; TACKSTROM; MCDONALD; USZKOREIT, 2012; TITOV; HENDERSON, 2007) but all of them depends on word alignment (TACKSTROM; MCDONALD; USZKOREIT, 2012) or word clustering, which increases the complexity since it is difficult to induce alignments between words and syntactic resources (TSARFATY et al., 2013; BOHNET et al., 2013a). A simple solution proposed recently (NIVRE et al., 2016a) uses an universal annotated corpus in order to reduce the complexity associated with the construction of a multilingual parser. In this context, this work presents an universal model for dependency parsing: the NNParser. Our model is a modification of Chen e Manning (2014) with a more greedy and accurate model to capture distributional representations (MIKOLOV et al., 2011). The NNparser reached 93.08% UAS in English Penn Treebank (WSJ) and better results than the state of the art Stack LSTM parser for Portuguese (87.93% × 86.2% LAS) and Spanish (86.95% × 85.7% LAS) on the universal dependencies corpus. / Um analisador sintático de dependência consiste em um modelo capaz de extrair a estrutura de dependência de uma sentença em língua natural. No Processamento de Linguagem Natural (PLN), os métodos multilíngues tem sido cada vez mais utilizados (BROWN et al., 1995; COHEN; DAS; SMITH, 2011), inclusive na tarefa de análise de dependência. Intuitivamente, um analisador sintático multilíngue pode ser visto como um vetor de analisadores sintáticos treinados individualmente em cada língua. Contudo, a tarefa realizada com base neste vetor torna-se inviável devido a sua alta demanda por recursos. Como alternativa, diversos métodos de análise sintática foram propostos (MCDONALD; PETROV; HALL, 2011; TACKSTROM; MCDONALD; USZKOREIT, 2012; TITOV; HENDERSON, 2007), mas todos dependentes de alinhamento entre palavras (TACKSTROM; MCDONALD; USZKOREIT, 2012) ou de técnicas de agrupamento, o que também aumenta a complexidade associada ao modelo (TSARFATY et al., 2013; BOHNET et al., 2013a). Uma solução simples surgiu recentemente com a construção de recursos universais (NIVRE et al., 2016a). Estes recursos universais têm o potencial de diminuir a complexidade associada à construção de um modelo multilíngue, uma vez que não é necessário um mapeamento entre as diferentes notações das línguas. Nesta linha, este trabalho apresenta um modelo para análise sintática universal de dependência: o NNParser. O modelo em questão é uma modificação da proposta de Chen e Manning (2014) com um modelo mais guloso e preciso na captura de representações distribuídas (MIKOLOV et al., 2011). Nos experimentos aqui apresentados o NNParser atingiu 93, 08% de UAS para o inglês no córpus Penn Treebank e resultados melhores do que o estado da arte, o Stack LSTM, para o português (87,93% × 86,2% LAS) e o espanhol (86,95% × 85,7% LAS) no córpus UD 1.2.
7

Propriedades das línguas naturais e o processo de aquisição = reflexões a partir da implementação do modelo em Berwick (1985) / Properties of natural languages and the acquisitions process : reflections based on an implementation of the model in Berwick (1985)

Faria, Pablo, 1978- 12 March 2009 (has links)
Orientador: Ruth Elisabeth Vasconcellos Lopes / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem / Made available in DSpace on 2018-08-16T06:36:14Z (GMT). No. of bitstreams: 1 Faria_Pablo_M.pdf: 1248984 bytes, checksum: 9609dfcb9ddec33250dfdefdb367fb5a (MD5) Previous issue date: 2009 / Resumo: Nesta dissertação de mestrado, o objetivo principal é refletir sobre algumas propriedades da linguagem e do processo de aquisição, tomando como ponto de partida questões que surgiram durante o processo de implementação do modelo proposto em Berwick (1985). O quadro teórico geral em que esta pesquisa se situa é o da Gramática Gerativa - na linha chomskiana - e, em particular, o modelo implementado aqui tem como principal base teórica a Gramática Transformacional (Cf. CHOMSKY, 1965). Entre as propriedades da linguagem que discutimos estão: os traços distintivos dos itens lexicais, a assimetria entre especificadores e complementos, categorias vazias e o papel da informação temática na sintaxe. A idéia subjacente que permeia as reflexões é a busca por um olhar mais abstrato sobre o conhecimento gramatical, procurando rever ou até eliminar dispositivos que, em primeiro lugar, aparecem como obstáculos significativos para o analisador e, em segundo lugar, resistem à identificação de evidências para sua aquisição, do ponto de vista do aprendiz da língua. Para atingir estes objetivos, a primeira metade do trabalho faz uma breve discussão teórica, para em seguida trazer uma apresentação razoavelmente detalhada do modelo de Berwick, incluindo exemplos de funcionamento. A segunda metade inclui a discussão dos resultados juntamente com as reflexões sobre a linguagem, procurando apontar caminhos que não apenas possam tornar o modelo de aquisição mais robusto, mas que levantem questões para investigação em teoria gramatical. Neste sentido, este trabalho - por se situar numa área multidisciplinar, a saber, a lingüística computacional - procura tornar explícitas as contribuições que esse tipo de investigação pode fazer à teoria lingüística. / Abstract: The main goal of this MA thesis is to discuss some properties of language and its acquisition process, taking as a starting point some issues that emerged during the implementation of the acquisition model proposed by Berwick (1985). Our general theoretical framework is the Generative Grammar - as proposed in Chomsky's works - and, in particular, the Transformational Grammar model (Cf. CHOMSKY, 1965). Some of the language properties discussed here involve: the set of distinctive features for lexical items, the asymmetry between specifiers and complements, empty categories and the role of thematic information in syntax. The subjacent idea surrounding the reections on language is the search for a more abstract view of the grammatical knowledge such that some of the theoretical devices can be revised or even abandoned. Two main goals drive this effort: first, the elimination of some significant obstacles in the parser's task to analyze sentences. Second, the elimination of those devices for which we cannot find proper evidence for their acquisition, considering the learner's perspective. In order to pursue these goals, in the first part of this work we set out the theoretical background for the whole discussion and give a somewhat detailed presentation of Berwick's acquisition model and examples of its functioning. In the second part we include a discussion of the results upon which the reection is built, whereby we point out some ways not only to increase the robustness of the acquisition model, but also to raise questions for further research in grammatical theory. In this sense, this work - which pertains to an interdisciplinary field, i.e, computational linguistics - tries to make explicit the contributions that this kind of investigation can offer to linguistic theory. / Mestrado / Linguistica / Mestre em Linguística
8

Analise e comparação qualitativa de sistemas de detecção de plagio em tarefas de programação / Qualitative analysis and comparison of plagiarism detection systems on programming coursework

Kleiman, Alan Bustos 22 June 2007 (has links)
Orientador: Tomasz Kowaltowski / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-09T11:46:19Z (GMT). No. of bitstreams: 1 Kleiman_AlanBustos_M.pdf: 724679 bytes, checksum: 98bfcce8c89306724c31252f82cf7cc0 (MD5) Previous issue date: 2007 / Resumo: Plágio em submissões de alunos e um problema que vem aumentando ao longo do tempo e instituições de ensino têm trabalho considerável para eliminá-lo. Examinamos o problema do ponto de vista de submissões de alunos em disciplinas introdutórias de programação, fazendo um resumo de alguns sistemas e algoritmos existentes. Implementamos vários algoritmos descritos com a finalidade de efetuar uma comparação direta e qualitativa, com foco no pré-processamento de programas. Em particular, desenvolvemos um mecanismo para a normalização de programas através de uma análise sintática cuidadosa e reordenação da árvore de sintaxe abstrata de maneira a minimizar a quantidade de ruído criada por plagiadores ao tentar copiar e modificar programas de outros. Conseguimos resultados positivos utilizando esse método de pré-processamento, especialmente quando combinado com o algoritmo conhecido como Running Karp Rabin Greedy String Tiling. Esses resultados positivos reforçam nossa conclusão de que o pré-processamento pode ser até mais importante que o algoritmo em si, e apontam novas direções para pesquisas futuras / Abstract: Encountering plagiarism in student coursework has become increasingly common, and signifcant effort has been undertaken to counter this problem. We focus on the plagiarism in student submissions in programming courses, in particular in introductory computer science courses, describing some of the existing systems and algorithms already dedicated to this problem. We implement many of the algorithms so that we could undertake a direct and qualitative comparison, with a special focus on pre-processing student programs. In particular, we develop a mechanism for normalizing programs through careful parsing and ordering of their abstract syntax trees so as to minimize the noise created by plagiarists attempting to copy and modify someone else's program. We achieve positive results utilizing this new pre-processing method, particularly with the Running Karp Rabin Greedy String Tiling algorithm. The positive results reinforce our conclusion that pre-processing may be more important than the algorithm itself and point to new directions for further research / Mestrado / Sistemas de Computação / Mestre em Ciência da Computação
9

O timbira falado pelos Canela Apaniekra : uma contribuição aos estudos da morfossintaxe de uma lingua Je

Alves, Flavia de Castro 26 November 2004 (has links)
Orientador: Lucy Seki / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem / Made available in DSpace on 2018-08-04T00:47:47Z (GMT). No. of bitstreams: 1 Alves_FlaviadeCastro_D.pdf: 5740323 bytes, checksum: b4b1f81385950a60c1cb6ee2e8bcfa15 (MD5) Previous issue date: 2004 / Resumo: O objetivo deste trabalho é apresentar uma descrição de aspectos fundamentais da morfossintaxe da língua Timbira falada pelos Apãniekrá da Área Indígena Porquinhos, localizada no interior do estado do Maranhão. O trabalho compreende seis capítulos. O capítulo 1 apresenta informações gerais relacionadas aos povos Timbira (quem e quantos são, sua localização e um breve histórico da minha relação com eles (como lingüista e como assessora lingüística)); os trabalhos anteriores sobre a(s) língua(s) falada(s) por esses povos e sobre a minha proposta de classificação, baseada na comparação dos inventários fonêmicos, das categorias de tempo, aspecto e modo, da ordem dos constituintes e da ergatividade morfológica, de serem duas as línguas dos povos Timbira (a língua Timbira, falada pelos povos Timbira à direita do Rio Tocantins (Apãniekrá, Ramkokamekrá, Krahô, Gavião Pykobjê e Krikatí) e pelos Gavião do Pará, e a língua Apinajé, falada pelos Apinajé que estão à esquerda do mesmo rio). O capítulo 2 apresenta uma análise de aspectos da fonologia do Apãniekrá, resultado de uma revisão da minha dissertação de mestrado. Os capítulos 3 a 5 apresentam uma descrição de tópicos selecionados da morfossintaxe do Apãniekrá que contribuem para uma compreensão mais aprofundada do fenômeno da ergatividade em Timbira e nas línguas Jê: o capítulo 3 (classes de palavras) apresenta as características semânticas, sintáticas e morfológicas das principais classes de palavras: nome, verbo, advérbio, pronome, numerais, posposições, conjunções e partículas; o capítulo 4 (orações simples) apresenta a ordem dos constituintes, os sistemas de marcação de caso (Ativo-Estativo, Nominativo-Absolutivo e Ergativo-Absolutivo), os principais tipos de predicado (verbais e não-verbais) e a estrutura das orações declarativas e negativas das orações simples da língua; o capítulo 5 (orações complexas) apresenta as sentenças complexas (as subordinadas completivas, com verbos de modalidade, de manipulação e de percepção, cognição, expressão, as relativas e as coordenadas), os mecanismos de co-referenciação e o sistema de switch-reference. O capítulo 6 apresenta uma hipótese para o aparecimento da ergatividade morfológica em Timbira: a partir da comparação de determinadas propriedades morfossintáticas com outras três línguas Jê (Apinajé - Kayapó - Suyá), levanto uma hipótese para o aparecimento da ergatividade em Timbira. Foi proposto considerar também, dentro da família lingüística Jê, o subgrupo Apinajé - Kayapó - Suyá - Timbira / Abstract: This work endeavors to describe the phonological system, word classes, case marking and agreement systems, phrases, simple c1auses, types of predicate and complex sentences of Timbira Apãniekrá, language of northern branch of the Jê family. This language is spoken by approximately 450 people living at Área Indígena Porquinhos in the state of Maranhão, Brazil. This dissertation explore too the hypothesis that the nominalization construction is one possible source for ergativity in this language / Doutorado / Doutor em Linguística
10

Técnicas de parsing para gramática livre de contexto lexicalizada da língua portuguesa.

Cinthyan Renata Sachs Camerlengo de Barbosa 00 December 2004 (has links)
Este trabalho apresenta algoritmos de reconhecimento e parsing para um subconjunto da Gramática Livre de Contexto Lexicalizada (GLCL) da língua portuguesa. A GLCL apresentada neste trabalho estende o domínio de localidade de uma Gramática Livre de Contexto (GLC) do português fazendo com que um item lexical (símbolo terminal das gramáticas formais) apareça como parte das estruturas elementares sem alterar as estruturas das árvores utilizadas, o que é lingüisticamente muito significativo. A GLCL é uma forma restrita da Gramática de Adjunção de Árvores Lexicalizada (LTAG) que pode somente gerar linguagens livres de contexto, mantendo limites de complexidade de ordem cúbica, no pior caso, para o reconhecimento e parsing. Inicialmente, é apresentada uma introdução à área das Interfaces em Linguagem Natural para Banco de Dados (ILNBDs) referenciando as principais motivações e problemas encontrados no uso destas. O trabalho também apresenta uma introdução ao processamento da linguagem natural, situando gramáticas e analisadores sintáticos, buscando inserir este trabalho em seu contexto. Para um embasamento teórico é descrito o formalismo das GLCLs, com suas características, componentes, e operações de combinações entre os componentes. Os componentes principais do formalismo são dois conjuntos de árvores: árvores iniciais, as quais são combinadas por substituição, e árvores auxiliares, combinadas por uma forma restrita de adjunção.A seguir, é apresentado o subconjunto da língua escolhida. Algumas famílias de árvores foram descritas, mostrando um conjunto de orações na voz ativa, passiva, orações relativas, interrogativas e clivadas. A gramática está descrita de acordo com o formalismo da GLCL. Finalmente, algoritmos de reconhecimento e parsing para a GLCL da língua portuguesa serão desenvolvidos.

Page generated in 0.0751 seconds