• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 6
  • 6
  • 1
  • 1
  • 1
  • Tagged with
  • 12
  • 12
  • 6
  • 6
  • 5
  • 5
  • 5
  • 5
  • 5
  • 4
  • 4
  • 3
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

[en] DESCRIPTION AND FORMALIZATION OF COMPOUND WORD IN BRAZILIAN PORTUGUESE FOR AN ELECTRONIC DICTIONARY / [fr] DESCRIPTION ET FORMALISATION DE MOTS COMPOSÉS DU BRÉSILIEN EN VUE DE L´ÉLABORATION D´UN DICTIONNAIRE ÉLECTRONIQUE / [pt] DESCRIÇÃO E FORMALIZAÇÃO DE PALAVRAS COMPOSTAS DO PORTUGUÊS DO BRASIL PARA ELABORAÇÃO DE UM DICIONÁRIO ELETRÔNICO

AUCIONE DAS DORES SMARSARO 10 September 2004 (has links)
[pt] Neste trabalho estudam-se os nomes com a estrutura NdeN que podem ser descritos como nomes compostos por justaposição. São observadas 1.500 seqüências de palavras, com o objetivo de contribuir na descrição formal do léxico do português do Brasil e de definir os critérios de identificação de um nome composto com essa estrutura. O critério geral está baseado no conceito da nãocomposicionalidade semântica. Os testes são feitos a partir das propriedades sintáticas e semânticas que há na relação entre os elementos que constituem o grupo nominal, mostrando as distinções entre um grupo nominal livre e um grupo nominal composto. Entre as propriedades, podem ser destacadas: o bloqueio distribucional, a inseparabilidade, a inserção lexical, o apagamento de N2, a substituição de N2 e as variações em gênero e número. Essa descrição mostra-se útil na medida em que um conjunto de regras e critérios de delimitação de unidades lexicais foi definido, constituindo uma base para a incorporação de novos itens ao léxico. Por fim, as propriedades das entradas incorporadas receberam uma representação formal, resultando na criação de um dicionário eletrônico utilizável em processos eletrônicos. / [en] This paper is a study of the NofN structure nouns, which may be described as compound nouns by juxtaposition. 1500 word sequences are observed, aiming at contributing to the formal description of the Brazilian Portuguese lexicon, and defining the identification criteria of a compound noun with such a structure. The general criterion is based on the concept of semantic non- compositionality. The tests are made from the syntactic and semantic properties existing in the relationship between the elements that constitute the nominal group, showing the differences between a free nominal group and a compound nominal group. Among such properties, the following can be pointed out: distributional blockage, inseparability, lexical insertion, N2 erasing, N2 substitution, and gender and number variations. Such description proves to be useful in the sense that a set of lexical units delimitation rules and criteria has been defined, constituting a basis for the incorporation of new items to the lexicon. Finally, the incorporated entries` properties received a formal representation, which resulted in the creation of an electronic dictionary that can be used in electronic processes. / [fr] On étudie dans ce travail les noms formés par la structure NdeN qui caractérise un nom composé par juxtaposition. On a observé 1.500 séquences de mots, pour définir les critères d`identification d`un nom composé par cette structure. Le critère general est fondé sur le concept de la non compositionalité sémantique. Les tests ont été faits à partir des propriétés syntaxiques et sémantiques qu`il y a dans la relation existante entre les éléments qui constituent le groupe nominal, en démontrant les distinctions entre un groupe nominal libre et un groupe nominal composé. Parmi ces propriétés, on peut remarquer le bloquement distributionnel, l`inséparabilité, l`insertion lexical, l`effacement de N2, le remplacement de N2 et les variations en genre et en nombre. En examinant ces propriétés, on a pu observer qu`il y a des irrégularités dans la formation de ce procès. Cette description devient utile dans la mesure que cette reconnaissance peut être formulée et qu`un ensemble de règles et de critères de délimitation d`unités lexicales peut être defini, et que, par là, on peut aboutir à l`incorporation de nouveaux items lexicaux. Au bout, en tenant compte de la possibilité de formalisation, les mots composés peuvent être processés automatiquement dans les diccionnaires électroniques.
2

Lexique-grammaire et Unitex : quels apports pour une description terminologique bilingue de qualité ? : analyse sur deux corpus comparables de médecine thermale / Lexicon-grammar and Unitex : are they suitable for a bilingual terminological description? : analysis on two comparable corpora of thermal medecine

Cetro, Rosa 05 April 2013 (has links)
La terminologie est une science qui étudie les termes, ces unités lexicales véhiculant un sens spécialisé dans un discours scientifique ou technique. Constituée en science dans la première moitié du XXe siècle, la terminologie est un terrain interdisciplinaire qui se nourrit des apports de la linguistique, de la logique et de l'informatique. C'est surtout grâce à cette dernière qu'elle a pu se développer considérablement. Le lexique-grammaire est une méthode de description linguistique strictement empirique d'inspiration harrissienne qui a vu le jour en France à la fin des années 1960. La description linguistique a été menée en parallèle avec la réalisation d'outils informatiques nécessaires à la formalisation et à l'exploitation de ces données, parmi lesquels il y a aussi le logiciel Unitex (Paumier, 2002). Tant le lexique-grammaire que le logiciel Unitex présentent un potentiel intéressant, largement inexploité, pour la terminologie. Dans ce travail, nous nous proposons d'évaluer les apports des méthodes liées au lexique-grammaire et au logiciel Unitex à une description terminologique bilingue de qualité. Après avoir défini des critères de qualité d'une description terminologique, nous menons cette évaluation sur deux corpus comparables ayant trait à la médecine thermale, en français et en italien / Terminology is the science concerned with the study of the terms, those lexical units thatpossess a specialized meaning within a scientific or technical context. Established as ascience in the first half of 20th century, terminology is an interdisciplinary field takingadvantage of contributions from linguistics, logics, and informatics. This latter in particularhas allowed significant developments in terminology. Lexicon-grammar is an empirical method of linguistic description inspired by the works of Zellig S. Harris, which has been founded by the French linguist Maurice Gross at the end of the 1960s. Linguistic description has been carried out in parallel with the development of informatics tools able to formalise and exploit linguistic data, including the software Unitex (Paumier, 2002). Both lexicon-grammar and Unitex have an interesting, largely unexploited potential for further developments in terminology. In this work, we assess the contributions brought by lexicon-grammar and Unitex to a high-profile bilingual terminological description. After defining quality criteria for such terminological description, we carry out our evaluation on two comparable corpora specific of thermal medicine, both in French and in Italian
3

Rôle des auxiliaires du passif en italien / Role of passive auxiliaries in italian

Castellani, Cristina 06 December 2018 (has links)
Le passif italien offre une variété de choix qui n‟est guère comparable à celle du français.En dehors de la forme canonique essere Vpp, il existe aussi les formes avec venire, andare, finire, rimanere, risultare, restare, stare. L‟objectif de ce travail est de comprendre le fonctionnement de essere, venire, andare, rimanere et restare, auxiliaires formateurs du passif italien, et la fonction de l‟existence d‟une telle diversité dans le cadre du Lexique-Grammaire de Maurice Gross et de la méthodologie de l‟Analyse Matricielle Définitoire (AMD) de Amr H. Ibrahim.L‟étude se développe sur 10 chapitres.La première partie présente l‟état de l‟art sur le passif italien et la description des 5 auxiliaires retenus, d‟après la description traditionnelle des linguistes et des grammairiens.Les chapitres suivants sont consacrés à la description de chaque auxiliaire et à la comparaison de leurs emplois. Le travail se conclut sur la synthèse des différentes caractéristiques des périphrases passives et sur des considérations d‟ordre aspectuo-temporel avec une tentative de systématisation.On constate que les auxiliaires sont rarement commutables et que chacun d'eux induit des restrictions d'ordre morpho-syntaxique et aspectuel différent. / Italian passive form offers a variety of choices that are hardly comparable to those of French. Apart from the canonical form essere and Past Participle, there are also the forms with venire, andare, finire, rimanere, risultare, restare, stare. The objective of this work is to understand the use of essere, venire, andare, rimanere and restare, auxiliaries of the Italian passive form, and the function of the existence of such a diversity within the framework of the Lexicon-Grammar of Maurice Gross and Amr H. Ibrahim's Methodology of Analytical Defining Matrixes (ADM).The study develops through 10 chapters.The first part introduces the state of the art on the Italian passive and the description of the chosen five auxiliaries, according to the traditional description of linguists and grammarians. The following chapters are devoted to the description of each auxiliary and the comparison of their uses.The work concludes with the synthesis of the different characteristics of passive periphrases and considerations of an aspectual-temporal order with an attempt at systematization.The aim of this work is to prove that the said auxiliaries are rarely commutable and that each of them introduces different morpho-syntactic and aspectual restrictions.
4

Descrição e classificação das expressões cristalizadas com ser e estar do português do Brasil

Carneiro, Amanda dos Santos 04 March 2016 (has links)
Submitted by Livia Mello (liviacmello@yahoo.com.br) on 2016-10-06T12:22:59Z No. of bitstreams: 1 DissASC.pdf: 3772859 bytes, checksum: 8170e2e66bfd0e2ae814994ee99aab36 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-20T18:37:17Z (GMT) No. of bitstreams: 1 DissASC.pdf: 3772859 bytes, checksum: 8170e2e66bfd0e2ae814994ee99aab36 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-20T18:37:23Z (GMT) No. of bitstreams: 1 DissASC.pdf: 3772859 bytes, checksum: 8170e2e66bfd0e2ae814994ee99aab36 (MD5) / Made available in DSpace on 2016-10-20T18:37:29Z (GMT). No. of bitstreams: 1 DissASC.pdf: 3772859 bytes, checksum: 8170e2e66bfd0e2ae814994ee99aab36 (MD5) Previous issue date: 2016-03-04 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / This dissertation aims to make a description and classification of frozen expressions of Brazillian's Portuguese that are built with the verbs ser and estar. We consider that frozen expressions are those whose overall meaning cannot be calculated from the sum of the parts that make it up, for example, pé frio in the phrase Leo é pé frio. For this work was adopted the theoretical-methodological perspective of Lexicon-Grammar (GROSS, 1975; GROSS 1981), which is fundamentally based on the Zellig Harris’s transformational grammar (1976). We have analyzed 530 expressions which are divided into eight different classes as distributional regularities. Each class is described in binary tables in which the lines are the expressions and the columns are the syntactic-semantic properties of each input. From the analysis of these classes, we can see a number of regularities showing that such predicates are not an anomaly of the langue. This classification proves helpful also to the Natural Language processing, since the binary tables may be adapted so that computer programs to interpret both the syntactic and semantically correct shape to use as the new searches in corpora. / A presente dissertação tem como objetivo realizar um estudo descritivo das expressões cristalizadas do português brasileiro que são construídas com os verbos ser e estar. Consideramos como expressão cristalizada aquela cuja soma dos componentes não pode ser calculado pela soma das partes que a compõem como, por exemplo, pé frio na frase Leo é pé frio. Para este trabalho foi adotado a perspectiva teórico-metodológico do Léxico-Gramática (GROSS, 1975; GROSS 1981), baseado fundamentalmente na gramática transformacional de Harris Zalling (1976). Foram analisadas 530 expressões que foram divididas em oito classes diferentes conforme regularidades distribucionais. Cada classe é descrita em uma matriz binária que contem nas linhas as expressões e nas colunas as propriedades sintáticas e semânticas. A partir da análise dessas classes podemos notar uma série de regularidades que demonstram que tais predicados não são uma anomalia da língua. Essa classificação mostra-se útil também para a área de processamento de língua natural, uma vez que as matrizes podem ser adaptadas para que os programas computacionais tanto as interpretem sintático e semanticamente de forma correta quanto as utilizem para novas buscas em corpora.
5

Análise contrastiva dos verbos locativos do português do Brasil e do português europeu

Rodrigues, Roana 14 March 2016 (has links)
Submitted by Livia Mello (liviacmello@yahoo.com.br) on 2016-10-03T12:57:04Z No. of bitstreams: 1 DissRR.pdf: 1171000 bytes, checksum: 788bfa05fbd516920b7782f7f4bf3920 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-10T19:43:45Z (GMT) No. of bitstreams: 1 DissRR.pdf: 1171000 bytes, checksum: 788bfa05fbd516920b7782f7f4bf3920 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-10T19:43:54Z (GMT) No. of bitstreams: 1 DissRR.pdf: 1171000 bytes, checksum: 788bfa05fbd516920b7782f7f4bf3920 (MD5) / Made available in DSpace on 2016-10-10T19:44:03Z (GMT). No. of bitstreams: 1 DissRR.pdf: 1171000 bytes, checksum: 788bfa05fbd516920b7782f7f4bf3920 (MD5) Previous issue date: 2016-03-14 / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / Locative verbs establish a locative relation between an object and a location and are very frequent in different types of texts. This thesis aims at describing the phenomenon of locative verb constructions in Portuguese and contrasting two recent studies on the syntactic-semantic classification of these constructions carried out for Brazilian and European Portuguese. This contrastive analysis presents not only the classes of locative constructions already determined, but also the intersection and divergence points between the two variants of the Portuguese language. The data here described is expected to contribute in the construction of language resources, which could be used in several didactic applications and in natural language processing. / Os verbos locativos estabelecem uma relação de localização entre um objeto e um lugar e são muito frequentes. A presente pesquisa descreve o fenômeno das construções verbais locativas em língua portuguesa e apresenta uma análise contrastiva de dois estudos atuais sobre a classificação dessas construções realizados para o português brasileiro e o português europeu, na qual é possível identificar os pontos de intersecção e de divergências entre as duas variantes da língua portuguesa. A partir dos dados aqui descritos, espera-se contribuir na descrição linguística do fenômeno das construções locativas, assim como na construção de recursos linguísticos que possam ser utilizados em diferentes aplicações didáticas e no processamento de língua natural. / FAPESP 2014/07747-7
6

Une approche hybride de l'extraction d'information : sous-langages et lexique-grammaire

Watrin, Patrick 25 October 2006 (has links)
L'extraction d'information consiste habituellement à remplir, au départ d'un ensemble de documents, les champs d'un formulaire préalablement établi et articulé autour d'un scénario précis. Dans ce travail, nous cherchons à étudier la pertinence des bases de données syntaxiques du lexique-grammaire afin de répondre aux questions et enjeux posés par ce domaine d'application (adaptabilité, performance,...). La phrase élémentaire (couple <prédicat, compléments essentiels>) est l'unité significative minimale de cette théorie linguistique (M. Gross, 1975) qui réunit lexique et syntaxe en un unique formalisme. Chacune de ces phrases dessine le sens d'un prédicat au moyen de critères tant distributionnels que transformationnels. Dans un cadre générique, on ne peut malheureusement pas prétendre caractériser davantage ces phrases. Il convient en effet que l'analyse syntaxico-sémantique qui dérive de l'utilisation du formalisme s'adapte à toute situation d'énonciation. Toutefois, si on limite l'analyse dont il est question à un contexte ou sous-langage particulier, celui d'un scénario d'extraction par exemple, en d'autres termes, si nous bornons la situation d'énonciation, il est envisageable de préciser la sémantique du prédicat et de ses compléments essentiels. Les phrases élémentaires peuvent ainsi être appréhendées comme autant de motifs d'extraction.
7

Descrição e classificação de predicados nominais com o verbo-suporte fazer no Português do Brasil

Barros, Cláudia Dias de 27 February 2014 (has links)
Made available in DSpace on 2016-06-02T20:24:01Z (GMT). No. of bitstreams: 1 5807.pdf: 3922654 bytes, checksum: 8e7ecafab817a3f26a6a94ca169e1863 (MD5) Previous issue date: 2014-02-27 / Financiadora de Estudos e Projetos / Lexical data base building can be considered an essential task for Natural Language Processing (NLP), since the data included can be used in numerous tools, such as Parsers, Semantic Role Labelers, automatic translators, Text Simplifiers, Paraphrases Systems, Question-Answer Systems, Information Extraction Systems, among others. One kind of lexical information that can be used by these systems and, therefore, must be described and formalized is the nominal predicates, which can be defined by the union of a predicative noun and a support verb. Predicative nouns are those with arguments, and support verbs are the ones semantically empty. The latter provides to nouns the tense-aspect-person-number marks that they don t have, given their morphology. In this context, this research presents the linguistic description of 1,815 Brazilian Portuguese nominal predicates (support verb fazer and a predicative noun) according to the Lexicon-Grammar Theory. Such theory proposes that the linguistic unity of analysis is the simple clause (the predicator and its arguments). The data is inserted in a binary table, which presents the lexical entries in rows and the formal properties (structural, distributional and transformational) in columns.Twenty-nine properties were identified, such as (i) the type of prepositions; (ii) the possibility of passive voice, and others. The nominal predicates analysed were divided into 17 classes, which have syntactic regularities. This research has identified the variants of support verb fazer (make/do), in order to expand the possibilities of the ocurrence of these kinds of predicates. This research aims to contribute to the linguistic description of the Brazilian Portuguese language and NLP, providing data to be used in the future by systems that process lexicon. / A construção de bases de dados com informações lexicais pode ser considerada uma tarefa essencial para o Processamento de Línguas Naturais (PLN), pois os dados ali contidos podem ser utilizados em muitas ferramentas, como Parsers, Anotadores de Papéis Semânticos, tradutores automáticos, Simplificadores Textuais, Sistemas que lidam com paráfrases, Sistemas de Perguntas e Respostas, Sistemas de Extração de Informação, entre outros. Um tipo de informação lexical que pode ser utilizado por esses sistemas e, portanto, carece de ser descrito e formalizado, é o predicado nominal, que pode ser definido pela união de um nome predicativo (Npred) e um verbo-suporte (Vsup). Os Npred são aqueles que possuem argumentos e os Vsup são verbos considerados fracos do ponto de vista semântico e que fornecem ao nome as marcas de tempo-aspecto-pessoa-número que este não possui, devido à sua morfologia. Nesse contexto, a presente pesquisa apresenta a descrição de 1815 predicados nominais, formados pelo Vsup fazer e um nome predicativo do português do Brasil (PB), tendo como arcabouço teórico-metodológico a Léxico-Gramática, que propõe que a unidade de análise linguística seja a frase simples (o predicado e seus argumentos) e não um item lexical isolado. A representação dos predicados nominais é feita em uma matriz binária que apresenta as entradas lexicais nas linhas e as propriedades formais (estruturais, distribucionais e transformacionais) nas colunas. Neste trabalho, foram identificadas 29 propriedades, utilizadas na análise dos predicados nominais, como: (i) o tipo de preposições que introduzem os complementos; (ii) a possibilidade de haver formação de passiva, entre outras. Os predicados nominais descritos nesta pesquisa foram divididos em 17 classes, que apresentavam regularidades sintáticas. Foi realizado também o levantamento de possíveis variantes para o Vsup fazer, para expandir as possibilidades de realizações de predicados nominais com os Npred analisados nesta pesquisa. Espera-se, com este trabalho, contribuir para a Descrição Linguística do Português, por meio da análise léxico-gramática dos predicados nominais com o verbo-suporte fazer, e também contribuir para o PLN por meio da disponibilização dos dados para a futura utilização por sistemas que lidem com o léxico.
8

Descrição e classificação das construções conversas do Português do Brasil

Calcia, Nathalia Perussi 07 April 2016 (has links)
Submitted by Izabel Franco (izabel-franco@ufscar.br) on 2016-10-11T12:54:51Z No. of bitstreams: 1 DissNPC.pdf: 2008745 bytes, checksum: 7c19c09cf12c8731fe30977bbcd97bd9 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-21T12:07:39Z (GMT) No. of bitstreams: 1 DissNPC.pdf: 2008745 bytes, checksum: 7c19c09cf12c8731fe30977bbcd97bd9 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-21T12:07:46Z (GMT) No. of bitstreams: 1 DissNPC.pdf: 2008745 bytes, checksum: 7c19c09cf12c8731fe30977bbcd97bd9 (MD5) / Made available in DSpace on 2016-10-21T12:07:53Z (GMT). No. of bitstreams: 1 DissNPC.pdf: 2008745 bytes, checksum: 7c19c09cf12c8731fe30977bbcd97bd9 (MD5) Previous issue date: 2016-04-07 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / This dissertation proposes an analysis about the relation between pairs of constructions, both with support-verb and predicative name, such as João deu uma ajuda ao Pedro/Pedro recebeu uma ajuda do João. This relation is called Conversion (G.GROSS, 1989), a transformational property that inverts the arguments of the subject position and the phrase complement, without changing their semantic roles, restructures a sentence inverting sense from active to passive. Thus, by inverting the standard support-verb (dar, fazer ou ter – to give, to do or to have) for a converse support-verb (receber, levar or ter – to receive, to lead or to have), the conversion produces equivalent syntactic-semantically sentences. The analysis of this type of construction is done systematically, based on Transformational Grammar (HARRIS, 1964) and theoretical-methodological model of Lexicon-Grammar (M.GROSS 1975, 1981), adopting formal criteria of linguistic description. The proposed classification is based on the set of support-verbs that each predicative noun selects such in the standard position, as in converse position. This criterion proved to be the most appropriate at this moment, because the predicative nouns constitute a very heterogeneous group, by the syntactic-semantic point of view. The sentences that exemplify constructions converses are validated introspectively and through of a corpus, where it can identify its structure with better precision. In addition, their structural, distributional and transformational properties are formalized in a table of Lexicon-Grammar, that is, is a binary matrix in which each row corresponds to a lexical entry (the predicative noun) and each column corresponds to a formal property of the construction. Therefore, this study aims to contribute to the linguistic description of Brazilian Portuguese, taking into account that this type of construction was studied only for the French (G.GROSS, 1989), European Portuguese (BAPTISTA, 1997) and more recently to the Romanian (CIOCANEA, 2011). The constructions description with support-verb and predicative noun, may collaborate in texts analysis, identifying information and the structure‘s form, then, consequently, enriching the description of the language. Besides, the results‘ representation in binary matrixes provides a formal description enough to be used in auto applications in Natural Language Processing (NLP). / Esta dissertação propõe uma análise da relação que existe entre pares de construções, ambas com verbo-suporte e nome predicativo, tais como João deu uma ajuda ao Pedro/Pedro recebeu uma ajuda do João. Essa relação é chamada de Conversão (G.GROSS, 1989), uma propriedade transformacional que inverte os argumentos da posição de sujeito e de complemento da frase sem alterar seus papeis semânticos, ou seja, reestrutura uma frase invertendo o sentido de ativo para passivo. Desse modo, por meio da inversão do verbosuporte standard (dar, fazer ou ter) por um verbo-suporte converso (receber, levar ou ter), a Conversão produz sentenças sintático-semanticamente equivalentes. A análise desse tipo de construção é feita sistematicamente, baseando-se na Gramática Transformacional de Operadores (HARRIS, 1964) e no modelo teórico-metodológico do Léxico-Gramática (M.GROSS, 1975, 1981), que adota critérios formais de descrição linguística. A classificação proposta é baseada no conjunto de verbos-suporte que cada nome predicativo seleciona, tanto na posição standard, quanto na posição conversa. Esse critério mostrou-se ser o mais adequado neste momento, pelo fato de os nomes predicativos constituírem um conjunto heterogêneo do ponto de vista sintático e semântico. As frases que exemplificam as construções conversas são validadas introspectivamente e por meio de um corpus, onde se pode identificar sua estrutura com maior precisão. Além disso, suas propriedades estruturais, distribucionais e transformacionais, são formalizadas em uma tábua do Léxico-Gramática, isto é, uma matriz binária em que cada linha corresponde a uma entrada lexical (ao nome predicativo) e cada coluna corresponde a uma propriedade formal da construção. Este estudo, portanto, visa a contribuir com a descrição linguística do português brasileiro, levando em consideração que esse tipo de construção foi estudada apenas para a língua francesa (G.GROSS, 1989), para o português europeu (BAPTISTA, 1997) e mais recentemente para a língua romena (CIOCANEA, 2011). A descrição de construções com verbo-suporte e nome predicativo pode colaborar na análise de textos, identificando as informações e a forma da estrutura, e consequentemente, enriquecendo a descrição da língua. Além de tudo, a representação dos resultados em matrizes binárias prevê uma descrição formal o suficiente para ser utilizada em aplicações no Processamento Automático da Língua Natural (PLN).
9

Descrição, classificação e processamento automático das construções com o verbo dar em Português Brasileiro

Rassi, Amanda Pontes 30 November 2015 (has links)
Submitted by Daniele Amaral (daniee_ni@hotmail.com) on 2016-10-20T17:03:22Z No. of bitstreams: 1 TeseAPR.pdf: 3132789 bytes, checksum: 6b6f2ec0e10cd93b5a4a9a82a65265ef (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-11-08T18:41:29Z (GMT) No. of bitstreams: 1 TeseAPR.pdf: 3132789 bytes, checksum: 6b6f2ec0e10cd93b5a4a9a82a65265ef (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-11-08T18:41:36Z (GMT) No. of bitstreams: 1 TeseAPR.pdf: 3132789 bytes, checksum: 6b6f2ec0e10cd93b5a4a9a82a65265ef (MD5) / Made available in DSpace on 2016-11-08T18:41:42Z (GMT). No. of bitstreams: 1 TeseAPR.pdf: 3132789 bytes, checksum: 6b6f2ec0e10cd93b5a4a9a82a65265ef (MD5) Previous issue date: 2015-11-30 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / This PhD thesis starts from the observation of constructions with the verb dar in Brazilian Portuguese and it proposes an analysis and classification of these constructions. The analysis of all constructions found in corpus is systematic and consistent, based on Transformational Grammar (HARRIS, 1964) and on Lexicon-Grammar approach (GROSS, 1975; GROSS, 1981). Both theories adopt formal and experimental criteria to make reproducible the identification of base sentences and the classification of constructions with the verb dar. The classification was based on structural and syntactic properties, leading to four classes or categories: (i) full verb or distributional verb, from which 8 verbal senses could be identified; (ii) causative operator verb, whose constructions could be subclassified in 4 groups, depending on the semantic type of the predicative noun; (iii) the verb as a fixed element, in idioms or in proverbs; and (iv) support verb, which is selected by a predicative noun. The first part of this thesis analyzes the constructions with the verb dar as a full verb, as a causative operator verb and as a fixed verb. The second part of this thesis debribes the support verb constructions (SVC), which are formed by the support verb dar (Vsup) and the predicative noun (Npred). This description is extensive, considering all the occurrences in the corpus adopted and identifying the main formal, distributional and transformational SVC properties. These properties were described and formalized in a Lexicon-Grammar table, which is a binary matrix: each line corresponds to a lexical entry (Npred) and each column corresponds to a syntactic property of the construction. In the intersection between each line and each column, we sign “+” or “-”, respectively, if the property is verified or not. The third part of the thesis presents an automatic syntactic analysis of SVC, by using an approach based in dependency rules between its constituents. The rules are automatically generated from the L-G matrix data and, then, those rules are used by the parser in order to extract the dependency between the Npred and the Vsup. Thus, this work aims to advance the state of the art of the general verbal classification in Portuguese and Automatic Processing of Natural Languages, to contribute to the development of computational-lexical resources (the Lexicon-Grammar of nominal constructions) and with automatic parsing. / Esta tese parte da observação das construções com o verbo dar em corpus em Português Brasileiro e propõe uma análise e classificação dessas construções, de forma sistemática e consistente, com base na Gramática Transformacional de operadores (HARRIS, 1964; HARRIS, 1978) e no modelo teórico-metodológico do Léxico-Gramática (GROSS, 1975; GROSS, 1981). Ambas as teorias adotam critérios formais/estruturais e procedimentos experimentais reprodutíveis para a identificação das frases de base e que adotamos para a classificação das construções com o verbo dar. A classificação dessas construções foi baseada em suas estruturas e propriedades sintáticas, tendo sido identificadas quatro categorias ou tipos de construções fundamentais em que esse verbo ocorre: (i) verbo pleno (distribucional), de onde se identificam 8 sentidos diferentes; (ii) verbo-operador causativo; (iii) o verbo constituinte de uma frase fixa, seja em expressões cristalizadas seja em provérbios; e (iv) verbo-suporte, um tipo particular de auxiliar que é selecionado por um nome predicativo. A primeira parte da tese analisa os três primeiros tipos sintático-semânticos do verbo dar (pleno, causativo e fixo). A segunda parte da tese analisa e descreve as construções com verbo-suporte (CVS), formadas pelo verbo-suporte (Vsup) dar e um nome predicativo (Npred). Essa descrição é sistemática, buscando recensear o máximo possível de construções em corpus e identificando as principais propriedades formais, distribucionais e transformacionais das CVS. As propriedades são formalizadas por meio de uma matriz de dados, a qual representa de maneira compacta a informação linguística relevante para a descrição dessas construções. A terceira parte da tese apresenta uma proposta de análise sintática automática das CVS, usando uma abordagem baseada em regras de dependência entre seus constituintes. As regras são geradas automaticamente a partir das informações constantes na matriz do L-G e, em seguida, são usadas pelo analisador sintático automático para extrair uma dependência entre o Npred e o Vsup ao identificar a CVS. Assim, este trabalho objetiva avançar o estado da arte da classificação geral dos verbos em Português e do Processamento Automático de Línguas Naturais, no sentido de contribuir com o desenvolvimento de recursos léxico-computacionais (o Léxico-Gramática das construções nominais) para a tarefa de análise sintática automática.
10

Analyse syntaxique à l'aide des tables du Lexique-Grammaire du français / Syntactic analysis with tables of French Lexicon-Grammar

Tolone, Elsa 31 March 2011 (has links)
Les tables du Lexique-Grammaire, dont le développement a été initié par Gross (1975), constituent un lexique syntaxique très riche pour le français. Elles couvrent diverses catégories lexicales telles que les verbes, les noms, les adjectifs et les adverbes. Cette base de données linguistiques n'est cependant pas directement exploitable informatiquement car elle est incomplète et manque de cohérence. Chaque table regroupe un certain nombre d'entrées jugées similaires car elles acceptent des propriétés communes. Ces propriétés ont pour particularité de ne pas être codées dans les tables même mais uniquement décrites dans la littérature. Pour rendre ces tables exploitables, il faut expliciter les propriétés intervenant dans chacune d'entre elles. De plus, un grand nombre de ces propriétés doivent être renommées dans un souci de cohérence. Notre objectif est d'adapter les tables pour les rendre utilisables dans diverses applications de Traitement Automatique des Langues (TAL), notamment l'analyse syntaxique. Nous expliquons les problèmes rencontrés et les méthodes adoptées pour permettre leur intégration dans un analyseur syntaxique. Nous proposons LGExtract, un outil générique pour générer un lexique syntaxique pour le TAL à partir des tables du Lexique-Grammaire. Il est relié à une table globale dans laquelle nous avons ajouté les propriétés manquantes et un unique script d'extraction incluant toutes les opérations liées à chaque propriété devant être effectuées pour toutes les tables. Nous présentons également LGLex, le nouveau lexique syntaxique généré des verbes, des noms prédicatifs, des expressions figées et des adverbes. Ensuite, nous montrons comment nous avons converti les verbes et les noms prédicatifs de ce lexique au format Alexina, qui est celui du lexique Lefff (Lexique des Formes Fléchies du Français) (Sagot, 2010), un lexique morphologique et syntaxique à large couverture et librement disponible pour le français. Ceci permet son intégration dans l'analyseur syntaxique FRMG (French MetaGrammar) (Thomasset et de La Clergerie, 2005), un analyseur profond à large couverture pour le français, basé sur les grammaires d'arbres adjoints (TAG), reposant habituellement sur le Lefff. Cette étape de conversion consiste à extraire l'information syntaxique codée dans les tables du Lexique-Grammaire. Nous présentons les fondements linguistiques de ce processus de conversion et le lexique obtenu. Nous évaluons l'analyseur syntaxique FRMG sur le corpus de référence de la campagne d'évaluation d'analyseurs du français Passage (Produire des Annotations Syntaxiques à Grande Échelle) (Hamon et al., 2008), en comparant sa version basée sur le Lefff avec notre version reposant sur les tables du Lexique-Grammaire converties / Lexicon-Grammar tables, whose development was initiated by Gross (1975), are a very rich syntactic lexicon for the French language. They cover various lexical categories such as verbs, nouns, adjectives and adverbs. This linguistic database is nevertheless not directly usable by computer programs, as it is incomplete and lacks consistency. Tables are defined on the basis of features which are not explicitly recorded in the lexicon. These features are only described in literature. To use these tables, we must make explicit the essential features appearing in each one of them. In addition, many features must be renamed for consistency sake. Our aim is to adapt the tables, so as to make them usable in various Natural Language Processing (NLP) applications, in particular parsing.We describe the problems we encountered and the approaches we followed to enable their integration into a parser. We propose LGExtract, a generic tool for generating a syntactic lexicon for NLP from the Lexicon-Grammar tables. It relies on a global table in which we added the missing features and on a single extraction script including all operations related to each property to be performed for all tables. We also present LGLex, the new generated lexicon of French verbs, predicative nouns, frozen expressions and adverbs.Then, we describe how we converted the verbs and predicatives nouns of this lexicon into the Alexina framework, that is the one of the Lefff lexicon (Lexique des Formes Fléchies du Français) (Sagot, 2010), a freely available and large-coverage morphological and syntactic lexicon for French. This enables its integration in the FRMG parser (French MetaGrammar) (Thomasset et de La Clergerie, 2005), a large-coverage deep parser for French, based on Tree-Adjoining Grammars (TAG), that usually relies on the Lefff. This conversion step consists in extracting the syntactic information encoded in Lexicon-Grammar tables. We describe the linguistic basis of this conversion process, and the resulting lexicon. We evaluate the FRMG parser on the reference corpus of the evaluation campaign for French parsersPassage (Produire des Annotations Syntaxiques à Grande Échelle) (Hamon et al., 2008), by comparing its Lefff-based version to our version relying on the converted Lexicon-Grammar tables

Page generated in 0.4429 seconds