Made available in DSpace on 2014-06-11T19:22:19Z (GMT). No. of bitstreams: 0
Previous issue date: 2009-02-20Bitstream added on 2014-06-13T19:27:30Z : No. of bitstreams: 1
kasama_dy_me_sjrp.pdf: 2392559 bytes, checksum: 97410d6af14f5587b05c598ca84a15f0 (MD5) / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / O Processamento de Língua Natural (ou PLN) tem sido objeto de estudo de pesquisadores das mais diversas áreas do conhecimento. O léxico é, sem sombra de dúvida, elemento essencial para o tratamento automático de dados lingüísticos, sendo a sua análise semântica fator crucial para um efetivo processamento computacional que, não raro, encontra barreiras em questões ligadas a uma representação semântica eficaz e que permita ser representada em linguagem de máquina. Na Terminologia, esse tratamento semântico favorece o estabelecimento de relações existentes entre unidades lexicais especializadas, e determina a elaboração de definições terminológicas coerentes e representativas ao campo de especialidade ao qual pertencem. Nesse sentido, propomos neste trabalho traçar uma estrutura conceitual do domínio da Nanociência e Nanotecnologia, em língua portuguesa do Brasil, visando a criação do que modernamente se conhece por ontologias, cujos preceitos nortearam o desenvolvimento desta pesquisa. Aliada a essas práticas, encontra-se a importância da adoção de um modelo que permita representar formalmente as relações semânticas existentes entre os diversos termos que compõem essa área técnico-científica. A busca por essas unidades lexicais especializadas e suas relações deu-se em um córpus formado por textos de tipologia diversa, com o auxílio de ferramentas computacionais – de extração semiautomática de termos e um processador de córpus. A modelagem do domínio em questão e sua representação em uma linguagem corrente e atual (a saber, a linguagem OWL) fez-se com o auxílio da ferramenta Protégé. Defende-se neste trabalho a necessidade, cada vez mais crescente, da adoção de métodos eficazes para o delineamento de estruturas conceituais a fim de executar tarefas computacionais utilizando informação lingüística. Espera-se ainda... / Natural Language Processing (or NLP) has been an object of study by researchers from different fields of knowledge. Lexicon is undoubtedly an essential element for the automatic processing of language data, and its semantic analysis is a crucial factor for an effective computational processing that as often as not finds barriers in matters concerning a productive semantic representation in machine language. In terminology, this semantic treatment favors the establishment of relations between specialized lexical units and determines the development of consistent terminological definitions that may represent the field of expertise to which they belong. Accordingly, what we propose in this work is to provide a conceptual structure of the specialized subject field of Nanoscience and Nanotechnology, in Brazilian Portuguese language, aimed at creating the modernly so-called ontologies, whose principles guided the development of this research. In addition to such practices, it is important to adopt a model which allows a formal representation of the semantic relations between the terms in this domain. The specialized lexical units and the semantic relations were extracted semiautomatically from a corpus, compiled with different types of texts, using a term extractor and a corpus processor. The modeling of the area concerned and its representation in a current language (i.e., OWL language) was possible with the aid of Protégé tool. We support in this work the increasing need to adopt effective methods for the design of conceptual structures in order to carry computational tasks using linguistic information. We hope that this work will strengthen the dialogue between linguists, computational and information scientists.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.unesp.br:11449/86567 |
Date | 20 February 2009 |
Creators | Kasama, Deni Yuzo [UNESP] |
Contributors | Universidade Estadual Paulista (UNESP), Zavaglia, Claudia [UNESP], Almeida, Gladis Maria de Barcellos [UNESP] |
Publisher | Universidade Estadual Paulista (UNESP) |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | 178 f. : il. color. |
Source | Aleph, reponame:Repositório Institucional da UNESP, instname:Universidade Estadual Paulista, instacron:UNESP |
Rights | info:eu-repo/semantics/openAccess |
Relation | -1, -1, -1 |
Page generated in 0.0025 seconds