Return to search

Indexação de acórdãos por meio de uma ontologia jurisprudencial populada a partir de um corpus jurídico real

Visando a uma melhoria na qualidade e precisão dos serviços de pesquisa jurisprudencial dos tribunais de justiça, a presente dissertação propõe a identificação automática de termos, ou sentenças, relevantes em um corpus de documentos jurisprudenciais. Cada termo identificado deve ser relacionado a um conceito que represente o seu significado no domínio da jurisprudência, compondo assim um indivíduo deste domínio. Ao final, cada indivíduo deve ser armazenado em uma base de conhecimentos, possibilitando, assim, pesquisas semânticas sobre os documentos. Para alcançar tais objetivos, são propostos métodos para extração de sentenças relevantes e para a construção de uma ontologia de aplicação para representação de acórdãos. Na seqüência são propostos ainda métodos de navegação e pesquisa na ontologia. Na extração de sentenças são abordadas técnicas de Mineração de Textos, tais como Extração de Sentenças, Análise de Expressões Regulares, Stemming, Stop-words e Vocabulários Controlados. A construção da ontologia segue a metodologia OTKM, utilizando-se também de linguagens de representação de conhecimento, tais com DL, RDF e OWL. Par a navegação na ontologia é abordada a framework Jena. Para pesquisas na ontologia é abordada a linguagem de consultas SPARQL. Para validar os métodos aqui propostos, foram construídos uma ontologia de aplicação para o domínio de acórdãos, bem como um aplicativo para gestão do conhecimento dos acórdãos baseado na ontologia. O aplicativo inclui rotinas de extração de conhecimento de um corpus de acórdãos, de população da ontologia com os conhecimentos extraídos e de pesquisa semântica sobre a ontologia populada. A ontologia bem como o conhecimento extraído de 50 acórdãos foram submetidos à crítica por especialistas em jurisprudência. Ao final, a rotina de pesquisa semântica foi submetida a uma experimentação com a ontologia populada por 15 mil acórdãos, todos extraídos da base de jurisprudência real do Tribunal de Justiça do Estado do Paraná. Os resultados obtidos nos experimentos demonstraram que a abordagem foi satisfatória tanto na indexação dos documentos como na pesquisa semântica, demonstrando que a ontologia desenvolvida responde aos requisitos da aplicação. / Aiming at improving the quality and accuracy of jurisprudential search services of the courts of justice, this dissertation proposes the automatic identification of relevant terms, or sentences, in a corpus of jurisprudential documents. Each identified term should be related to a concept that represents its meaning in the domain of jurisprudence, thus instancing an individual of that domain. At the end, each individual must be stored in knowledge base, thus enabling semantic queries over the documents. To achieve these objectives, methods were proposed for the extraction of relevant sentences and to build an application ontology for the representation of judgments. Furthermore, ontology navigation and search methods were proposed. For the extraction of sentences, several Text Mining techniques were used, such as Sentence Extraction, Analysis of Regular Expressions, Stemming, Stop-words and Controlled Vocabularies. The construction of the ontology followed the methodology OTKM and used some knowledge representation languages, such as DL, RDF and OWL. The Jena framework was applied for navigation in the ontology. SPARQL queries language was applied for search in the ontology. To validate the methods here proposed, an application ontology for the domain of judgments were built, as well as a knowledge management application to the judgments based on the ontology. The application includes routines for knowledge extraction from a corpus of judgments, population of the ontology with the extracted knowledge and then semantic search on the populated ontology. The ontology. The ontology and the knowledge extracted from 50 judgments were submitted to criticism by experts in jurisprudence. At the end, the semantic search routine was experimented with the ontology populated by 15,000 judgments, all extracted from the actual jurisprudence base of the Court of Paraná, a state of Brazil. The results obtained in the experiments demonstrated that the approach was satisfactory in both the indexing of documents as well as in the semantic search, showing that the developed ontology meets the application requirements.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.utfpr.edu.br:1/360
Date30 August 2011
CreatorsMolinari, Alberto Heitor
ContributorsTacla, Cesar Augusto
PublisherUniversidade Tecnológica Federal do Paraná, Curitiba, Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UTFPR, instname:Universidade Tecnológica Federal do Paraná, instacron:UTFPR
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0024 seconds