Return to search

Indexação automática de acórdãos por meio de processamento de linguagem natural

Dissertação (mestrado)—Universidade de Brasília, Faculdade de Economia, Administração, Contabilidade e Ciência da Informação e Documentação, Departamento de Ciência da Informação e Documentação, 2007. / Submitted by Kathryn Cardim Araujo (kathryn.cardim@gmail.com) on 2009-11-27T16:52:36Z
No. of bitstreams: 1
2007_AutoTavaresdaCamaraJunior.PDF: 932269 bytes, checksum: b454ad4e3f15f3bf1695b52952f3e4bf (MD5) / Approved for entry into archive by Daniel Ribeiro(daniel@bce.unb.br) on 2009-12-03T22:39:10Z (GMT) No. of bitstreams: 1
2007_AutoTavaresdaCamaraJunior.PDF: 932269 bytes, checksum: b454ad4e3f15f3bf1695b52952f3e4bf (MD5) / Made available in DSpace on 2009-12-03T22:39:10Z (GMT). No. of bitstreams: 1
2007_AutoTavaresdaCamaraJunior.PDF: 932269 bytes, checksum: b454ad4e3f15f3bf1695b52952f3e4bf (MD5)
Previous issue date: 2007-06-11 / A indexação é uma área pesquisada há muito tempo, ferramenta fundamental para a qualidade da recuperação da informação. Indexação automática é uma área mais recente cujos resultados melhoram com a evolução de técnicas de inteligência artificial. Com o recorrente crescimento de demanda judicial, os tribunais do País, em particular o Tribunal de Justiça do Distrito Federal e dos Territórios, têm de buscar mecanismos, em sua maioria apoiados em tecnologia da informação, para acelerar seus trâmites. A indexação automática oferece ganhos estratégicos aos tribunais, diminuindo seu custo com pessoal, melhorando a qualidade das pesquisas e acelerando seus processos organizacionais. Esta pesquisa insere-se nesta área e propõe um modelo de indexação automática de acórdãos que atenda a essas necessidades. A utilização de PLN sobrepõe-se aos métodos estritamente estatísticos com o objetivo de alcançar melhores resultados. Para isso, foram desenvolvidas ferramentas que constroem um corpus de língua portuguesa com jargão jurídico e indexam automaticamente uma base de jurisprudência de direito penal do TJDFT. Os resultados demonstram que a indexação automática utilizando PLN atinge níveis de revocação e precisão equivalentes à base indexada manualmente. Entre as contribuições dessa pesquisa encontram-se as ferramentas desenvolvidas, a metodologia de indexação automática proposta e o estudo sobre uma área muito pouco pesquisada em língua portuguesa. _______________________________________________________________________________ ABSTRACT / Indexing is an area that has been researched for a long time, crucial tool to information retrieval quality. Automatic indexing is a more recent area, in which results are improved with the evolution of artificial intelligence techniques. As judicial claims increase repeatedly, Country’s courthouses, Tribunal de Justiça do Distrito Federal e dos Territórios in particular, have to search for mechanisms, in their majority based on information technology, to speed up their workflows. Automatic indexing offers strategic gains to courthouses, diminishing their personnel costs, improving research quality and accelerating their organizational processes. This research inserts itself in this area and proposes a sentence automatic indexing model which fulfills these needs. NLP utilization is chosen instead of strictly statistic methods with the purpose of achieving better results. In order to do so, tools have been developed which build a corpus of portuguese language containing common juridical vocabulary and automatically index a criminal law jurisprudence base from TJDFT. Results demonstrate that automatic indexing using NLP obtains equivalent revocation and precision levels than manual indexing. Between this research contributions are mentioned the developed tools, the automatic indexing methodology proposed and the study of a very little researched area in portuguese language.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/2493
Date11 June 2007
CreatorsCâmara Júnior, Auto Tavares da
ContributorsMedeiros, Marisa Bräscher Basílio
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0026 seconds