Return to search

M?todos de clusteriza??o para apoio ? classifica??o est?tica de documentos

Made available in DSpace on 2015-04-14T14:49:01Z (GMT). No. of bitstreams: 1
406128.pdf: 16056423 bytes, checksum: d4b22e3a871de544238db5630e9a295f (MD5)
Previous issue date: 2008-03-24 / Neste trabalho ser?o abordados estudos referentes ? classifica??o de grande quantidade de documentos de conte?do vari?vel. Em tal processo quando um grande n?mero de documentos ? gerado, existe a necessidade de um usu?rio verific?-los um a um com a inten??o de separ?-los em bons (com pouco ou nenhum problema estrutural) ou ruins (que possuem problemas estruturais), processo este considerado lento e oneroso. Considerando este problema, neste trabalho foi desenvolvida uma ferramenta de classifica??o est?tica de documentos que visa reduzir esta interven??o humana. A ferramenta desenvolvida ? baseada em m?tricas que avaliam o quanto um documento automaticamente gerado difere de seu template, criando para cada um destes documentos uma assinatura baseada nas t?cnicas de fingerprint, objetivando primeiramente distingui-los entre si para ent?o utilizar t?cnicas de clusteriza??o criando grupos de documentos com caracter?sticas semelhantes. O algoritmo K-Med?ides ? usado para fazer tal agrupamento, tal algoritmo funciona criando grupos de objetos considerando um destes como base para a cria??o de cada cluster. A id?ia deste trabalho ? reduzir a interven??o humana fazendo com que um usu?rio classifique em bom ou ruim apenas determinados documentos de cada grupo formado pelo algoritmo de clusteriza??o. S?o tamb?m apresentados resultados de quatro experimentos realizados com esta ferramenta avaliando as contribui??es para diminuir a interven??o humana no processo de classifica??o de documentos.

Identiferoai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/5028
Date24 March 2008
CreatorsPrimo, Tiago Thompsen
ContributorsOliveira, Jo?o Batista Souza de
PublisherPontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, BR, Faculdade de Inform?ca
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS
Rightsinfo:eu-repo/semantics/openAccess
Relation1974996533081274470, 500, 600, 1946639708616176246

Page generated in 0.0019 seconds