Made available in DSpace on 2015-04-14T14:49:01Z (GMT). No. of bitstreams: 1
406128.pdf: 16056423 bytes, checksum: d4b22e3a871de544238db5630e9a295f (MD5)
Previous issue date: 2008-03-24 / Neste trabalho ser?o abordados estudos referentes ? classifica??o de grande quantidade de documentos de conte?do vari?vel. Em tal processo quando um grande n?mero de documentos ? gerado, existe a necessidade de um usu?rio verific?-los um a um com a inten??o de separ?-los em bons (com pouco ou nenhum problema estrutural) ou ruins (que possuem problemas estruturais), processo este considerado lento e oneroso. Considerando este problema, neste trabalho foi desenvolvida uma ferramenta de classifica??o est?tica de documentos que visa reduzir esta interven??o humana. A ferramenta desenvolvida ? baseada em m?tricas que avaliam o quanto um documento automaticamente gerado difere de seu template, criando para cada um destes documentos uma assinatura baseada nas t?cnicas de fingerprint, objetivando primeiramente distingui-los entre si para ent?o utilizar t?cnicas de clusteriza??o criando grupos de documentos com caracter?sticas semelhantes. O algoritmo K-Med?ides ? usado para fazer tal agrupamento, tal algoritmo funciona criando grupos de objetos considerando um destes como base para a cria??o de cada cluster. A id?ia deste trabalho ? reduzir a interven??o humana fazendo com que um usu?rio classifique em bom ou ruim apenas determinados documentos de cada grupo formado pelo algoritmo de clusteriza??o. S?o tamb?m apresentados resultados de quatro experimentos realizados com esta ferramenta avaliando as contribui??es para diminuir a interven??o humana no processo de classifica??o de documentos.
Identifer | oai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/5028 |
Date | 24 March 2008 |
Creators | Primo, Tiago Thompsen |
Contributors | Oliveira, Jo?o Batista Souza de |
Publisher | Pontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, BR, Faculdade de Inform?ca |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS |
Rights | info:eu-repo/semantics/openAccess |
Relation | 1974996533081274470, 500, 600, 1946639708616176246 |
Page generated in 0.0021 seconds