Agrupamento de documentos forenses utilizando redes neurais art1 / Computer forensic document clusteringwith art1 neural networks

Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2011. / Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2012-09-05T15:13:09Z
No. of bitstreams: 1
2011_GeorgerRommelFerreiraAraujo.PDF: 2835953 bytes, checksum: dd16eaff79eecf269f263e5c9d9db626 (MD5) / Approved for entry into archive by Luanna Maia(luanna@bce.unb.br) on 2012-09-10T13:05:29Z (GMT) No. of bitstreams: 1
2011_GeorgerRommelFerreiraAraujo.PDF: 2835953 bytes, checksum: dd16eaff79eecf269f263e5c9d9db626 (MD5) / Made available in DSpace on 2012-09-10T13:05:29Z (GMT). No. of bitstreams: 1
2011_GeorgerRommelFerreiraAraujo.PDF: 2835953 bytes, checksum: dd16eaff79eecf269f263e5c9d9db626 (MD5) / Coleções textuais de Informática Forense são normalmente muito heterogêneas. Embora técnicas de classificação, por tipo de arquivo ou outros critérios, possam auxiliar na exploração dessas coleções textuais, elas não ajudam a agrupar documentos com conteúdo assemelhado. A Teoria da Ressonân-
cia Adaptativa (Adaptive Resonance Theory – ART) descreve várias Redes
Neurais Artificiais auto-organizáveis que utilizam um processo de aprendizado
não-supervisionado e são especialmente projetadas para resolver o dilema da
estabilidade/plasticidade. Este trabalho aplica o algoritmo ART1 (ART com
vetores de entrada binários) para agrupar tematicamente documentos retor-
nados de uma ferramenta de busca utilizada com coleções textuais forenses.
Documentos que antes seriam apresentados em uma lista desorganizada e frequentemente longa passam a ser agrupados por conteúdo, oferecendo ao perito uma forma organizada de obter uma visão geral do conteúdo dos documentos durante o exame pericial. Os resultados experimentais são indicativos da validade da abordagem proposta, obtendo uma correspondência adequada entre a
solução de agrupamento processada com o protótipo de aplicação desenvolvido
e as classes-padrão definidas por um especialista. ______________________________________________________________________________ ABSTRACT / Computer forensic text corpora are usually very heterogeneous. While classifi-
cation, by file type or other criteria, should be an aid in the exploration of such
corpora, it does not help in the task of grouping together documents themati-
cally. Adaptive Resonance Theory (ART) describes a number of self-organizing
artificial neural networks that employ an unsupervised learning process and are
specially designed to learn new patterns without forgetting what they have al-
ready learned, overcoming the important restriction defined by the stability/
plasticity dilemma. This work applies the ART1 algorithm (ART with binary
input vectors) to thematically cluster documents returned from a query tool
used with forensic text corpora. Documents that would previously be presented
in a disorganized and often long list are thematically clustered, giving the ex-
aminer an organized way of obtaining a general picture of document content
during forensic examinations. Experimental results validated the approach,
achieving adequate agreement between the clustering solution processed with
the developed prototype software package and the gold standard defined by a
domain specialist.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/11123
Date18 October 2011
CreatorsAraújo, Georger Rommel Ferreira de
ContributorsRalha, Célia Ghedini
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds