Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2011. / Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2012-09-05T15:13:09Z
No. of bitstreams: 1
2011_GeorgerRommelFerreiraAraujo.PDF: 2835953 bytes, checksum: dd16eaff79eecf269f263e5c9d9db626 (MD5) / Approved for entry into archive by Luanna Maia(luanna@bce.unb.br) on 2012-09-10T13:05:29Z (GMT) No. of bitstreams: 1
2011_GeorgerRommelFerreiraAraujo.PDF: 2835953 bytes, checksum: dd16eaff79eecf269f263e5c9d9db626 (MD5) / Made available in DSpace on 2012-09-10T13:05:29Z (GMT). No. of bitstreams: 1
2011_GeorgerRommelFerreiraAraujo.PDF: 2835953 bytes, checksum: dd16eaff79eecf269f263e5c9d9db626 (MD5) / Coleções textuais de Informática Forense são normalmente muito heterogêneas. Embora técnicas de classificação, por tipo de arquivo ou outros critérios, possam auxiliar na exploração dessas coleções textuais, elas não ajudam a agrupar documentos com conteúdo assemelhado. A Teoria da Ressonân-
cia Adaptativa (Adaptive Resonance Theory – ART) descreve várias Redes
Neurais Artificiais auto-organizáveis que utilizam um processo de aprendizado
não-supervisionado e são especialmente projetadas para resolver o dilema da
estabilidade/plasticidade. Este trabalho aplica o algoritmo ART1 (ART com
vetores de entrada binários) para agrupar tematicamente documentos retor-
nados de uma ferramenta de busca utilizada com coleções textuais forenses.
Documentos que antes seriam apresentados em uma lista desorganizada e frequentemente longa passam a ser agrupados por conteúdo, oferecendo ao perito uma forma organizada de obter uma visão geral do conteúdo dos documentos durante o exame pericial. Os resultados experimentais são indicativos da validade da abordagem proposta, obtendo uma correspondência adequada entre a
solução de agrupamento processada com o protótipo de aplicação desenvolvido
e as classes-padrão definidas por um especialista. ______________________________________________________________________________ ABSTRACT / Computer forensic text corpora are usually very heterogeneous. While classifi-
cation, by file type or other criteria, should be an aid in the exploration of such
corpora, it does not help in the task of grouping together documents themati-
cally. Adaptive Resonance Theory (ART) describes a number of self-organizing
artificial neural networks that employ an unsupervised learning process and are
specially designed to learn new patterns without forgetting what they have al-
ready learned, overcoming the important restriction defined by the stability/
plasticity dilemma. This work applies the ART1 algorithm (ART with binary
input vectors) to thematically cluster documents returned from a query tool
used with forensic text corpora. Documents that would previously be presented
in a disorganized and often long list are thematically clustered, giving the ex-
aminer an organized way of obtaining a general picture of document content
during forensic examinations. Experimental results validated the approach,
achieving adequate agreement between the clustering solution processed with
the developed prototype software package and the gold standard defined by a
domain specialist.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/11123 |
Date | 18 October 2011 |
Creators | Araújo, Georger Rommel Ferreira de |
Contributors | Ralha, Célia Ghedini |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0021 seconds