Spelling suggestions: "subject:"combinação dde classificados dde texto"" "subject:"combinação dde classificados dee texto""
1 |
Sistemas inteligentes híbridos para classificação de textoPereira Rodrigues, Joseane 31 January 2009 (has links)
Made available in DSpace on 2014-06-12T16:00:02Z (GMT). No. of bitstreams: 2
arquivo5821_1.pdf: 891518 bytes, checksum: 9560f5e12af9c2656653e6d7b10b47ed (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2009 / Fundação de Amparo a Pesquisa do Estado da Bahia / Grande parte da informação contida em repositórios digitais, como a Web e
as Bibliotecas Digitais, está representada em formato de documentos de texto.
Sistemas de Recuperação de Informação têm sido usados para prover acesso a
documentos relevantes armazenados nesses repositórios. No entanto, esses
sistemas ainda apresentam limitações a serem superadas. Muitos dos problemas
desses sistemas têm sido tratados usando técnicas de classificação de texto
oriundas da Inteligência Artificial (em especial os algoritmos de Aprendizado de
Máquina). Cada técnica apresenta vantagens e limitações, considerando os
conjuntos de textos em que são aplicadas.
Este trabalho investigou técnicas de combinação de classificadores de
texto, em especial, técnicas baseadas em Boosting. Essas técnicas tentam
superar as limitações dos classificadores sendo combinados, mantendo suas
vantagens individuais, e assim apresentando um melhor desempenho nas tarefas
em que são aplicados. Trabalhos anteriores apontam problemas em aberto em
relação ao uso de métodos de combinação para classificadores de texto. Assim,
esperamos neste projeto avançar o estado da arte sobre o tema.
No trabalho realizado, implementamos uma variação de Boosting proposta
na literatura que usa informações de vizinhança, chamada LocalBoost. Essa
variação tem alcançado bons resultados comparativos em dados benchmark.
Propomos ainda uma variação do LocalBoost para tratamento de dados
desbalanceados, que foi avaliada em experimentos tanto com bases de
classificação de texto como para bases de dados não-textuais. Os resultados dos
experimentos revelaram a viabilidade do uso da variação proposta
|
Page generated in 0.135 seconds