Return to search

Análise da relevância semântica na seleção de atributos para a mineração de dados

A cada dia, mais dados podem ser armazenados e, portanto, analisados. Em cada conjunto de dados, a tendência é haver uma quantidade cada vez maior de atributos. A obtenção de modelos de mineração de dados, que revelem alguma informação importante, depende da seleção dos atributos mais relevantes, mas determinar a relevância de um atributo em certo contexto não é uma tarefa fácil. Por isso mesmo, apenas pela análise dos dados, em geral, os métodos de seleção de atributos falham em identificar atributos relevantes, incluem atributos irrelevantes e não reconhecem quando há atributos redundantes entre si. Por outro lado, quando se leva em conta o domínio de conhecimento de onde os dados foram coletados, a análise do significado de cada atributo pode indicar sua importância, contudo, isso pode não ser facilmente compreendido por alguém que não esteja familiarizado com o domínio considerado. De qualquer forma, na prática, a análise da semântica dos atributos é feita de forma manual, o que pode ocasionar enganos, custos e desperdício de tempo. Assim, partindo da hipótese de que a incorporação de semântica na atividade de seleção de atributos leva à escolha de atributos mais relevantes e à geração de modelos de mineração mais significativos, para a tarefa de classificação em mineração de dados, um modelo semântico estatístico que propicia a incorporação de semântica à seleção feita pelos métodos tradicionais foi definido. O modelo emprega ontologia, base linguística e recuperação de informação. Com base neste modelo e utilizando conjuntos de dados reais, procedeu-se a um estudo de caso, a partir do qual se pôde observar seleção de atributos mais relevantes.

Identiferoai:union.ndltd.org:IBICT/oai:agregador.ibict.br.BDTD_ITA:oai:ita.br:3360
Date13 November 2015
CreatorsAdriana da Silva Jacinto
ContributorsJosé Maria Parente de Oliveira, Ricardo da Silva Santos
PublisherInstituto Tecnológico de Aeronáutica
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações do ITA, instname:Instituto Tecnológico de Aeronáutica, instacron:ITA
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.094 seconds