Global ETD Search

251	Substituição de valores ausentes: uma abordagem baseada em um algoritmo evolutivo para agrupamento de dados / Missing value substitution: an approach based on evolutionary algorithm for clustering data Jonathan de Andrade Silva 29 April 2010 (has links) A substituição de valores ausentes, também conhecida como imputação, é uma importante tarefa para a preparação dos dados em aplicações de mineração de dados. Este trabalho propõe e avalia um algoritmo para substituição de valores ausentes baseado em um algoritmo evolutivo para agrupamento de dados. Este algoritmo baseia-se na suposição de que grupos (previamente desconhecidos) de dados podem prover informações úteis para o processo de imputação. Para avaliar experimentalmente o algoritmo proposto, simulações de valores ausentes foram realizadas em seis bases de dados, para problemas de classificação, com a aplicação de dois mecanismos amplamente usados em experimentos controlados: MCAR e MAR. Os algoritmos de imputação têm sido tradicionalmente avaliados por algumas medidas de capacidade de predição. Entretanto, essas tradicionais medidas de avaliação não estimam a influência dos métodos de imputação na etapa final em tarefas de modelagem (e.g., em classificação). Este trabalho descreve resultados experimentais obtidos sob a perspectiva de predição e inserção de tendências (viés) em problemas de classificação. Os resultados de diferentes cenários nos quais o algoritmo proposto, apresenta em geral, desempenho semelhante a outros seis algoritmos de imputação reportados na literatura. Finalmente, as análises estatísticas reportadas sugerem que melhores resultados de predição não implicam necessariamente em menor viés na classificação / The substitution of missing values, also called imputation, is an important data preparation task for data mining applications. This work proposes and evaluates an algorithm for missing values imputation that is based on an evolutionary algorithm for clustering. This algorithm is based on the assumption that clusters of (partially unknown) data can provide useful information for the imputation process. In order to experimentally assess the proposed method, simulations of missing values were performed on six classification datasets, with two missingness mechanisms widely used in practice: MCAR and MAR. Imputation algorithms have been traditionally assessed by some measures of prediction capability. However, this traditionall approach does not allow inferring the influence of imputed values in the ultimate modeling tasks (e.g., in classification). This work describes the experimental results obtained from the prediction and insertion bias perspectives in classification problems. The results illustrate different scenarios in which the proposed algorithm performs similarly to other six imputation algorithms reported in the literature. Finally, statistical analyses suggest that best prediction results do not necessarily imply in less classification bias Agrupamento de dados Imputação Mineração de dados Valores ausentes Clustering Data mining Imputation Missing values
252	Mineração de regras de associação em dados georreferenciados / Mining of association rules in geographic data Marina Abichabki Pivato 21 March 2006 (has links) Sistemas de informações geográficas permitem armazenar, manipular e armazenar, manipular e analisar dados espaciais e aspectos descritivos desses dados. A análise de dados espaciais pode ser realizada por meio de técnicas de extração de regras de associação, ou seja, regras que descrevem relacionamentos entre os dados. Porém, a mineração de regras de associação não considera as relações topológicas existentes entre dados georreferenciados. Para solucionar esse problema, Koperski and Han (1995) e Malerba et al. (2001) propuseram um processo de extração de regras integrado ao algoritmo de mineração e utilizavam predicados lógicos para representar as regras. Como alternativa a essa solução, este trabalho propõe pré-processar os dados referenciados para encontrar relações topológicas em separado e aplicar um algoritmo de mineração de regras de associação disponí?vel pela comunidade acadêmica. As regras geradas devem apresentar características descritivas dos dados e relações topológicas. Para atingir esse objetivo foi especificado um processo de extração de regras em dados georreferenciados e implementado um módulo de pré-processamento que extrai relações topológicas. O módulo foi avaliado por meio de um estudo de caso utilizando o sistema de informação geográfica da cidade de Jaboticabal, no contexto de planejamento urbano. As regras encontradas foram analisadas por um especialista utilizando as medidas de suporte e confiança. Além disso, uma análise sobre o tempo de processamento e consumo de memória para encontrar as relações topológicas foi realizada, mostrando que é possível extrair padrões utilizando o processo e o módulo proposto neste trabalho. / Geographic information systems are used to store, manipulate, and analyze spatial data and its descriptive aspects. Spatial data analysis can be done by searching association rules that describe relationships between the data. However, georeferenced data present topological relations unknown to traditional mining association rule algorithms. To solve this problem, Koperski and Han (1995) and Malerba et al. (2001) proposed a topological relation extraction process integrated to a mining association rule algorithm. This process requires all data to be translated as logical predicates. As an alternative to this solution, this work proposes to break down this process by pre-processing the georeferenced data to find topological relations, then executing traditional mining association rule algorithms. The resulting rules must present descriptive characteristics of the data and topological relations. To reach this objective, a process of rule extraction in georeferenced data was specified, in addition to a pre-processing module implementation. This module was evaluated by using a case study that uses a geographic information system of the city of Jaboticabal, in the context of urban planning. The generated rules were analyzed by a specialist using the measures of support and confidence. In addition, an analysis regarding the processing time and memory consumption was provided to find the topological relations, which shows that it is possible to extract the patterns with the proposed process and module. Banco de dados espaciais Mineração de dados Regras de associação Association rules Data mining Geographic data
253	"O framework de integração do sistema DISCOVER" / The Discover integration framework Ronaldo Cristiano Prati 04 April 2003 (has links) Talvez uma das maiores capacidades do ser humano seja a sua habilidade de aprender a partir de observações e transmitir o que aprendeu para outros humanos. Durante séculos, a humanidade vem tentado compreender o mundo em que vive e, a partir desse novo conhecimento adquirido, melhorar o mundo em que vive. O desenvolvimento da tecnologia colocou a descoberta de conhecimento em um momento ímpar na história da humanidade. Com os progressos da Ciência da Computação, e, em particular, da Inteligência Artificial - IA - e Aprendizado de Máquina -AM, hoje em dia é possível, a partir de métodos de inferência indutiva e utilizando um conjunto de exemplos, descobrir algum tipo de conhecimento implícito nesses exemplos. Entretanto, por ser uma área de pesquisa relativamente nova, e por envolver um processo tanto iterativo quanto interativo, atualmente existem poucas ferramentas que suportam eficientemente a descoberta de conhecimento a partir dos dados. Essa falta de ferramentas se agrava ainda mais no que se refere ao seu uso por pesquisadores em Aprendizado de Máquina e Aquisição de Conhecimento. Esses fatores, além do fato que algumas pesquisas em nosso Laboratório de Inteligência Computacional - LABIC - têm alguns componentes em comum, motivaram a elaboração do projeto Discover, que consiste em uma estratégia de trabalho em conjunto, envolvendo um conjunto de ferramentas que se integram e interajam, e que supram as necessidades de pesquisa dos integrantes do nosso laboratório. O Discover também pode ser utilizado como um campo de prova para desenvolver novas ferramentas e testar novas idéias. Como o Discover tem como principal finalidade o seu uso e extensão por pesquisadores, uma questão principal é que a arquitetura do projeto seja flexível o suficiente para permitir que novas pesquisas sejam englobadas e, simultaneamente, deve impor determinados padrões que permitam a integração eficiente de seus componentes. Neste trabalho, é proposto um framework de integração de componentes que tem como principal objetivo possibilitar a criação de um sistema computacional a partir das ferramentas desenvolvidas para serem utilizadas no projeto Discover. Esse framework compreende um mecanismo de adaptação de interface que cria uma camada (interface horizontal) sobre essas ferramentas, um poderoso mecanismo de metadados, que é utilizado para descrever tanto os componentes que implementam as funcionalidades do sistema quanto as configurações de experimentos criadas pelos usuário, que serão executadas pelo framework, e um ambiente de execução para essas configurações de experimentos. / One of human greatest capability is the ability to learn from observed instances of the world and to transmit what have been learnt to others. For thousands of years, we have tried to understand the world, and used the acquired knowledge to improve it. Nowadays, due to the progress in digital data acquisition and storage technology as well as significant progress in the field of Artificial Intelligence - AI, particularly Machine Learning - ML, it is possible to use inductive inference in huge databases in order to find, or discover, new knowledge from these data. The discipline concerned with this task has become known as Knowledge Discovery from Databases - KDD. However, this relatively new research area offers few tools that can efficiently be used to acquire knowledge from data. With these in mind, a group of researchers at the Computational Intelligence Laboratory - LABIC - is working on a system, called Discover, in order to help our research activities in KDD and ML. The aim of the system is to integrate ML algorithms mostly used by the community with the data and knowledge processing tools developed as the results of our work. The system can also be used as a workbench for new tools and ideas. As the main concern of the Discover is related to its use and extension by researches, an important question is related to the flexibility of its architecture. Furthermore, the Discover architecture should allow new tools be easily incorporated. Also, it should impose strong patterns to guarantee efficient component integration. In this work, we propose a component integration framework that aims the development of an integrated computational environment using the tools already implemented in the Discover project. The proposed component integration framework has been developed keeping in mind its future integration with new tools. This framework offers an interface adapter mechanism that creates a layer (horizontal interface) over these tools, a powerful metadata mechanism, which is used to describe both components implementing systems' functionalities and experiment configurations created by the user, and an environment that enables these experiment execution. Aprendizado de Máquina Descoberta de Conhecimento Discover Mineração de Dados Data Mining Discover Knowledge Discovery Machine Learning
254	Mineração de dados em redes complexas: estrutura e dinâmica / Data mining in complex networks: structure and dynamics Guilherme Ferraz de Arruda 02 April 2013 (has links) A teoria das redes complexas é uma área altamente interdisciplinar que oferece recursos para o estudo dos mais variados tipos de sistemas complexos, desde o cérebro até a sociedade. Muitos problemas da natureza podem ser modelados como redes, tais como: as interações protéicas, organizações sociais, o mercado financeiro, a Internet e a World Wide Web. A organização de todos esses sistemas complexos pode ser representada por grafos, isto é, vértices conectados por arestas. Tais topologias têm uma influencia fundamental sobre muitos processos dinâmicos. Por exemplo, roteadores altamente conectados são fundamentais para manter o tráfego na Internet, enquanto pessoas que possuem um grande número de contatos sociais podem contaminar um grande número de outros indivíduos. Ao mesmo tempo, estudos têm mostrado que a estrutura do cérebro esta relacionada com doenças neurológicas, como a epilepsia, que está ligada a fenômenos de sincronização. Nesse trabalho, apresentamos como técnicas de mineração de dados podem ser usadas para estudar a relação entre topologias de redes complexas e processos dinâmicos. Tal estudo será realizado com a simulação de fenômenos de sincronização, falhas, ataques e propagação de epidemias. A estrutura das redes será caracterizada através de métodos de mineração de dados, que permitirão classificar redes de acordo com um conjunto de modelos e determinar padrões de conexões presentes na organização de diferentes tipos de sistemas complexos. As análises serão realizadas com aplicações em neurociências, biologia de sistemas, redes sociais e Internet / The theory of complex networks is a highly interdisciplinary reseach area offering resources for the study of various types of complex systems, from the brain to the society. Many problems of nature can be modeled as networks, such as protein interactions, social organizations, the financial market, the Internet and World Wide Web. The organization of all these complex systems can be represented by graphs, i.e. a set of vertices connected by edges. Such topologies have a fundamental influence on many dynamic processes. For example, highly connected routers are essential to keep traffic on the Internet, while people who have a large number of social contacts may infect many other individuals. Indeed, studies have shown that the structure of brain is related to neurological conditions such as epilepsy, which is relatad to synchronization phenomena. In this text, we present how data mining techniques data can be used to study the relation between complex network topologies and dynamic processes. This study will be conducted with the simulation of synchronization, failures, attacks and the epidemics spreading. The structure of the networks will be characterized by data mining methods, which allow classifying according to a set of theoretical models and to determine patterns of connections present in the organization of different types of complex systems. The analyzes will be performed with applications in neuroscience, systems biology, social networks and the Internet Redes complexas Sistemas complexos Complex networks Complex systems Data mining and machine learning
255	Framework para Detecção de Anomalias em Bases de Folha de Pagamento Baseado em Mapas Auto-Organizáveis” ANDRADE, Anderson de Souza 12 April 2013 (has links) Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-09T14:29:36Z No. of bitstreams: 2 Dissertação Anderson Andrade.pdf: 3071313 bytes, checksum: 07908bf89eea7f7f09b78f5f6f3c1ed9 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-09T14:29:36Z (GMT). No. of bitstreams: 2 Dissertação Anderson Andrade.pdf: 3071313 bytes, checksum: 07908bf89eea7f7f09b78f5f6f3c1ed9 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-04-12 / O aumento na complexidade do ambiente de negócios e o acirramento da competição implicam a necessidade de informações para tomada de decisão em um espaço de tempo cada vez menor. Por outro lado, sistemas de informação mais abrangentes e complexos geram cada vez mais dados, tornando inviável a atividade de auditoria não assistida por métodos computacionais. As técnicas de inteligência artificial, particularmente aprendizagem de máquina, estão entre as mais apropriadas para lidar com esse tipo de problema. Dentre as técnicas de aprendizagem de máquina, as redes neurais artificiais vêm desempenhando um papel comprovadamente eficaz como ferramenta de apoio a atividade de auditoria. Diante desse cenário e alinhado ao estado da arte no uso da tecnologia da informação na atividade de auditoria, essa dissertação propõe a construção de um framework para detecção de anomalias em bases de dados baseado na rede neural artificial Mapas auto-organizáveis - Self-Organizing Maps (SOM). Utilizando as propriedades de mapeamento da Rede SOM, o framework consiste em: (i) demonstrar que dados visualmente distantes da área de influência da rede SOM são anomalias, e (ii) estabelecer um critério, baseado em intervalo de percentil, para classificação dos dados como possíveis anomalias independentemente da região do mapa SOM em que se encontrem. Ademais, este trabalho usa a análise de trajetória SOM na função de classificador de anomalia, a fim de comparar o limiar fixo baseado na vizinhança do neurônio com o limiar baseado em intervalo de percentil. O framework proposto foi aplicado em uma base de dados real de folha de pagamento. Os resultados apresentados na dissertação mostraram que o framework conseguiu obter bons resultados neste problema. Mapas auto-organizáveis Auditoria assistida por software SOM Mineração de Dados Análise de Trajetória SOM Folha de pagamento
256	Utilização de técnicas de inteligência artificial para classificação de crianças cardiopatas em base de dados desbalanceadas Tavares, Thiago Ribeiro 31 January 2013 (has links) Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-12T17:23:07Z No. of bitstreams: 2 Dissertacao Thiago Tavares.pdf: 3582760 bytes, checksum: dfee6c424fc987631aeae3fbd4e4e524 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Approved for entry into archive by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-13T13:23:44Z (GMT) No. of bitstreams: 2 Dissertacao Thiago Tavares.pdf: 3582760 bytes, checksum: dfee6c424fc987631aeae3fbd4e4e524 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-13T13:23:44Z (GMT). No. of bitstreams: 2 Dissertacao Thiago Tavares.pdf: 3582760 bytes, checksum: dfee6c424fc987631aeae3fbd4e4e524 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013 / As doenças cardiovasculares são as que mais matam no Brasil e no mundo. Dessas, a cardiopatia congênita, uma malformação cardíaca presente desde o nascimento, acomete 8 a 10 em cada 1000 nascidos vivos e aproximadamente 1/3 deles necessitam de tratamento já no primeiro ano de vida. Inúmeros trabalhos demonstram que quanto antes for estabelecido o diagnóstico maiores serão as chances de sucesso no tratamento. O atendimento de crianças com suspeita de cardiopatia gera uma grande quantidade de informação, porém a diferenciação entre sinais e sintomas normais ou patológicos logo no início, por exemplo, na marcação da consulta, pode ser aspecto fundamental para agilizar o atendimento. Há algum tempo a Inteligência Artificial, mais especificamente a subárea de Mineração de Dados, tem sido utilizada como ferramenta de suporte à decisão médica em diversas especialidades, inclusive na cardiologia. Apesar da maioria das aplicações nesse contexto utilizarem Árvore de Decisão para classificação devido ao seu poder de interpretação e extração de regras, Máquinas de Vetor de Suporte (Support Vector Machines - SVM) têm demonstrado, em várias aplicações, um maior poder de generalização apresentando melhores resultados. No entanto, esse tipo de algoritmo, caixa-preta, não produz um conhecimento explícito de modo que um médico, especialista no domínio, possa interpretá-lo. A proposta desse trabalho é o desenvolvimento de um sistema de apoio à decisão médica que auxilie na detecção de cardiopatias em crianças, a partir de dados iniciais, como gênero, peso, altura e presença de sopros, com o objetivo de priorizar o seu atendimento médico. Técnicas para lidar com bases de dados desbalanceadas, tais como SMOTE e SVM com pesos foram utilizadas a fim de melhorar os resultados com relação a classificadores convencionais. Além disso, foi possível realizar a extração de regras a partir dos resultados obtidos pela SVM. Segundo os especialistas, os resultados obtidos viabilizam a utilização do sistema de apoio à decisão que pode ser incorporado à prática clínica para melhorar a qualidade dos serviços prestados. Mineração de dados em medicina SVM com pesos Bases de dados desbalanceadas SMOTE Árvore de decisão Sistemas de apoio a diagnóstico
257	Framework Híbrido para Integração de Ferramentas e Reuso do Conhecimento em Problemas Binários de Mineração de Dados CUNHA, Rodrigo Carneiro Leão Vieira da 31 January 2009 (has links) Made available in DSpace on 2014-06-12T15:50:08Z (GMT). No. of bitstreams: 2 arquivo1928_1.pdf: 1948940 bytes, checksum: ed1bedfc483f596f442e5ff7208e1ed0 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2009 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Data Mining surgiu da necessidade de extração do conhecimento a partir de volumosas massas de dados geradas pelas empresas/instituições. Com o crescimento da área e o aumento do poder de processamento dos computadores, as organizações que prestam serviços em KDD (Knowledge Discovery in Database) têm guardado, cada vez mais, um grande número de documentos e processos referentes a projetos executados no passado. Por outro lado, hoje, o desenvolvimento de projetos de Data Mining exige do especialista o uso de diversas ferramentas, linguagens de programação e metodologias associadas à sua experiência para resolução do problema. Um dos maiores problemas práticos de KDD é como prover a interoperabilidade entre diferentes plataformas existentes, de tal forma que os processos fiquem centralizados e documentados em um único ambiente. Outro grande problema, hoje, é a falta de reuso de conhecimento devido à complexidade e forte dependência do usuário. Neste contexto, as experiências adquiridas em projetos anteriores não são devidamente documentadas, gerenciadas e controladas, gerando como conseqüência a repetição de erros dos projetos anteriores. Em outras palavras, outro grande problema prático é a falta de plataformas capazes de fazer o reuso do conhecimento adquirido em projetos realizados no passado. O principal objetivo deste trabalho é criar um framework híbrido para desenvolvimento de soluções em Mineração de Dados que integra diversas ferramentas disponíveis no mercado e disponibiliza um ambiente integrado para reuso do conhecimento na área de KDD. Este ambiente possibilita a centralização e padronização dos artefatos gerados ao longo do processo de KDD, assim como aproveita os melhores recursos de cada ferramenta de mercado disponível. Para validação do framework foram coletados os metadados de 69 projetos reais de mineração de dados, 61 lições aprendidas dos profissionais que trabalharam nestes projetos e 654 entidades de conhecimento (congressos, softwares, publicações etc) da área de KDD. Os estudos apresentados, principalmente para definição do início do projeto, mostraram ser possível, através do framework, entender as características que levaram os projetos a serem um sucesso ou fracasso. Assim, o framework é um ambiente que assegura o desenvolvimento de projetos em KDD de alta qualidade que atende às expectativas do cliente dentro do tempo e orçamento previstos Mineração de Dados Processos de KDD Framework Interoperabilidade Reuso do Conhecimento Metamineração de dados
258	Uso de contexto para adição de semântica a trajetórias de objetos móveis Neiva Moreno, Bruno 31 January 2011 (has links) Made available in DSpace on 2014-06-12T15:50:15Z (GMT). No. of bitstreams: 2 arquivo1402_1.pdf: 3159163 bytes, checksum: f1456cd735a3541751542a864fd7d8ae (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / A crescente popularização dos dispositivos móveis, como celular ou GPS, tem gerado uma grande quantidade de dados espaço-temporais. Estes dados são também denominados como dados de trajetórias de objetos móveis. Em seu formato original de coleta, estes dados não possuem qualquer tipo de semântica. Desta forma, diversos estudos têm focado na extração de conhecimento a partir de dados de trajetórias. Buscando a adição de semântica a partir deste tipo de dado, recentemente foi definido um modelo conceitual para defini-lo: o modelo de stops e moves. Diferentes trabalhos têm estendido este modelo com o objetivo de se extrair conhecimento sobre dados gerados pelos objetos móveis. Estes trabalhos têm investigado como extrair conhecimento dos dados de trajetórias fazendo uso de suas propriedades geométricas e geográficas, porém, pouca atenção tem sido dada às propriedades de contexto das trajetórias. O trabalho apresentado nesta dissertação propõe um método que faz uso de informações de contexto do objeto móvel para extrair conhecimento e, conseqüentemente, adicionar semântica em dados de trajetórias, este método é denominado MTSA (Method for Trajectory Semantic Annotation). Para que o mesmo fosse desenvolvido, foi necessário definir um modelo de contexto para dados de trajetórias com o objetivo de representar os principais conceitos referentes ao significado de informações de contexto na área de trajetórias de objetos móveis. O método proposto adiciona semântica a trajetórias por meio de elementos básicos definidos como stops e moves e acessa as informações de contexto representadas em uma base de dados que contém informações sobre as principais situações de contexto que um objeto móvel pode realizar em um domínio específico. Para validar o MTSA, foram obtidos resultados da execução do mesmo sobre três conjuntos de dados de trajetórias de domínios diferentes. Estes resultados mostraram que o uso do MTSA pode ser útil para extração de conhecimento, definição de padrões de comportamento e adição de semântica a trajetórias Objetos móveis Trajetórias espaço-temporal Trajetórias semânticas Sistema de posicionamento global GPS Mineração de Dados Espaciais Contexto Computacional.
259	Uma arquitetura de software para descoberta de regras de associação multidimensional, multinível e de outliers em cubos OLAP: um estudo de caso com os algoritmos APriori e FPGrowth Moreira Tanuro, Carla 31 January 2010 (has links) Made available in DSpace on 2014-06-12T15:55:26Z (GMT). No. of bitstreams: 2 arquivo2236_1.pdf: 2979608 bytes, checksum: 3c3ed256a9de67bd5b716bb15d15cb6c (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2010 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / O processo tradicional de descoberta de conhecimento em bases de dados (KDD Knowledge Discovery in Databases) não contempla etapas de processamento multidimensional e multinível (i.e., processamento OLAP - OnLine Analytical Processing) para minerar cubos de dados. Por conseqüência, a maioria das abordagens de OLAM (OLAP Mining) propõe adaptações no algoritmo minerador. Dado que esta abordagem provê uma solução fortemente acoplada ao algoritmo minerador, ela impede que as adaptações para mineração multidimensional e multinível sejam utilizadas com outros algoritmos. Além disto, grande parte das propostas de OLAM para regras de associação não considera o uso de um servidor OLAP e não tira proveito de todo o potencial multidimensional e multinível presentes nos cubos OLAP. Por estes motivos, algum retrabalho (e.g., re-implementação de operações OLAP) é realizado e padrões possivelmente fortes decorrentes de generalizações não são identificados. Diante desse cenário, este trabalho propõe a arquitetura DOLAM (Decoupled OLAM) para mineração desacoplada de regras de associação multidimensional, multinível e de outliers em cubos OLAP. A arquitetura DOLAM deve ser inserida no processo de KDD (Knowledge Discovery in Databases) como uma etapa de processamento que fica entre as etapas de Pré-Processamento e Transformação de Dados. A arquitetura DOLAM define e implementa três componentes: 1) Detector de Outliers, 2) Explorador de Subcubos e 3) Expansor de Ancestrais. A partir de uma consulta do usuário, estes componentes são capazes de, respectivamente: 1) identificar ruídos significativos nas células do resultado; 2) explorar, recursivamente, todas as células do resultado, de forma a contemplar todas as possibilidades de combinações multidimensional e multinível e 3) recuperar todos os antecessores (generalizações) das células do resultado. O componente central da arquitetura é o Expansor de Ancestrais - o único de uso obrigatório. Ressalta-se que, a partir desses componentes, o processamento OLAM fica desacoplado do algoritmo minerador e permite realizar descobertas mais abrangentes, as quais, por conseqüência, podem retornar padrões potencialmente mais fortes. Como prova de conceito, foi realizado um estudo de caso com dados reais de uma empresa de micro-crédito. O estudo de caso foi implementado em Java, fez uso do servidor OLAP Mondrian e utilizou as implementações dos algoritmos para mineração de regras de associação APriori e FP-Growth do pacote de software Weka OLAP Mineração de dados KDD OLAM Regras de associação APriori FP-growth Mineração multidimensional Mineração multinível Outlier
260	DB-SMoT: um método baseado na direção para identificação de áreas de interesse em trajetórias ROCHA, José Antônio Manso Raimundo da 31 January 2010 (has links) Made available in DSpace on 2014-06-12T15:56:15Z (GMT). No. of bitstreams: 2 arquivo2790_1.pdf: 2753254 bytes, checksum: 58c415938566a69e881ed3b2c5347301 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2010 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / O Sistema GPS permite que objetos móveis possuam a funcionalidade de obter sua posição espaço-temporal a todo instante. Esta funcionalidade, recentemente requerida pelos mais diversos tipos de aplicações computacionais, tem gerado uma enorme quantidade de dados espaciais brutos sobre trajetórias, criando grandes bancos de dados espaço-temporais. Estão em curso projetos e pesquisas direcionados para o gerenciamento deste novo tipo de dados, e para a implementação de técnicas de análises apropriadas para a extração de conhecimento sobre trajetórias. Este trabalho propõe um novo método para se adicionar semântica às trajetórias, fundamentando-se na variação temporal da direção do objeto móvel, com a finalidade de gerar agrupamentos que representem locais de interesse no contexto da atividade na qual o objeto móvel se encontra inserido. Com a finalidade de validar o método proposto, trajetórias reais de barcos pesqueiros de atuns, obtidas pelo Programa Nacional de Rastreamento de Embarcações Pesqueiras por Satélite (PREPS), foram processadas pela extensão espacial do software Weka, o qual foi estendido para incorporar as funcionalidades principais do nosso método proposto, denominado de DB-SMoT (Stops and Moves de Trajetórias Baseado na Direção). Os resultados experimentais foram avaliados por meio da análise ROC (Receiver Operating Characteristic). No espaço ROC o método DB-SMoT foi comparado com outro método existente, chamado CB-SMoT (Clustering-Based Stops and Moves of Trajectories), que se baseia na variação da velocidade do objeto móvel para incorporação de semântica às trajetórias. Em experimentos com três trajetórias, o método proposto teve um desempenho superior ao CB-SMoT com relação à identificação de áreas de interesse em trajetórias Banco de Dados Espaço-Temporal Trajetórias Mineração de Dados GPS Rastreamento Análise ROC

Search results