Global ETD Search

1	Estudo comparativo entre algoritmos de regras de associação de forma normal e incremental de dados / Euclides Peres Farias Junior ; orientador, Júlio Cesar Nievola Farias Junior, Euclides Peres January 2008 (has links) Dissertação (mestrado) - Pontifícia Universidade Católica do Paraná, Curitiba, 2008 / Bibliografia: f. 109-114 / Atualmente, o maior desafio da Tecnologia da Informação é vislumbrar mecanismos de exploração de dados de forma a apresentar uma análise detalhada com o objetivo de detectar novas descobertas de negócios ou tendências de mercado. Agregadas a esta necessid / Now a days the biggest challenge to the Information Technology is to catch a glimpse of the data mining exploration mechanisms to present a detailed analysis with the objective to detect new discoveries in business or market tendencies. Aggregated to this 004 20 Informática Dissertações Exploração de dados Algoritmos de computador
2	Seleção de atributos utilizando algoritmos genéticos multiobjetivos / Gisele Lobo Pappa ; orientador, Celso Antônio Alves Kaestner, co-orientador, Alex Alves Freitas Pappa, Gisele Lobo January 2002 (has links) Dissertação (mestrado) - Pontifícia Universidade Católica do Paraná, 2002 / Inclui bibliografias / A seleção de atributos é uma das tarefas que podem ser realizadas durante a fase de pré-processamento de dados que serão posteriormente minerados. Ela é importante porque, na maioria dos casos, dados são coletados para propósitos diferentes da classificaç / Attribute selection is one of the tasks that can be performed during the preprocessing of the data to be mined. It is an important task because, in the majority of the cases, data is collected for purposes other than classification. As a result, databases 004 20 Informática - Dissertações Exploração de dados Algoritmos genéticos
3	Construção de atributos X-of-N usando algoritimos genéticos / Otavio Larsen ; orientador, Júlio César Nievola ; co-orientador, Alex Alves Freitas Larsen, Otavio January 2002 (has links) Dissertação (mestrado) - Pontifícia Universidade Católica do Paraná, 2002 / Inclui bibliografias / Este trabalho propõe um novo Algoritmo Genético (AG) para construção indutiva. O objetivo do AG é construir novos atributos X-of-N a partir dos atributos originais de uma dada base de dados, com o objetivo de melhorar a eficiência de um algoritmo de miner / We propose a new Genetic Algorithm (GA) for constructive induction. The goal of the GA is to construct new X-of-N attributes out of the original attributes of a given data set, in order to improve the effectiveness of a data mining (or machine learning) a 004 20 Informática - Dissertações Algoritmos genéticos Exploração de dados
4	Integração de modelos baseada em sistemas multi-agente / Ana Carolina Mendonça Pilatti de Paula ; orientador, Fabrício Enembreck ; co-orientador, Bráulio Coelho Ávila Paula, Ana Carolina Mendonça Pilatti de January 2005 (has links) Dissertação (mestrado) - Pontifícia Universidade Católica do Paraná, Curitiba, 2005 / Inclui bibliografia / A Mineração de Dados permite produzir conhecimento a partir de dados armazenados. Com o crescimento das bases de dados e a necessidade de bases distribuídas, novas técnicas são pesquisadas visando acelerar o processo de extração do conhecimento nestas bas 004 20 Informática - Dissertações Exploração de dados Agentes inteligentes (Software)
5	Redução da dimensionalidade em bases de dados de expressão gênica / Helyane Bronoski Borges ; orientador, Júlio Cesar Nievola Borges, Helyane Bronoski January 2006 (has links) Dissertação (mestrado) - Pontifícia Universidade Católica do Paraná, Curitiba, 2006 / Inclui bibliografia / O rápido desenvolvimento das pesquisas na área de genoma e proteoma têm contribuído para o crescimento acelerado das bases de dados biológicas, inviabilizando a análise humana sem algum suporte tecnológico. Uma das características desses tipos de dados é 004 20 Informática - Dissertações Exploração de dados Biologia computacional
6	Aplicação de técnicas de data mining na caracterização de turnover interno para o suporte à gestão de pessoas / Application of data mining techniques to the characterization of internal turnover to support personnel management Mendes, Alessandro de Souza 30 April 2013 (has links) Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2013. / Submitted by Alaíde Gonçalves dos Santos (alaide@unb.br) on 2014-05-08T14:32:21Z No. of bitstreams: 1 2013_AlessandrodeSouzaMendes.pdf: 4711286 bytes, checksum: 346038fb585a97db1696325bc7b1961f (MD5) / Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2014-05-12T13:59:07Z (GMT) No. of bitstreams: 1 2013_AlessandrodeSouzaMendes.pdf: 4711286 bytes, checksum: 346038fb585a97db1696325bc7b1961f (MD5) / Made available in DSpace on 2014-05-12T13:59:07Z (GMT). No. of bitstreams: 1 2013_AlessandrodeSouzaMendes.pdf: 4711286 bytes, checksum: 346038fb585a97db1696325bc7b1961f (MD5) / Esta dissertação encontra-se no campo da Mineração de Dados e suas aplicações em bases de dados de Gestão de Pessoas, na hipótese de que tais técnicas podem ser agregadas a um modelo multidimensional que leve à descoberta de fenômenos e ao entendimento dos dados relativos à rotatividade interna de pessoal e seus impactos. Foram utilizadas as abordagens de modelagem descritiva e preditiva, a fim de descobrir informações ocultas no histórico de transferências dos empregados entre as unidades de uma organização. Entre as técnicas descritivas, foram aplicados métodos de agrupamento e regras de associação, para descrever os dados. Para as análises preditivas, foi utilizada a técnica de Árvores de Decisão, um método de indução que mostra graficamente o processo de classificação. Para validar a hipótese de que tais proposições levam à descoberta de conhecimento acerca de rotatividade de pessoas, foi desenvolvido um módulo de suporte à decisão no domínio do problema, aplicando as técnicas de Mineração de Dados propostas, além da criação de um novo tipo de dimensão voltada para a descoberta de conhecimento. Para validar as contribuições e atingir o objetivo proposto neste trabalho, foram utilizados, como estudo de caso, dados oriundos de uma instituição financeira de grande porte e com um longo histórico de rotatividade de pessoas. Os resultados obtidos são apresentados e discutidos. _______________________________________________________________________________________ ABSTRACT / This dissertation is in the field of Data Mining and its applications in databases of Personnel Management, considering the assumption that such technique can be aggregated to a multidimensional model that leads to the discovery of phenomena and the understanding of data relating to internal employee turnover and its impacts. Descriptive and predictive modeling approaches were used in order to discover hidden information on the history of transfers of employees between departments of an organization. Among the descriptive techniques, cluster analysis and association rules have been applied to describe the data. For predictive analysis, the technique of Decision Trees was used, comprising a method of induction that graphically shows the classification process. For validating the hypothesis that such proposals lead to the knowledge discovery about employee turnover, a decision support module was developed in the problem domain, applying the proposed techniques of Data Mining. This decision support module introduces a new type of dimension focused on knowledge discovery. For validating the contributions and evaluating the achievements of this work, a case study was performed using data from a large financial institution with a long history of employee turnover. The results are presented and discussed. Exploração de dados Gestão de pessoas Rotatividade de pessoal Data warehouse Clustering
7	Metodologia e uso de técnica de exploração e análise de dados na construção de Date Warehouse SANTOS, Roberto Ângelo Fernandes January 2002 (has links) Made available in DSpace on 2014-06-12T15:59:30Z (GMT). No. of bitstreams: 2 arquivo5134_1.pdf: 2541591 bytes, checksum: 6f46eb970bb56cef73fafe13dc208cad (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2002 / O volume de informações a ser trabalhado na tomada das decisões gerenciais supera largamente a capacidade do processamento humano, mecânico e dos sistemas transacionais atuais, exigindo ferramentas de apoio à decisão mais adequadas aos novos desafios gerenciais. Mesmo aplicando-se modelos de decisão tidos como adequados, uma grande parte das implementações de Sistemas de Informação não atingem os resultados esperados, o que levam muitos deles ao fracasso total ou parcial. Acredita-se que com obtenção de resultados rápidos se possa conseguir um maior envolvimento do usuário final, o que segundo os especialistas diminui bastante a possibilidade de fracasso. Esse trabalho visa a utilizar técnicas de análise e exploração de dados na construção de soluções de Sistemas de Apoio à Decisão, em especial na construção de Data Warehouse(DW). Aproveita-se o conhecimento adquirido com a aplicação dessas técnicas, mostrando a sua importância nas diversas fases de sua construção de um DW. Propõe-se e implementa-se uma metodologia chamada FASTCUBE, que é baseada em um modelo de préprocessamento de dados. Ela incorpora de maneira rápida os metadados extraídos diretamente da massa de dados. Acelerar e sedimentar a compreensão do problema, sempre levando-se em consideração a qualidade dos dados, durante todas as suas fases é um dos pontos forte dessa metodologia. O seu objetivo final é acelerar o processo de visualização do modelo de decisão, através de um protótipo de modelo dimensional, com dados operacionais amostrados no início do processo e tratados durante o mesmo Sistemas de Apoio à Decisão Data Warehouse(DW)
8	Interpretação de clusters gerados por algoritmos de clustering hierárquico / Interpreting clusters generated by hierarchical clustering algorithms Metz, Jean 04 August 2006 (has links) O processo de Mineração de Dados (MD) consiste na extração automática de padrões que representam o conhecimento implícito em grandes bases de dados. Em geral, a MD pode ser classificada em duas categorias: preditiva e descritiva. Tarefas da primeira categoria, tal como a classificação, realizam inferências preditivas sobre os dados enquanto que tarefas da segunda categoria, tal como o clustering, exploram o conjunto de dados em busca de propriedades que o descrevem. Diferentemente da classificação, que analisa exemplos rotulados, o clustering utiliza exemplos para os quais o rótulo da classe não é previamente conhecido. Nessa tarefa, agrupamentos são formados de modo que exemplos de um mesmo cluster apresentam alta similaridade, ao passo que exemplos em clusters diferentes apresentam baixa similaridade. O clustering pode ainda facilitar a organização de clusters em uma hierarquia de agrupamentos, na qual são agrupados eventos similares, criando uma taxonomia que pode simplificar a interpretação de clusters. Neste trabalho, é proposto e desenvolvido um módulo de aprendizado não-supervisionado, que agrega algoritmos de clustering hierárquico e ferramentas de análise de clusters para auxiliar o especialista de domínio na interpretação dos resultados do clustering. Uma vez que o clustering hierárquico agrupa exemplos de acordo com medidas de similaridade e organiza os clusters em uma hierarquia, o usuário/especialista pode analisar e explorar essa hierarquia de agrupamentos em diferentes níveis para descobrir conceitos descritos por essa estrutura. O módulo proposto está integrado em um sistema maior, em desenvolvimento no Laboratório de Inteligência Computacional ? LABIC ?, que contempla todas as etapas do processo de MD, desde o pré-processamento de dados ao pós-processamento de conhecimento. Para avaliar o módulo proposto e seu uso para descoberta de conceitos a partir da estrutura hierárquica de clusters, foram realizados diversos experimentos sobre conjuntos de dados naturais, assim como um estudo de caso utilizando um conjunto de dados real. Os resultados mostram a viabilidade da metodologia proposta para interpretação dos clusters, apesar da complexidade do processo ser dependente das características do conjunto de dados. / The Data Mining (DM) process consists of the automated extraction of patterns representing knowledge implicitly stored in large databases. In general, DM tasks can be classified into two categories: predictive and descriptive. Tasks in the first category, such as classification and prediction, perform inference on the data in order to make predictions, while tasks in the second category, such as clustering, characterize the general properties of the data. Unlike classification and prediction, which analyze class-labeled data objects, clustering analyses data objects without a known class-label. Clusters of objects are formed so that objects that are in the same cluster have a close similarity among them, but are very dissimilar to objects in other clusters. Clustering can also facilitate the organization of clusters into a hierarchy of clusters that group similar events together. This taxonomy formation can facilitate interpretation of clusters. In this work, we propose and develop tools to deal with this task by implementing a module which comprises hierarchical clustering algorithms and several cluster analysis tools, aiming to help the domain specialist to interpret the clustering results. Once clusters group objects based on similarity measures which are organized into a hierarchy, the user/specialist is able to carry out an analysis and exploration of the agglomeration hierarchy at different levels of the hierarchy in order to discover concepts described by this structure. The proposed module is integrated into a large system under development by researchers from the Computational Intelligence Laboratory ? LABIC ?- which contemplates all the DM process steps, from data pre-processing to knowledge post-processing. To evaluate the implemented module and its use to discover concepts from the hierarchical structure of clusters, several experiments on natural databases were carried out as well as a case study using a real database. Results show the viability of the proposed methodology although the process could be complex depending on the characteristics of the database. Aprendizado não-supervisionado Data exploration Exploração de dados Extração de padrões Non-supervised learning Pattern extraction
9	Visualização e exploração de dados multidimensionais na web / Exploratory multidimensional data visualization on the web Pagliosa, Lucas de Carvalho 13 November 2015 (has links) Com o crescimento do volume e dos tipos de dados, a necessidade de analisar e entender o que estes representam e como estão relacionados tem se tornado crucial. Técnicas de visualização baseadas em projeções multidimensionais ganharam espaço e interesse como uma das possíveis ferramentas de auxílio para esse problema, proporcionando um forma simples e rápida de identificar padrões, reconhecer tendências e extrair características antes não óbvias no conjunto original. No entanto, a projeção do conjunto de dados em um espaço de menor dimensão pode não ser suficiente, em alguns casos, para responder ou esclarecer certas perguntas feitas pelo usuário, tornando a análise posterior à projeção crucial para a correta interpretação da visualização observada. Logo, a interatividade, aplicada à necessidade do usuário, é uma fator essencial para análise. Neste contexto, este projeto de mestrado tem como principal objetivo criar metáforas visuais baseadas em atributos, através de medidas estatísticas e artefatos para detecção de ruídos e grupos similares, para auxiliar na exploração e análise dos dados projetados. Além disso, propõe-se disponibilizar, em navegadores Web, as técnicas de visualização de dados multidimensionais desenvolvidas pelo Grupo de Processamento Visual e Geométrico do ICMC-USP. O desenvolvimento do projeto como plataforma Web inspira-se na dificuldade de instalação e execução que certos projetos de visualização possuem, como problemas causados por diferentes versões de IDEs, compiladores e sistemas operacionais. Além disso, o fato do projeto estar disponível online para execução tem como propósito facilitar o acesso e a divulgação das técnicas propostas para o público geral. / With the growing number and types of data, the need to analyze and understand what they represent and how they are related has become crucial. Visualization techniques based on multidimensional projections have gained space and interest as one of the possible tools to aid this problem, providing a simple and quick way to identify patterns, recognize trends and extract features previously not obvious in the original set. However, the data set projection in a smaller space may not be sufficient in some cases to answer or clarify certain questions asked by the user, making the posterior projection analysis crucial for the exploration and understanding of the data. Thus, interactivity in the visualization, applied to the users needs, is an essential factor for analysis. In this context, this master projects main objective consists to create visual metaphors based on attributes, through statistical measures and artifacts for detecting noise and similar groups, to assist the exploration and analysis of projected data. In addition, it is proposed to make available, in Web browsers, the multidimensional data visualization techniques developed by the Group of Visual and Geometric Processing at ICMC-USP. The development of the project as a Web platform was inspired by the difficulty of installation and running that certain visualization projects have, mainly due different versions of IDEs, compilers and operating systems. In addition, the fact that the project is available online for execution aims to facilitate the access and dissemination of technical proposals for the general public. Análise de atributos Attribute analysis Data exploration Exploração de dados Interability Iteratividade Multidimensional projection Projeção multidimensional Visualização Visualization
10	Descoberta de conhecimento em texto aplicada a um sistema de atendimento ao consumidor Schiessl, José Marcelo 12 April 2007 (has links) Dissertação (mestrado)—Universidade de Brasília, Faculdade de Economia, Administração, Contabilidade e Ciência da Informação e Documentação, Departamento de Ciência da Informação e Documentação, 2007. / Submitted by Luis Felipe Souza (luis_felas@globo.com) on 2009-01-12T11:44:00Z No. of bitstreams: 1 Dissertacao_2007_JoseSchiessl.pdf: 1688737 bytes, checksum: 8cde16615a96a2427a9cdfb62c3f48cc (MD5) / Approved for entry into archive by Georgia Fernandes(georgia@bce.unb.br) on 2009-03-04T14:33:25Z (GMT) No. of bitstreams: 1 Dissertacao_2007_JoseSchiessl.pdf: 1688737 bytes, checksum: 8cde16615a96a2427a9cdfb62c3f48cc (MD5) / Made available in DSpace on 2009-03-04T14:33:25Z (GMT). No. of bitstreams: 1 Dissertacao_2007_JoseSchiessl.pdf: 1688737 bytes, checksum: 8cde16615a96a2427a9cdfb62c3f48cc (MD5) / Analisa um Serviço de Atendimento ao Consumidor de uma instituição financeira que centraliza, em forma textual, os questionamentos, as reclamações, os elogios e as sugestões, verbais ou escritas, de clientes. Discute a complexidade da informação armazenada em linguagem natural para esse tipo de sistema. Visa apresentar alternativa para extração de conhecimento de bases textuais com a criação de agrupamentos e modelo de classificação automática de textos para agilizar a tarefa realizada atualmente por pessoas. Apresenta uma revisão de literatura que mostra a Descoberta de Conhecimento em Texto como uma extensão da Descoberta de Conhecimento em Dados que utiliza técnicas do Processamento de Linguagem Natural para adequar o texto a um formato apropriado para a mineração de dados e destaca a importância do processo dentro da Ciência da Informação. Aplica a Descoberta de Conhecimento em Texto em uma base do Serviço de Atendimento ao Cliente com objetivo de criar automaticamente agrupamentos de documentos para posterior criação de um modelo categorizador automático dos novos documentos recebidos diariamente. Essas etapas contam com a validação de especialistas de domínio que atestam a qualidade dos agrupamentos e do modelo. Cria indicadores de desempenho que avaliam o grau de satisfação do cliente em relação aos produtos e serviços oferecidos para fornecer subsídio à gestão na política de atendimento. _______________________________________________________________________________________________________________ ABSTRACT / It analyses a Help Desk System of a federal institution that centralizes customer answers, complains, compliments, and suggestions, spoken or written. It argues about information complexity stored in natural language. It intends to present an alternative for knowledge extraction from textual databases by creating clusters and automatic classification model of texts in order to improve the current tasks made by employees. It presents a literature revision that shows the Knowledge Discovery in Text as an extension of Knowledge Discovery in Data that utilizes the Natural Language Processing in order to adequate the text into an appropriated format to data mining and enhances the importance of the process in the Information Science field. It applies the Knowledge Discovery in Text techniques in the Help Desk Database in order to create cluster of documents and, after that, to build an automatic classification model to new documents received every day. These steps need to be validated by specialist in the area to verify the model and clusters quality. It creates performance indexes in order to measure the customer satisfaction related to products and services to provide information for decision makers. Mineração de texto Exploração de dados Descoberta de conhecimento em dado

Search results