Global ETD Search

181	Mineração de dados em redes complexas: estrutura e dinâmica / Data mining in complex networks: structure and dynamics Arruda, Guilherme Ferraz de 02 April 2013 (has links) A teoria das redes complexas é uma área altamente interdisciplinar que oferece recursos para o estudo dos mais variados tipos de sistemas complexos, desde o cérebro até a sociedade. Muitos problemas da natureza podem ser modelados como redes, tais como: as interações protéicas, organizações sociais, o mercado financeiro, a Internet e a World Wide Web. A organização de todos esses sistemas complexos pode ser representada por grafos, isto é, vértices conectados por arestas. Tais topologias têm uma influencia fundamental sobre muitos processos dinâmicos. Por exemplo, roteadores altamente conectados são fundamentais para manter o tráfego na Internet, enquanto pessoas que possuem um grande número de contatos sociais podem contaminar um grande número de outros indivíduos. Ao mesmo tempo, estudos têm mostrado que a estrutura do cérebro esta relacionada com doenças neurológicas, como a epilepsia, que está ligada a fenômenos de sincronização. Nesse trabalho, apresentamos como técnicas de mineração de dados podem ser usadas para estudar a relação entre topologias de redes complexas e processos dinâmicos. Tal estudo será realizado com a simulação de fenômenos de sincronização, falhas, ataques e propagação de epidemias. A estrutura das redes será caracterizada através de métodos de mineração de dados, que permitirão classificar redes de acordo com um conjunto de modelos e determinar padrões de conexões presentes na organização de diferentes tipos de sistemas complexos. As análises serão realizadas com aplicações em neurociências, biologia de sistemas, redes sociais e Internet / The theory of complex networks is a highly interdisciplinary reseach area offering resources for the study of various types of complex systems, from the brain to the society. Many problems of nature can be modeled as networks, such as protein interactions, social organizations, the financial market, the Internet and World Wide Web. The organization of all these complex systems can be represented by graphs, i.e. a set of vertices connected by edges. Such topologies have a fundamental influence on many dynamic processes. For example, highly connected routers are essential to keep traffic on the Internet, while people who have a large number of social contacts may infect many other individuals. Indeed, studies have shown that the structure of brain is related to neurological conditions such as epilepsy, which is relatad to synchronization phenomena. In this text, we present how data mining techniques data can be used to study the relation between complex network topologies and dynamic processes. This study will be conducted with the simulation of synchronization, failures, attacks and the epidemics spreading. The structure of the networks will be characterized by data mining methods, which allow classifying according to a set of theoretical models and to determine patterns of connections present in the organization of different types of complex systems. The analyzes will be performed with applications in neuroscience, systems biology, social networks and the Internet Complex networks Complex systems Data mining and machine learning Redes complexas Sistemas complexos
182	Análise de sentimentos para o auxílio na gestão das cidades inteligentes. / Sentiment analysis for the aid in the smart cities management. Rossi, Rosa Helena Peccinini Silva 27 June 2019 (has links) Esta Tese tem como objetivo geral inserir a Análise de Sentimentos na gestão das Cidades Inteligentes, possibilitando a implementação de uma ferramenta que disponibilize informações que auxiliem na supervisão e gestão dessas cidades. Dentre os possíveis auxílios que podem ser prestados está a identificação de ações, meios de prevenção e predição de possíveis adversidades nos diversos Domínios de Interesse, além da busca por melhorias na qualidade vida da população, que pode ser feita por meio dessa análise, permitindo que os gestores dessas cidades possam tomar as melhores decisões de acordo com cada cenário. Este trabalho contribui com um novo método cujo o objetivo é o desenvolvimento de um Sistema de Análise de Sentimentos para Auxílio na Gestão das Cidades Inteligentes (ASCI). Esse Sistema é capaz de captar, tratar, processar, filtrar por Domínio de Interesse e avaliar os sentimentos contidos nas informações provenientes dos cidadãos de uma Cidade Inteligente. O método utiliza duas Fases de Mineração de Dados, uma para a classificação dos Domínios de Interesse e outra para a Análise de Sentimentos. Para o estudo de caso foi implementado o método ASCI por meio do qual são captadas informações provenientes da população de uma determinada região da cidade de São Paulo, por meio da Rede Social Twitter. Também foi realizado um estudo de classificação de sentimentos no Domínio específico do Transporte, no qual também foram utilizados, e tiveram seu desempenho avaliado, os classificadores do tipo Linear SVC, Logistic Regression, Multinomial Naive Bayes e Random Forest Classifier para identificar os sentimentos positivos, neutros e negativos dos tweets captados. Os dados foram avaliados usando duas técnicas de extração de características de texto: Bag of Words e TF-IDF. O método ASCI desenvolvido nesta Tese contribui de maneira relevante para a área de Análise de Sentimentos, uma vez que os resultados obtidos foram satisfatórios quando aplicado em cenários de Domínios de Interesse das Cidades Inteligentes. / The main objective of this work is to insert the Sentiment Analysis in the management of Smart Cities, enabling the implementation of a supervision and management tool in these cities. Among the possible aid services that can be applied, there is the identification of actions, ways of prevention and prediction of possible adversities in the various Domains of Interest, and also the search for improvements in the quality of life of the population. This can be done through this analysis, allowing the best decisions according to each scenario by the city managers. This work contributes to a new method whose objective is the development of a Sentiment Analysis System to Assist in the Management of Smart Cities (ASCI). This System is capable of capturing, classifying, processing, filtering by Domain of Interest and evaluating the sentiments of Smart City citizens. The method uses two Data Mining phases, one for the classification of Domains of Interest and the other for Sentiment Analysis. For the case study, the ASCI method was implemented, through which information was collected from a regional population in São Paulo city through Twitter Social Network data. A study of Sentiment Analysis in specific Domain of Interest Transport was also carried out, in which Linear SVC, Logistic Regression, Multinomial Naive Bayes and Random Forest classifiers were used to identify the positive, neutral and negative sentiments of collected tweets. The data were evaluated using two techniques of extraction of text characteristics: Bag of Words and TF-IDF. The ASCI method developed in this Thesis contributes significantly to the area of Sentiment Analysis and the results obtained were satisfactory when applied in Smart City Domain of Interest scenarios. Algoritmos (Classificação) Análise de sentimentos Cidades inteligentes Classification algorithms Data mining Mineração de dados Sentiment analysis Smart cities
183	Processo de indução e ranqueamento de árvores de decisão sobre modelos OLAP Colares, Peterson Fernandes January 2011 (has links) Made available in DSpace on 2013-08-07T18:42:31Z (GMT). No. of bitstreams: 1 000437994-Texto+Completo-0.pdf: 1640213 bytes, checksum: 26f32168808fae3383c6bd3a3b9c87fc (MD5) Previous issue date: 2011 / Organizations acting on several markets have been using the benefits offered by the use of Data Mining - DM techniques as a complementary activity to their support systems to the strategic decision. However, to the great majority of the organizations, the deployment of a DM Project ends up not being feasible due to different factors, such as: Project duration, high costs and mainly by the uncertainty as to getting results that may effectively help the organization to improve their business processes. In this context, this paper presents a process based on the process of knowledge Discovery in Database - KDD which aims to identify opportunities to the application of DM techniques through the induction and ranking of decisions generated by the exploration of semi automatic Online Analytical Processing Models-OLAP. The built process uses stored information in a OLAP model prepared on the basis of used information by Customer Relationship Management - CRM and Business Intelligence - BI typically used by the organization to support strategic decision making. In relation to the information selected for this research, it has been carried out in a semi automatic way, a series of experiments using DM techniques which the results are collected and stored for later evaluation and ranking. The process was built and tested with a significant number of experiments and later evaluated by business experts in a large financial institution where this research was developed. / Organizações atuantes nos mais diferentes mercados, têm utilizado os benefícios oferecidos pela utilização de técnicas de Data Mining – DM como atividades complementares a seus sistemas de apoio a decisão estratégica. Porém, para a grande maioria das organizações, a implantação de um projeto de DM acaba sendo inviabilizada em função de diferentes fatores como: duração do projeto, custos elevados e principalmente pela incerteza quanto à obtenção de resultados que possam auxiliar de fato a organização a melhorar seus processos de negócio. Neste contexto, este trabalho apresenta um processo, baseado no processo de Knowledge Discovery in Database – KDD, que visa identificar oportunidades para aplicação de técnicas de DM através da indução e ranqueamento de árvores de decisão geradas pela exploração semiautomática de modelos On-Line Analytical Processing - OLAP. O processo construído utiliza informações armazenadas em um modelo OLAP preparado com base nas informações utilizadas por sistemas de Customer Relationship Management - CRM e Business Intelligence – BI, tipicamente utilizados por organizações no apoio a tomada de decisão estratégica. Neste trabalho é apresentada uma série de experimentos, gerados de forma semiautomática, utilizando técnicas de DM, cujos resultados são coletados e armazenados para posterior avaliação e ranqueamento. O processo foi construído e testado com um conjunto significativo de experimentos e posteriormente avaliado por especialistas de negócio em uma instituição financeira de grande porte onde esta pesquisa foi desenvolvida. INFORMÁTICA MINERAÇÃO DE DADOS (INFORMÁTICA) DATA WAREHOUSE SISTEMAS DE INFORMAÇÃO
184	Aplicação de técnicas de visualização de informações em uma ferramenta de descoberta de conhecimento Rosas, Daniel Henrique Perucelli 09 July 2013 (has links) Capes / Ferramentas de descoberta de conhecimento que usam a mineração de dados para extração de informações geram relatórios que são analisados e podem servir de base para a tomada de decisão. Mas, a percepção do conhecimento obtido pode ser comprometida caso os resultados fornecidos pelas ferramentas utilizem termos técnicos, linguagem de máquina ou o formato de exibição das informações seja inteligível. Por isso, técnicas que utilizam recursos gráficos para expor informações passam a ser importantes na descoberta de conhecimento podendo ser aplicadas aos resultados de modo a facilitar a compreensão da informação exposta. Este trabalho correlaciona o conhecimento fornecido pelas técnicas de mineração de dados com as características gráficas das técnicas de visualização de informações de modo que auxiliem na compreensão dos resultados fornecidos pelas ferramentas de descoberta de conhecimento. Apresenta também as técnicas de visualização de informações mais apropriadas para transmitir o conhecimento obtido além de exibir os protótipos das representações gráficas dos resultados gerados por técnicas e algoritmos de mineração da ferramenta Weka. A aplicação de recursos visuais visa simplificar a interpretação do conhecimento extraído e fortalecer a base de informações para tomada de decisão das organizações. / Tools for knowledge discovery using data mining to extract information generate reports that are reviewed and may serve as a basis for decision making. But the perception of knowledge gained can be compromised if the results provided by the tools using technical terms, machine language or the display format of the information to be intelligible. Therefore, techniques that use information to display graphics resources become important in knowledge discovery can be applied to the results in order to facilitate the understanding of the information displayed. This work correlates the knowledge provided by the techniques of data mining with graphic features of information visualization techniques in order to assist in the understanding of the results provided by the tools of knowledge discovery. It also presents information visualization techniques most appropriate to convey the knowledge gained in addition to displaying prototypes of graphical representations of the results generated by techniques and algorithms mining tool Weka. The use of visuals to simplify the interpretation of the extracted knowledge and strengthen the information base for decision-making organizations. Mineração de dados (Computação) Data mining
185	ANÁLISE DO PERFIL DOS COLÉGIOS MILITARES BASEADO EM DADOS DE RENDIMENTOS DE ENSINO / ANALYSIS OF THE PROFILES OF MILITAR SCHOOLS BASED IN TEACHING EFFICIENCY DATA Silva, Fernando Monteiro 25 May 2005 (has links) In order to determine the profile of pupils and the Militar Schools, multivariate statistical techniques on the students data are applied, providing therefore, aids for the administration decision takings. First, a data descriptive analysis of four Militar Schools was carried out according to a cross of school efficiency variants. The multivariate analysis is applied in some teaching indicators by using agglomeration analysis as well as principal components and discriminatory. It is possible to identify the number of students presenting low school grades in their social classes and to compare them among the schools. Once grades in disciplines are used, sets that represent attributes in psychomotor/affective and scientific/cognitive areas are verified. A model formed by the most representative disciplines in the school year, compared to the need of recovery, is shown, classifying a new student in this system. The techniques applied in teaching indicators seem to be suitable to check the quality because when the multivariate nature is obeyed, relevant information can be taken by using different variants and cases. The search for knowledge in data banks has been distinguished as a desirable activity to find out and to understand hidden standards in institutions once they are not always seen through ordinary observation. Thus, it is aimed to enhance the competence and creativity in public institutions looking for organization and quality system management by the usage of methodology in order to show the comparative performance among schools and their own pupils / Com o objetivo de determinar o perfil dos alunos e dos Colégios Militares, aplicam-se técnicas estatísticas multivariadas em dados dos alunos, disponibilizando assim subsídios para a tomada de decisões da administração. Realiza-se, primeiramente, a análise descritiva dos dados de quatro Colégios Militares, segundo um cruzamento de variáveis de rendimento escolar. Aplica-se análise multivariada em alguns indicadores de ensino, utilizando-se análise de aglomeração, componentes principais e discriminante. Pode-se identificar o número de alunos com rendimento baixo nas classes de origem social e compará-los entre as escolas. Utilizando graus das disciplinas, verificam-se agrupamentos que representam os atributos da área psicomotora/afetiva e ciências/cognitivas. Mostra-se um modelo formado pelas disciplinas mais representativas em um ano letivo comparadas com a necessidade de recuperação, classificando um aluno novo neste sistema. As técnicas aplicadas em indicadores de ensino mostram-se adequadas para a verificação da qualidade, pois, obedecendo a natureza multivariada, pode-se extrair informações relevantes utilizando-se diferentes casos e variáveis. A procura de conhecimento em bancos de dados tem se destacado como uma atividade desejável para descobrir e compreender padrões ocultos nas instituições, os quais nem sempre são visíveis através da simples observação. Desta forma, busca-se aumentar a competência e a criatividade nas instituições públicas, visando a organização e gestão de sistemas de qualidade, através do uso de metodologia para mostrar o desempenho comparativo entre as escolas e entre os próprios alunos. Ensino Militar Estatística multivariada Mineração de dados Teaching Military Multivariate statistic Data mining
186	Visão sistêmica do Sítio Arqueológico Piracanjuba: a descoberta de conhecimento em sítios arqueológicos Franco, Clélia [UNESP] 26 February 2007 (has links) (PDF) Made available in DSpace on 2014-06-11T19:30:31Z (GMT). No. of bitstreams: 0 Previous issue date: 2007-02-26Bitstream added on 2014-06-13T21:01:19Z : No. of bitstreams: 1 franco_c_dr_prud.pdf: 7388592 bytes, checksum: 3b1b05541970e72cb28df9a6b857ffe8 (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Universidade Estadual de Maringa - Uem / Nas últimas décadas, a capacidade de gerar e coletar dados aumentou rapidamente, gerando a necessidade do desenvolvimento de novas técnicas e ferramentas capazes de processar e analisar esses dados descobrindo informações novas e úteis. Surgindo um proeminente campo de pesquisa para a extração de conhecimento de dados Descoberta de Conhecimento em Banco de Dados. Pela aplicação da metodologia da descoberta de conhecimento indireto aos atributos dos fragmentos cerâmicos coletados ao nível do solo no Sítio Arqueológico Piracanjuba Piraju SP, este trabalho pretende prover aos peritos em arqueologia uma visão sistêmica capaz de auxiliá-los no conhecimento das populações pretéritas que ali habitaram. / In the last decades, the capacities to produce and collect data has grown fast and the development of news techniques and tools capable to processes and analyze this datas discovering new and useful information as necessary. Therefore, a huge research area has beginning for the extraction of data understanding Knowledge Discovery in Database. The indirect knowledge discovery applied to ceramic fragment collected at soil level in Piracanjuba's Piraju, SP aims give to archaeology experts a whole vision able to be useful knowledge of the past people living there. Cartografia Arqueologia Mineração de dados (Computação) Estatística multivariada Knowledge discovery Data mining Multivariate statistical
187	Visão sistêmica do Sítio Arqueológico Piracanjuba : a descoberta de conhecimento em sítios arqueológicos / Franco, Clélia. January 2007 (has links) Resumo: Nas últimas décadas, a capacidade de gerar e coletar dados aumentou rapidamente, gerando a necessidade do desenvolvimento de novas técnicas e ferramentas capazes de processar e analisar esses dados descobrindo informações novas e úteis. Surgindo um proeminente campo de pesquisa para a extração de conhecimento de dados Descoberta de Conhecimento em Banco de Dados. Pela aplicação da metodologia da descoberta de conhecimento indireto aos atributos dos fragmentos cerâmicos coletados ao nível do solo no Sítio Arqueológico Piracanjuba Piraju SP, este trabalho pretende prover aos peritos em arqueologia uma visão sistêmica capaz de auxiliá-los no conhecimento das populações pretéritas que ali habitaram. / Abstract: In the last decades, the capacities to produce and collect data has grown fast and the development of news techniques and tools capable to processes and analyze this datas discovering new and useful information as necessary. Therefore, a huge research area has beginning for the extraction of data understanding Knowledge Discovery in Database. The indirect knowledge discovery applied to ceramic fragment collected at soil level in Piracanjuba's Piraju, SP aims give to archaeology experts a whole vision able to be useful knowledge of the past people living there. / Orientador: Nilton Nobuhiro Imai / Coorientador: Neide Faccio Barrocá / Coorientador: Vilma Tachibana / Banca: Milton Hirokazu Shimabukuro / Banca: Mário Hissamitsu Tarumoto / Banca: José Luiz de Morais / Banca: Emília Mariko Kashimoto / Doutor Cartografia. Arqueologia. Mineração de dados (Computação) Knowledge discovery. eng Data mining. eng Multivariate statistical. eng
188	Extração de conhecimento em trajetorias semânticas / Lima, Daniel da Silva Gomes. January 2017 (has links) Orientador: Ivan Rizzo Guilherme / Banca: Daniel Carlos Guimarães Pedronette / Banca: Evandro Eduardo Seron Ruiz / Resumo: O rápido avanço do uso de tecnologias que permitem a coleta dos dados de movimentação de indivíduos gerou como consequência um crescimento no volume de dados de trajetórias. Trabalhos que utilizam esses dados tem como principal objetivo a realização de análises para identificação de padrões que permitam explicar o comportamento do indivíduo durante o movimento. Para que a extração de conhecimento dos dados de trajetória possa ser gerada de uma forma que agregue conteúdo relevante, é necessário que exista um modelo de representação de trajetória que contemple as principais características do movimento no contexto de aplicação utilizado, além de um processo que transforme os dados brutos de trajetória na estrutura definida por esse modelo. Com isso é possível aplicar técnicas e algoritmos para exploração desses dados e geração de conhecimento. As técnicas de aprendizado de máquina em conjunto com a área de representação de conhecimento fornecem a base conceitual para que problemas desse tipo possam ser modelados e soluções possam ser desenvolvidas a fim de solucionar esses problemas. Este trabalho utiliza esses aspectos conceituais para apresentar uma proposta que permite a extração de conhecimento de trajetória. Esse conhecimento é obtido através da identificação dos locais de parada mais relevantes para um indivíduo e do movimento sequencial entres esses locais determinando o conjunto de comportamentos que representam o padrão de movimento do indivíduo em um período / Abstract: The rapid advance of the use of technologies that allow the collection of the data of movement of individuals generate as a consequence an increase in the volume of trajectory data. Works that use this data have as main objective the accomplishment of analyzes for identification of patterns that allow to explain the behavior of the individual during the movement. In order to the knowledge extraction of the trajectory data to be generated in a way that aggregates relevant content, there must be a trajectory representation model that considers the main characteristics of the movement in the context of the application used, besides a process that transforms the raw trajectory data in the structure defined by this model. With this it is possible to apply techniques and algorithms for exploration of this data and generation of knowledge. Machine learning techniques in conjunction with the area of knowledge representation provide the conceptual basis for problems of this type to be modeled and solutions can be developed in order to solve these problems. This work uses these conceptual aspects to present a proposal that allows the extraction of knowledge of trajectory. This knowledge is obtained through the identification of the most relevant stop places for an individual and the sequential movement between these places determining the set of behaviors that represent the individual's movement pattern in a period / Mestre Ciência da computação. Aprendizado do computador. Mineração de dados (Computação) Movimento - Estudo. Computer science
189	Modelo de mineração de dados em bases de dados acadêmicas / Data mining model in academics databases Silva, Renan Monteiro da 12 April 2016 (has links) Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2016. / Submitted by Fernanda Percia França (fernandafranca@bce.unb.br) on 2016-05-17T16:17:57Z No. of bitstreams: 1 2016_RenanMonteirodaSilva.pdf: 2565220 bytes, checksum: 9d4ad5ce9de42a46b61bb7148d21919d (MD5) / Approved for entry into archive by Marília Freitas(marilia@bce.unb.br) on 2016-05-26T16:25:53Z (GMT) No. of bitstreams: 1 2016_RenanMonteirodaSilva.pdf: 2565220 bytes, checksum: 9d4ad5ce9de42a46b61bb7148d21919d (MD5) / Made available in DSpace on 2016-05-26T16:25:53Z (GMT). No. of bitstreams: 1 2016_RenanMonteirodaSilva.pdf: 2565220 bytes, checksum: 9d4ad5ce9de42a46b61bb7148d21919d (MD5) / No campo das comunidades de pesquisa existe uma série de bases de dados que proveem informações interessantes sobre publicações resultantes da pesquisa, incluindo títulos de artigos, autores, palavras-chave, citações, índices, veículos de publicação (revistas, livros, conferências e os tipos de eventos mais importantes) e assim por diante. Exemplos de tais bases de dados são Google Scholar, CiteSeerX, DBLP, Microsoft Academic, Thomson Reuters Web of Science, entre outros. No entanto, essas bases de dados globais ainda carecem de serviços que possam ser usados na procura por comunidades ou agrupamentos. Uma comunidade pode ser definida como um grupo de entidades, nesse caso autores e/ou universidades, que compartilham atributos ou relacionamentos semelhantes. Neste trabalho é proposto um modelo de mineração e análise das informações contidas nessas bases de dados acadêmicas. A análise dessas informações apresentadas nos resultados visa à descoberta das universidades, autores e assuntos mais significativos dentro do contexto dos dados minerados. Para isso foi feito um estudo de caso utilizando as informações contidas nas bases de dados do CiteSeerX e do DBLP como ponto de partida para a criação de um modelo genérico com o objetivo de ser aplicável a qualquer base de dados acadêmica. No estudo de caso é feita uma extensa mineração nas bases de dados do CiteSeerX e do DBLP, a partir dessa etapa é feita a migração e tratamento dos dados originais obtidos para o modelo genérico proposto neste trabalho. Com o modelo preenchido são aplicados os algoritmos e instruções para geração dos resultados que são subdivididos em três diferentes categorias: clusters, rankings e comunidades de relacionamento. A partir dos resultados são investigadas as tendências atuais na colaboração entre autores e institutos educacionais usando as bases de dados do CiteSeerX e do DBLP. Com a obtenção das informações disponíveis foram construídos várias comunidades e agrupamentos usando as técnicas de clusterização existentes. _______________________________________________________________________________________________ ABSTRACT / In the field of the research community, several databases such as Google Scholar, CiteSeerX, DBP, Microsoft Academic, Thomson Reuter´s Web of Science among others provide interesting information about authors, citations, indexes, most relevant venues types and so on. However, those global databases have limitations, especially in finding communities or clusters. A community can be defined as a group of entities, in this case authors and/or universities that share similar properties or relations. In this work, it is proposed a model of data mining and analysis of the obtained information in these academics databases. The analysis of the presented information in the results aims the discovery of the universities, authors and subjects most significant inside the context of the mined data. Thus a study case was realized using the CiteSeerX database as the start point for creating a generic model in order to be applied in any academic database. In the study case an extensive data mining was performed in the CiteSeerX database, as well as the migration and treatment of the original data obtained for the generic model proposed in this work. With the model data filled the proposed algorithms and the code instructions were applied for the generation of the results which are subdivided in three different categories: clusters, rankings and relationship communities. From the results, the work is validated by showing the current trends in the collaboration between authors and educational institutes, using the CiteSeerX dataset. By mining the available information, several communities and clusters are revealed using the proposed techniques. Sistemas distribuídos Mineração de dados (Computação) Bases de dados Aprendizagem de máquina Algoritmos de computador
190	Uma metodologia para previsão da severidade da inadimplência de consumidores residenciais de energia elétrica Caixeta, Daniel Araujo January 2010 (has links) Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2010. / Made available in DSpace on 2012-10-25T07:13:41Z (GMT). No. of bitstreams: 0 / Dissertação não autorizada para a publicação no Repositório Institucional pelo autor / A inadimplência residencial tem sido motivo de preocupação por parte das distribuidoras de energia elétrica. A quantia financeira advinda do consumo faturado e não pago tem gerado grandes prejuízos para a saúde financeira destas empresas. O insucesso das soluções convencionais aliado às incertezas inerentes ao comportamento dos clientes residenciais tem dificultado a prevenção e combate ao problema. Um dos fatores importantes para uma melhor compreensão das particularidades determinantes para o agravamento do problema diz respeito à repetitividade de atrasos no pagamento da fatura, caracterizando assim a severidade da inadimplência. Neste trabalho apresenta-se uma metodologia para previsão da severidade da inadimplência de consumidores residenciais de energia elétrica baseada na Descoberta de Conhecimento em Bancos de Dados - KDD. Por meio de uma série de procedimentos relacionados às etapas de Pré-processamento, Mineração de Dados e Pós-processamento, são obtidos conjuntos de regras de associação combinando variáveis técnicas, socioeconômicas e culturais dos consumidores inadimplentes. A partir desse conhecimento, o trabalho apresenta um modelo preditivo, baseado em heurística, para estimar a quantidade de meses em que determinado consumidor não irá efetuar o pagamento em dia de sua conta de energia. Para a validação da metodologia proposta a base de dados original foi particionada em dois conjuntos: o primeiro, reservado para a construção e aprimoramento do modelo de conhecimento, e o segundo, dedicado a testes do modelo e avaliação de seu desempenho e acurácia. Os resultados desta pesquisa podem contribuir para o planejamento mais efetivo de ações contra o agravamento do problema pelas empresas distribuidoras de energia elétrica e visando a diminuição dos prejuízos financeiros provocados pela inadimplência residencial. Engenharia eletrica Energia eletrica - Consumo Consumidores Inadimplencia (Finanças) Previsao Mineração de dados (Computação)

Search results