Global ETD Search

31	Aplicação de minerador de dados na obtenção de relações entre padrões de encadeamento de viagens codificados e características sócio-econômicas / Applicability of a data miner for obtaining relationships bteween trip-chaining patterns and urban trip-makers socioeconomic characteristics Ichikawa, Sandra Matiko 29 November 2002 (has links) O principal objetivo deste trabalho é analisar a aplicabilidade de um minerador de dados para obter relações entre padrões de viagens encadeadas e características sócio-econômicas de viajantes urbanos. Para representar as viagens encadeadas, as viagens correspondentes a cada indivíduo do banco de dados foram codificadas em termos de seqüência de letras que indicam uma ordem cronológica em que atividades são desenvolvidas. O minerador de dados utilizado neste trabalho é árvore de decisão e classificação, uma ferramenta de análise disponível no software S-Plus. A análise foi baseada na pesquisa origem-destino realizada pelo Metrô-SP na região metropolitana de São Paulo, por meio de entrevistas domiciliares, em 1987. Um dos importantes resultados é que indivíduos que têm atributos sócio-econômicos e de viagens similares não se comportam de maneira similar; pelo contrário, eles fazem diferentes padrões de viagens encadeadas, as quais podem ser descritas em termos de probabilidade ou freqüência associada a cada padrão. Portanto, o minerador de dados deve possuir a habilidade para representar essa distribuição. A consistência do resultado foi analisada comparando-os com alguns resultados encontrados na literatura referente a análise de viagem baseada em atividades. A principal conclusão é que árvore de decisão e classificação aplicada a dados individuais, contendo encadeamento de viagem codificado e atributos socioeconômicos e de viagem, permite extrair conhecimento e informações ocultas que ajudam a compreender o comportamento de viagem de viajantes urbanos. / The main aim of this work is to analyze the applicability of a data miner for obtaining relationships between trip-chaining patterns and urban trip-makers socioeconomic characteristics. In order to represent the trip-chains, trips corresponding to each individual in the data set were coded in terms of letters indicating a chronological order in which activities are performed. Data miner applied in this work is decision and classification tree, an analysis tool available in S-Plus software package. The analysis was based on the origin-destination home-interview survey carried out by Metrô-SP in São Paulo metropolitan area. One of the important findings is that individuals having similar socieconomic and trip attributes do not behave in a similar way; on the contrary, they make different trip-chaining patterns, which may be described in term of probability or frequency associated to each pattern. Therefore, the data miner should have ability to represent that distribution. The consistency of results was analyzed by comparing them with some results found in literature related to activity-based travel analysis. The main conclusion is that decision and classification tree applied to individual data, containing coded trip-chaining and socioeconomic and trip attributes, allows extracting hidden knowledge and information that help to understand the travel behaviour of urban trip-makers. Activity based theory Análise de demanda Árvores de decisão Codificação dos padrões de viagens Decision trees Demand analysis Encadeamento de viagem Teoria de atividades Travel pattern coding Trip chaining
32	Aplicação de mineração de dados na identificação de áreas cultivadas com cana-de-açúcar em imagens de sensoriamento remoto no Estado de São Paulo / Application of data mining for identifying sugar cane crop plantations in remote sensing images of the state of São Paulo Nonato, Robson Tavares 07 July 2010 (has links) Orientador: Stanley Robson de Medeiros Oliveira / Acompanhado de 1 DVD / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola / Made available in DSpace on 2018-08-16T20:09:48Z (GMT). No. of bitstreams: 1 Nonato_RobsonTavares_M.pdf: 2571579 bytes, checksum: 95440ba27ff9c0fe2dfa47f9b7f3d9e5 (MD5) Previous issue date: 2010 / Resumo: O surgimento e a evolução das geotecnologias, que podem ser entendidas como tecnologias originadas de estudos e pesquisas na área de sensoriamento remoto, mais especificamente da utilização de sensores situados na órbita do planeta Terra, têm permitido o desenvolvimento de metodologias inovadoras para o mapeamento da cobertura do solo e o monitoramento agrícola. O emprego dessas novas tecnologias tem permitido, também, uma melhoria das metodologias utilizadas na estimativa da produtividade agrícola e na previsão de safras. Mesmo assim, no Brasil, muitas das metodologias empregadas no mapeamento agrícola ainda utilizam as imagens de satélite como material auxiliar, principalmente, em levantamentos amostrais. Isto se deve, em parte, aos avanços necessários no processo de extração de informações das imagens. Dentre estes avanços, deve-se destacar a necessidade de melhoria dos métodos utilizados para identificação e classificação digital de regiões contendo a cultura agrícola de interesse dentro da imagem. Amplamente utilizadas na resolução de problemas de classificação automatizada de dados, nas mais diversas áreas do conhecimento, as técnicas de mineração de dados se apresentam como uma alternativa promissora na resolução de problemas de identificação e classificação de regiões cultivadas com cana-de-açúcar. Dentro desse contexto, o objetivo desse trabalho foi avaliar as técnicas de mineração de dados voltadas para classificação de dados, dentre elas os métodos de seleção de atributos e a técnica de árvore de decisão binária na identificação de áreas cultivadas com cana-de-açúcar, no estado de São Paulo, em imagens com correção atmosférica do sensor TM a bordo do satélite Landsat 5. Também foi investigado o resultado da inserção de atributos de textura e de índices de vegetação com o objetivo de melhorar os resultados da identificação e classificação de áreas cultivadas com cana-de-açúcar. Neste trabalho foram abordados três cenários contendo áreas cultivadas com canade- açúcar. No primeiro cenário, a técnica de árvore de decisão foi avaliada na classificação de pixels puros de regiões cultivadas com cana-de-açúcar em meio a alvos diversos, como áreas urbanas, solo exposto, corpos compostos por água e outros tipos de vegetação. No segundo cenário, a ênfase foi a classificação de pixels puros de regiões cultivadas com cana-de-açúcar em diferentes fases fenológicas. No último cenário, a técnica de classificação foi avaliada na distinção de pixels puros de regiões cultivadas com cana-de-açúcar, em diferentes fases fenológicas, e em meio a outros tipos de cobertura do solo como áreas urbanas, solo exposto, corpos compostos por água e outros tipos de vegetação, como pastos e florestas. Nos três cenários abordados, os modelos de árvores de decisão binária, induzidos pelo algoritmo J48, produziram taxas de acerto superiores a 90%. A introdução de atributos de textura trouxe ganhos expressivos nos três cenários e contribuiu para melhorar a distinção de áreas cultivadas com cana-de-açúcar em meio a tipos diversos de cobertura do solo, como solo exposto, área urbana e corpos d'água. Os resultados de todos os cenários estudados reforçam o potencial forte das árvores de decisão no processo de classificação e identificação de áreas cultivadas com canade- açúcar, em diferentes cidades produtoras no estado de São Paulo. Também, deve-se destacar, que as técnicas de mineração de dados destinadas à seleção de subconjuntos de atributos relevantes para a classificação trouxeram redução significativa dos conjuntos de dados e permitiram a identificação de modelos melhores de classificação / Abstract: The appearance and evolution of geotechnologies, notably those originated from research results in the area of remote sensing, allowed for the development of innovative methodologies for the land cover mapping and agricultural monitoring. The use of such technologies also allowed for a significant improvement in the methods used for agricultural productivity and crop forecasting. However, in Brazil, most of the methodologies applied to agricultural mapping are still using remote sensing images as an auxiliary tool, especially in connection with sample surveys designed to solve agricultural problems. This fact may be explained, in part, by the advances in the information extraction process of remote sensing images. Among such advances, it could be highlighted the need for improvement in methods used for identification and digital classification of regions containing agricultural crops inside the remote sensing images. Frequently used to solve data classification problems at the most different knowledge areas, the data mining techniques arise as alternative way to solve problems related to classification of pixels related to sugar cane tilled areas. So this work aimed evaluate the data mining techniques driven for data classification like decision tree learning methods and feature selection methods for the identification and classification of tilled regions with sugar cane inside TM Landsat 5 images. In this work three scenarios having tilled areas with sugar cane inside were evaluated. In the first scenario, decision tree learning technique was evaluated in the classification process of pixels having only sugar cane tilled areas among several others soil coverage like water, rivers, lakes, forest and others kind of vegetations. The second scenario was compound by pure pixels having only sugar cane in three different age phases. In the last scenario, the decision three learning technique was evaluated in the distinction of pure pixels having sugar cane in three different age phases among different kinds of soil coverage like urban areas, water, rivers, lakes, forests and vegetation. In all of the three scenarios, the binary decision three learning techniques, inducted by J48 algorithm, produced accuracy rates up to 90%. The insertion of the texture attributes produced relevant gains in two of three scenarios and also has demonstrated to bring contribution to improvement of the classification process of tilled sugar cane among different kinds of soil coverage. The observed results in all studied scenarios confirm the relevance of the decision three learning technique in the classification and identification process of regions tilled with sugar cane in different producer cities from the state of São Paulo. Also, should be highlighted that data mining techniques driven to feature selection have bring significant reduction of the databases and allowed the identification of better classification models / Mestrado / Planejamento e Desenvolvimento Rural Sustentável / Mestre em Engenharia Agrícola Mineração de dados (Computação) Árvores de decisão Análise de imagem Cana-de-açúcar - Colheita Atributos Data mining (Computer) Cecision trees Image analysis Cane sugar - Harvest Attributes
33	Mineração de dados climaticos para previsão local de geada e deficiencia hidrica / Data mining climatic for frost and deficit hidric forescast Bucene, Luciana Corpas, 1974- 12 August 2018 (has links) Orientadores: Luiz Henrique Antunes Rodrigues, Eduardo Delgado Assad / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agricola / Made available in DSpace on 2018-08-12T21:35:45Z (GMT). No. of bitstreams: 1 Bucene_LucianaCorpas_D.pdf: 2595416 bytes, checksum: 86c930f5cf0a3ca7ba03de8acb811ea8 (MD5) Previous issue date: 2008 / Resumo: As perdas que ocorrem na agricultura são grandes, devido, principalmente, à ocorrência de sinistros climáticos que ocorrem nas plantações. Muitas vezes, os impactos social e econômico causados pelos danos são significativos, uma vez que envolvem fatores como a produção e o preço de alimentos. Como exemplos, têm-se a produção de café e a de cana-de-açúcar no Estado de São Paulo, que sofrem alternâncias motivadas por eventos climáticos adversos e, em especial, as geadas e as secas, que reduzem drasticamente as produções. Neste sentido, este estudo propõe identificar relações entre parâmetros climáticos, como temperatura máxima, temperatura mínima, precipitação, entre outros atributos, visando descobrir eventuais novos conhecimentos, a partir do comportamento conhecido dos atributos climáticos já ocorridos no passado, com o propósito de desenvolver a previsão local de geada e a previsão de deficiência hídrica. Para isso, foram aplicadas técnicas de descoberta de conhecimento em grandes bancos de dados climáticos. Utilizaram-se as ferramentas WEKA e o DISCOVER, que foram consideradas satisfatórias, uma vez que os objetivos propostos foram atingidos. As bases de dados disponíveis atenderam a necessidade para a realização do projeto, apresentando um volume de dados e atributos suficientes para que pudesse gerar resultados para a previsão local de geada e de deficiência hídrica. Referente aos resultados, com até 1 dia de antecedência à geada, o modelo gerado foi considerado confiável. A partir de 2 dias de antecedência à geada, os resultados encontrados apresentam uma diminuição no grau de acerto quanto mais distante estiver de acontecer o evento geada. Para o caso deficiência hídrica, os resultados encontrados foram diferenciados conforme a classe. Para a classe não, com 1dia até 15 dias de antecedência ao evento, o grau de acerto foi alto e aceitável. A classe forte, em seguida à classe não, é a que apresenta melhores resultados de acerto, decaindo para as outras classes. Até 3 dias de antecedência ao evento deficiência hídrica e, dependendo do mês, o grau de acerto é aceitável. De 4 dias em diante, os resultados mostram que o modelo gerado não é aceitável / Abstract: The losses that occur in agriculture are high, mainly due to the occurrence of crop damages due to climatic events. Many times, the social and economic impacts caused by the damages are significant, since they involve factors such as the production and the price of foods. For example, coffee and sugarcane production in São Paulo State suffer alternations motivated by adverse climatic events and, in special, frost and drought, that greatly reduce the production. The purpose of this study is to identify relationships between climatic parameters, such as maximum temperature, minimum temperature, precipitation, etc., in order to discover eventual new knowledge, from known behavior of the climatic attributes already occurred in the past, with the objective of developing local frost and deficit water forecast models. To achieve this, data mining techniques were applied to climatic data bases. WEKA and the DISCOVER tools had been used and considered satisfactory, since they reached the objectives. The available databases were suitable for the accomplishment of the project, presenting enough volume of data and attributes so that it could generate results for the frost and water deficit forecast. Concerning to the results, with up to 1 day of antecedence to the frost, the generated model was considered trustworthy. From 2 days of antecedence to the frost the results present a reduction in the accuracy. For water deficit, results were differentiated, depending on the class. For the not class, from 1 to 15 days of antecedence to the event, the accuracy was high and acceptable. The strong class, following the not class, is the one that presents better results, falling down for the other classes. Up to 3 days of antecedence to the event water deficit and, depending on the month, the accuracy is acceptable. For 4 days or more in advance, the results showed that the generated model is not acceptable / Doutorado / Doutor em Engenharia Agrícola Agricultura - Fatores climaticos Agricultura - Previsão Meteorologia agricola Inteligência artificial Aprendizado de máquina Árvores de decisão Artificial intelligence Intelligence sytems Decision tree Climatic alert
34	Um modelo para recomendação de cursos de especialização baseado no perfil profissional do candidato Souza, Antonio Eduardo Rodrigues de 27 August 2013 (has links) Made available in DSpace on 2016-03-15T19:37:46Z (GMT). No. of bitstreams: 1 Antonio Eduardo Rodrigues de Souza.pdf: 1430416 bytes, checksum: 7625e34085fd9ad09014886b876642c3 (MD5) Previous issue date: 2013-08-27 / Economic globalization has made products and services markets more competitive, demanding a better qualification of manpower. Consequently, companies are in need of best qualified professionals to meet specific demands. In this context, specialization courses options have been sought by professionals to acquire and update knowledge. However, diversification of courses offered by various institutions in various areas, targeted to specific audiences or general, or the lack of objective information, hinder the understanding of the important factors in the decision to be taken by a candidate. A poorly chosen option may incur factors that can trigger the change or even dropping out of the course. The topic is current and relevant to Higher Education Institutions (HEIs), showing the importance of offering specialized courses that are aligned to the skills of educational institutions and the interests of the professional training and retraining. Therefore, this paper proposes to study professional factors that influence candidates in choosing a course, and develop a recommendation model, using artificial intelligence techniques to practical use in HEIs, which assists applicants in the choice of courses, as well as serve as support and guidance to staff in the selection of candidates. It was applied a methodology based on processes Knowledge Discovery in Databases (KDD) and Cross-Industry Standard Process for Data Mining (CRISP-DM) in the evaluation of the historical data of candidates freshmen at a private university in the city of São Paulo, and proposed a recommendation model, which will identify the most suitable course of a candidate's profile, using a technique of data mining based on decision trees for the discovery of relevant knowledge from database. The completion of this project has allowed to propose courses that would be more suitable to professional profiles of the candidates, based on the professional and educational historical information which were considered more important for the candidate selection. It is expected, therefore, that the counseling service will become more accurate and more responsive to the selection of candidates, assisting to reduce the number of abandonments, dropouts or changes in specialization courses offered by the studied university. / A globalização da economia tornou os mercados de produtos e serviços mais competitivos, demandando uma melhor qualificação da mão-de-obra. Consequentemente, as empresas têm necessitado de profissionais mais bem qualificados para atender a demandas específicas. Neste contexto, os cursos de especialização têm sido opções procuradas por profissionais para adquirir e atualizar o conhecimento. Contudo, a diversificação de cursos, oferecidos por diversas instituições de ensino, nas mais variadas áreas, direcionados a públicos específicos ou gerais, ou a falta de informações objetivas, dificultam a compreensão de fatores importantes na decisão a ser tomada por um candidato. Uma opção mal escolhida pode incorrer em fatores que podem desencadear a mudança ou até mesmo a desistência do curso. O tema é atual e relevante para as Instituições de Ensino Superior (IES), mostrando a importância de se ofertar cursos de especialização que estejam alinhados às competências das instituições de ensino e aos interesses de capacitação e requalificação do profissional. Portanto, o presente trabalho propõe estudar as características profissionais que influenciam os candidatos na escolha de um curso, e desenvolver um modelo de recomendação, utilizando-se técnicas de inteligência artificial, para uso prático nas IES, que auxilie os candidatos na escolha dos cursos, assim como sirva de apoio aos coordenadores na orientação e seleção dos candidatos. Será aplicada uma metodologia baseada nos processos Knowledge Discovery in Databases (KDD) e CRoss-Industry Standard Process for Data Mining (CRISPDM) para análise e avaliação dos dados históricos de candidatos ingressantes em uma universidade particular, na cidade de São Paulo, e proposto um modelo de recomendação, que identificará o curso mais adequado ao perfil de um candidato, utilizando-se uma técnica de mineração de dados baseada em árvores de decisão para a descoberta de conhecimento relevante do banco de dados. A conclusão do projeto permitiu propor cursos que seriam mais adequados aos perfis profissionais dos candidatos, tomando-se como base as informações do histórico profissional e educacional que foram consideradas mais importantes para a seleção dos candidatos. Espera-se, com isso, tornar mais preciso o serviço de aconselhamento de cursos, e mais ágil a seleção de candidatos, contribuindo para a redução do número de abandonos, desistências ou mudanças nos cursos de especialização oferecidos pela universidade estudada. sistemas de recomendação mineração de dados aprendizagem de máquina árvores de decisão aconselhamento acadêmico recommender systems data mining learning machine decision trees academic counseling CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
35	Análise inteligente de dados em um banco de dados de procedimentos em cardiologia intervencionista / Intelligent data analysis in an interventional cardiology procedures database Cantídio de Moura Campos Neto 02 August 2016 (has links) O tema deste estudo abrange duas áreas do conhecimento: a Medicina e a Ciência da Computação. Consiste na aplicação do processo de descoberta de conhecimento em base de Dados (KDD - Knowledge Discovery in Databases), a um banco de dados real na área médica denominado Registro Desire. O Registro Desire é o registro mais longevo da cardiologia intervencionista mundial, unicêntrico e acompanha por mais de 13 anos 5.614 pacientes revascularizados unicamente pelo implante de stents farmacológicos. O objetivo é criar por meio desta técnica um modelo que seja descritivo e classifique os pacientes quanto ao risco de ocorrência de eventos cardíacos adversos maiores e indesejáveis, e avaliar objetivamente seu desempenho. Posteriormente, apresentar as regras extraídas deste modelo aos usuários para avaliar o grau de novidade e de concordância do seu conteúdo com o conhecimento dos especialistas. Foram criados modelos simbólicos de classificação pelas técnicas da árvore de decisão e regras de classificação utilizando para a etapa de mineração de dados os algoritmos C4.5, Ripper e CN2, em que o atributo-classe foi a ocorrência ou não do evento cardíaco adverso. Por se tratar de uma classificação binária, os modelos foram avaliados objetivamente pelas métricas associadas à matriz de confusão como acurácia, sensibilidade, área sob a curva ROC e outras. O algoritmo de mineração processa automaticamente todos os atributos de cada paciente exaustivamente para identificar aqueles fortemente associados com o atributo-classe (evento cardíaco) e que irão compor as regras. Foram extraídas as principais regras destes modelos de modo indireto, por meio da árvore de decisão ou diretamente pela regra de classificação, que apresentaram as variáveis mais influentes e preditoras segundo o algoritmo de mineração. Os modelos permitiram entender melhor o domínio de aplicação, relacionando a influência de detalhes da rotina e as situações associadas ao procedimento médico. Pelo modelo, foi possível analisar as probabilidades da ocorrência e da não ocorrência de eventos em diversas situações. Os modelos induzidos seguiram uma lógica de interpretação dos dados e dos fatos com a participação do especialista do domínio. Foram geradas 32 regras das quais três foram rejeitadas, 20 foram regras esperadas e sem novidade, e 9 foram consideradas regras não tão esperadas, mas que tiveram grau de concordância maior ou igual a 50%, o que as tornam candidatas à investigação para avaliar sua eventual importância. Tais modelos podem ser atualizados ao aplicar novamente o algoritmo de mineração ao banco com os dados mais recentes. O potencial dos modelos simbólicos e interpretáveis é grande na Medicina quando aliado à experiência do profissional, contribuindo para a Medicina baseada em evidência. / The main subject of this study comprehends two areas of knowledge, the Medical and Computer Science areas. Its purpose is to apply the Knowledge Discovery Database-KDD to the DESIRE Registry, an actual Database in Medical area. The DESIRE Registry is the oldest world\'s registry in interventional cardiology, is unicentric, which has been following up 5.614 resvascularized patients for more then 13 years, solely with pharmacological stent implants. The goal is to create a model using this technique that is meaningful to classify patients as the risk of major adverse cardiac events (MACE) and objectively evaluate their performance. Later present rules drawn from this model to the users to assess the degree of novelty and compliance of their content with the knowledge of experts. Symbolic classification models were created using decision tree model, and classification rules using for data mining step the C4.5 algorithms, Ripper and CN2 where the class attribute is the presence or absence of a MACE. As the classification is binary, the models where objectively evaluated by metrics associated to the Confusion Matrix, such as accuracy, sensitivity, area under the ROC curve among others. The data mining algorithm automatically processes the attributes of each patient, who are thoroughly tested in order to identify the most predictive to the class attribute (MACE), whom the rules will be based on. Indirectly, using decision tree, or directly, using the classification rules, the main rules of these models were extracted to show the more predictable and influential variables according to the mining algorithm. The models allowed better understand the application range, creating a link between the influence of the routine details and situations related to the medical procedures. The model made possible to analyse the probability of occurrence or not of events in different situations. The induction of the models followed an interpretation of the data and facts with the participation of the domain expert. Were generated 32 rules of which only three were rejected, 20 of them were expected rules and without novelty and 9 were considered rules not as expected but with a degree of agreement higher or equal 50%, which became candidates for an investigation to assess their possible importance. These models can be easily updated by reapplying the mining process to the database with the most recent data. There is a great potential of the interpretable symbolic models when they are associated with professional background, contributing to evidence-based medicine. Árvores de decisão Cardiologia Doença das Coronárias Mineração de dados Stents Artificial intelligence C4.5 Cardiology Coronary disease Data mining Database Decision tree KDD
36	Avaliação do algoritmo Gradient Boosting em aplicações de previsão de carga elétrica a curto prazo Mayrink, Victor Teixeira de Melo 31 August 2016 (has links) Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-03-07T14:25:21Z No. of bitstreams: 1 victorteixeirademelomayrink.pdf: 2587774 bytes, checksum: 1319cc37a15480796050b618b4d7e5f7 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-03-07T15:06:57Z (GMT) No. of bitstreams: 1 victorteixeirademelomayrink.pdf: 2587774 bytes, checksum: 1319cc37a15480796050b618b4d7e5f7 (MD5) / Made available in DSpace on 2017-03-07T15:06:57Z (GMT). No. of bitstreams: 1 victorteixeirademelomayrink.pdf: 2587774 bytes, checksum: 1319cc37a15480796050b618b4d7e5f7 (MD5) Previous issue date: 2016-08-31 / FAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais / O armazenamento de energia elétrica em larga escala ainda não é viável devido a restrições técnicas e econômicas. Portanto, toda energia consumida deve ser produzida instantaneamente; não é possível armazenar o excesso de produção, ou tampouco cobrir eventuais faltas de oferta com estoques de segurança, mesmo que por um curto período de tempo. Consequentemente, um dos principais desafios do planejamento energético consiste em realizar previsões acuradas para as demandas futuras. Neste trabalho, apresentamos um modelo de previsão para o consumo de energia elétrica a curto prazo. A metodologia utilizada compreende a construção de um comitê de previsão, por meio da aplicação do algoritmo Gradient Boosting em combinação com modelos de árvores de decisão e a técnica de amortecimento exponencial. Esta estratégia compreende um método de aprendizado supervisionado que ajusta o modelo de previsão com base em dados históricos do consumo de energia, das temperaturas registradas e de variáveis de calendário. Os modelos propostos foram testados em duas bases de dados distintas e demonstraram um ótimo desempenho quando comparados com resultados publicados em outros trabalhos recentes. / The storage of electrical energy is still not feasible on a large scale due to technical and economic issues. Therefore, all energy to be consumed must be produced instantly; it is not possible to store the production leftover, or either to cover any supply shortages with safety stocks, even for a short period of time. Thus, one of the main challenges of energy planning consists in computing accurate forecasts for the future demand. In this paper, we present a model for short-term load forecasting. The methodology consists in composing a prediction comitee by applying the Gradient Boosting algorithm in combination with decision tree models and the exponential smoothing technique. This strategy comprises a supervised learning method that adjusts the forecasting model based on historical energy consumption data, the recorded temperatures and calendar variables. The proposed models were tested in two di erent datasets and showed a good performance when compared with results published in recent papers. CNPQ::CIENCIAS EXATAS E DA TERRA Previsão de carga elétrica Amortecimento exponencial Árvores de decisão Gradient Boosting Short Term Load Forecasting Exponential Smoothing Decision Trees Gradient Boosting
37	Modelo para sistematização da inovação e da gerencia de projetos nos processos das instituições cientificas e tecnologicas - ICT Mattos, João Roberto Loureiro de 20 April 2005 (has links) Orientador: Elizabete Jordão / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Quimica / Made available in DSpace on 2018-08-04T05:23:42Z (GMT). No. of bitstreams: 1 Mattos_JoaoRobertoLoureirode_D.pdf: 9136301 bytes, checksum: deb65dc9955b906cab0f31f73cd5ad35 (MD5) Previous issue date: 2005 / Resumo: O objetivo do presente trabalho consiste no desenvolvimento de um modelo, dirigido para Instituições Científicas e Tecnológicas ICT, que combina a gerência de projetos com técnicas de gestão da inovação. Este estudo inclui uma avaliação de aplicabilidade do modelo proposto por meio de um estudo de caso em um projeto de gerência de rejeitos na área de Engenharia Química, especificamente, na gerência de combustíveis queimados de reatores nucleares de pesquisa. O modelo desenvolvido para gerência de projetos é baseado em práticas e ferramentas internacionalmente consagradas, adaptadas à cultura das ICT. Na abordagem proposta neste estudo, a inovação nas ICT está sendo considerada como diretamente associada à geração das alternativas de projetos, seguida da avaliação e seleção a solução preferida, se revestem de alta relevância, pois é aqui que se considera que existe o maior potencial para a sistematização da inovação nas ICT. É na geração e seleção de alternativas de projetos e tecnologias onde se define se dada solução será um produto adequado, inovador ou inservível. O modelo proposto é operacionalizado por meio de árvores de decisão que orientam o usuário na escolha de procedimentos e documentos padronizados, adaptados aos perfis de projetos usualmente desenvolvidos nas ICT... Observação: O resumo, na íntegra, poderá ser visualizado no texto completo da tese digital / Abstract: The objective of the preset work consists in the development of a model that combines project management with innovation management techniques for Scientific and Technological Institutions ¿ ICT. A case study was performed in order to evaluate the applicability of this model in a project of waste management in the Chemical Engineering area, specifically on management of spent fuel from nuclear research reactors. The project management model developed in this study is based on practices and tools internationally recognized, tailored for the ICT culture. In the scope of this study, the innovation in the ICT is being considered as directly associated to the generation of project alternatives and their correspondent technologies. The stages of alternatives generation followed by the evaluation and selection of the preferred solution has high relevance, because it is here that it is considered that exists the greater potential for the systematization of the innovation in the ICT. Is in the generation and selection of project alternatives and their correspondent techonologies where is defined if a given solution will be a standard, innovative or useless product. Decision trees support the execution of the proposed model and provide guidance to the user in the choice of procedures and templates, which are specially adapted to the profiles of the work of the users by means of a standard and repeatable procedures, with potential to lead to a better efficiency... Note: The complete abstract is available with the full electronic digital thesis or dissertations / Doutorado / Sistemas de Processos Quimicos e Informatica / Doutor em Engenharia Química Desenvolvimento organizacional Gerência Instituições e sociedades cientificas Administração de projetos Árvores de decisão Modelos Organizational development Decision trees Models
38	A localização de faltas em um sistema de distribuição radial baseada na aplicação de árvores de decisão e redes neurais artificiais / Fault location in a radial distribution system based on the application of decision trees and artificial neural networks Pessoa, André Luís da Silva 02 August 2017 (has links) Os Sistemas de Distribuição (SDs), devido as suas topologias e configurações, dentre outros fatores, apresentam um desafio para a localização física das situações de faltas passíveis de ocorrência. Como fato, tem-se que uma localização de faltas, rápida e precisa, possibilita atenuar os transtornos que os usuários finais dos SDs viriam a ter em relação à qualidade do serviço prestado pelas distribuidoras. No contexto das redes elétricas inteligentes, e considerando medidores de qualidade da energia elétrica previamente alocados de forma otimizada, esta pesquisa propõe uma metodologia baseada em árvores de decisão e redes neurais artificiais para a localização de faltas em SDs radiais e aéreos. Foram realizados testes da metodologia proposta considerando variações no tipo, na impedância e no ângulo de incidência da falta aplicadas sobre o SD de 34 barras do IEEE (Institute of Electrical and Electronics Engineers). Para os testes de sensibilidade da metodologia desenvolvida, foram consideradas variações no carregamento do sistema, os erros inerentes ao sistema de medição, a variação no número de medidores disponível, o impacto de uma alocação não otimizada dos medidores e uma redução na taxa amostral. Os resultados encontrados foram promissores e indicam que a metodologia como desenvolvida poderá ser aplicada para SDs diferentes do caso teste utilizado. / Due to the distribution systems (DS) topologies, configurations and among other factors, it is a challenge to physically locate situations of faults. As a matter of fact, a fast and accurate fault location will make it possible to mitigate the inconvenience that the end users of DS would have due to the quality of the service provided by the distributors. In the context of intelligent electric grids, and considering the electric power quality meters optimally alocated, this research proposes a methodology based in decision trees and artificial neural networks for a fault location in radial and aerial DS. The proposed methodology was tested considering variations on the type, impedance and angle of incidence of the fault applied on the DS of 34 bars of the IEEE (Institute of Electrical and Electronic Engineers). For a sensitivity test of the developed methodology, it were considered the variations in system loading, the errors inherent to the measurement system, a variation in number of meters available, the impact of the non-optimized allocation of the meters and a redution on the sampling rate. The results were promising and indicated that the methodology developed can be applied to different DS from the test case used. Aerial distribution system Árvores de decisão Decision trees Monitoramento e localização de faltas Monitoring and fault location Neural networks Redes elétricas inteligentes Redes neurais artificiais Sistema de distribuição aéreo Smart grids
39	Uso de redes neurais artificiais para descoberta de conhecimento sobre a escolha do modo de viagem / Using artificial neural network for the discovery of mode travel choice knowledge Wermersch, Fábio Glauco 09 May 2002 (has links) Esta pesquisa objetivou uma melhor compreensão do processo de escolha do modo de viagem. Empregou-se a abordagem indutiva dirigida a dados livre de suposições a priori da mineração em banco de dados (Data Mining), utilizando redes neurais artificiais (RNA) como ferramenta mineradora, à procura de conhecimento, ou informação útil, a respeito de escolha e capaz de indicar qual das estruturas de decisão subjacentes aos modelos de escolha modal considerados mais se aproximaria ao do observado. Partindo-se da ideia de que nesse processo exista um padrão o qual pode ser captado por uma RNA, ajustou-se um modelo de RNA aos dados e extraiu-se então o conhecimento contido no modelo de RNA ajustado através de um algoritmo de extração de árvore de decisão de RNA chamado Trepan (Trees parroting network), que foi analisado e interpretado à luz dos objetivos desta pesquisa. Os dados que foram utilizados nesse processo de descoberta de conhecimento são provenientes de uma pesquisa de entrevista domiciliar realizada na cidade de Bauru - SP, para fins de estimativa da matriz de deslocamentos origem-destino dessa cidade. Obteve-se quatro árvores de decisão com estruturas simples e com a araucária preditiva de 75% aproximadamente para os três modos de viagem estudados. Embora o conhecimento extraído dos modelos neurais ajustados não tenham proporcionado a indicação de qual das estruturas de decisão subjacentes aos modelos de escolha modal mais se aproxima da obtida com o modelo neural, foi constatada nas árvores resultantes do processo de descoberta do conhecimento uma relação de compensação entre o atributo sexo e os atributos relacionados à capacidade econômica do domicílio na decisão de escolha do modo carro para a realização de uma viagem. Os resultados também sugerem a não necessidade de mais um atributo de entrada referente ao deslocamento realizado em uma viagem para modelagem por RNA do processo de escolha do modo de viagem no contexto estudado. / This research aimed at a better understanding of the mode travel choice process. The inductive data driven free from a priori assumptions of the data mining approach was employed, using artificial neural networks (ANN) as a mining tool, looking for knowledge or useful information, concerning the choice process and capable of indicating which of the underlying decision structures to the considered modal choice models would come closer to the observed one. Taking into consideration that there is a pattern in this process that can be captured by ANN, an ANN model was fitted (trained) to the data, and the knowledge contained in the trained ANN model was extracted by employing an ANN decision tree extraction algorithm called Trepan (Trees parroting network), which was analysed and interpreted in the light of the object of this research. The data which was employed in this knowledge discovery process come from a household survey carried out in Bauru - SP in order to estimate the O-D matrix in this city. Four decision trees with simple structures and predicting accuracy of approximately 75% for the three travel modes studied were obtained. Even though the knowledge extracted from the trained ANN model has not yielded the indication of which of the underlying decision structures to the modal choice models was closer to the neural model, a compensating relation between the sex attribute and the household economic-related attribute in the decision of choosing the car mode in order to travel was evidenced in the trees resulting from the process of knowledge discovery. The results also suggest the lack of necessity of more than one input travel attribute concerning the displacement performed in a trip for the ANN modelling of the mode travel choice process in the studied context. Análise de demanda por transporte Artificial intelligence Artificial neural network Árvores de decisão Choice models Data mining Decision trees Inteligência artificial Knowledge discovery in database Mineração de dados Modelos de escolha Redes neurais artificiais Transport demand analysis
40	Avaliação da distorção harmônica total de tensão no ponto de acoplamento comum industrial usando o processo KDD baseado em medição / Evaluation of total voltage harmonic distortion at the industrial joint coupling point using the KDD-based measurement process OLIVEIRA, Edson Farias de 27 March 2018 (has links) Submitted by Kelren Mota (kelrenlima@ufpa.br) on 2018-06-13T17:38:37Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese_AvaliacaoDistorcaoHarmonica.pdf: 4309009 bytes, checksum: 017d26b4d8e0ce6653f66d67f13f4cb6 (MD5) / Approved for entry into archive by Kelren Mota (kelrenlima@ufpa.br) on 2018-06-13T17:39:00Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese_AvaliacaoDistorcaoHarmonica.pdf: 4309009 bytes, checksum: 017d26b4d8e0ce6653f66d67f13f4cb6 (MD5) / Made available in DSpace on 2018-06-13T17:39:00Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese_AvaliacaoDistorcaoHarmonica.pdf: 4309009 bytes, checksum: 017d26b4d8e0ce6653f66d67f13f4cb6 (MD5) Previous issue date: 2018-03-27 / In the last decades, the transformation industry has provided the introduction of increasingly faster and more energy efficient products for residential, commercial and industrial use, however these loads due to their non-linearity have contributed significantly to the increase of distortion levels harmonic of voltage as a result of the current according to the Power Quality indicators of the Brazilian electricity distribution system. The constant increase in the levels of distortions, especially at the point of common coupling, has generated in the current day a lot of concern in the concessionaires and in the consumers of electric power, due to the problems that cause like losses of the quality of electric power in the supply and in the installations of the consumers and this has provided several studies on the subject. In order to contribute to the subject, this thesis proposes a procedure based on the Knowledge Discovery in Database - KDD process to identify the impact loads of harmonic distortions of voltage at the common coupling point. The proposed methodology uses computational intelligence and data mining techniques to analyze the data collected by energy quality meters installed in the main loads and the common coupling point of the consumer and consequently establish the correlation between the harmonic currents of the nonlinear loads with the harmonic distortion at the common coupling point. The proposed process consists in analyzing the loads and the layout of the location where the methodology will be applied, in the choice and installation of the QEE meters and in the application of the complete KDD process, including the procedures for collection, selection, cleaning, integration, transformation and reduction, mining, interpretation, and evaluation of data. In order to contribute, the data mining techniques of Decision Tree and Naïve Bayes were applied and several algorithms were tested for the algorithm with the most significant results for this type of analysis as presented in the results. The results obtained evidenced that the KDD process has applicability in the analysis of the Voltage Total Harmonic Distortion at the Point of Common Coupling and leaves as contribution the complete description of each step of this process, and for this it was compared with different indices of data balancing, training and test and different scenarios in different shifts of analysis and presented good performance allowing their application in other types of consumers and energy distribution companies. It also shows, in the chosen application and using different scenarios, that the most impacting load was the seventh current harmonic of the air conditioning units for the collected data set. / Nas últimas décadas, a indústria de transformação, tem proporcionado a introdução de produtos cada vez mais rápidos e energeticamente mais eficientes para utilização residencial, comercial e industrial, no entanto essas cargas devido à sua não linearidade têm contribuído significativamente para o aumento dos níveis de distorção harmônica de tensão em decorrência da corrente conforme indicadores de Qualidade de Energia Elétrica do sistema brasileiro de distribuição de energia elétrico. O constante aumento dos níveis das distorções, principalmente no ponto de acoplamento comum, tem gerado nos dias atuais muita preocupação nas concessionárias e nos consumidores de energia elétrica, devido aos problemas que causam como perdas da qualidade de energia elétrica no fornecimento e nas instalações dos consumidores e isso têm proporcionado diversos estudos sobre o assunto. Com o intuito de contribuir com o assunto, a presente tese propõe um procedimento com base no processo Knowledge Discovery in Database - KDD para identificação das cargas impactantes das distorções harmônicas de tensão no ponto de acoplamento comum. A metodologia proposta utiliza técnicas de Inteligência computacional e mineração de dados para análise dos dados coletados por medidores de qualidade de energia instalados nas cargas principais e no ponto de acoplamento comum do consumidor e consequentemente estabelecer a correlação entre as correntes harmônicas das cargas não lineares com a distorção harmônica no ponto de acoplamento comum. O processo proposto consiste na análise das cargas e do layout do local onde a metodologia será aplicada, na escolha e na instalação dos medidores de QEE e na aplicação do processo KDD completo, incluindo os procedimentos de coleta, seleção, limpeza, integração, transformação e redução, mineração, interpretação, e avaliação dos dados. Com o propósito de contribuição foram aplicadas as técnicas de mineração de dados Árvore de Decisão e Naïve Bayes e foram testados diversos algoritmos em busca do algoritmo com resultados mais significativos para esse tipo de análise conforme apresentado nos resultados. Os resultados obtidos evidenciaram que o processo KDD possui aplicabilidade na análise da Distorção Harmônica Total de Tensão no Ponto de Acoplamento Comum e deixa como contribuição a descrição completa de cada etapa desse processo, e para isso foram comparados com diferentes índices de balanceamento de dados, treinamento e teste e diferentes cenários em diferentes turnos de análise e apresentaram bom desempenho possibilitando sua aplicação em outros tipos de consumidores e empresas de distribuição de energia. Evidencia também, na aplicação escolhida e utilizando diferentes cenários, que a carga mais impactante foi a sétima harmônica de corrente das centrais de ar condicionado para o conjunto de dados coletados. Distorção harmônica total Mineração de dados KDD Inteligência computacional Árvores de decisão Naïve Bayes Rede neural Qualidade de energia elétrica SISTEMAS DE POTÊNCIA SISTEMAS DE ENERGIA ELÉTRICA

Search results