Global ETD Search

141	Aplicação da lógica nebulosa em um classificador para identificação de perfis por aspectos cognitivos / Oliveira, Alciano Gustavo Genovez. January 2016 (has links) Orientador: Norian Marranghello / Banca: Rodrigo Capobianco Guido / Banca: Henrique Dezani / Resumo: Atualmente, as instituições de ensino, em sua grande maioria, estão disponibilizando cursos na modalidade de ensino a distância com o intuito de possibilitar aos indivíduos que não podem frequentar as aulas regularmente a realização de estudos a distância. Em muitos casos, os indivíduos desistem dessa modalidade de ensino sem concluir os estudos, isso se deve a vários fatores, sendo um deles, a dificuldade no entendimento do conteúdo disponibilizado durante as aulas devido a forma com que o mesmo é apresentado. Esta dissertação apresenta a utilização da lógica nebulosa em um classificador computacional, que tem por objetivo classificar indivíduos por aspectos cognitivos que estão relacionados com a Teoria das Inteligências Múltiplas propostas, originalmente, por Howard Gardner. O resultado dessa classificação possibilita direcionar os indivíduos para ambientes de ensino em que o conteúdo esteja adequado ao seu perfil cognitivo. Os testes foram realizados utilizando uma ferramenta acadêmica de mineração de dados que possibilitou determinar padrões cognitivos em cada indivíduo pela inserção de dados de entrada obtidos por meio da aplicação de um questionário e retornando os aspectos cognitivos mais aflorados de cada indivíduo. Após validados, os resultados mostraram aproximadamente 67% das classificações condizentes com os aspectos cognitivos identificados em aula / Abstract: Most educational institutions are offering distance-learning courses, in order to enable individuals who cannot attend classes regularly, to conduct their studies. In many cases, individuals drop out of this mode of teaching without completing their studies. One of the factors for that being the difficulty in understanding the content due to the way content is presented. This dissertation presents the use of fuzzy logic in a computational classifier that aims to classify individuals by cognitive aspects related to Howard Gardner's Theory of Multiple Intelligences. The outcome of such a classifier makes it possible to direct individuals to learning environments in which the content is presented according to his/her main cognitive profile. The tests were performed using a data mining academic tool that allowed determining cognitive patterns for each individual by inputting data obtained from a questionnaire and returning the cognitive aspect most outlined in each individual. After validated, about 67% of the classification outcomes were considered in accordance to the cognitive aspects identified in classroom observations / Mestre Ciência da computação - Matemática. Mineração de dados (Computação) Lógica difusa. Inteligências múltiplas. Computer science
142	Aplicação de computação evolucionária na mineração de dados físico-químicos da água e do solo / Guimarães, Alaine Margarete, 1969- January 2005 (has links) Resumo: Essa tese apresenta o desenvolvimento de um sistema de mineração de dados baseado na técnica de computação evolucionária denominada Algoritmos Genéticos. O sistema resultante, de nome MinAG, realiza a tarefa de classificação de dados contínuos e destina-se a minerar dados físico-químicos do solo e da água. Os padrões de comportamento dos atributos minerados são apresentados no formato SE-ENTÃO, facilitando a compreensão da informação descoberta. Foram definidos alguns requerimentos e restrições para o uso desse sistema relacionados às características do arquivo de dados possível de ser minerado. O MinAG adota o conceito de computação em grid, o que propicia para que mais e melhores resultados sejam obtidos. Os testes realizados permitiram concluir que o sistema executou as tarefas definidas para o mesmo e gerou resultados corretos ao minerar as bases de dados a que se propôs, atingindo, portanto os objetivos dessa tese. Foram realizados dois estudos de casos. No primeiro foi utilizada uma base de dados brasileira sobre dados físico-químicos do solo obtidos por equipamentos de agricultura de precisão na região de Campos Novos Paulista - SP. No segundo estudo de caso usou-se uma base de dados de qualidade de água do estado da Flórida - EUA. Em ambos os casos o sistema foi capaz de atingir seu objetivo encontrando padrões de comportamento nos dados. Pode-se concluir que o sistema MinAG apresenta-se como uma nova maneira de analisar a correlação entre os elementos físico-químicos do solo e da água. Esse sistema não deve ser entendido como um substituto de métodos de análise tradicionais, como a estatística. Sua função é servir como uma ferramenta adicional na geração de informações para auxílio à compreensão do comportamento existente nos dados. / Abstract: This thesis presents the data mining system development based on an evolutionary computation technique named Genetic Algorithms. The MinAG system performs the continuous data classification task and mines water and soil physico-chemical datasets. The patterns discovered by mining the attributes are presented using the IF-THEN rule format. It makes it easier to understand the information discovered. Some requirements and restrictions related to the dataset features were defined in order to use the system. MinAG adopts the grid computing concept in order to produce more and better results. By the evaluation system, it was possible to conclude that it is able to perform the proposed tasks and produces correct results when mining the datasets. Therefore, the system reached the thesis goals. Two case studies were performed. In the first one, a Brazilian dataset related to soil physico-chemical properties was used. The data was obtained in Campos Novos Paulista - SP by Precision Agriculture equipment. In the second case study, a Florida - USA water quality dataset was utilized. The system discovered behavior patterns achieving the goals in both cases. The MinAG system presents a new way to analyse the correlation between the water and soil physico-chemical attributes. This system is not a substitute for traditional methods such as statistics. In fact, it is an auxiliary tool to generate information in order to help understand the behavior between data. / Orientador: Angelo Cataneo / Coorientador: Fedro S. Zazueta / Banca: Manoel Henrique Salgado / Banca: José Luis Braga / Banca: Luiz Roberto Almeida Gabriel / Banca: Marcelo Giovaneti Canteri / Doutor Agricultura de precisão. Algoritmos genéticos. Mineração de dados (Computação) Propriedades físico-quimicas. Inteligência computacional. Precision agriculture. eng Genetic algorithms. eng Computational intelligence. eng Data mining. eng Physico-chemical properties. eng
143	Estratégias evolucionárias para otimização no tratamento de dados ausentes por imputação múltipla de dados LOBATO, Fábio Manoel França 16 February 2016 (has links) Submitted by camilla martins (camillasmmartins@gmail.com) on 2017-01-03T14:53:16Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese_EstrategiasEvolucionariasOtimizacao.pdf: 5582868 bytes, checksum: 54c5dbfe417941cefd31b320a9aa99bb (MD5) / Approved for entry into archive by Edisangela Bastos (edisangela@ufpa.br) on 2017-01-10T16:57:42Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese_EstrategiasEvolucionariasOtimizacao.pdf: 5582868 bytes, checksum: 54c5dbfe417941cefd31b320a9aa99bb (MD5) / Made available in DSpace on 2017-01-10T16:57:42Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese_EstrategiasEvolucionariasOtimizacao.pdf: 5582868 bytes, checksum: 54c5dbfe417941cefd31b320a9aa99bb (MD5) Previous issue date: 2016-02-16 / CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A análise de dados envolve aquisição e organização de informação com o objetivo de se obter conhecimento a partir deles, propiciando avanços científicos nos mais variados campos, bem como provendo vantagens competitivas às corporações. Neste âmbito, um problema ubíquo na área merece destaque, os valores ausentes, pois a maior parte das técnicas de análise de dados não consegue lidar de forma satisfatória com dados incompletos, impactando negativamente o resultado final. Visando contornar os efeitos danosos desta problemática, diversos trabalhos vêm sendo desenvolvidos nas áreas de análise estatística e aprendizado de máquina, com destaque para o estudo de métodos de Imputação Múltipla de Dados (IMD), que consiste no preenchimento dos dados ausentes por valores plausíveis. Tal metodologia pode ser vista como um problema de otimização combinatória, onde buscam-se valores candidatos à imputação de forma a reduzir o viés imposto por esta problemática. Meta-heurísticas, em especial, métodos baseados em Computação Evolucionária (CE) têm sido aplicadas com sucesso em problemas de otimização combinatórios. Apesar dos recentes avanços na área, percebe-se algumas falhas na modelagem dos métodos de imputação baseados em CE existentes. Visando preencher tais lacunas encontradas na literatura, esta tese apresenta uma descrição da IMD como um problema de otimização combinatória e propõe métodos baseados em CE neste contexto. Além disso, em virtude das falhas encontradas na modelagem dos métodos recentemente propostos na literatura e da necessidade de se adotar diferentes medidas de desempenho para avaliar a eficiência dos métodos de imputação, também é proposto neste projeto de tese um algoritmo genético multiobjetivo para a imputação de dados no contexto de classificação de padrões. Este método mostra-se flexível quanto aos tipos de dados, além de evitar a análise de caso completo. Dado a flexibilidade da abordagem proposta, é possível ainda utilizá-lo em outros cenários como no aprendizado não supervisionado, classificação multirrótulo e em análise de séries temporais. / The data analysis process includes information acquisition and organization in order to obtain knowledge from them, bringing scientific advances in various fields, as well as providing competitive advantages to corporations. In this context, an ubiquitous problem in the area deserves attention, the missing data, since most of the data analysis techniques can not deal satisfactorily with this problem, which negatively impacts the final results. In order to avoid the harmful effects of missing data, several studies have been proposed in the areas of statistical analysis and machine learning, especially the study of Multiple Data Imputation, which consists in the missing data substitution by plausible values. This methodology can be seen as a combinatorial optimization problem, where the goal is to find candidate values to substitute the missing ones in order to reduce the bias imposed by this issue. Metaheuristics, in particular, methods based in evolutionary computing have been successfully applied in combinatorial optimization problems. Despite the recent advances in this area, it is perceived some shortcomings in the modeling of imputation methods based on evolutionary computing. Aiming to fill these gaps in the literature, this thesis presents a description of multiple data imputation as a combinatorial optimization problem and proposes imputation methods based on evolutionary computing. In addition, due to the limitations found in the methods presented in the recent literature, and the necessity of adoption of different evaluation measures to assess the imputation methods performance, a multi-objective genetic algorithm for data imputation in pattern classification context is also proposed. This method proves to be flexible regarding to data types and avoid the complete-case analysis. Because the flexibility of the proposed approach, it is also possible to use it in other scenarios such as the unsupervised learning, multi-label classification and time series analysis. CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Mineração de dados (Computação) Imputação de dados Algoritmos genéticos Otimização combinatória Computação evolucionária
144	Análise dos impactos harmônicos em uma indústria de manufatura de eletroeletrônicos utilizando árvores de decisão NOGUEIRA, Rildo de Mendonça 27 March 2015 (has links) Submitted by camilla martins (camillasmmartins@gmail.com) on 2017-02-01T18:34:26Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_AnaliseImpactosHarmonicos.pdf: 2483778 bytes, checksum: c5e0e109c5f916f6d322fe03bdbba91d (MD5) / Approved for entry into archive by Edisangela Bastos (edisangela@ufpa.br) on 2017-02-14T14:02:44Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_AnaliseImpactosHarmonicos.pdf: 2483778 bytes, checksum: c5e0e109c5f916f6d322fe03bdbba91d (MD5) / Made available in DSpace on 2017-02-14T14:02:44Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_AnaliseImpactosHarmonicos.pdf: 2483778 bytes, checksum: c5e0e109c5f916f6d322fe03bdbba91d (MD5) Previous issue date: 2015-03-27 / A Qualidade da Energia Elétrica (QEE) é constantemente alvo de vários estudos, principalmente os que estão relacionados com o setor de produção industrial, onde estão concentradas grandes cargas dos sistemas elétricos. Com a evolução dos processos de produção industrial e a inserção de novas tecnologias no setor industrial, foram adicionadas grandes quantidades de equipamentos eletrônicos que são fontes geradoras de perturbações nos sistemas, e que alteram a qualidade do produto “energia elétrica”. Com o intuito de minimizar os transtornos decorrentes da baixa qualidade da energia e os prejuízos causados para as concessionárias e consumidores (industriais, residenciais e comerciais), foi desenvolvido no Brasil, os procedimentos de distribuição no sistema elétrico nacional (PRODIST), criado e desenvolvido pela Agencia Nacional de Energia Elétrica (ANEEL). O PRODIST tem o objetivo de normatizar e padronizar as atividades relacionadas à distribuição de energia, incluindo os padrões de qualidade do produto. O presente trabalho foi concentrado e realizado em uma empresa do polo industrial de Manaus (PIM), que possui um sistema elétrico trifásico de baixa tensão, com objetivo de monitorar a qualidade do produto “energia elétrica” através do conteúdo harmônico gerado pela rede elétrica envolvida na manufatura. Os dados gerados foram submetidos a uma técnica de inteligência computacional (IC), com uso do processo de descoberta de extração de conhecimento em bases de dados ou KDD. O objetivo do trabalho é analisar, identificar e diagnosticar os pontos de acoplamento e processos que apresentam conteúdos harmônicos representativos para o sistema, podendo-se assim verificar o quanto cada processo analisado pode estar afetando a qualidade da energia dentro da própria indústria e no ponto de acoplamento com a concessionária, através das gerações de distorções harmônicas, evitando assim, penalizações e outras sanções regulamentadas. / The Power Quality (PQ) is constantly the subject of many studies, mainly those that are related to the industrial production sector, where are concentrated large loads of the electrical systems. With the evolution of industrial production processes and the introduction of new technologies in the industrial sector, quantities of electronic equipment bars were added that are sources of disturbances in the systems, and affecting the quality of the product "electricity". In order to minimize the inconvenience resulting from low quality of energy and damage to utilities and consumers (industrial, commercial and residential), it was developed in Brazil, distribution procedures in the national grid (PRODIST), created and developed the National Electric Energy Agency (ANEEL). The PRODIST aims to regulate and standardize activities related to energy distribution, including product quality standards. This work was concentrated and held in a company of the industrial pole of Manaus (PIM), which has a three-phase electrical system low voltage, in order to monitor the quality of the product "electricity" through the harmonic content generated by the electrical network involved in manufacturing. The data generated were subjected to computational intelligence technique (HF), using the process of knowledge extraction discovery in databases or KDD. The objective is to analyze, identify and diagnose the coupling points and processes that have representative harmonic content for the system, so being able to check how much each analyzed process may be affecting the power quality within the industry itself and the point of coupling with the concessionaire, through the generations of harmonic distortion, thus avoiding penalties and other sanctions regulated. Sistemas de energia elétrica Mineração de dados (Computação) Harmônicos (Ondas elétricas) Indústria eletrônica Qualidade de energia elétrica
145	Avaliação de características que influenciam nos votos de utilidade de opiniões sobre serviços em português / Assessement of features influencing the voting for opinions’ helpfulness about services in portuguese Martins, Augusto Cesar Souza 27 August 2015 (has links) O grande número de opiniões geradas por usuários online fez o antigo \boca a boca" migrar para o mundo virtual. Além de numerosas, muitas opiniões úteis estão misturadas com um grande número de opiniões fraudulentas, incompletas ou repetitivas. No entanto, como encontrar os fatores que influenciam no número de votos recebidos por uma opinião e encontrar opiniões consideradas úteis? A literatura na área de mineração de opiniões possui diversos estudos e técnicas que são capazes de analisar a influência de propriedades encontradas no texto das opiniões. Este trabalho apresenta a adaptação para o português de uma metodologia de avaliação de utilidade de opiniões com o objetivo de identificar quais características exercem maior influência na quantidade de votos de utilidade: básicas (ex. nota atribuída a produtos/serviços, data da publicação), textuais (ex. tamanho das palavras, parágrafos) e semântica (ex. o significado das palavras do texto). A avaliação foi realizada em uma base de dados extraída do site TripAdvisor com opiniões sobre hotéis escritas em português. Resultados mostram que os usuários dão mais atenção a opiniões recentes com notas mais altas para localização do hotel e com notas mais baixas para qualidade do sono, atendimento e limpeza. Textos com opiniões positivas, palavras curtas, poucos adjetivos e advérbios aumentam as chances de receber mais votos. / The large number of opinions generated by online users made the former “word of mouth” find its way to virtual world. In addition to be numerous, many of the useful reviews are mixed with a large number of fraudulent, incomplete or duplicate reviews. However, how to find the features that influence on the number of votes received by an opinion and find useful reviews? The literature on opinion mining has several studies and techniques that are able to analyze of properties found in the text of reviews. This paper presents the application of a methodology for evaluation of usefulness of opinions with the aim of identifying which characteristics have more influence on the amount of votes: basic utility (e.g. ratings about the product and/or service, date of publication), textual (e.g.size of words, paragraphs) and semantics (e.g., the meaning of the words of the text). The evaluation was performed in a database extracted from TripAdvisor with opinionsabout hotels written in Portuguese. Results show that users give more attention to recent opinions with higher scores for value and location of the hotel and with lowest scores for sleep quality and service and cleanliness. Texts with positive opinions, small words, few adjectives and adverbs increase the chances of receiving more votes. Mineração de dados (Computação) Opinião pública Hotéis - Avaliação Agentes de viagem - Avaliação Computação Data mining Public opinion Hotels - Rating of Travel agentes - Rating of Computer science
146	VISTREE: uma linguagem visual para análise de padrões arborescentes e para especificação de restrições em um ambiente de mineração de árvores Felício, Crícia Zilda 25 March 2008 (has links) The frequent pattern mining in data represented by more complex structures like trees and graphs are growing lately. Among the reasons for this improvement is the fact that the tree and graph patterns has more information than sequential patterns, besides there is the possibility of usage of this type of mining in several areas like XML Mining,Web Mining and Bioinformatic. A problem that occurs in mining patterns in general is the great amount of patterns generated. Being some of them not interesting for users. The decrease in the quantity of patterns generated can be done restricting the patterns types produced through the user constraint. Even incorporating constraints in the mining process, the quantity of tree pattern mined is large, what make necessary one tool for pattern analysis, possibiliting the user specify queries to extract in the mass of mined patterns that satisfy the criteria of the selection in the query. The pattern mining with constraint, aim to obtain as a result of the process of mining only the patterns with the real interest for the user. The constraint about patterns will be represented related to the structure of them. One form to represent the sequential pattern mining would be through regular expressions, for the tree pattern mining, the tree automata. The use of constraints solve the problem to generate a large amout of patterns, but the mechanism used to represent the constraint is still constituted in another problem that would be the difficult for a user do the input of constraint using this mechanism. The queries about frequent patterns are made according to the characteristics of the data. One way to extract specific patterns in data structured like trees is to store the specific patterns in a XML file and make queries using one of the query languages for XML files. Among the XML query languages, the XQuery language is very used, mainly by the fact that it s similar in semantic to SQL, the query language for databases. The frequently patterns queries could be made using this language, but, for this the user would have to know and be capable to express queries through it. In this research it will be presented the visual language VisTree that consists of visual tool to be used in a phase of preprocess for specification the user preferences that involves the format of the tree pattern that are interested to him, as in a phase of postprocess to analyze the mined patterns. The VisTree sintaxe is based on in a fragment of the Tree Pattern language[Chen et al. 2003, Che and Liu 2005], the core of XPath 1.0 [Clark and Derose 1999, Olteanu et al. 2002]. However, the semantic of VisTree differs from the semantic of these languages in the sense that VisTree queries return the sets of tree patterns. VisTree uses a XQuery language [Chamberlin 2003, Katz et al. 2003] like query process mechanism: the visual queries specified in VisTree are mapped in XQuery queries and theirs responses are adapted to fit the format returned by VisTree. VisTree works like a XQuery front-end. A complete system of mining tree pattern was developed to test and validate the use of VisTree language in specific contexts of applications. The system was made in a modular form, in a way to allow that new applications could be incorporated in a simple way. This research show the application of tree mining with constraint in the areas of XML Mining andWeb Mining through study case. In both applications, the system use the VisTree language in the preprocess modules (constraint input) and analysis of patterns (query input). / A mineração de padrões freqüentes em dados representados por estruturas mais complexas como árvores e grafos vêm crescendo muito nos últimos tempos. Entre as razões para esse crescimento está o fato do padrão arborescente ou em forma de grafo possuir mais informações do que os padrões seqüenciais, e na possibilidade de aplicação desse tipo de mineração em várias áreas como XML Mining, Web Mining e Bioinformática. Um problema que ocorre na mineração de padrões em geral é a grande quantidade de padrões gerados; sendo que muitos deles nem são do interesse do usuário. A diminuição da quantidade de padrões gerados pode ser feita restringido o tipo de padrão produzido através de especificações do usuário. Mesmo incorporando restrições no processo de mineração, a quantidade de padrões arborescentes minerados é grande, o que torna necessário uma ferramenta de análise dos padrões, possibilitando ao usuário especificar consultas para extrair da massa de padrões minerados aqueles que satisfazem os critérios de seleção da consulta. A mineração de padrões com restrição, visa obter como resultado de um processo de mineração apenas os padrões de real interesse do usuário. Uma restrição sobre padrões será representada de acordo com a estrutura dos mesmos. Para a mineração de padrões seqüencias uma forma de representá-la seria através de expressões regulares, para a mineração de padrões arborescentes, os autômatos de árvore. O uso de restrições resolve o problema da geração de uma grande quantidade de padrões, mas o mecanismo usado para representar a restrição ainda se constitui em um outro problema que seria a dificuldade de um usuário em fazer a entrada da restrição utilizando esse mecanismo. As consultas sobre padrões freqüentes são feitas de acordo com as características dos dados. Uma forma de extrair padrões específicos em dados estruturados como árvores é armazenar os padrões freqüentes em um documento XML e efetuar uma consulta usando uma das linguagens de consulta a documentos XML. Dentre as linguagens de consulta XML, a linguagem XQuery é muito utilizada, principalmente pelo fato de ser similar semanticamente a SQL (linguaguem de consulta a banco de dados). A consulta aos padrões freqüentes poderia então ser feita utilizando essa linguagem, mas para isso o usuário teria que conhecer e ser capaz de expressar sua consulta através dela. Nesse trabalho é apresentada a linguagem visual VisTree, que consiste em uma ferramenta visual a ser utilizada tanto numa fase de Pré-processamento para a especificação das preferências do usuário no que se refere ao formato dos padrões arborescentes que lhe interessa, quanto numa fase de pós-processamento para a análise dos padrões minerados. A sintaxe da VisTree se baseia na sintaxe de um fragmento simples da linguagem Tree Pattern [Miklau and Suciu 2004, Chen et al. 2003], na qual a linguagem XPath 1.0 [Clark and Derose 1999, Olteanu et al. 2002] também se baseou. Entretanto, a semântica de VisTree difere da semântica destas linguagens no sentido de que consultas de VisTree retornam conjuntos de padrões arborescentes. A VisTree utiliza a linguagem XQuery [Chamberlin 2003, Katz et al. 2003] como mecanismo de processamento de consultas: as consultas visuais especificadas em VisTree são mapeadas em consultas da XQuery e suas respostas adaptadas para se adequarem ao formato retornado por VisTree. Um sistema completo de mineração de padrões arborescentes foi desenvolvido para testar e validar o uso da linguagem VisTree em contextos específicos de aplicações. O sistema foi construído de forma modular para que novas aplicações possam ser incorporadas de maneira simples. A aplicação de mineração de árvores com restrição nas áreas de XML Mining e Web Mining foi feita através de um estudo de caso. Nas duas aplicações, o sistema utiliza a linguagem VisTree nos módulos que fazem a tarefa de Pré-Processamento (entrada da restrição) e de Análise de Padrões (entrada da consulta). / Mestre em Ciência da Computação Datamining Tree mining Constraint-based tree mining Web mining XML mining Mineração de árvores Mineração de árvores com restrição Banco de dados Mineração de dados (Computação)
147	Um modelo para descrição e previsão da demanda dos consumidores industriais de energia elétrica Andrade, Fabiano Ferreira 24 October 2012 (has links) Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-graduação em Engenharia Elétrica, Florianópolis, 2009 / Made available in DSpace on 2012-10-24T11:29:12Z (GMT). No. of bitstreams: 1 270196.pdf: 6914719 bytes, checksum: 4dd0786ec35a2520458fe68cf5ef1f2f (MD5) / A estreita relação existente entre oferta e demanda é um dos temas centrais do planejamento e da operação dos sistemas de energia elétrica. O desconhecimento sobre o comportamento do consumidor pode ter consequências graves ao equilíbrio entre a oferta e a demanda. A dinâmica de mercados competitivos de energia elétrica envolvendo grandes consumidores industriais exige um alto nível de conhecimento sobre a evolução da demanda. Neste trabalho apresenta-se um novo modelo para descrever e prever a demanda dos consumidores industriais de energia elétrica, de forma desagregada. Por meio de um modelo descritivo da demanda é possível quantificar a influência de fatores econômicos e/ou climáticos característicos de um segmento da indústria. A partir desse conhecimento, o trabalho apresenta um modelo de preditivo, baseado em redes neurais artificiais, para estimar o consumo nos meses seguintes. O diferencial deste trabalho está na aplicação de técnicas de mineração de dados como suporte à integração do modelo econométrico de descrição com o modelo neural de previsão. Para validação da metodologia proposta foram utilizados dados mensais de consumo das indústrias têxtil e metalúrgicas de Santa Catarina, fornecidos pelas Centrais Elétricas de Santa Catarina - CELESC S.A. Os resultados da pesquisa podem contribuir para o planejamento da produção e comercialização da energia elétrica, principalmente em mercados competitivos, gerando maior comprometimento nas relações de comercialização da energia elétrica. / The narrow relationship between demand and supply is of paramount importance for planning and operation of electrical power systems. The lack of knowledge about consumer's behavior may lead to serious problems to the balance between supply and demand. The dynamic of competitive markets related to great industrial consumers needs a high level of knowledge about the market evolution. Then, this work presents a new model to describe and foresee the separated demand of great industrial consumers of electrical energy. It is possible to include the economic and climatic factors, which are characteristics of some industrial sector, by using an appropriated modeling technique. Afterwards, it is developed a predictive model based on neural networks to estimate the demand up to 12 months ahead. The main contribution of this thesis is in the application of data mining procedures as an aid to integrate the econometric model of description with the neural network model of demand forecasting. To validate these models real data were used from CELESC, a south brazilian power utility, referring to textile and metallurgical Industrial sectors. The results of this research have demonstrated that the proposed model is a promising computational tool to improve the understanding of the electrical energy production business. Engenharia eletrica Energia eletrica Oferta e procura Demanda (Teoria economica) Previsao Metodologia Sistemas de energia eletrica Planejamento Mineração de dados (Computação) Econometria Redes neurais (Computação) Energia eletrica - Consumo Industrias
148	Aplicação de classificadores Bayesianos e regressão logística na análise de desempenho dos alunos de graduação Kuribara, Alex Rodrigo 15 December 2015 (has links) Submitted by Alex Kuribara (alex_kuribara@yahoo.com.br) on 2016-01-04T20:27:16Z No. of bitstreams: 1 MPA Sistema da Informação - Alex Kuribara.pdf: 2558507 bytes, checksum: 5157a9a4230813d00ed67591adac5ccf (MD5) / Rejected by Ana Luiza Holme (ana.holme@fgv.br), reason: Alex, Na pagina 04 precisa retirar os dizeres Projeto de Dissertação. Ana Luiza Holme 3799-3492 on 2016-01-05T11:50:07Z (GMT) / Submitted by Alex Kuribara (alex_kuribara@yahoo.com.br) on 2016-01-05T13:16:47Z No. of bitstreams: 1 MPA Sistema da Informação - Alex Kuribara.pdf: 2558380 bytes, checksum: 7b98268613b3870b062daca2fceae2ab (MD5) / Approved for entry into archive by Ana Luiza Holme (ana.holme@fgv.br) on 2016-01-05T13:22:22Z (GMT) No. of bitstreams: 1 MPA Sistema da Informação - Alex Kuribara.pdf: 2558380 bytes, checksum: 7b98268613b3870b062daca2fceae2ab (MD5) / Made available in DSpace on 2016-01-05T13:33:50Z (GMT). No. of bitstreams: 1 MPA Sistema da Informação - Alex Kuribara.pdf: 2558380 bytes, checksum: 7b98268613b3870b062daca2fceae2ab (MD5) Previous issue date: 2015-12-15 / Este trabalho minera as informações coletadas no processo de vestibular entre 2009 e 2012 para o curso de graduação de administração de empresas da FGV-EAESP, para estimar classificadores capazes de calcular a probabilidade de um novo aluno ter bom desempenho. O processo de KDD (Knowledge Discovery in Database) desenvolvido por Fayyad et al. (1996a) é a base da metodologia adotada e os classificadores serão estimados utilizando duas ferramentas matemáticas. A primeira é a regressão logística, muito usada por instituições financeiras para avaliar se um cliente será capaz de honrar com seus pagamentos e a segunda é a rede Bayesiana, proveniente do campo de inteligência artificial. Este estudo mostre que os dois modelos possuem o mesmo poder discriminatório, gerando resultados semelhantes. Além disso, as informações que influenciam a probabilidade de o aluno ter bom desempenho são a sua idade no ano de ingresso, a quantidade de vezes que ele prestou vestibular da FGV/EAESP antes de ser aprovado, a região do Brasil de onde é proveniente e as notas das provas de matemática fase 01 e fase 02, inglês, ciências humanas e redação. Aparentemente o grau de formação dos pais e o grau de decisão do aluno em estudar na FGV/EAESP não influenciam nessa probabilidade. / This dissertation mines a database with information gathered from 2009 to 2012 during the application process to join the business administration course offered by FGV-EAESP. The goal is to develop classifiers which estimate whether a new student will have good performance. The methodology of this dissertation is based on KDD process (Knowledge Discovery in Database) developed by Fayyad et al. (1996a); in addition, the classifiers will be developed by using two theories. The first one is the logistic regression, broadly adopted in financial institutions to assess the potential default of their customers in the credit market. The second one Bayesian networks from artificial intelligence field. The outcomes of this dissertation show that both classifiers have the same discriminant capacity. In addition, the student’s age, the number of times she/he applied for FGV/EAESP before joining the school, the region of Brazil she/he comes from and the grades of five exams: Mathematics phase 01 and phase 02, English, Human Science and Essay influence the student performance. However, neither the parents’ formal education background nor the student’s willingness to join FGV/EAESP impact on such performance. Redes bayesianas KDD Mineração de dados Administração de empresas Análise de regressão logística Mineração de dados (Computação)
149	Análise de sentimentos em reclamações: uma aplicação no maior site de reclamações do Brasil Gonçalves, Cristiano de Andrade 22 July 2016 (has links) Submitted by Cristiano de Andrade Gonçalves (cristianogoncalves@yahoo.com.br) on 2016-07-15T00:18:37Z No. of bitstreams: 1 Dissertação Cristiano Gonçalves completa.pdf: 793794 bytes, checksum: 25b9c77cb59d14b9ecddf59b69643200 (MD5) / Approved for entry into archive by Janete de Oliveira Feitosa (janete.feitosa@fgv.br) on 2016-07-20T12:51:19Z (GMT) No. of bitstreams: 1 Dissertação Cristiano Gonçalves completa.pdf: 793794 bytes, checksum: 25b9c77cb59d14b9ecddf59b69643200 (MD5) / Approved for entry into archive by Maria Almeida (maria.socorro@fgv.br) on 2016-07-25T13:27:52Z (GMT) No. of bitstreams: 1 Dissertação Cristiano Gonçalves completa.pdf: 793794 bytes, checksum: 25b9c77cb59d14b9ecddf59b69643200 (MD5) / Made available in DSpace on 2016-07-25T13:29:08Z (GMT). No. of bitstreams: 1 Dissertação Cristiano Gonçalves completa.pdf: 793794 bytes, checksum: 25b9c77cb59d14b9ecddf59b69643200 (MD5) Previous issue date: 2016-07-22 / A análise de sentimentos é uma ferramenta com grande potencial, podendo ser aplicada em vários contextos. Esta dissertação tem com o objetivo analisar a viabilidade da aplicação da técnica numa base capturada do site de reclamações mais popular do Brasil, com a aplicação de técnicas de processamento de linguagem natural e de aprendizagem de máquinas é possível identificar padrões na satisfação ou insatisfação dos consumidores. Comportamento do consumidor Análise de sentimentos Processamento de linguagem natural Aprendizagem por máquinas Matemática Mineração de dados (Computação)
150	Análise preditiva de Churn com ênfase em técnicas de Machine Learning: uma revisão Schneider, Pedro Henrique 27 July 2016 (has links) Submitted by Pedro Henrique Schneider (pedro.hesch@gmail.com) on 2016-09-09T15:00:58Z No. of bitstreams: 1 Dissertação de Mestrado versB - Pedro Schneider.pdf: 3405337 bytes, checksum: f452667b92fb078d3ef982a694d30db3 (MD5) / Approved for entry into archive by Janete de Oliveira Feitosa (janete.feitosa@fgv.br) on 2016-09-26T12:55:03Z (GMT) No. of bitstreams: 1 Dissertação de Mestrado versB - Pedro Schneider.pdf: 3405337 bytes, checksum: f452667b92fb078d3ef982a694d30db3 (MD5) / Approved for entry into archive by Maria Almeida (maria.socorro@fgv.br) on 2016-10-17T16:18:06Z (GMT) No. of bitstreams: 1 Dissertação de Mestrado versB - Pedro Schneider.pdf: 3405337 bytes, checksum: f452667b92fb078d3ef982a694d30db3 (MD5) / Made available in DSpace on 2016-10-17T16:18:27Z (GMT). No. of bitstreams: 1 Dissertação de Mestrado versB - Pedro Schneider.pdf: 3405337 bytes, checksum: f452667b92fb078d3ef982a694d30db3 (MD5) Previous issue date: 2016-07-27 / In the last two decades, the growth of the Internet and its associated technologies, are transforming the way of the relationship between companies and their clients. In general, the acquisition of a new customer is much more expensive for a company than the retention of a current one. Thus, customer retention studies or Churn management has become more important for companies. This study represents the review and classi cation of literature on applications of Machine Learning techniques to build predictive models of customers loss, also called Churn. The objective of this study was collecting the largest possible number of documents on the subject within the proposed methodology and classi es them as per application areas, year of publication, Machine Learning techniques applied, journals and repositories used and in uence level of the documents. And thus, bringing to the light the existing studies in this eld of activity, consolidating what is the state of the art of research in this area, and signi cantly contribute as a reference for future applications and researches in this area. Although, the study has not been the rst in the literature of Machine Learning related to the loss of customer or customer retention in the way of literature review, it was the rst, among the ones we have found, with focus on documents studying, not exclusively, loss or retention of customers by Machine Learning techniques, and without any kind of restriction. Furthermore it was the rst to classify documents by in uence, through the quotations from each document. As a nal database was collected and analyzed 80 documents, from which were found as main application areas: Telecommunications, Financial, Newspapers, Retail, among others. As per Machine Learning techniques applied, the most applied techniques founded related to the problem, were the following: Logistic Regression, Decision Tree and Neural Networks, among others. And based on the results, this kind of study is dated since 2000. / Nas últimas duas décadas, o crescimento da internet e suas tecnologias associadas, vêm transformando a forma de relacionamento entre as empresas e seus clientes. Em geral, a aquisição de um novo cliente custa muito mais caro para uma empresa que a retenção do mesmo. Desta forma, estudos de retenção de clientes, ou gerenciamento do Churn, se tornaram mais importantes para as empresas. O presente trabalho consiste na revisão e classificação da literatura sobre aplicações de técnicas com ênfase em Machine Learning para construir modelos preditivos de perda de clientes, também chamada de Churn. O objetivo do trabalho foi reunir o maior número possível de documentos sobre o assunto, dentro da metodologia proposta, e classificá-los quanto às áreas de aplicação, ano de publicação, técnicas de Machine Learning aplicadas, periódicos e repositórios utilizados, nível de influência dos documentos e desta forma trazer à luz os estudos já existentes nesse campo de atuação, consolidando o que há do estado da arte em pesquisas desta área, e de forma significativa contribuir como uma referência para futuras aplicações e pesquisas nesta área. Embora o trabalho não tenha sido o primeiro na literatura de Machine Learning relacionado a perda ou retenção de clientes na linha de revisão literária, foi o primeiro encontrado com foco em documentos que estudam, não exclusivamente, a perda ou retenção de clientes por técnicas de Machine Learning e sem nenhum tipo de restrições. Da mesma forma foi o primeiro a classificar os documentos por influência através das citações entre os documentos. Assim, como base final para o trabalho, analisou-se 80 documentos, onde foram encontradas como principais áreas de aplicação: Telecomunicações, Financeiras, Jornais, Varejo entre outras. Constataram-se como técnicas de Machine Learning mais utilizadas para o problema em questão: Regressão Logística, Árvores de Decisão e Redes Neurais, entre outras. E ainda, de acordo com os resultados obtidos, notou-se que ano 2000 tende a ser um marco para esta pesquisa, pois foi a data mais antiga para a qual foi encontrado um artigo nesse trabalho. Churn Análise Preditiva de Churn Retenção de clientes Machine learning Aprendizagem de máquina Data mining Mineração de dados Revisão Matemática Mineração de dados (Computação) Aprendizado do computador

Search results