Spelling suggestions: "subject:"mineração dde dados (computação)"" "subject:"mineração dde dados (omputação)""
191 |
Programação Genética Aplicada no Processo de Descoberta de Conhecimento em Bases de Dados de Redes de Pesquisa. / Genetic Programming Apllied in the Process of Knowledge Discovery in Databases for Research Networks.DUARTE, Kedma Batista 20 December 2010 (has links)
Made available in DSpace on 2014-07-29T15:08:16Z (GMT). No. of bitstreams: 1
Tese de Kedma Batista Duarte.pdf: 2986348 bytes, checksum: b08f936c5937365d2b7493f4db0f0b88 (MD5)
Previous issue date: 2010-12-20 / The Genetic Programming (GP) is a heuristic algorithm for Data Mining (DM), which can be applied to the classification task. This is a method of evolutionary computing inspired in the
mechanisms of natural selection theory of Charles Darwin, declared in 1859 in his book "The Origin of Species." From an initial population, the method search over a number of
generations to find solutions adapted to the environment of problem. The PG method was proposed in 1990 by John Koza, who demonstrated in one of its applications, the induction in
formation of decision trees in the process of data classification. Within this context, the study developed in this work has as main objective the investigation of the concepts of PG and its
application on a database of scientific collaboration networks, helping as a management tool in prospective studies of trends for the establishment of common axes in public policy of
Science, Technology and Innovation (STI), focusing on regional development. The method is applied on a set of attributes, sorting them in order to identify similarity relationships
between groups of researchers that comprise the network. The study involves the concepts of Knowledge Discovery in Databases (KDD) and Data Mining (DM). Networks of Scientific
Collaboration, or Networks Research, are inserted in the context of small groups of social networks, the environment is dynamic due to the easy of information exchange and links between individuals, favoring the formation of new groups, which makes the growth of the network unlimited. "The combination of these groups, generated by the relationships between them, appears as a case of multi-criteria decision, granting the application of some complexity. In this sense, it is intended to apply the method of PG for generation of classification rules that lead to the discovery of groups of researchers with similar traits, which in a planned process could be induced to form groups strengthened and consolidated. The study helps to exploit the potential of genetic programming as a classifier algorithm, as well as use it as a method to build tools to support planning and decision making in STI. / A Programação Genética (PG) é um algoritmo heurístico de Mineração de Dados (MD), quepode ser aplicado na tarefa de classificação. Trata-se de um método da Computação Evolutiva
inspirado nos mecanismos de seleção natural, da teoria de Charles Darwin, declarada em 1859 em seu livro A Origem das Espécies . A partir de uma população inicial, o método busca ao
longo de um conjunto de gerações a descoberta de soluções bem adaptadas ao ambiente do problema. O método de PG foi proposto por John Koza em 1990, que demonstrou em uma de
suas aplicações, a indução na formação de árvores de decisão em processos de classificação de dados. Dentro deste contexto, o estudo desenvolvido neste trabalho tem como objetivo principal a investigação dos conceitos de PG e sua aplicação sobre uma base de dados de Redes de Colaboração Científica, auxiliando como ferramenta de gestão em estudos
prospectivos de tendências para o estabelecimento de eixos comuns em políticas públicas de Ciência, Tecnologia e Inovação (CT&I), com foco em desenvolvimento regional. O método é
aplicado sobre um conjunto de atributos, classificando-os de forma a identificar relações de similaridade entre os grupos de pesquisadores que compõem a rede. O estudo envolve conceitos de Descoberta do Conhecimento em Bases de Dados (DCBD) e Mineração de Dados (MD). As Redes de Colaboração Científica, ou Redes de Pesquisa, estão inseridas no contexto dos pequenos grupos das Redes Sociais, o ambiente é dinâmico devido à facilidade para troca de informações e articulação entre os indivíduos, favorecendo a formação de novos grupos, fato que torna ilimitado o crescimento da Rede. A combinação das características desses grupos, gerada pelos relacionamentos entre eles, configura-se como um caso de decisão multi-critério, dotando a aplicação de certa complexidade. Neste sentido, pretende-se com a aplicação do método da PG a geração de regras de classificação que levem à descoberta de grupos de pesquisadores com características similares, que em um processo planejado poderiam ser induzidos à formação de grupos fortalecidos e consolidados. O estudo contribui no sentido de explorar o potencial da Programação Genética como um algoritmo classificador, bem como, usá-lo como método na construção de ferramentas de apoio ao planejamento e tomada de decisão em CT&I.
|
192 |
Odysseýs : sistema para análise de documentos de patentes / Odysseýs : system for analysis of patent documentsMasago, Fábio Kenji, 1984 04 August 2013 (has links)
Orientador: Jacques Wainer / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-22T23:44:38Z (GMT). No. of bitstreams: 1
Masago_FabioKenji_M.pdf: 2909118 bytes, checksum: 6db84a869c4da011cf0f5cd7114bcf63 (MD5)
Previous issue date: 2013 / Resumo: Uma patente é um documento sobre uma propriedade de criação concedida pelo Estado aos autores, que impede terceiros a produzir, utilizar, comercializar, importar e exportar a invenção descrita sem a devida autorização do titular do documento. Um estudo na área econômico muito empregado é a utilização de patentes para medir a importância ou impacto tecnológico de um campo inovativo de uma entidade ou nação. Pode-se afirmar que as patentes são como uma espécie de medidores do nível inventivo e as citações contidas nas patentes são um meio para medir o fluxo ou os impactos do conhecimento de um país ou firma, assim como, avaliar tendências de um campo tecnológico. A presente dissertação de mestrado apresenta o desenvolvimento de uma ferramenta para auxiliar no procedimento de análise de patentes, abordando a aplicabilidade do método Latent Dirichlet Allocation (LDA) para o processo de similaridade de patentes. O sistema computacional denominado Odysseýs verifica a similaridade entre uma determinada patente dada pelo usuário e um grupo de documentos, ordenando-os conforme o seu grau de semelhança em relação à patente em avaliação. Além disso, o software permite, de forma não supervisionada, a geração de redes de citações de patentes por meio de buscas de um conjunto de patentes correlacionadas na base de dados do United States Patent and Trademark Office (USPTO) a partir de uma consulta designada pelo usuário, utilizando essas patentes para a análise de similaridade e, também, para a geração da rede de fluxo de conhecimento. A inexistência de softwares nacionais específicos para o processamento de patentes e as poucas ferramentas auxiliares para a análise de tais documentos foram às principais motivações para o desenvolvimento do projeto / Abstract: A patent is a document about an invention's property given by the state to authors, preventing others from producing, using, commercialize, importing and exporting the described invention without a permission of the document's owner. A study in the economic area frequently used is the use of patents to measure importance or technological impact of an innovative field of an entity or nation. Thus, can be asserted that patents are a kind of inventive level meter and their citations is a form of measuring a country's or firm's flow or the impact of knowledge, as well as evaluate trends in a certain technological field. This thesis presents a computational tool to assist in the process of patents analysis, approaching the applicability of the method Latent Dirichlet Allocation (LDA) for the similarity of patents. The computational system called Odysseýs evaluates the similarity between a patent given by the user and a group of documents, ordering them according to their similarity degree in relation to evaluated patent. In addition, the software allows, in an unsupervised manner, generate a patent citation's network by searches for a set of related patents in the database United States Patent and Trademark Office (USPTO) through a query designated by the user applying those patents to the similarity analysis, and also for generation of a knowledge flow network. The inexistence of national software for patent processing and only a few auxiliary tools for the analysis of such documents were the main motivations for the development of this project / Mestrado / Ciência da Computação / Mestre em Ciência da Computação
|
193 |
Avaliação da influência da temperatura e da precipitação na ocorrência da ferrugem asiática da soja por meio da técnica de árvore de decisão / Evaluation of the influence of temperature and precipitation in the occurrence of Asian soybean rust by using the technique of decision treeMegeto, Guilherme Augusto Silva, 1984- 07 October 2012 (has links)
Orientadores: Stanley Robson de Medeiros Oliveira, Carlos Alberto Alves Meira / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola / Made available in DSpace on 2018-08-20T23:34:35Z (GMT). No. of bitstreams: 1
Megeto_GuilhermeAugustoSilva_M.pdf: 5556599 bytes, checksum: c545e13e7ec81e96cf9e6a3e46d01de2 (MD5)
Previous issue date: 2012 / Resumo: A ferrugem asiática, causada pelo fungo Phakopsora pachyrhizi, atualmente é considerada uma das doenças mais importantes e agressivas da soja. A principal forma de controle é a aplicação calendarizada de fungicidas a qual desconsidera o risco de ocorrência da doença. Estudos epidemiológicos buscam compreender os fatores que influenciam na ocorrência e desenvolvimento das epidemias, especialmente aqueles relacionados ao ambiente tais como condições meteorológicas. Com o avanço da tecnologia da informação e do armazenamento de dados, técnicas de mineração de dados (data mining) apresentam-se promissoras para a descoberta de conhecimento em bases de dados epidemiológicos. Este trabalho tem como objetivo avaliar a influência da chuva e da temperatura na ocorrência da ferrugem asiática da soja utilizando árvores de decisão. Para tal, foram obtidos dados de ocorrências da doença em quatro safras, de 2007/2008 a 2010/2011, oriundos do banco de dados do Consórcio Antiferrugem, e dados meteorológicos, provenientes do sistema Agritempo. A análise exploratória dos dados permitiu obter subsídios para compor o conjunto de dados final e definir o escopo deste trabalho, buscando-se características intrínsecas à doença e sua interação com o ambiente, utilizando apenas variáveis de base meteorológica. As variáveis utilizadas foram relacionadas à precipitação e à temperatura, que deram origem a nove atributos avaliados para cada período temporal...Observação: O resumo, na íntegra, poderá ser visualizado no texto completo da tese digital / Abstract: The Asian soybean rust, caused by Phakopsora pachyrhizi, is now considered one of the most important and aggressive diseases of soybean. The main form of control is the scheduled application of fungicides which disregards the the risk of disease occurrence. Epidemiological studies seek to understand the factors that influence the occurrence and development of epidemics, especially those related to the environment such as weather conditions. With the development of information technology and data warehousing, data mining techniques appear to be promising for knowledge discovery in epidemiological databases. This study aims to evaluate the influence of rainfall and temperature on the occurrence of soybean rust by using decision trees models. To accomplish that, data of the occurence of the disease were collected from four seasons, 2007/2008 to 2010/2011, from the Consórcio Antiferrugem and weather data from the Agritempo system. Exploratory data analysis allowed for obtaining subsidies to generate the final data set and define the scope of this work, seeking intrinsic characteristics of the disease and its interaction with the environment, using only meteorological variables. The variables used were related to precipitation and temperature, resulting into nine attributes evaluated in different periods. Such attributes were related to the event of occurrence (Oc) and non occurrence (NaoOc) of the disease (assumed as the thirtieth day prior to the event of occurrence). The results include a predictive model and an interpretive model for classifying events of occurrences and non occurrences of the disease...Note: The complete abstract is available with the full electronic document / Mestrado / Planejamento e Desenvolvimento Rural Sustentável / Mestre em Engenharia Agrícola
|
194 |
Avaliação da segurança de sistemas de potência para múltiplas contingências usando árvore de decisão multicaminhosOLIVEIRA, Werbeston Douglas de 15 September 2017 (has links)
Submitted by Carmen Torres (carmensct@globo.com) on 2018-02-09T18:08:56Z
No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Tese_AvaliacaoSegurancaSistemas.pdf: 3858130 bytes, checksum: 2cbcf782498880ce489e50eb58e31bf7 (MD5) / Approved for entry into archive by Edisangela Bastos (edisangela@ufpa.br) on 2018-02-16T13:42:52Z (GMT) No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Tese_AvaliacaoSegurancaSistemas.pdf: 3858130 bytes, checksum: 2cbcf782498880ce489e50eb58e31bf7 (MD5) / Made available in DSpace on 2018-02-16T13:42:52Z (GMT). No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Tese_AvaliacaoSegurancaSistemas.pdf: 3858130 bytes, checksum: 2cbcf782498880ce489e50eb58e31bf7 (MD5)
Previous issue date: 2017-09-15 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico / Eletronorte - Centrais Elétricas do Norte do Brasil S/A / A busca de formas eficazes para promover a operação segura de sistemas de potência e aumentar a compreensão dos operadores tem encorajado a pesquisa contínua de novas técnicas e métodos que possam ajudar nessa tarefa. Nesta tese, propõe-se uma abordagem para avaliar a segurança da operação de sistemas de potência para múltiplas contingências usando a técnica árvore de decisão multi-caminhos ou (MDT, do inglês “Multiway Decision Tree”). A MDT difere de outras técnicas de árvore de decisão por estabelecer, na etapa de treinamento, um valor de atributo categórico por ramo. Essa abordagem propõe o uso de topologias (contingências) como atributos categóricos. Desta forma, a MDT melhora a interpretabilidade em relação ao estado operacional do sistema de potência, pois o operador pode ver claramente as variáveis críticas para cada topologia, de modo que as regras da MDT possam ser usadas no auxílio à tomada de decisão. Essa abordagem proposta foi utilizada para avaliação da segurança em dois sistemas testes, o sistema IEEE 39 barras e o sistema da parte do Norte do Sistema Interligado Nacional (SIN), sendo que este último foi testado com dados reais de um dia de operação. A técnica proposta baseada em MDT demonstrou bom desempenho, utiliando um conjunto de regras simples e claras. Também foi realizada uma comparação dos resultados obtidos com outras técnicas baseadas em árvores de decisão e verificou-se que o MDT resultou em um procedimento mais simples para a classificação de segurança dos sistemas com boa precisão. / The search for effective ways to promote the secure operation of power systems and to increase its understanding by operators has encouraged continuous research for new techniques and methods that can help in this task. In this paper, it is proposed an approach to assess power system operation security for multiple contingencies using a multiway decision tree (MDT). The MDT differs from other decision tree techniques for establishing, in the training step, one value of the categorical attributes by branch. This approach proposes the use of topologies (contingencies) as categorical attributes. In this way, it improves interpretability regarding the power system operational state, as the operator can see clearly the critical variables for each topology, such that the MDT rules can be used in aiding the decision-making. This proposal was used for security assessment of two test systems, the IEEE 39-bus system and the Northern part of the Brazilian Interconnected Power System (BIPS), and BIPS was tested with real data from one day operation. The proposed MDT-based technique demonstrated superior performance, with a set of simple and clear rules. It was also performed a comparison of the obtained results with other techniques based on DT and it turned out that MDT has resulted in a simpler procedure for power system security classification with good accuracy.
|
195 |
Uso de técnicas de mineração de dados para a extração de indicação de falha na operação de hidrogeradores a partir de medidas de descargas parciaisPARDAUIL, Ana Carolina Neves 17 June 2016 (has links)
Submitted by camilla martins (camillasmmartins@gmail.com) on 2017-01-27T15:40:38Z
No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertacao_TecnicasMineracaoDados.pdf: 5205222 bytes, checksum: 0ac0aceafcb8be8da514e3982160642b (MD5) / Approved for entry into archive by Edisangela Bastos (edisangela@ufpa.br) on 2017-01-30T12:17:53Z (GMT) No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertacao_TecnicasMineracaoDados.pdf: 5205222 bytes, checksum: 0ac0aceafcb8be8da514e3982160642b (MD5) / Made available in DSpace on 2017-01-30T12:17:53Z (GMT). No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertacao_TecnicasMineracaoDados.pdf: 5205222 bytes, checksum: 0ac0aceafcb8be8da514e3982160642b (MD5)
Previous issue date: 2016-06-17 / Mediante estudos realizados pelo CIGRE em 2009, constatou-se que a fonte principal de falhas elétricas em hidrogeradores estão correlacionados a isolação elétrica. Devido a isto, monitorar as condições do enrolamento estatórico tornou-se primordial e um dos meios de se realizar este procedimento é através da medição e análise de descargas parciais, sendo este um dos métodos mais eficazes e seguros para análise do isolamento do estator do gerador. No entanto, apesar de possuírem padrões bem definidos, não é trivial encaixar os sinais obtidos nestes padrões, devido principalmente ao grande número e variedades de ocorrências de DPs. Este aumento no volume de dados obtidos foi devido a melhorias nos equipamentos e softwares do IMA-DP que viabilizou melhor planejamento e periodicidade nas medições. O uso de uma ferramenta que agilize este processo de identificação e diagnóstico das Descargas Parciais é proposto neste trabalho, baseado em técnicas de mineração dados utilizando árvores de decisão, que é uma solução para análise de grandes volumes de dados. No caso especifico aqui apresentado, utilizou-se 2435 medições provenientes da fase A de um dos hidrogeradores da Casa de Força 1 da Usina Hidrelétrica de Tucuruí, o que foi fundamental para validar o método, pois trata-se de dados reais do sistema. Foi utilizada uma abordagem híbrida (não-supervisionado/ supervisionado) para identificar padrões e posteriormente classifica-los dentre as formas conhecidas de DPs. Obteve-se respostas de classificação dos sinais de forma rápida e muito satisfatória, principalmente ao se converter os dados dos mapas estatísticos em histogramas de amplitude, conseguindo assim, clusters bem definidos e uma árvore de decisão que apresentou índices de acerto global na sua validação acima de 98%. / By studies conducted by CIGRE in 2009, it was found that the main source of hydro generator failures is correlated to the machine electrical insulation. Due to this fact, monitoring the stator winding conditions became an important supervising procedure. A very used practice to accomplish this supervision is through the measurement and analysis of partial discharges (PDs), being this practice one of the most effective and secure methods for analysis of generator stator insulation. However, although PDs have well-defined standards, it is not trivial to classify the obtained PDs signals in these patterns, mainly due to the large number and variety of PDs occurrences. Today, the significant increase in the amount of PDs data available was due to improvements in equipment and software for PDs monitoring, as for example the system IMA-DP, which has contributed to better planned and more frequent measurement campaigns. So, this work proposes the use of an intelligent tool to facilitate the process of identification and diagnosis of partial discharges, based on data mining techniques using decision trees (DT), which is a solution for analyzing large amount of data. In the specific case presented in this dissertation it was used 2,435 measurements obtained for phase A of a hydro generator of the Tucurui Hydro Plant, which was essential to validate the proposed method, because they represent real data obtained from the Hydro Plant operation. A hybrid approach (supervised/unsupervised) was used to identify and rank PDs patterns among the well-known forms of DPs. A fast and very satisfactory PDs classification procedure was achieved, especially when converting data from statistical maps into amplitude histograms, thus, obtaining well-defined clusters and a created decision tree that achieved global indices of accuracy above 98%.
|
196 |
Stormsom: clusterização em tempo-real de fluxos de dados distribuídos no contexto de BigDataLIMA, João Gabriel Rodrigues de Oliveira 28 August 2015 (has links)
Submitted by camilla martins (camillasmmartins@gmail.com) on 2017-01-27T16:34:20Z
No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertacao_StormsomClusterizacaoTempo-Real.pdf: 1081222 bytes, checksum: 30261425224872c11433d064abb4a2d8 (MD5) / Approved for entry into archive by Edisangela Bastos (edisangela@ufpa.br) on 2017-01-30T13:30:32Z (GMT) No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertacao_StormsomClusterizacaoTempo-Real.pdf: 1081222 bytes, checksum: 30261425224872c11433d064abb4a2d8 (MD5) / Made available in DSpace on 2017-01-30T13:30:32Z (GMT). No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertacao_StormsomClusterizacaoTempo-Real.pdf: 1081222 bytes, checksum: 30261425224872c11433d064abb4a2d8 (MD5)
Previous issue date: 2015-08-28 / Cresce cada vez mais a quantidade de cenários e aplicações que algoritmo necessitam de processamento e respostas em tempo real e que se utilizam de modelos estatísticos e de mineração de dados a fim de garantir um melhor suporte à tomada de decisão. As ferramentas disponíveis no mercado carecem de processos computacionais mais refinados que sejam capazes de extrair padrões de forma mais eficiente a partir de grandes volumes de dados. Além disso, há a grande necessidade, em diversos cenários, que o os resultados sejam providos em tempo real, tão logo inicie o processo, uma resposta imediata já deve estar sendo produzida. A partir dessas necessidades identificadas, neste trabalho propomos um processo autoral, chamado StormSOM, que consiste em um modelo de processamento, baseado em topologia distribuída, para a clusterização de grandes volumes de fluxos, contínuos e ilimitados, de dados, através do uso de redes neurais artificiais conhecidas como mapas auto-organizáveis, produzindo resultados em tempo real. Os experimentos foram realizados em um ambiente de computação em nuvem e os resultados comprovam a eficiência da proposta ao garantir que o modelo neural utilizado possa gerar respostas em tempo real para o processamento de Big Data.
|
197 |
Análise de crédito utilizando inteligência artificial: validação com dados do cartão BNDES / Credit analysis based on artificial intelligence: validation with data of BNDES cardOswaldo Luiz Humbert Fonseca 26 March 2008 (has links)
O presente trabalho apresenta um estudo feito para a elaboração de um modelo de análise de crédito para micro, pequenas e médias empresas (MPME) utilizando Inteligência Artificial. Apresenta, também, uma contribuição de um novo método de raciocínio baseado em casos, denominado FISKNN, que utiliza medida de similaridade presente nos métodos KNN e KNN-Fuzzy, e um sistema de inferência Fuzzy para decidir se a classe de um determinado caso é a classe do elemento mais próximo ou a classe da maioria dos K elementos selecionados para análise. Compara-se o método FISKNN com os métodos tradicionais KNN e KNN-Fuzzy utilizando os dados do Machine Learning Repository da Universidade da Califórnia, e apresentam-se três estudos de casos com bases de dados selecionadas das informações provenientes de solicitações de financiamento através do Cartão BNDES. / This work presents an investigation of a model of credit analysis for micro, small and medium size enterprises based on artificial intelligence techniques. The novelty is a cases-based reasoning, denoted by FISKNN, which uses a measure of similarity present in the KNN and KNN-Fuzzy methods, and a Fuzzy Inference System to decide between the class of the nearest case and the class of the majority of K elements selected for the analysis. One compares the FISKNN methods with the more traditional ones, KNN and KNNFuzzy, using data from the Machine Learning Repository of the University of California, and one presents three study cases with data bases selected from the set of financing applications to the BNDES Card.
|
198 |
Uma abordagem interativa para auxiliar no diagnóstico automotivo / An interactive approach to assist automotive diagnosticOliveira, Leonardo Presoto de 21 September 2017 (has links)
Fundação Araucária de Apoio ao Desenvolvimento Científico e Tecnológico do Paraná / Este trabalho tem como objetivo desenvolver uma abordagem para auxiliar as montadoras na obtenção de informações sobre os problemas e falhas que ocorrem nos veículos durante o seu uso pelos motoristas, relacionando os dados obtidos com a leitura da telemetria do veículo, assim como as percepções do motorista sobre uma determinada falha. A exploração de técnicas que auxiliam o diagnóstico automotivo é um problema a ser discutido na engenharia. As técnicas de diagnóstico devem fornecer suporte à grande gama de sistemas que surgirão nos próximos anos. Assim, é possível também utilizar a conectividade que os celulares e veículo dispõem na atualidade, com o intuito de evoluir o produto oferecido e melhorar a experiência do cliente enquanto dirige. A inclusão do cliente no processo de diagnóstico, visa permitir que os projetistas identifiquem pontos que podem ser melhorados no carro, mesmo que não apresentem erro aparente. A opinião do cliente pode ser considerada, uma vez que ele é incluído no processo como um novo “sensor" (o mais inteligente e importante de todos) capaz de reportar suas percepções. Considerando este fato, a motivação deste trabalho se encontra em: (i) Procurar alternativas para aplicar de maneira eficiente a conectividade dos veículos no processo de diagnóstico; (ii)Permitir que as montadoras possam obter informações mais concretas dos veículos que comercializam. O objeto é fornecer um sistema de interface entre o usuário e o carro auxiliando a realização dos diagnósticos preventivos mais completos do que apenas usando a telemetria. Neste projeto busca-se que haja uma interação maior com o motorista, e que a experiência das montadoras possa entrar no processo de diagnóstico. Mesmo que o cliente não tenha tanta intimidade com o funcionamento do veículo, o sistema deve orientar o motorista no processo. A entrada de dados do cliente é realizada por texto ou comando de voz. Para a análise desta entrada de dados do cliente foi realizado um estudo de mineração de dados em bases que a montadora já possuía. Estas bases são entrevistas telefônicas nas quais a montadora pergunta ao cliente problemas percebidos no carro, e então as respostas são transcritas para a base. O estudo de mineração de dados foi realizado para a criação do classificador que é responsável por receber os dados de entrada do cliente e classifica-lo em um determinado problema ligado à multimídia ou relacionado ao motor do veículo. O software contido no celular será responsável por solicitar ao sistema de sensores do veículo as leituras necessárias para que o cliente obtenha as informações que deseja. Foi realizado um experimento no qual analistas de diagnóstico responderam a um questionário que buscava analisar se o sistema proposto realmente influenciava no processo de diagnóstico, fazendo com que a solução dos problemas no veículo seja realizada em menos etapas, se comparado com o processo atual. Os resultados mostraram que a abordagem diminuiu o número de etapas necessárias para a obtenção do diagnóstico correto. Dos três estudos de caso realizados, as etapas necessárias para se chegar ao diagnóstico apropriado diminuiu em uma etapa para o primeiro estudo de caso, diminuiu uma etapa para o segundo estudo de caso, e três etapas a menos para o terceiro estudo de caso. Com estes resultados foi possível demonstrar que a abordagem proposta influiu no processo de diagnóstico aplicado atualmente pelas montadoras e concessionárias analisadas. / The goal of this project is to develop an approach to assist automakers in obtaining information about the problems and failures that occur in the vehicles during their use by drivers, relating the data obtained by reading the telemetry of the vehicle, as well as the perceptions of the driver about a particular failure. The exploration of techniques to optimize automotive diagnosis is a problem to be discussed in Engineering. Diagnostic techniques should support the wide range of systems that will emerge in the coming years. Thus, it is also possible to use the connectivity that mobile phones and vehicles have today, in order to evolve the product offered and improve the customer experience while driving. The customer inclusion in the diagnostic process aims to allow engineers identifies points to be improved in the car, even if they dont present an apparent error. The customer opinion should be considered, since he/she is included in the process as a new "sensor"(the most intelligent and important of all) able to report his/her perceptions. Considering this fact, the motivation of this research is: (i) search for alternatives to efficiently apply vehicle connectivity in the diagnostic process, (ii) enable automakers to obtain more concrete information on the vehicles they sell. The object is provide an interface between the user and the car helping them to perform a more complete preventive diagnoses than only using telemetry. In this project it is sought that there is a greater interaction with the driver, and the experience of the automakers could be included the diagnostic process. Even if the customer isnt so accustomed with the operation of the vehicle, the system must guide the driver by the process. The customer input data is performed by text or voice command. The analysis of this customer input data, a data mining study was performed based on a base that automaker already had. These bases are telephone interviews in which the automaker asks the customer for perceived problems in the car, and then the answers are transcribed to the base. The data mining study was performed to create one classifier which was responsible for receiving the input data from the customer and sorting it into a particular problem related with the multimídia or related to the motor of the vehicle. The software contained in the mobile phone will be responsible asking to the vehicle sensor system for the readings necessary for the customer can to obtain the information he/she wants. An experiment was carried out in which diagnostic analysts answered a questionnaire that sought to analyze whether the proposed system actually influenced the diagnostic process, so the solution of the problems in the vehicle was performed on less steps compared to the current process. The results showed the approach reduced the number of steps required to obtain the correct diagnosis. Of the three case studies performed, the steps required to arrive at appropriate diagnosis decreased in one step to the first case study, one step to the second case study decreased, and three less steps to the third case study . With these results it was possible to demonstrate that the proposed approach influenced the diagnostic process currently applied by the automakers and concessionaires analyzed.
|
199 |
Mineração de textos para o tratamento automático em sistemas de atendimento ao usuárioSanga, Dione Aparecido de Oliveira 22 August 2017 (has links)
A explosão de novas formas de comunicação entre empresas e clientes proporciona novas oportunidades e meios para que empresas possam tirar proveito desta interação. A forma como os clientes interagem com as empresas tem evoluído nos últimos anos, devido ao aumento dos dispositivos móveis e o acesso à internet: clientes que tradicionalmente solicitavam atendimento via telefone migraram para meios de atendimento eletrônicos, sejam eles via app´s dos smartphones ou via portais de atendimento a clientes. Como resultado desta transformação tecnológica do meio de comunicação, a Mineração de Textos tornou-se uma atrativa forma das empresas extraírem conhecimento novo a partir do registro das interações realizadas pelos clientes. Dentro deste contexto, o ambiente de telecomunicações proporciona os insumos para a realização de experimentos devido ao grande volume de dados gerados diariamente em sistemas de atendimento a clientes. Esse trabalho tem por objetivo analisar se o uso de Mineração de Textos aumenta a acurácia dos modelos de Mineração de Dados em aplicações que envolvem textos livres. Para isso é desenvolvido uma aplicação que visa a identificação de clientes propensos a saírem de ambientes internos de atendimento (CRM) e migrarem para órgãos regulamentadores do setor de telecomunicações. Também são abordados os principais problemas encontrados em aplicações de Mineração de Textos. Por fim, são apresentados os resultados da aplicação de algoritmos de classificação sobre diferentes conjuntos de dados, para a avaliação da melhoria obtida com a inclusão da Mineração de Textos para este tipo de aplicação. Os resultados obtidos mostram um ganho consolidado na melhoria da acuraria na ordem de 32%, fazendo da Mineração de Textos uma ferramenta útil para este tipo de problema. / The explosion of new forms of communication between companies and new opportunities and means for companies to take advantage of this interaction. The way customers interact with companies has evolved in the recent years due to the increase in mobile devices and Internet access: clients who traditionally requested phone service migrated to electronic means of service, whether via smartphone app's or via customer service portals. As a result of this technological transformation of the communication medium, text mining has become an attractive form for companies to extract new knowledge from the register of interactions carried out by customers. Within this context, the telecommunications environment provides the inputs for conducting experiments due to the large volume of data generated daily in customer service systems. This job aims to analyze if the use of text mining increases the accuracy of data mining models in applications involving free texts. For this purpose, an application is developed that aims to identify clients likely to leave internal service environments (CRM) and migrate to regulatory agencies in the telecommunications sector [Baeza, Ricardo e Berthier ,1999]. Also addressed are the main problems encountered in text mining applications. Finally, the results of the application of classification algorithms on different data sets are presented for the evaluation of the improvement obtained with the inclusion of text mining for this type of application. The results obtained show a consolidated gain in the improvement of the acuraria in the order of 32%, making the mining of texts a useful tool for this type of problem.
|
200 |
Arquitetura RF-Miner: uma solução para localização em ambientes internos / RF-Miner Architecture: a solution for locating indoor environmentsGomes, Eduardo Luis 12 December 2017 (has links)
A utilização de etiquetas RFID UHF passivas para localização indoor vem sendo amplamente estudada devido ao seu baixo custo. Porém ainda existe uma grande dificuldade em obter bons resultados, principalmente devido à variação de rádio frequência em ambientes que possuem materiais reflexivos, como por exemplo, metais e vidros. Esta pesquisa propõe uma arquitetura de localização para ambientes indoor utilizando etiquetas RFID UHF passivas e técnicas de mineração de dados. Com a aplicação da arquitetura em ambiente real foi possível identificar a posição exata de objetos com a precisão de aproximadamente cinco centímetros e em tempo real. A arquitetura se demonstrou uma eficiente alternativa para implantação de sistemas de localização indoor, além de apresentar uma técnica de derivação de atributos diretos que contribui efetivamente para os resultados finais. / The use of passive UHF RFID tags for indoor location has been widely studied due to its low cost. However, there is still a great difficulty to reach good results, mainly due the radio frequency variation in environments that have materials with reflective surfaces, such as metal and glass. This research proposes a localization architecture for indoor environments using passive UHF RFID tags and data mining techniques. With the application of the architecture in real environment, it was possible to identify the exact position of objects with the precision of approximately five centimeters and in real time. The architecture has demonstrated an efficient alternative for the implantation of indoor localization systems, besides presenting a derivation technique of direct attributes that contributes effectively to the final results.
|
Page generated in 0.114 seconds