Global ETD Search

11	Método para apoio à construção de strings de busca em revisões sistemáticas por meio de mineração visual de texto Mergel, Germano Duarte January 2014 (has links) Made available in DSpace on 2015-04-30T14:04:04Z (GMT). No. of bitstreams: 1 000467244-Texto+Completo-0.pdf: 1839473 bytes, checksum: addcf180682b243c0834e784f67d8774 (MD5) Previous issue date: 2014 / Despite the increased popularity of the adoption of Systematic Literature Reviews in Software Engineering, many researchers still indicate it as a costly and challenging process. Studies report problems in different activities throughout the review process, as in the construction of the Systematic Review search string and selection of primary studies. Aiming to promote aid to its realization, tools based on methods and techniques from the Visual Text Mining area are presented in published studies, proposing assistance in various tasks of a Systematic Literature Review. However, it’s perceived a lack of methods proposing to aid a researcher with the construction of the Systematic Review search string, on its planning phase. In this context, this paper proposes an iterative method to assist the process of building the search string for a Systematic Review. Using Visual Text Mining techniques, it supports the researcher by suggesting terms for the search string. Relevant terms are extracted from studies selected by the researcher and shown in a visualization that facilitates the decision of the researcher to update the search string and include them, building and refining the search string that will be used in the Systematic Review. A tool that implements the proposed method has been developed, allowing the execution of tests with researchers and an analysis of the feasibility of this proposal. Interviews with researchers identified the difficulties in performing Systematic Reviews and captured their opinions regarding the use of the proposed method, discussing its adoption. / Apesar do aumento na popularidade da aplicação de Revisões Sistemáticas da Literatura na Engenharia de Software, muitos pesquisadores ainda a apontam como um processo custoso e desafiador. Estudos levantados reportam problemas em diferentes atividades ao longo de seu processo, como na construção da string de busca da Revisão Sistemática e na seleção dos estudos primários. Visando promover um auxílio à sua realização, métodos e ferramentas baseados em técnicas da área de Mineração Visual de Texto são propostas em estudos publicados da área, atuando em diversas etapas de uma Revisão Sistemática da Literatura. É percebida, porém, a ausência de métodos que auxiliem um pesquisador na construção da string de busca de sua Revisão Sistemática, na fase de planejamento da mesma. Neste contexto, o presente trabalho visa qualificar o processo de construção da string de busca de uma Revisão Sistemática, propondo um método iterativo que, aplicando técnicas da Mineração Visual de Texto, apoia o pesquisador através da sugestão de termos relevantes de estudos selecionados. Os termos mais relevantes são extraídos de estudos selecionados e visualizados de forma a facilitar a decisão do pesquisador em incluí-los na string de busca utilizada, construindo e refinando a string de busca que será usada na Revisão Sistemática. Uma ferramenta que implementa o método proposto foi desenvolvida, permitindo que testes com estes mesmos pesquisadores fossem realizados, e que uma análise sobre a viabilidade desta proposta fosse feita. Entrevistas realizadas com pesquisadores identificaram as dificuldades enfrentadas na realização de Revisões Sistemáticas e captaram suas opiniões a respeito da utilização do método proposto como solução. INFORMÁTICA ENGENHARIA DE SOFTWARE MINERAÇÃO DE DADOS (INFORMÁTICA)
12	Uso de agrupamento de interesse e trajetória para caracterização de sessões de aprendizado Nichele, Caren Moraes January 2006 (has links) Made available in DSpace on 2013-08-07T18:42:18Z (GMT). No. of bitstreams: 1 000406064-Texto+Completo-0.pdf: 2136241 bytes, checksum: 1ec360a68cfe28f759f1832832dffb38 (MD5) Previous issue date: 2006 / The Web Usage Mining (WUM) applies data mining techniques to discover web usage patterns from Web server logs. The WUM process is composed by three major phases: pre-processing (where data is collected, cleaned and transformed), pattern discovery (in which mining algorithms are applied), and pattern analysis (where resulting patterns are analyzed). The categorization of visitor’s behavior based on their interaction in the web site is a key issue in WUM. In the E-learning area this topic becomes more relevant due to the lack of face-to-face contact between students and professors, given the physical distance, as well as the semantical gap between URLs and corresponding application events. Clustering, which subject of this research, is a mining technique that aims at grouping objects on basis of high inter-group similarity and low inter-group similarity. Several works leverage clustering techniques with the purpose of characterizing web user behavior during navigation. However, most of the works do not consider the meaning of visited URLs in the application domain, when measuring similarity between web sessions. Page semantics is frequently considered in the pre-processing phase, in data enrichment tasks, in which URLs are mapped into domain concepts. This approach is static in the sense that a new perspective of a URL (e. g. more generalized concept), to obtain better clustering results, often implies re-processing data. In addition to that, the correct clustering technique execution is a complex task which includes data preparation and transformation according to the mining objectives in such way interesting patterns can be found. Considering these problems, this research proposes a clustering mechanism and an interpretation mechanism as a way to characterize student’s behavior in a Web course. These mechanisms aim make the clustering technique execution and group analysis easy to a non data mining expert person. The proposed mechanisms are based in a domain taxonomy representing the domain events for addressing the semantic gap between URLs and application events. The clustering mechanism considers the similarity between visited pages as a way to improve the quality of clustering results. The proposed interpretation mechanism allows visualize the characteristics for each group, according to the clustering objective, as well as inspects groups dynamically considering the different levels of abstraction for application events in the domain taxonomy. These mechanisms establish the basis for categorization of web user behavior, for which a prototype was developed. / Um dos principais problemas evidenciados no domínio da Educação a Distância (EAD) é a falta de percepção que os instrutores de cursos Web têm quanto à interação dos alunos durante o processo de aprendizado. Este problema é mais fortemente evidenciado no ambiente da EAD devido ao pouco contato entre os instrutores e os alunos, dadas as limitações dos ca°nais de comunicação, e à falta de semântica no registro das páginas acessadas, em relação ao seu significado no domínio da aplicação. A Mineração do Uso da Web (MUW) oferece técnicas de mineração de dados que permitem descobrir padrões de utilização da Web para melhor entender e servir as necessidades das aplicações. O processo de MUW é composto de etapas, a saber: préprocessamento, descoberta de padrões e análise de padrões. Várias técnicas podem ser aplicadas na etapa de descoberta de padrões. A técnica de agrupamento, foco deste trabalho, destaca-se por agregar valor nesta questão, pois tende a estabelecer grupos de usuários que mostram padrões de comportamento semelhantes. O agrupamento de sessões Web tem impulsionado uma grande área de pesquisa que visa caracterizar os usuários com base na navegação na Web. Porém, nenhum trabalho foi encontrado que aborde a similaridade entre as páginas considerando a semântica dos eventos da aplicação quando computando a similaridade entre as sessões Web. Além disso, a correta aplicação da técnica de agrupamento é uma tarefa complexa que envolve desde a preparação dos dados até a escolha do algoritmo de agrupamento, além de estar fortemente associada à complexidade do processo de descoberta de conhecimento. Dados os problemas identificados, este trabalho propõe mecanismos de agrupamento e de interpretação de padrões que facilitem, respectivamente, a aplicação da técnica de agrupamento e a análise dos grupos por pessoas leigas, visando auxiliar na caracterização das sessões de aprendizado em um ambiente de EAD. Estes mecanismos fazem uso de uma taxonomia como forma de agregar semântica aos eventos do domínio, reduzindo assim a necessidade de retorno à etapa de pré-processamento. O mecanismo de agrupamento proposto visa facilitar a aplicação da técnica de agrupamento e aumentar a qualidade dos grupos, considerando para isso a similaridade entre as páginas com base na semântica dos eventos do domínio. O mecanismo de interpretação proposto permite representar os grupos visualmente, de modo condizente com o objetivo do agrupamento, bem como inspecionar dinamicamente os grupos formados considerando os diferentes níveis de abstração das páginas no domínio da aplicação. Foi desenvolvido um ambiente de apoio para auxiliar o intrutor durante a execução das etapas da MUW visando a facilitar a aplicação do agrupamento e a análise das sessões de aprendizado. INFORMÁTICA MINERAÇÃO DE DADOS (INFORMÁTICA) WORLD WIDE WEB
13	Seleção eficiente de conformações de receptor flexível em simulações de docagem molecular Machado, Karina dos Santos January 2011 (has links) Made available in DSpace on 2013-08-07T18:42:55Z (GMT). No. of bitstreams: 1 000432221-Texto+Completo-0.pdf: 7126072 bytes, checksum: 4f9458bc22424532f20fd0c85208b5c7 (MD5) Previous issue date: 2011 / Drug Development is one of the biggest challenges of current science since it deals with a process involving time and high costs. One of the most interesting problems in this area is the conformation and energy prediction between ligand and target proteins (or receptors) interaction, where such interaction is evaluated through molecular docking. It is very common to make simplifications such as to treat the receptor structure as rigid during a molecular docking. However, proteins are inherently flexible, and its flexibility is essential for its function. The inclusion of receptor flexibility in docking experiments is not a trivial task, since the allowance of mobility to some receptor atoms implies in an exponential increase in the numbers of degrees of freedom to be considered. Nowadays there are a variety of alternatives to treat this problem, as such the one chosen for this work: to consider the receptors explicit flexibility through a series of molecular docking simulations, using in each one, one different conformation (or snapshot) from a dynamic trajectory, generated by a molecular dynamic simulation (MD). This method execution, however, has the disadvantage of being very time-consuming. In doing so, the aim of this work is to contribute to the selection of receptors conformations in order to execute docking experiments faster, still taking into account the fully receptors flexibility. Besides, this work introduces new methodologies to analyze receptor-ligand interaction in this kind of docking simulations. To achieve this, it is applied a Knowledge Discovery in Databases (KDD) process. The first step required the development of a database, called FReDD. Such a database store detailed information about the receptors and its conformations, ligands and molecular docking results. From the data stored on FReDD, it was possible to apply different data mining techniques. The first set of experiments was performed with the J48 classification algorithm. The second one was executed using M5P regression algorithm, where despite the interesting results, the application of the induced models directly on snapshot selection seems to be not promising. Finally, clustering experiments were executed with 10 different algorithms with a variety of inputs. For these clustering algorithms, we developed different similarity functions where the final results, combined with the P-MIA data pattern, allowed the effective reduction in the amount of docking experiments to be performed. / O desenvolvimento de fármacos é um dos grandes desafios da ciência atual por se tratar de um processo onde os custos e o tempo envolvido são elevados. Um dos problemas mais interessantes nessa área é a predição da conformação e da energia envolvida na interação entre ligantes e suas proteínas-alvo ou receptores. É nos experimentos de docagem molecular que essa interação é avaliada. É muito comum que durante a docagem molecular se façam simplificações onde o receptor é tratado como rígido. Porém, proteínas são inerentemente sistemas flexíveis e essa flexibilidade é essencial para a sua função. A inclusão da flexibilidade do receptor em experimentos de docagem molecular não é uma tarefa trivial, pois, para permitir mobilidade a certos átomos do receptor, há um aumento exponencial do número de graus de liberdade a serem considerados. Há atualmente diversas alternativas para contornar esse problema, entre elas, a que se optou neste trabalho: considerar a flexibilidade explícita do receptor por meio da execução de uma série de simulações de docagem molecular, utilizando em cada um deles uma conformação diferente da trajetória dinâmica do receptor, gerada por uma simulação por dinâmica molecular (DM). Um dos maiores problemas desse método é o tempo necessário para executá-lo. Sendo assim, o objetivo desse trabalho é contribuir para a seleção de conformações do receptor de forma a acelerar a execução de experimentos de docagem molecular com o receptor completamente flexível. Além do mais, o trabalho apresenta novas metodologias para a análise da interação receptor-ligante em simulações de docagem deste tipo. Para alcançar esses objetivos, é aplicado um processo de descoberta de conhecimento.A primeira etapa consistiu no desenvolvimento de um banco de dados para armazenar informações detalhadas sobre o receptor e suas conformações, ligantes e experimentos de docagem molecular, chamado FReDD. Com os dados organizados no FReDD, foi possível a aplicação de diferentes técnicas de mineração de dados. O primeiro conjunto de experimentos foi realizado utilizando o algoritmo de classificação J48. O segundo conjunto de experimentos foi executado com o algoritmo de regressão M5P, onde apesar de resultados interessantes, a utilização direta para seleção de conformações em futuros experimentos de docagem molecular não se mostrou promissora. Finalmente, foram executados os experimentos de agrupamento com 10 diferentes algoritmos, com entradas variadas. Para os algoritmos de agrupamento foram desenvolvidas diferentes funções de similaridade onde os resultados finais utilizados em conjunto com o padrão de dados P-MIA permitiu a redução efetiva da quantidade de experimentos de docagem. INFORMÁTICA BIOLOGIA COMPUTACIONAL MINERAÇÃO DE DADOS (INFORMÁTICA) BIOLOGIA MOLECULAR BANCO DE DADOS
14	Uma arquitetura para suporte à mineração de dados paralela e distribuída em ambientes de computação de alto desempenho Bernardi, Élder Francisco Fontana January 2010 (has links) Made available in DSpace on 2013-08-07T18:42:56Z (GMT). No. of bitstreams: 1 000431852-Texto+Completo-0.pdf: 1120851 bytes, checksum: 164e0d72a540ab33502e807a748407b1 (MD5) Previous issue date: 2010 / In this paper, we present an architecture to support the execution of data mining applications on high performance computing environments such as clusters, SMP and grids. This architecture automates the process of parallel applications sizing, presenting tools for automatic construction of parallel tasks, automatic scheduling, managing and execution of these applications on high performance computing environments. The mechanisms created for executing mining applications make it possible to explore both data and instruction parallelism. The main contributions of this work are the organization of the proposed architecture and the creation of an algorithm for mapping parallel data mining applications on heterogeneous computational environments. The support of multi-core resources is taken on account. Furthermore, we present the parallelization of a data mining algorithm for regression. / Este trabalho apresenta uma arquitetura para suporte à execução de tarefas de mineração de dados em ambientes de computação de alto desempenho, tais como: clusters, máquinas SMP e grades. Esta arquitetura automatiza o processo de dimensionamento da aplicação paralela, criando ferramentas para a construção automática de tarefas, mapeamento, gerência e execução dessas aplicações nos recursos computacionais disponíveis. Os mecanismos criados para a execução de aplicações de mineração possibilitam a combinação do paralelismo do fluxo de dados e de instruções. Como contribuição do trabalho, destaca-se a organização da arquitetura proposta e a criação de um algoritmo para mapeamento de aplicações de mineração paralelas em ambientes computacionais heterogêneos. Enfatiza-se o suporte ao aproveitamento de recursos com múltiplos núcleos de processamento (multi-cores). Além disso, apresenta-se a paralelização de um algoritmo de mineração de dados para regressão. INFORMÁTICA MINERAÇÃO DE DADOS (INFORMÁTICA) ARQUITETURA DE COMPUTADOR
15	Gestão de métricas e indicadores de doenças em saúde bucal suportado por um ambiente de descoberta de conhecimento em banco de dados Blomberg, Luciano Costa January 2010 (has links) Made available in DSpace on 2013-08-07T18:43:37Z (GMT). No. of bitstreams: 1 000423037-Texto+Completo-0.pdf: 1478944 bytes, checksum: d2974fba2b6145147b3c83b7003075fb (MD5) Previous issue date: 2010 / Although the last epidemiological survey (BRAZIL, 2006) reveal a significant improvement in oral health status of the Brazilian population in the last two decades, oral diseases still require large financial investments by the federal government. This study aims to develop and document a computational approach (Knowledge Discovery in Database Process) capable of managing large volumes of data and producing more comprehensible models to support the decision making process and the formulation of improved oral health policies, as well as making new teaching and research activities in the area viable. Therefore, we analyze a sample of data concerning the dental records of 598 low-income patients, treated with one unit of PUCRS linked to the SUS (Unified Health System). The main result of this work, we identified opportunities for data mining for the extraction of predictive models applied to the analysis of periodontal diseases, malocclusion and indicators of dental caries. / Embora o último levantamento epidemiológico (BRASIL, 2006) revele uma sensível melhora na condição bucal da população brasileira nas últimas duas décadas, patologias bucais ainda demandam grandes investimentos financeiros por parte do governo federal. Este trabalho tem como objetivo desenvolver e documentar uma abordagem computacional (Knowledge Discovery in Database) capaz de gerenciar grandes volumes de dados e produzir modelos mais compreensíveis para o suporte à tomada de decisão, formulação de melhores políticas de saúde bucal, bem como a viabilização de novas atividades de ensino e pesquisa na área. Para tanto, analisamos uma amostra de dados referente às fichas odontológicas de 598 pacientes de baixa renda, atendidos junto a uma unidade da PUCRS vinculada ao SUS (Sistema Único de Saúde). Como principal resultado deste trabalho, identificamos oportunidades de data mining pela extração de modelos preditivos aplicados à análise de patologias periodontais, má-oclusão e indicadores de cárie dentária. INFORMÁTICA BANCO DE DADOS MINERAÇÃO DE DADOS (INFORMÁTICA) DATA WAREHOUSE
16	3D-Tri: um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor Winck, Ana Trindade January 2012 (has links) Made available in DSpace on 2013-08-07T18:43:30Z (GMT). No. of bitstreams: 1 000436381-Texto+Completo-0.pdf: 5238803 bytes, checksum: ca22d61f2fb4075e277ed531aee231ce (MD5) Previous issue date: 2012 / With the growth of biological experiments, solving and analyzing the massive amount of data being generated has been one of the challenges in bioinformatics, where one important research area is the rational drug design (RDD). The interaction between biological macromolecules called receptors, and small molecules called ligands, is the fundamental principle of RDD. In in-silico molecular docking experiments it is investigated the best bind and conformation of a ligand into a receptor. A docking result can be discriminated by a continue value called Free Energy of Binding (FEB). We are attempting on mining data from molecular docking results, aiming at selecting promising receptor conformations to the next docking experiments. In this sense, we have developed a comprehensive repository to store our molecular docking data. Having such repository, we were able to apply preprocessing strategies on the stored data and submit them to different data mining tasks. Among the techniques applied, the most promising results were obtained with regression model trees. Although we have already addressed important issues and achieved significant results, there are some properties in these experiments turning it difficult to properly select conformations. Hence, a strategy was proposed considering the three-dimensional (3D) properties of the receptor conformations, to predict FEB. This thesis presents the 3D-Tri, a novel algorithm able to handle and treat spatial coordinates in a x, y,z format, and induce a tree that predicts FEB value by representing such properties. The algorithm uses such coordinates to split a node in two parts, where the edges evaluate whether the atom being tested by the node is part of a given interval [(xi, xf );(yi, yf );(zi, zf )], where i indicates the initial position of the coordinate, and f its final position. The induced model can help a domain specialist to select promising conformations, based on the region of the atoms in the model, to perform new molecular docking experiments. / Com o avanço nos experimentos biológicos, a manipulação e análise do grande volume de dados sendo gerados por esses experimentos têm sido um dos desafios em bioinformática, onde uma importante área de pesquisa é o desenho racional de fármacos (RDD - Rational Drug Desing). A interação entre macromoléculas biológicas, chamadas de receptores, e pequenas moléculas, chamadas ligantes, é o princípio fundamental do RDD. É em experimentos in silico de docagem molecular que se investiga o melhor encaixe e conformação de um ligante em uma cavidade do receptor. O resultado de um experimento de docagem pode ser avaliado a partir de um valor contínuo de energia livre de ligação (FEB - Free Energy of Binding). Tem-se empregado esforços em minerar dados de resultados de docagem molecular, com o objetivo de selecionar conformações relevantes para reduzir o tempo de futuros experimentos de docagem. Nesse sentido, foi desenvolvido um repositório para armazenar todos os dados a respeito desses experimentos, em nível de detalhe. Com esse repositório, os dados foram devidamente pré-processados e submetidos a diferentes tarefas de mineração de dados. Dentre as técnicas aplicadas, a que apresentou-se mais promissora para o tipo de dados sendo utilizado foi árvore de decisão para regressão. Apesar dos resultados alcançados por esses experimentos serem promissores, existem algumas propriedades nos experimentos que dificultam a efetiva seleção de conformações. Dessa forma, propõe-se uma estratégia que considera as propriedades tridimensionais (3D) do receptor para predizer o valor de FEB. Assim, nesta Tese é apresentado o 3D-Tri, um algoritmo de indução de árvore de regressão que considera essas propriedades 3D, onde essas propriedades são definidas como atributos no formato x, y,z. O algoritmo proposto faz uso dessas coordenadas para dividir um nodo em duas partes, onde o átomo sendo testado para o nodo é avaliado em termos de sua posição em um bloco [(xi, xf );(yi, yf );(zi, zf )] que melhor represente sua posição no espaço, onde i indica a posição inicial de uma coordenada, e f indica a posição final. O modelo induzido pode ser útil para um especialista de domínio para selecionar conformações promissoras do receptor, tendo como base as regiões dos átomos que aparecem no modelo e que indicam melhores valores de FEB. INFORMÁTICA BIOLOGIA COMPUTACIONAL MINERAÇÃO DE DADOS (INFORMÁTICA) DINÂMICA MOLECULAR
17	Algoritmos genéticos para seleção de atributos em problemas de classificação de processos de negócio Basgalupp, Márcio Porto January 2007 (has links) Made available in DSpace on 2013-08-07T18:43:30Z (GMT). No. of bitstreams: 1 000399894-Texto+Completo-0.pdf: 2578031 bytes, checksum: 13c49dacd5dde6e8b24f2ef51ae6b87a (MD5) Previous issue date: 2007 / A business process defines a set of activities along with their possible execution flows and their necessary resources. Business Intelligence (BI) projects have been show the importance of the data mining techniques to analysis, prediction and optimization of business processes. One of the most important data mining’s tasks is classification, which aims, by a training dataset or a set of training instances, the induction of a predictive model capable to associate each instance to its respective class or category. In the business process context, the aim of classification task is to understand the causes of certain behaviors and to generate models to predict the behavior and performance of these processes. Practical problem in pattern classification and knowledge discovery tasks require the selection of predictive attribute sets in order to represent the patterns which will be classified. This is because the presence of irrelevant and redundant attributes may damage the quality of classification models. When leading with business processes classification, it is recommended the use of feature selection, due to the large possible amount of attributes may be necessary to characterize a process. In addition to the attributes that are directly related to the process, it must also considered other attributes related to each process activity. Thus, this work aims the use of multiobjective genetic algorithms for feature selection upon business processes’ classification problems. The obtained results were satisfactory, considering that the criteria aimed to be optimized were improved. Specific business process domain problems were detected. These problems appears due to the presence of alternative paths and execution order of the processes flow tasks. Although those problems are not considered in the present work, we presented possible solutions to be adopted in future studies. / Um processo de negócio define um conjunto de atividades junto com os seus possíveis fluxos de execução e recursos necessários. Trabalhos da área de Business Intelligence (BI) têm destacado o papel da mineração de dados como instrumento facilitador da análise, previsão e otimização de processos de negócio. Uma das tarefas mais utilizadas da mineração de dados é a classificação, cujo objetivo é, dado um conjunto de dados ou instâncias de treino, induzir um modelo preditivo capaz de associar a cada instância sua classe ou categoria. Espera-se que este modelo seja bem sucedido na classificação de novas instâncias. No contexto de processos de negócio, o uso da classificação tem como objetivo entender as causas de determinados comportamentos e gerar modelos de predição do comportamento e do desempenho dos processos. Problemas práticos de classificação de padrões e descoberta de conhecimento requerem a seleção de subconjuntos de atributos preditivos para representar os padrões a serem classificados, pois a presença de atributos preditivos irrelevantes, redundantes ou em grande quantidade pode prejudicar a qualidade do modelo de classificação. Em classificação de processos de negócio, é bastante interessante a utilização de seleção de atributos, visto que a quantidade de atributos que caracterizam um processo pode ser enorme. Além dos atributos diretamente relacionados a uma instância de processo, também devem ser considerados os atributos pertencentes às atividades contidas neste processo. Assim, este trabalho propõe a utilização de algoritmos genéticos multiobjetivos para seleção de atributos em problemas de classificação de processos de negócio. Os resultados obtidos foram considerados satisfatórios, visto que os critérios utilizados na função de fitness, ou seja, os critérios a serem otimizados, foram melhorados. Problemas específicos do domínio de processos de negócio foram detectados. Esses problemas surgem em virtude da presença de caminhos alternativos e ordem de execução das atividades nos fluxos de processos. Embora tais problemas não sejam tratados no presente trabalho, são apresentadas possíveis soluções a serem abordadas em trabalhos futuros. INFORMÁTICA ALGORITMOS GENÉTICOS PROCESSOS DE NEGÓCIO MINERAÇÃO DE DADOS (INFORMÁTICA)
18	Metodologia de mineração de dados para detecção de desvio de comportamento do uso de energia em concessionária de energia elétrica Minussi, Marlon Mendes January 2008 (has links) Made available in DSpace on 2013-08-07T18:52:59Z (GMT). No. of bitstreams: 1 000405417-Texto+Completo-0.pdf: 1389351 bytes, checksum: 6f00a0ed9add46a5b7f8106681a81fdd (MD5) Previous issue date: 2008 / With opening of the market of electric energy and increased competitiveness in the Brazilian electric sector, the energy companies seek tools to minimize losses and maximize their commercial profits. In order to have a balance it was developed a data mining method to discover the bad user behavior of the use of energy in electrical energy company. The less is lost, less needs to be generated and less natural resources are wasted. Stages of review and evaluation of data, as well as construction of a Data Warehouse more appropriate for the development of this work were accomplished. Customers Load curves were analyzed and through this analysis there was the profile of consumption of these customers and through this analysis the data mining algorithms are applied. The association algorithm provides indicators pattems of consumers profile besides a decision tree and Bayesianos Classifyings. The results validate the developed and implemented method allowing their use in an electric energy company being used as another tool for GLD to help and add to the existing actions in the company. / Com abertura do mercado de energia elétrica e o aumento da competitividade no setor elétrico brasileiro, as concessionárias de energia buscam ferramentas para minimizar as perdas comerciais e maximizar seus lucros. Visando solucionar este problema foi desenvolvido um método de mineração de dados para detecção de desvio de comportamento no uso de energia em concessionária de energia elétrica. Pois quanto menos perde-se, menos precisa ser gerado, e menos se desperdiça recursos naturais. Na elaboração do método compreendeu etapas de análise e avaliação dos dados, assim como construção de um Data Warehouse mais adequado para o desenvolvimento deste trabalho. Foram analisadas curvas de cargas dos clientes e através dessa análise observou-se o perfil de consumo dos mesmos, embasados na análise foram aplicados os algoritmos de mineração de dados, como o algoritmo de associação Apriori para fornecer padrões de indicadores de perfil dos consumidores bem como os algoritmos de Árvore de Decisão e Classificadores Bayesianos. Os resultados validam o método desenvolvido e implementado permitindo sua utilização em uma concessionária de energia elétrica sendo utilizado como mais uma ferramenta de GLD para auxiliar e somar-se a ações já existentes na concessionária. MINERAÇÃO DE DADOS (INFORMÁTICA) DATA WAREHOUSE BANCO DE DADOS ENERGIA ELÉTRICA - CONTROLE
19	Solução de auxílio ao diagnóstico e à pesquisa médica baseada em mineração de dados utilizando interface android Chimieski, Bruno Fernandes January 2013 (has links) Made available in DSpace on 2013-08-07T18:53:29Z (GMT). No. of bitstreams: 1 000445055-Texto+Completo-0.pdf: 5786647 bytes, checksum: cdcdc51bf8f86cf0c8bce837ef82e984 (MD5) Previous issue date: 2013 / Since the primary studies on the applications of Information Technology aiming to add value to other areas of knowledge, the playing eld of medicine has always been seen as fertile ground for such. With the advent of Arti cial Intelligence techniques, computer programs have been given a power of learning more sophisticated and thus opening the possibility of its use beyond the hospital administrative processes, drawing ever closer to the provision of patient care. Therefore, this paper proposes to demonstrate the feasibility of an aid to medical diagnosis and obtaining implicit knowledge in databases of three diseases: breast cancer, dermatology and vertebral column problems. To do so, is applied the process of extracting knowledge from databases in order to achieve these goals. This process has Data Mining as its core, which in turn relies on machine learning algorithms to transform data, sometimes not analyzed, in useful information for business referred to, in this case about health care. Therefore, this work presents a study aided by the tool Weka, to determine which machine learning algorithms perform best when applied to target databases. With these algorithms in hand, is implemented a solution to aid the diagnosis and study of medical applications making use of Android as interface for healthcare professionals, with it, utilizing what is most modern in terms of mobile electronic devices in the world market. The results were quite satisfactory, given that the objectives for the study on the determination of Data Mining algorithms, preparation of databases for future research and implementation of the solution for the diagnosis have been met and, together, prove that you can apply tools of information technology to add value to medical practice. / Desde os estudos primordiais sobre as aplicações da Tecnologia da Informação objetivando agregar valor a outras areas do conhecimento, o campo de atuação da Medicina sempre foi visto como terreno fértil para tal. Com o advento das técnicas de Inteligência Artificial, os programas de computador passaram a ter um poderio de aprendizagem mais sofisticado e, portanto, abrindo a possibilidade da sua utilização além dos processos administrativos hospitalares, chegando cada vez mais próximo da prestação de cuidados aos pacientes. Por isso, a presente dissertação propõe-se a demonstrar a viabilidade de uma solução de auxílio ao diagnóstico médico e a obtenção de conhecimento implícito em bases de dados de três doenças: tumor de mama, problemas dermatológicos e da coluna vertebral. Para tanto, aplica-se o processo de extração de conhecimento de bases de dados afim de atingir esses objetivos. Esse processo tem como cerne o uso da Mineração de Dados, que por sua vez, apoia-se nos algoritmos de aprendizado de máquina para transformar dados em informações úteis para os negócios a que se referem. Por isso, esse trabalho apresenta um estudo, auxiliado pela ferramenta Weka, para a determinação de quais os algoritmos de aprendizado de máquina apresentam melhor desempenho quando aplicados as bases de dados alvo .Com esses algoritmos em mãos, implementou-se uma solução de auxilio ao diagnóstico e estudo médico fazendo uso de aplicativos Android como interface de utilização para os profissionais de saúde, com isso, utilizando o que há de mais moderno em termos de dispositivos eletrônicos móveis no mercado mundial. Os resultados foram bastante satisfatórios, dado que os objetivos traçados referentes ao estudo sobre a determinação de algoritmos de Mineração de Dados, a preparação das bases de dados para futuras pesquisas e a implementação da solução de auxílio ao diagnóstico foram atingidos e, em conjunto, comprovam que e possível aplicar ferramentas da Tecnologia da Informação para agregar valor a prática médica. INFORMÁTICA MINERAÇÃO DE DADOS (INFORMÁTICA) ALGORITMOS DE CLASSIFICAÇÃO E BUSCA TECNOLOGIA DA INFORMAÇÃO
20	Processo de indução e ranqueamento de árvores de decisão sobre modelos OLAP Colares, Peterson Fernandes January 2011 (has links) Made available in DSpace on 2013-08-07T18:42:31Z (GMT). No. of bitstreams: 1 000437994-Texto+Completo-0.pdf: 1640213 bytes, checksum: 26f32168808fae3383c6bd3a3b9c87fc (MD5) Previous issue date: 2011 / Organizations acting on several markets have been using the benefits offered by the use of Data Mining - DM techniques as a complementary activity to their support systems to the strategic decision. However, to the great majority of the organizations, the deployment of a DM Project ends up not being feasible due to different factors, such as: Project duration, high costs and mainly by the uncertainty as to getting results that may effectively help the organization to improve their business processes. In this context, this paper presents a process based on the process of knowledge Discovery in Database - KDD which aims to identify opportunities to the application of DM techniques through the induction and ranking of decisions generated by the exploration of semi automatic Online Analytical Processing Models-OLAP. The built process uses stored information in a OLAP model prepared on the basis of used information by Customer Relationship Management - CRM and Business Intelligence - BI typically used by the organization to support strategic decision making. In relation to the information selected for this research, it has been carried out in a semi automatic way, a series of experiments using DM techniques which the results are collected and stored for later evaluation and ranking. The process was built and tested with a significant number of experiments and later evaluated by business experts in a large financial institution where this research was developed. / Organizações atuantes nos mais diferentes mercados, têm utilizado os benefícios oferecidos pela utilização de técnicas de Data Mining – DM como atividades complementares a seus sistemas de apoio a decisão estratégica. Porém, para a grande maioria das organizações, a implantação de um projeto de DM acaba sendo inviabilizada em função de diferentes fatores como: duração do projeto, custos elevados e principalmente pela incerteza quanto à obtenção de resultados que possam auxiliar de fato a organização a melhorar seus processos de negócio. Neste contexto, este trabalho apresenta um processo, baseado no processo de Knowledge Discovery in Database – KDD, que visa identificar oportunidades para aplicação de técnicas de DM através da indução e ranqueamento de árvores de decisão geradas pela exploração semiautomática de modelos On-Line Analytical Processing - OLAP. O processo construído utiliza informações armazenadas em um modelo OLAP preparado com base nas informações utilizadas por sistemas de Customer Relationship Management - CRM e Business Intelligence – BI, tipicamente utilizados por organizações no apoio a tomada de decisão estratégica. Neste trabalho é apresentada uma série de experimentos, gerados de forma semiautomática, utilizando técnicas de DM, cujos resultados são coletados e armazenados para posterior avaliação e ranqueamento. O processo foi construído e testado com um conjunto significativo de experimentos e posteriormente avaliado por especialistas de negócio em uma instituição financeira de grande porte onde esta pesquisa foi desenvolvida. INFORMÁTICA MINERAÇÃO DE DADOS (INFORMÁTICA) DATA WAREHOUSE SISTEMAS DE INFORMAÇÃO

Search results