Global ETD Search

11	Aplicação do processo de descoberta de conhecimento em banco de dados acadêmico utilizando as tarefas de agrupamento e classificação / Asseiss, Maraísa da Silva Guerra January 2017 (has links) Orientador: Alexandre Cesar Rodrigues da Silva / Resumo: Nos últimos anos a quantidade de dados armazenados diarimente em empresas e instituições aumentou consideravelmente e um dos motivos que contribuiu para isso é a crescente importân- cia dada à informação. De forma geral, esses dados são meramente armazenados e, portanto, subutilizados pelos seus detentores, enquanto poderiam ser estudados a fim de obter novos co- nhecimentos, informações e relacionamentos. Neste contexto, surge o processo de descoberta de conhecimento em banco de dados. Este trabalho apresenta uma introdução a banco de dados, uma revisão bibliográfica sobre o processo de descoberta de conhecimento em banco de dados, a descrição de cada etapa deste processo, uma explanação sobre as tarefas de agrupamento e classificação, além de resumir brevemente as técnicas de particionamento e árvore de decisão. É exposto um estudo sobre o sistema Weka, em que apresenta-se conceitos, funcionalidades e exemplifica-se diversas formas de utilização do sistema. O objetivo principal deste trabalho é propor uma metodologia para descoberta de novos conhecimentos em bancos de dados acadê- micos baseada no processo de descoberta de conhecimento em banco de dados, sendo esta uma metodologia mais simplificada e de execução mais direcionada. Como parte da metodologia este trabalho contribui ainda com uma aplicação desenvolvida em Python como forma de apoio a etapas da metodologia. A metodologia proposta conta com a ferramenta Weka para execução dos algoritmos de data mining e prevê a e... (Resumo completo, clicar acesso eletrônico abaixo) / Mestre Agrupamento Classificação. Descoberta de conhecimento Estudo de caso Metodologia. Data mining Weka
12	Aprendizagem de m?quina em apoio a diagn?stico em ortopedia / Machine learning in support of medical diagnosis orthopedics Silva, Marcelo Cicero Ribeiro da 13 December 2016 (has links) Submitted by SBI Biblioteca Digital (sbi.bibliotecadigital@puc-campinas.edu.br) on 2017-02-01T12:15:41Z No. of bitstreams: 1 Marcelo Cicero Ribeiro da Silva.pdf: 2629636 bytes, checksum: 626dcdd3e190058ed959a36deb2c116f (MD5) / Made available in DSpace on 2017-02-01T12:15:41Z (GMT). No. of bitstreams: 1 Marcelo Cicero Ribeiro da Silva.pdf: 2629636 bytes, checksum: 626dcdd3e190058ed959a36deb2c116f (MD5) Previous issue date: 2016-12-13 / Pontif?cia Universidade Cat?lica de Campinas ? PUC Campinas / One of the major responsible to change in a competitive landscape is the steady progress of technology and communication (TIC). With the evolution of technology and 'machine learning', computers are already available to carry out learning in a sophisticated way, improving the prescriptions of medical diagnosis, generating a second opinion for the medical professional and thus, To provide a better service to the community. The objective of this research is to develop a computational model, supported by data mining using machine learning techniques and, using communication devices integrated with communication and information technologies, to provide efficient support for The medical diagnosis in the area of orthopedics.The proof of the concept of this proposal will be used besed on a public database in the branch of backbone and the specific objective will be assist the doctor in the discovery of the Diseases Olisthesis and Herniated disk. This application will work with the concept of Knowledge Discovery in Databases to achieve the desired result. This process will use the Data Mining that, through classification algorithms, can transform data into useful information to the support the medical professional in the elaboration of diagnosis. The research will explore and define, in the WEKA Data Mining tool, the most appropriate algorithm, among the several that already exist, that can offer the highest diagnostic accuracy and enable a mobile solution. The dynamics structured in this work should allow that system to be enriched for each new patient treated and, with this, the platform becomes more efficient and effective as it expands. It is expected that the consulted computational model can be configured as a second opinion in support of the diagnosis of the medical professional. The results were satisfactory obtaining an average accuracy index above 86%. Among the benefits it is believed that it will be possible to assist in the graduation of new professionals assisting them in the Medical Residency, and reducing problems in possible medical errors thus, increasing the efficiency during the attendance and saving time and money. / Um dos grandes respons?veis pela mudan?a deum panorama competidor ? o progresso constante da tecnologia da informa??o e comunica??o (TIC).A maior parte das dificuldades na tomada de decis?o ? a transforma??o de dados e informa??es em conhecimento, principalmente quando as bases de dados dizem respeito ? sa?de. Com a evolu??o da tecnologia e do ?aprendizado de m?quina?(machine learning), j? se disp?e de computadores capazes de realizar aprendizado de forma sofisticada, permitindo sua utiliza??o no aux?lio nas prescri??es de diagn?stico m?dico, gerando uma segunda opini?o para o profissional da medicina e contribuindo, assim, para uma melhor presta??o de servi?o ? comunidade. O objetivo da pesquisa relatada consiste em elaborar um modelo computacional, apoiado em minera??o de dados com uso de t?cnicas de aprendizado de m?quina, que, utilizando-se de dispositivos de comunica??o integrados ?s tecnologias de comunica??o e informa??o e que venha oferecer suporte eficiente para o diagn?stico m?dico na ?rea de ortopedia. A prova do conceito desta proposta utilizar? de uma base de dados p?blica na especialidade da ortopedia (coluna vertebral) e o objetivo espec?fico ser? o de auxiliar o m?dico na descoberta das doen?as Listese e H?rnia de Disco. Esta aplica??o trabalhou com o conceito de descoberta de conhecimento em bases de dados (Knowledge Discovery in Databases), para conseguir o resultado desejado. Esse processo a Minera??o de Dados que, por meio de algoritmos de classifica??o, poder? transformar dados em informa??es ?teis ao apoio do profissional m?dico na elabora??o do seu diagn?stico. A pesquisa ir? explorar e definir, na ferramenta de Data Mining WEKA, o algoritmo mais apropriado, dentre os v?rios j? existentes, que possa oferecer maior acur?cia no diagn?stico e que viabilize uma solu??o tipo mobile. A din?mica estruturada neste trabalho dever? permitir que o sistema seja enriquecido a cada novo paciente tratado e que, com isto, a plataforma se torne mais eficiente e eficaz ? medida que se amplie. Espera-se que o modelo computacional elaborado possa se configurar como uma segunda opini?o em apoio ao diagn?stico do profissional m?dico retornando o diagnostico do paciente. Os resultados obtidos foram satisfat?rios obtendo um ?ndice de acuracidade m?dia acima de 86%. Dentre os benef?cios acredita-se que ser? poss?vel auxiliar na forma??o de novos profissionais auxiliando-os na Resid?ncia M?dica, na redu??o de problemas decorrentes de erros m?dicos e, dessa forma, aumenta-se a efic?cia no atendimento com ganhos de tempo e dinheiro. CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
13	DDAAV DETECTOR DO DESEMPENHO DO ALUNO EM AVAs / DDAAV DETECTOR PERFORMANCE OF STUDENTS IN VLES Mühlbeier, Andreia Rosangela Kessler 15 April 2014 (has links) Conselho Nacional de Desenvolvimento Científico e Tecnológico / The virtual learning environments (VLEs) are benefited with advances in the use of technologies in education, enabling a more dynamic and meaningful learning. In the face of increased interaction in these environments, greatly increases the amount of data stored. The process of knowledge discovery in database (KDDKnowledge Discovery in Databases) has been used successfully in several areas and in the academic area some results have been used to assist the teachers. This dissertation describes a survey conducted with the steps of KDD, which utilizes the WEKA tool (free data mining software), specifically the J48 algorithm, to apply data mining techniques on the information stored in the database, in order to detect the student performance while running the course. The research scenario was constructed with data from assessments of introduction to media in education, Integration of the specialization course in Media in education, composed of 134 (one hundred and thirty-four) students, distributed in 5 (five) different poles. In this way, with the results obtained in the research, noted that the application of rules of the algorithm, can be a valuable instrument to professor during the execution of the course, and not only a posteriori, because it allows a positive immediate intervention of even in several variables that impact on the success of the apprentice, as type of material, discussions, activities, methodologies and strategies. / Os Ambientes Virtuais de Aprendizagem (AVAs) são beneficiados com os avanços do uso de tecnologias na Educação, possibilitando uma aprendizagem mais dinâmica e significativa. Diante do aumento de interação nestes ambientes, aumenta consideravelmente o volume de dados armazenados. O processo de Descoberta de Conhecimento em Base de Dados (Knowledge Discovery in Databases - KDD) vem sendo utilizado com sucesso em diversas áreas e na área acadêmica alguns resultados têm sido utilizados para auxiliar os professores. A presente dissertação descreve uma pesquisa realizada com as etapas de KDD, que utiliza a ferramenta WEKA (software de mineração de dados livre), em específico o algoritmo J48, para aplicar técnicas de mineração de dados nas informações armazenadas no banco de dados, a fim de detectar o desempenho dos alunos durante a execução do curso. O cenário de investigação foi construído com os dados oriundos das avaliações da disciplina de Introdução à Integração de Mídias na Educação, do Curso de Especialização em Mídias na Educação, composto de 134 (cento e trinta e quatro) alunos, distribuídos em 5 (cinco) polos distintos. Dessa forma, com os resultados obtidos na pesquisa, observou se que a aplicação de regras do algoritmo, pode ser um valioso instrumento ao professor durante a execução do curso, e não apenas a posteriori, pois possibilita uma intervenção positiva imediata do mesmo, nas diversas variáveis que impactam no sucesso do aprendiz, como tipo de material, discussões, atividades, metodologias e estratégia. Desempenho do aluno WEKA Knowledge discovery in database Student performance WEKA
14	Empirické porovnání systémů dobývání znalostí z databází / Empirical comparison of systems for knowledge discovery in databases Benešová, Kristýna January 2008 (has links) S rostoucím množstvím shromažďovaných a ukládaných dat roste také potřeba a zájem majitelů těchto dat o využití jejich potenciálu k dalšímu rozhodování. Proto se vyvíjí nové přístupy a způsoby vycházející z informatiky, statistiky a oblasti strojového učení, které se této potřebě snaží vyhovět. Cílem této diplomové práce je uvést proces dobývání znalostí dat z databází na medicínských datech Tinnitus a představit systémy LISp-Miner a Weka, které daný proces podporují. Obsahem teoretické části diplomové práce je shrnutí základních charakteristik a přístupů procesu dobývání znalostí. Praktická část diplomové práce je věnována realizaci celého procesu v jednotlivých krocích. V samotném kroku modelování jsou využity již zmíněné systémy akademické LISp-Miner a Weka. Poslední část praktické části práce patří prezentaci dosažených výsledků a vlastnímu zhodnocení systémů.
15	Uma implementação paralela do AIRS em Scala / A parallel implementation of AIRS in Scala Salgado, Filipe Ferraz 15 September 2010 (has links) Com o avanço tecnológico dos últimos anos passou a ser normal vermos microprocessadores com múltiplos núcleos (cores). A expectativa é de que o crescimento da quantidade de núcleos passe a ser maior do que o crescimento da velocidade desses núcleos. Assim, além de se preocuparem em otimizar algoritmos sequenciais, os programadores começaram a dar mais atenção às possibilidades de aproveitamento de toda a capacidade oferecida pelos diversos cores. Existem alguns modelos de programação que permitem uma abordagem concorrente. O modelo de programação concorrente mais adotado atualmente é o baseado em threads, que utiliza memória compartilhada e é adotado em Java. Um outro modelo é o baseado em troca de mensagens, no qual as entidades computacionais ativas são denominadas atores. Nesse trabalho, estudamos a linguagem Scala e seu modelo de atores. Além disso, implementamos em Scala uma versão paralela de um algoritmo de classicação que simula o sistema imunológico dos animais, o AIRS paralelo, e comparamos seu desempenho com a versão em Java. / With the technological advance of the last years it has been normal to see microprocessors with multiple cores. The expectation is that the growth of number of cores becomes greater than the growth of the speed of these cores. This way, besides worrying about optimizing sequential algorithms, developers started to give more attention to the possibilities of proting from all capacity offered by the cores. There exists a few programming models that allow a concurrent approach. In these days, the most adopted concurrent programming model is the one based on threads, which uses shared memory and is adopted in Java. Other model is based on message passing, on which the active computational entities are called actors. In this project, we studied Scala language and its model based on actors. Besides that, we implemented in Scala a parallel version of a classification algorithm that simules the immune system of the animals, parallel AIRS, and compared its performance with the Java version. actor AIRS AIRS ator concorrente concurrent functional programming immune imunológico Java Java object oriented programming paralelo parallel programação funcional programação orientada a objetos Scala Scala WEKA. WEKA.
16	Estimação das perdas produtivas em frangos de corte devido ao estresse por calor / Pet loss in broiler production due to heat stress Santos, João Paulo Aquino 25 February 2014 (has links) Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The environmental control of sheds for the broiler chickens production can bring better performance results with the reduction of production losses due to heat, and the variations in climatic events may significantly alter the viability of the production system. The objective of this study was to estimate the production loss due to heat in the broiler production system. This research was carried out through a meta- analysis in which 52 related research were used to heat stress in broiler chickens aged 1-42 days old. The data were processed according to the method of meta- analysis and explored by data mining technique for obtaining decision models to assist in the determination and quantification of production losses in broilers. The results demonstrate that the climatic variables the wet bulb temperature and dry bulb temperature in Celsius degrees and the Temperature- Humidity Index (THI ) is possible to estimate the performance loss of broilers influencing low weight gains and worst feed conversions ratio, with values of 32° C dry bulb temperature, relative humidity above 40 % , wet bulb temperature above 25.51 or 25.77º C and 23.29º C of THI as threshold conditions to potential production losses at 30.99% to feed conversion, 36.54% to weight gain and 52.04% to daily weight gain. / O controle da ambiência de galpões para a produção de frangos de corte pode trazer melhores resultados de desempenho devido à redução das perdas produtivas decorrentes do calor, sendo que as variações nos eventos climáticos podem alterar significativamente a viabilidade do sistema produtivo. O objetivo deste trabalho foi estimar as perdas produtivas relacionadas ao calor no sistema de produção de frangos de corte. Este trabalho foi realizado através de uma meta-analise onde foram utilizados 52 trabalhos relacionados com estresse por calor em frangos de corte com idade de 1 a 42 dias. Os dados foram processados segundo o método da meta-análise e explorados pela técnica de Mineração de Dados para a obtenção de modelos decisórios que auxiliem na determinação e quantificação das perdas produtivas em frangos de corte. Os resultados demonstram que por intermédio das variáveis climáticas temperatura de bulbo úmido, a temperatura do bulbo seco em graus Celsius e o índice de temperatura e umidade (ITU) é possível estimar a perda de desempenho dos frangos de corte influenciando os ganhos de peso baixos e conversões alimentares piores, sendo valores de 32º C da temperatura de bulbo seco, umidade relativa do ar acima de 40%, temperatura de bulbo úmido acima de 25,51 ou 25,77º C e ITU de 23,29º C como condições limite para a ocorrência de perdas produtivas potenciais de até 30,99% para a conversão alimentar, 36,54% no ganho de peso e 52,04% no ganho de peso médio diário. Frangos de corte Meta-análise Mineração de dados Perdas produtivas Weka® Broilers Meta-analysis Data mining Productive losses Weka® CNPQ::CIENCIAS AGRARIAS::ZOOTECNIA
17	Descoberta automatizada de associações com o uso de algoritmo Apriori como técnica de mineração de dados / Automatic discovery of associations by Apriori data mining technique ALMEIDA, Derciley Cunha de 25 February 2011 (has links) Made available in DSpace on 2014-07-29T15:08:17Z (GMT). No. of bitstreams: 1 Dissertacao Derciley Cunha de Almeida.pdf: 2389648 bytes, checksum: c4c207dc1855a4a0e99ee3eeed7c28b9 (MD5) Previous issue date: 2011-02-25 / Nowadays, the use of modern information systems allows the storage and management of increasingly large amounts of data. On the other hand, the full analysis and the maximum extraction of useful information from this universe of available data present considerable challenges in view of inherent human limitations. This dissertation deals with the subject of data mining, which is the use of technology resources in order to extract information from databases in an automated way. One of the possibilities offered by data mining technologies is the automated search for possible associations within data. Information about such associations can be useful for understanding cause and effect relationships between the involved variables in data analysis for decision making. There are several data mining techniques and many of them can be used for discovering associations. The main goal of this work is to study a particular method for automated search of associations called Apriori , evaluating its capabilities and outcomes. The study focuses on the problem of improving the Apriori algorithm results, taking into consideration that the results of the data mining process might be improved if the data are prepared specifically for Apriori application. The conclusions are drawn from a case study in which the Apriori algorithm was applied to a database with information on drug distribution at a health institute. The results of two experiments are considered in order to evaluate the influence of data preprocessing on the Apriori algorithm's performance. It was found that the Apriori algorithm yields satisfactory results on the discovery of association in data; however, for best results, it is advisable that the data be prepared in advance, specifically for the Apriori application, otherwise many associations in the database might be left undiscovered. / Atualmente é possível o armazenamento e o gerenciamento de grandes quantidades de dados, através de modernos sistemas informatizados. Por outro lado, a análise completa e a extração do máximo de informações desse universo de dados disponíveis passaram a ser um grande desafio, diante das limitações próprias de um ser humano. Essa dissertação aborda o tema mineração de dados, também muito conhecido pelo termo em inglês data mining. Trata-se da extração de informações de bases de dados de forma automatizada, com o uso de recursos tecnológicos. Uma das possibilidades que as tecnologias de data mining oferecem é a busca automatizada de possíveis associações existentes entre dados. As informações sobre associações entre dados podem ser muito úteis para se compreender possíveis relações de causa e efeito entre muitas variáveis envolvidas em estudos e análises de dados para tomada de decisões. Há várias técnicas de mineração de dados e muitas podem ser utilizadas para descoberta de associações. O principal objetivo deste trabalho é estudar mais especificamente o método de busca automatizada de associações conhecido como Apriori de forma a avaliar sua sistemática, capacidade e resultados. O estudo é direcionado por um problema que está relacionado à busca pelo aprimoramento dos resultados gerados pelo algoritmo Apriori sob a premissa de que uma preparação de dados específica e direcionada para o uso do algoritmo pode aprimorar os resultados do processo de mineração de dados. As conclusões são extraídas de um estudo de caso sobre a aplicação do algoritmo Apriori em uma base de dados com informações sobre fornecimento de medicamentos de uma unidade de saúde. São avaliados e comparados os resultados de três experimentos para se verificar a influência de uma preparação de dados no desempenho do algoritmo. Ficou evidenciado que o algoritmo Apriori alcança resultados satisfatórios na tarefa de busca por associações entre dados, no entanto, é recomendável uma preparação específica desses dados para que a aplicação do algoritmo alcance melhores resultados ou muitas associações existentes podem não ser encontradas. Mineração de dados Descoberta de associações Apriori Banco de dados WEKA Data mining Association discovery Apriori Databases WEKA CNPQ::ENGENHARIAS
18	Uma implementação paralela do AIRS em Scala / A parallel implementation of AIRS in Scala Filipe Ferraz Salgado 15 September 2010 (has links) Com o avanço tecnológico dos últimos anos passou a ser normal vermos microprocessadores com múltiplos núcleos (cores). A expectativa é de que o crescimento da quantidade de núcleos passe a ser maior do que o crescimento da velocidade desses núcleos. Assim, além de se preocuparem em otimizar algoritmos sequenciais, os programadores começaram a dar mais atenção às possibilidades de aproveitamento de toda a capacidade oferecida pelos diversos cores. Existem alguns modelos de programação que permitem uma abordagem concorrente. O modelo de programação concorrente mais adotado atualmente é o baseado em threads, que utiliza memória compartilhada e é adotado em Java. Um outro modelo é o baseado em troca de mensagens, no qual as entidades computacionais ativas são denominadas atores. Nesse trabalho, estudamos a linguagem Scala e seu modelo de atores. Além disso, implementamos em Scala uma versão paralela de um algoritmo de classicação que simula o sistema imunológico dos animais, o AIRS paralelo, e comparamos seu desempenho com a versão em Java. / With the technological advance of the last years it has been normal to see microprocessors with multiple cores. The expectation is that the growth of number of cores becomes greater than the growth of the speed of these cores. This way, besides worrying about optimizing sequential algorithms, developers started to give more attention to the possibilities of proting from all capacity offered by the cores. There exists a few programming models that allow a concurrent approach. In these days, the most adopted concurrent programming model is the one based on threads, which uses shared memory and is adopted in Java. Other model is based on message passing, on which the active computational entities are called actors. In this project, we studied Scala language and its model based on actors. Besides that, we implemented in Scala a parallel version of a classification algorithm that simules the immune system of the animals, parallel AIRS, and compared its performance with the Java version. AIRS ator concorrente imunológico Java paralelo programação funcional programação orientada a objetos Scala WEKA. actor AIRS concurrent functional programming immune Java object oriented programming parallel Scala WEKA.
19	A Proposed Frequency-Based Feature Selection Method for Cancer Classification Pan, Yi 01 April 2017 (has links) Feature selection method is becoming an essential procedure in data preprocessing step. The feature selection problem can affect the efficiency and accuracy of classification models. Therefore, it also relates to whether a classification model can have a reliable performance. In this study, we compared an original feature selection method and a proposed frequency-based feature selection method with four classification models and three filter-based ranking techniques using a cancer dataset. The proposed method was implemented in WEKA which is an open source software. The performance is evaluated by two evaluation methods: Recall and Receiver Operating Characteristic (ROC). Finally, we found the frequency-based feature selection method performed better than the original ranking method. frequency-based feature selection ranking method WEKA ROC Bioinformatics Computer Sciences Databases and Information Systems
20	EXPLORING IMPACT OF EDUCATIONAL AND ECONOMIC FACTORS ON NATIONAL INTELLECTUAL PRODUCTIVITY USING MACHINE LEARNING METHODS Fazenbaker, Canon 01 January 2009 (has links) The patent process is representative of a nationwide means for innovations and new ideas to be recognized. The U.S. Patents Office, since its inception in 1790, has issued nearly five million patents. These patents span from the U.S. Patent #1, which was for an improvement "in the making of Pot ash and Pearl ash by a new Apparatus and Process" to today's patents which deal with technologies and mediums that were unimaginable at the Patent Offices' inception. The purpose of this study is to determine what social and economic factors at the federal level have the highest impact on national productivity measured by the number of patents applied for and/or granted each year. Using Machine Learning algorithms and predictive analysis on fifty years worth of data to determine what macroeconomic and educational factors have the most impact on patents. The first part of this study describes the methods and algorithms used during this research. The second part of this study discusses the results and what those results reveal about the impact of education and economic factors as they relate to national creativity / intellectual productivity. The goal of this study is to determine what factors affect national intellectual productivity in a given year. This data will be useful for governments, both local and federal, when faced with educational and economic issues. Computer Sciences Physical Sciences and Mathematics

Search results