• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 591
  • 18
  • 18
  • 13
  • 13
  • 12
  • 12
  • 9
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 629
  • 629
  • 376
  • 373
  • 243
  • 110
  • 104
  • 104
  • 103
  • 102
  • 90
  • 89
  • 87
  • 81
  • 67
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
231

Aprendizado supervisionado incremental de Redes Bayesianas para mineração de dados.

Yoshida, Murilo Lacerda 29 August 2007 (has links)
Made available in DSpace on 2016-06-02T19:05:25Z (GMT). No. of bitstreams: 1 DissMLY.pdf: 1150965 bytes, checksum: b52b13360fef92e8f025d95e6667d557 (MD5) Previous issue date: 2007-08-29 / The objective of this work is to introduce two algorithms for supervised Bayesian network incremental learning, AIP (Algorithm for simple Bayesian network numerical parameters supervised incremental learning) and ABC (Algorithm for Bayesian network supervised incremental learning in layers). In order to develop these algorithms we studied relevant works about the Bayesian networks concepts, the algorithms for supervised Bayesian network learning and the algorithms for incremental supervised Bayesian network learning. To improve the performance of the ABC algorithm, we studied the AD-Tree structure and implemented it on the algorithm. To measure the quality of the networks learned by the algorithms we used these networks learnt to classify a test set, resulting in the correct classification rate (ICC). To do that we studied the test set classification process and the propagation of evidences along the Bayesian network. The result of the studies is described on this work, along with the results and discussions about the experiments made with the introduced algorithms. / Esse trabalho tem como objetivo propor dois algoritmos para aprendizado incremental supervisionado de redes Bayesianas, o AIP (Aprendizado Incremental ingênuo de Parâmetros) e o ABC (Aprendizado Bayesiano em Camadas). Para isso se pesquisou conceitos teóricos de redes Bayesianas, algoritmos de aprendizado de redes Bayesianas e métodos de aprendizado incremental de redes Bayesianas relevantes na literatura. Para melhorar o desempenho do aprendizado incremental se pesquisou uma estrutura de representação de conhecimento chamada AD-Tree. Para aferir a qualidade das redes Bayesianas produzidas se utilizou essas redes para classificar conjuntos de teste, obtendo assim o índice de classificação correta (ICC). Foi pesquisado o processo de classificação de conjuntos de teste e o processo de propagação de evidências. O resultado dessas pesquisas está descrito no trabalho, junto com os resultados e discussões sobre os experimentos feitos com os algoritmos propostos.
232

A seleção de atributos e o aprendizado supervisionado de redes bayesianas no contexto da mineração de dados

Galvão, Sebastian David Carvalho de Oliveira 29 October 2007 (has links)
Made available in DSpace on 2016-06-02T19:05:28Z (GMT). No. of bitstreams: 1 1698.pdf: 1287729 bytes, checksum: 3b1a05110798861ad7e42fd67b1694d6 (MD5) Previous issue date: 2007-10-29 / Universidade Federal de Minas Gerais / The Knowledge Discovery in Databases (KDD) techniques have grown from the need for obtain more information about the data stored by organizations, such as, enterprise companies and research institutes. Bayesian Networks (BNs) can be considered as a probabilistic reasoning based model to represent knowledge and are very adequate to KDD tasks. In the last years, Bayesian Networks (BNs) have been applied in many supervised and unsupervised learning successful applications. The process to induce BNs and Bayesian Classifiers (BCs) from data tries do identify a BN (or a BC) able to represent the relationship among the variables of a certain data set. However, this is a NP-complete problem and, thus, its search space may become very large in most applications. That is the reason why many algorithms explore some way to reduce the search space in order to make the learning process computationally viable. In this master s thesis a new Conditional Independence based approach to induce BCs from data is proposed and implemented. Such approach is based on the Markov Blanket concept in order to impose some constraints and optimize the traditional PC learning algorithm. Experiments performed with ten data sets revealed that the proposed approach tends to execute fewer comparisons than the traditional PC. The experiments also show that the implemented algorithm produce competitive classification rates when compared with both, PC and NaiveBayes / As técnicas de Descoberta de Conhecimento em Bancos de Dados (KDD), também chamadas de Mineração de Dados, surgiram da grande necessidade de se obter mais informação sobre os dados armazenados por organizações, como empresas, grandes corporações e instituições de pesquisa. As Redes Bayesianas (RBs) podem ser consideradas como uma forma de representação do conhecimento baseada no raciocínio probabilístico e possuem características que as tornam muito adequadas para tarefas de descoberta de conhecimento em bancos de dados. Por isso, este é um campo de aplicação efervescente nos últimos anos. O aprendizado automático de RBs e Classificadores Bayesianos (CBs) busca identificar uma RB (ou CB) que represente o relacionamento entre as variáveis de um determinado conjunto de dados, mas como este é um problema NP-completo o espaço de busca se torna muito amplo na maioria das aplicações. Por este motivo, muitos algoritmos exploram alguma forma de redução do espaço de busca para tornar o processo de aprendizado computacionalmente viável. Esta dissertação de mestrado apresenta um método (MarkovPC) de aprendizado de CBs que visa exatamente reduzir o espaço de busca durante a indução de um classificador a partir de dados. Para tanto, toma-se como base algoritmos de aprendizado de RB da classe IC (Independência Condicional) e o conceito de Markov Blanket. Resultados obtidos através de experimentos realizados com 10 conjuntos de dados mostram que o MarkovPC é capaz de reduzir o esforço computacional do processo de indução de um classificador Bayesiano e manter a qualidade do classificador induzido (em termos de taxa de classificação correta)
233

Algoritmo narfo para mineração de regras de associação generalizadas não redundantes baseada em uma ontologia difusa

Miani, Rafael Garcia 29 April 2009 (has links)
Made available in DSpace on 2016-06-02T19:05:33Z (GMT). No. of bitstreams: 1 2522.pdf: 1514825 bytes, checksum: ebe56f7053e2af32e46a9f292c53aa9c (MD5) Previous issue date: 2009-04-29 / Financiadora de Estudos e Projetos / Traditional approaches for mining generalized association rules are based only on database contents, and focus on exact matches among items. However, in many applications, the use of some background knowledge, as ontologies, can enhance the discovery process and generate semantically richer rules. In this way, this paper proposes the NARFO algorithm, a new algorithm for mining non-redundant and generalized association rules based on fuzzy ontologies. Fuzzy ontology is used as background knowledge, to support the discovery process and the generation of rules. One contribution of this work is the generalization of nonfrequent itemsets that helps to extract meaningful knowledge. NARFO algorithm also contributes at post-processing stage with its generalization and redundancy treatment. / Abordagens tradicionais para mineração de regras de associação generalizadas são somente baseadas no conteúdo do banco de dados, tendo um maior foco em combinações exatas entre os itens. No entanto, em muitas aplicações, o uso de um conhecimento de apoio, como ontologias, pode aprimorar o processo de descoberta de conhecimento e gerar regras de associação semanticamente mais ricas. Desse modo, neste trabalho de mestrado foi desenvolvido o algoritmo NARFO, um novo algoritmo para a mineração de regras de associação generalizadas não redundantes baseada em uma ontologia difusa. A ontologia difusa é utilizada como um conhecimento prévio de apoio, para dar suporte ao processo de descoberta e geração das regras. Uma importante contribuição desse algoritmo é a implementação da generalização de itemsets não frequentes durante o processamento do algoritmo que auxilia na obtenção de regras significantes. O algoritmo NARFO também contribui na etapa de pós-processamento, com seu tratamento de generalização e redundância.
234

Abordagem chem-risk: avaliação, gerenciamento e comunicação de riscos químicos em alimentos empregando descoberta de conhecimento em bases de dados, lógica fuzzy e ontologias

Magalhães Junior, Walter Coelho Pereira de 31 May 2011 (has links)
Made available in DSpace on 2016-06-02T19:05:52Z (GMT). No. of bitstreams: 1 3863.pdf: 3890839 bytes, checksum: 2673ad557bc976e88a3245a8854caa82 (MD5) Previous issue date: 2011-05-31 / This research presents the Chem-Risk approach which is applied to chemical food safety domain, in order to circumvent a problem often encountered: data with little semantic or presenting low quality results that lead to results of low quality, unreliable and therefore inadequate to the reality of domain analyzed. In response to this purpose, the approach creates a Flexible Base Platform to properly pre-process the results of laboratory tests in agricultural food, allowing so many other variables, here considered as food risk factors, are observed in this analysis. Managed by the platform, the concepts of fuzzy logic and ontologies enable the incorporation of new risk factors, improve data quality and produce a superior technical expertise to that offered by traditional approaches used in the context of Brazilian public policies that aim to assess chemical risks and maximize the chemical safety of agricultural food. Due to the complexity and scope required for the ontology, a new approach to ontological engineering is presented. Data mining techniques used here play a key role, helping government officials and experts to extract higher risk levels of non-trivial knowledge, from the superior knowledge provided by the incorporation of fuzzy logic and ontology during the preprocessing step. The results obtained in mining step reveal a more faithfully semantic to the reality of food chemical safety, complement this reality and increase the level of expertise in favor of non-trivial decisions. By the other hand, if there were no proper preprocessing at the semantic level, the results, although apparently correct, would be concealing its false basis and, and thus presenting results completely wrong before the reality of chemical safety of agricultural food worldwide. We believe that what makes our real case study more remarkable is that it helps to improve the health of global population and, by extension, save our own lives. / Esta pesquisa apresenta a abordagem Chem-Risk a qual é aplicada ao domínio mundial da segurança química alimentar, visando contornar um problema freqüentemente encontrado: dados com pouca semântica, apresentando baixa qualidade, que levam a resultados de baixa qualidade, pouco confiáveis e, portanto, inadequados para corretamente expressarem a realidade do domínio analisado. Em atendimento a esta finalidade, a abordagem Chem-Risk cria uma Plataforma Base Flexível para adequadamente pré-processar os resultados das análises laboratoriais em alimentos agropecuários, permitindo que inúmeras outras variáveis, aqui consideradas como fatores de risco alimentar, sejam consideradas nestas análises. Gerenciados por esta plataforma, conceitos da lógica fuzzy e ontologias viabilizam a incorporação dos novos fatores de risco, aprimoram a qualidade dos dados e produzem um conhecimento técnico superior, àquele oferecido pelas abordagens tradicionalmente empregadas no contexto das políticas públicas brasileiras, que visam avaliar os riscos químicos e maximizar a segurança química dos alimentos agropecuários. Devido à complexidade e escopo requeridos para a ontologia, uma nova abordagem de engenharia ontológica é apresentada. As técnicas de mineração de dados aqui empregadas desempenham um papel fundamental, auxiliando as autoridades governamentais e especialistas de risco a extraírem maiores níveis de conhecimentos não-triviais, a partir do conhecimento superior fornecido pela incorporação da lógica fuzzy e ontologia, durante a etapa de préprocessamento dos dados. Os resultados alcançados na etapa de mineração revelam uma semântica mais fidedigna à realidade da segurança química alimentar, complementam esta realidade e ampliam o nível de conhecimento especializado em favor de decisões não triviais. Por outro lado, se não houvesse adequado pré-processamento de dados a nível semântico, os resultados, apesar de aparentemente corretos, estariam encobrindo bases falsas e, portanto, estariam completamente equivocados perante a realidade da segurança química mundial dos alimentos agropecuários. Acreditamos que o que torna o nosso estudo de caso mais notável é que ele ajuda a melhorar a saúde da população mundial e, por extensão, salvar nossas próprias vidas.
235

Mining ontologies to extract implicit knowledge

Navarro, Lucas Fonseca 07 April 2016 (has links)
Submitted by Bruna Rodrigues (bruna92rodrigues@yahoo.com.br) on 2016-10-13T14:14:35Z No. of bitstreams: 1 DissLFN.pdf: 3044084 bytes, checksum: 821534c448710467d6addecc27edfec0 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-21T13:48:51Z (GMT) No. of bitstreams: 1 DissLFN.pdf: 3044084 bytes, checksum: 821534c448710467d6addecc27edfec0 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-21T13:48:57Z (GMT) No. of bitstreams: 1 DissLFN.pdf: 3044084 bytes, checksum: 821534c448710467d6addecc27edfec0 (MD5) / Made available in DSpace on 2016-10-21T13:49:18Z (GMT). No. of bitstreams: 1 DissLFN.pdf: 3044084 bytes, checksum: 821534c448710467d6addecc27edfec0 (MD5) Previous issue date: 2016-04-07 / Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) / With the exponentially growing of data available on the Web, several projects were created to automatically represent this information as knowledge bases(KBs). Knowledge bases used in most projects are represented in an ontology-based fashion, so the data can be better organized and easily accessible. It is common to map these KBs into a graph to apply graph mining algorithms to extract implicit knowledge from the KB, knowledge that sometimes is easy for human beings to infer but not so trivial to a machine. One common graph-based task is link prediction, which can be used not only to predict edges (new facts for the KB) that will appear in a near future, but also to nd misplaced edges (wrong facts present in the KB). In this project, we create algorithms that uses graph-mining (mostly link-prediction based) approaches to nd implicit knowledge from ontological knowledge bases. Despite of common graph-mining algorithms, we mine not just the facts on the KB, but also the ontology information (such as categories of instances and relations among them). The implicit knowledge that our algorithms will nd, is not just new facts for the KB, but also new relations and categories, extending the ontology as well. / Com o crescimento exponencial dos dados disponíveis na Web, diversos projetos foram criados para automaticamente representar esta informação como bases de conhecimento( KBs). As bases de conhecimento utilizadas na maioria destes projetos são representadas através de uma ontologia, então os dados são melhor organizados e facilmente acessíveis. E comum mapear estes KBs utilizando grafos para aplicação de algoritmos de mineração em grafos com o intuito de extrair conhecimento implícito do KB, conhecimento que as pode ser facil para seres humanos inferir mas não são tão triviais para uma maquina. Uma tarefa comum e a predição de arestas, que pode ser usada para encontrar arestas (fatos no KB) que vão aparecer em um futuro próximo, e além disso para encontrar arestas mal alocadas (fatos incorretos no KB). Neste projeto, criamos algoritmos que utilizam mineração em grafos (na maioria baseados em predição de arestas) para encontrar conhecimento implícito em bancos de conhecimento ontológicos. Apesar do uso comum de algoritmos de predição de arestas, vamos minerar também informações da ontologia (como categorias das instancias e relações entre elas). O conhecimento implícito que nossos algoritmos vai encontrar, serão não somente novos fatos para o KB, mas também novas relações e categorias, estendendo também a ontologia.
236

Pós-processamento de padrões para identificação de beneficiários de alto custo em operadoras de saúde

Escobar, Leandro Fabian Almeida January 2015 (has links)
Orientadora : Profª. Drª. Deborah Ribeiro Carvalho / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Sociais Aplicadas, Programa de Pós-Graduação em Ciência, Gestão e Tecnologia da Informação. Defesa: Curitiba, 26/03/2015 / Inclui referências : fls. 85-88 / Área de concentraçâo: Gestão da Informação e do conhecimento / Resumo: As operadoras de saúde armazenam grandes volumes de dados sobre procedimentos realizados por seus beneficiários e, na mesma medida que criam valiosas oportunidades, também geram dificuldades em analisar e interpretar os padrões contidos em tais bases de dados. A Mineração de Dados pode constituir uma alternativa para compensar tal deficiência, mas sua adoção e uso cotidiano no suporte à decisão na área da Saúde ainda são baixos. O problema de pesquisa abordado se relaciona ao baixo uso do processo de descoberta de conhecimento (KDD) na área e questiona-se até que ponto é possível fomentar sua adoção na rotina dos especialistas em Saúde. Assim, este trabalho apresenta um modelo que fomente o uso do KDD na rotina da gestão em Saúde, mediante a identificação de beneficiários de alto custo em operadoras de Saúde, avaliando sua aceitação junto a especialistas na área. Foram identificados os pontos de atenção recomendados na literatura para uso efetivo dos resultados do KDD na Saúde, o modelo foi elaborado e um protótipo foi desenvolvido com a capacidade de obter padrões e pós processálos, obentendo padrões de sequência de janelas temporais. Sua aceitação foi avaliada junto aos especialistas, tendo atingido 78% de aceitação. Destaca-se que todos os especialistas envolvidos concordam que o modelo é aplicável à sua rotina de trabalho. Conclui-se que a associação dos pontos de atenção para o uso da Mineração de Dados na Saúde e a atenção a requisitos específicos dos especialistas, mediante o desenvolvimento de um modelo que facilite a obtenção e a exploração em padrões minerados, se mostrou capaz de fomentar o uso do KDD na rotina em Saúde. Palavras chave: Descoberta de conhecimento; Mineração de Dados, Apoio à decisão em Saúde. / Abstract: Health insurance companies store large amounts of data on procedures performed over its beneficiaries and to the same extent that create valuable opportunities also lead to difficulties in analyzing and interpreting the standards contained in such databases. Data mining can be an alternative to compensate for this deficiency, but their adoption and use in everyday decision support in healthcare are still low. The research problem addressed is related to the low use of knowledge Discovery in data bases process (KDD) in the area and wonders to what extent it is possible to foster its adoption in experts routine. So, this researche presents a model that promotes the use of KDD in the routine management in Health, by identifying high-cost beneficiaries and evaluating its acceptance by the experts. Points of attention for the use of Data Mining in Health were identified in the literature for effective use of the results of KDD. A model and a prototype were developed with the capability of discovering patterns and post process into sequential and time frames patterns. Its acceptance was evaluated with the experts, reaching 78% of acceptance. It is noteworthy that all the experts involved agree that the model is applicable to their daily work. We conclude that the association of points of attention for the use of Data Mining in Health and attention to specific requirements of experts, by developing a model to facilitate the obtaining and exploring mined patterns, has been shown to promote the use of KDD in routine Health. Keywords: Knowledge discovery; Data Mining, Decision Support in Health.
237

Uma metodologia para a criação de etiqueta de qualidade no contexto de descoberta de conhecimento em bases de dados

Góes, Anderson Roges Teixeira 26 November 2012 (has links)
Resumo
238

Uso de técnicas de mineração de dados na identificação de áreas hidrologicamente homogêneas

Diniz, Roberta Brito Nunes 26 June 2009 (has links)
Made available in DSpace on 2015-05-14T12:36:36Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 2195598 bytes, checksum: a95d4adfe41dfc528b087d4d211c0932 (MD5) Previous issue date: 2009-06-26 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The lack of fluviometric data and the bad quality of existing data related to watercourses of Brazilian northeast have obligated hydrology specialists to search for new solutions, improving the knowledge and methodologies to build the region up according to its environment limitations. Through the hydrologic regionalization techniques it's possible to transfer data and information among similar watersheds. In this context, the purpose of this work is to identify hydrologically similar regions in the State of Paraiba using Clustering - a kind of data mining technique - to find patterns that allow data transposition from one region to other. Algorithms were used with methods based on partition, hierarchical methods, and methods based on neural networks. It is used data of 41 watersheds located in the State of Paraíba. For all the watersheds, 32 physical and climatological characteristic were determined, being six characteristics of the linear measures of the watersheds, three of shape, nine of the drainage net, seven of the relief, two of the drainage capacity, three of the classes of soils and two of the climatology. Four sceneries were composed for the execution of the algorithms of which three were obtained through the technique of selection of attributes. To evaluate the groups obtained by the algorithms three validation indexes were applied, namely index of Silhouette, index Davies-Bouldin and index Dunn. The results of the statistical validation showed that the algorithm Ward stood out in the clustering of the 41 watersheds, identifying 6 homogeneous regions in the State of Paraíba. The obtained results showed the viability of the use of techniques of data mining in studies of hydrologic regionalization and practical applications in engineering of water resources in the ambit of the State of Paraíba. / A escassez de dados fluviométricos e a má qualidade dos dados existentes sobre os cursos d água do Nordeste do Brasil têm obrigado os especialistas em hidrologia a buscar novos caminhos, ampliando assim os conhecimentos e metodologias sobre como desenvolver a região com base em suas limitações ambientais. Uma dessas metodologias consiste na utilização de técnicas de regionalização hidrológica, que possibilitam a transferência de dados e informações entre bacias com características similares. Nesse contexto, este trabalho visa identificar regiões hidrologicamente homogêneas no Estado da Paraíba, utilizando Mineração de Dados, através da técnica de Clusterização, possibilitando assim a identificação de padrões que permitam a transposição de dados de uma região para outra. Foram utilizados algoritmos com métodos baseados em partição, métodos hierárquicos e métodos baseados em redes neurais. Foram empregados dados de 41 bacias hidrográficas localizadas no Estado da Paraíba. Para todas as bacias foram determinadas 32 características físicas e climatológicas, sendo seis características das medidas lineares das bacias, três de forma, nove da rede de drenagem, sete do relevo, duas da capacidade de escoamento, três das classes de solos e duas da climatologia. Foram compostos quatro cenários para a execução dos algoritmos dos quais três foram obtidos através da técnica de seleção de atributos. Para avaliar os grupos obtidos pelos algoritmos três índices de validação foram aplicados, a saber índice de Silhouette, índice Davies-Bouldin e índice Dunn. Os resultados da validação estatística mostraram que o algoritmo Ward se destacou na clusterização das 41 bacias hidrográficas, identificando 6 regiões hidrologicamente homogêneas no Estado da Paraíba. Os resultados obtidos mostraram a viabilidade do uso de técnicas de mineração de dados em estudos de regionalização hidrológica e aplicações práticas em engenharia de recursos hídricos no âmbito do Estado da Paraíba.
239

Modelo computacional para previsão de mortalidade de galinhas poedeiras em função de ondas de calor e tipologia dos aviários / Computational model for prediction of laying hens mortality due to heat waves and avian typology

Riquena, Rodrigo da Silva [UNESP] 13 February 2017 (has links)
Submitted by RODRIGO DA SILVA RIQUENA null (r.riquena@hotmail.com) on 2017-04-08T14:36:36Z No. of bitstreams: 1 RodrigoRiquena_PGAD_TUPA_02217.pdf: 2586767 bytes, checksum: 6bbcda45670b228af1c74a3153a5c33e (MD5) / Approved for entry into archive by Luiz Galeffi (luizgaleffi@gmail.com) on 2017-04-17T14:58:41Z (GMT) No. of bitstreams: 1 riquena_rs_me_tupa.pdf: 2586767 bytes, checksum: 6bbcda45670b228af1c74a3153a5c33e (MD5) / Made available in DSpace on 2017-04-17T14:58:41Z (GMT). No. of bitstreams: 1 riquena_rs_me_tupa.pdf: 2586767 bytes, checksum: 6bbcda45670b228af1c74a3153a5c33e (MD5) Previous issue date: 2017-02-13 / A mortalidade na produção de galinhas poedeiras é fato preocupante para produtores e constitui considerável perda econômica. Alguns eventos climáticos, como ondas de calor, estão diretamente relacionados ao aumento da mortalidade. O objetivo deste trabalho foi relacionar a ocorrência de ondas de calor com a mortalidade de poedeiras, considerando o efeito de duas diferentes tipologias de galpão utilizado na produção de ovos. Os dados de mortalidade diária foram obtidos em dois aviários localizados na cidade de Bastos-SP para o período de outubro de 2014 a janeiro de 2016. Para padronizar a coleta de informações foi construída uma ferramenta para registro diário da mortalidade na granja. Os dados do clima foram obtidos de duas estações meteorológicas localizadas nos municípios Tupã-SP e Rancharia-SP para o período de 2010 a 2015. As ondas de calor foram classificadas na base de dados climática usando diferentes definições da literatura. Os dados de mortalidade e clima foram relacionados em um mesmo banco de dados e foram classificados em mortalidade normal e alta de acordo com manual da linhagem. Após serem relacionados os dados foram levados a mineração, a técnica utilizada foi a CRISP-DM utilizando o algoritmo J48. A classificação para ondas de calor do INMET foi a mais adequada para região. Foi possível associar as ocorrências de onda de calor ao aumento da mortalidade de poedeiras e as variáveis construtivas dos aviários influenciam na mortalidade e produção. A árvore de classificação gerada identificou com precisão 71%, das ocorrências de mortalidade alta e 95% de todos os dados de mortalidade. A árvore de classificação permitiu relacionar o aumento da mortalidade de poedeiras em função de ondas de calor e permite que se faça uma previsão de quando haverá maior chance de ocorrer mortalidade alta. / Mortality in the production of laying hens is a concern for producers and constitutes a considerable economic loss. Some climatic events, such as heat waves, are directly related to increase of mortality. The aim of this work was to relate the occurrence of heat waves with laying hens mortality, considering the effect of two different typologies of shed used in egg production. Daily mortality data were obtained from two aviaries located in the city of Bastos-SP for the period from October 2014 to January 2016. To standardize the collection of information, a tool was created to record daily mortality on the farm. The climate data were obtained from two meteorological stations located in the cities of Tupã-SP and Rancharia-SP for the period from 2010 to 2015. The heat waves were classified in the climatic database using different definitions of the literature. Mortality and climate data were related in a single database and were classified into normal and high mortality according to the lineage manual. After being related the data were taken to mining, the technique used was the CRISP-DM using the algorithm J48. The classification for INMET heat waves was the most adequate for region. It was possible to associate the occurrences of heat wave to the increase of laying hens mortality and the constructive variables of the aviaries influence the mortality and production. The classification tree generated accurately identified 71% of occurrences of high mortality and 95% of all mortality data. The classification tree allowed to relate the increase in laying mortality as a function of heat waves and allows a forecast of when there is a higher chance of high mortality occurrence.
240

Mineração multirrelacional de regras de associação em grandes bases de dados

Oyama, Fernando Takeshi [UNESP] 22 February 2010 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:29:40Z (GMT). No. of bitstreams: 0 Previous issue date: 2010-02-22Bitstream added on 2014-06-13T20:39:07Z : No. of bitstreams: 1 oyama_ft_me_sjrp.pdf: 1107324 bytes, checksum: 0977db2af1589dece4aa46b5882d84d6 (MD5) / O crescente avanço e a disponibilidade de recursos computacionais viabilizam o armazenamento e a manipulação de grandes bases de dados. As técnicas típicas de mineração de dados possibilitam a extração de padrões desde que os dados estejam armazenados em uma única tabela. A mineração de dados multirrelacional, por sua vez, apresenta-se como uma abordagem mais recente que permite buscar padrões provenientes de múltiplas tabelas, sendo indicada para a aplicação em bases de dados relacionais. No entanto, os algoritmos multirrelacionais de mineração de regras de associação existentes tornam-se impossibilitados de efetuar a tarefa de mineração em grandes volumes de dados, uma vez que a quantia de memória exigida para a conclusão do processamento ultrapassa a quantidade disponível. O objetivo do presente trabalho consiste em apresentar um algoritmo multirrelacional de extração de regras de associação com o foco na aplicação em grandes bases de dados relacionais. Para isso, o algoritmo proposto, MR-RADIX, apresenta uma estrutura denominada Radix-tree que representa comprimidamente a base de dados em memória. Além disso, o algoritmo utiliza-se do conceito de particionamento para subdividir a base de dados, de modo que cada partição possa ser processada integralmente em memória. Os testes realizados demonstram que o algoritmo MR-RADIX proporciona um desempenho superior a outros algoritmos correlatos e, ainda, efetua com êxito, diferentemente dos demais, a mineração de regras de associação em grandes bases de dados. / The increasing spread and availability of computing resources make feasible storage and handling of large databases. Traditional techniques of data mining allows the extraction of patterns provided that data is stored in a single table. The multi- relational data mining presents itself as a more recent approach that allows search patterns from multiple tables, indicated for use in relational databases. However, the existing multi-relational association rules mining algorithms become unable to make mining task in large data, since the amount of memory required for the completion of processing exceed the amount available. The goal of this work is to present a multi- relational algorithm for extracting association rules with focus application in large relational databases. For this the proposed algorithm MR-RADIX presents a structure called Radix-tree that represents compressly the database in memory. Moreover, the algorithm uses the concept of partitioning to subdivide the database, so that each partition can be processed entirely in memory. The tests show that the MR-RADIX algorithm provides better performance than other related algorithms, and also performs successfully, unlike others, the association rules mining in large databases.

Page generated in 0.0809 seconds