• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 132
  • 34
  • Tagged with
  • 166
  • 121
  • 95
  • 61
  • 47
  • 46
  • 43
  • 39
  • 36
  • 30
  • 26
  • 23
  • 16
  • 16
  • 15
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
101

[pt] OS EFEITOS DA ELEIÇÃO DE UM PREFEITO MINERADOR NO BRASIL / [en] THE EFFECTS OF ELECTING A MINER MAYOR: EVIDENCE FROM BRAZIL

WALLACE DE JESUS INOCENCIO 06 October 2022 (has links)
[pt] Este trabalho analisa se a eleição de mineradores como prefeitos em municípios brasileiros tem implicações sobre o gasto público ambiental e a saúde pública. Primeiro, ao combinar diferentes bases de dados públicas administrativas, este trabalho identifica candidatos a prefeitos que detém uma licença de mineração. Então, eu seleciono eleições com margem de vitória estreita para aplicar uma regressão com descontinuidade que estima os impactos de eleger um prefeito minerador na despesa pública ambiental. Na sequência, utilizando diferenças-em-diferenças, eu foco na eleição de prefeitos mineradores de ouro, cuja extração artesanal é altamente tóxica, e verifico se a potencial emissão de mercúrio pelos garimpos afeta a saúde pública em municípios vizinhos. Em ambos os casos, este trabalho não encontra um efeito causal estatisticamente significante, porém, a análise carece de poder estatístico por conta do tamanho reduzido da amostra. / [en] This paper analyses whether electing a miner as mayor in a Brazilian municipality has implications on municipal environmental expenditure and general health. First, by merging different public administrative data, this paper identifies candidates for municipal office in Brazil who hold a mining permit. Then, I use close elections to apply a regression discontinuity design to estimate the impact of electing a miner mayor on public environmental expense. Furthermore, by using a difference-in-differences approach, I focus on the election of mayors who mine gold, a highly contaminating activity, and check whether potential mercury contamination due to gold mining affects health outcomes in neighboring municipalities. In both cases, this paper does not find a statistically significant causal effect, however, the analysis lacks statistical power due to the small sample size.
102

[en] TEXT MINING AT THE INTELLIGENT WEB CRAWLING PROCESS / [pt] MINERAÇÃO DE TEXTOS NA COLETA INTELIGENTE DE DADOS NA WEB

FABIO DE AZEVEDO SOARES 31 March 2009 (has links)
[pt] Esta dissertação apresenta um estudo sobre a utilização de Mineração de Textos no processo de coleta inteligente de dados na Web. O método mais comum de obtenção de dados na Web consiste na utilização de web crawlers. Web crawlers são softwares que, uma vez alimentados por um conjunto inicial de URLs (sementes), iniciam o procedimento metódico de visitar um site, armazenálo em disco e extrair deste os hyperlinks que serão utilizados para as próximas visitas. Entretanto, buscar conteúdo desta forma na Web é uma tarefa exaustiva e custosa. Um processo de coleta inteligente de dados na Web, mais do que coletar e armazenar qualquer documento web acessível, analisa as opções de crawling disponíveis para encontrar links que, provavelmente, fornecerão conteúdo de alta relevância a um tópico definido a priori. Na abordagem de coleta de dados inteligente proposta neste trabalho, tópicos são definidos, não por palavras chaves, mas, pelo uso de documentos textuais como exemplos. Em seguida, técnicas de pré-processamento utilizadas em Mineração de Textos, entre elas o uso de um dicionário thesaurus, analisam semanticamente o documento apresentado como exemplo. Baseado nesta análise, o web crawler construído será guiado em busca do seu objetivo: recuperar informação relevante sobre o documento. A partir de sementes ou realizando uma consulta automática nas máquinas de buscas disponíveis, o crawler analisa, igualmente como na etapa anterior, todo documento recuperado na Web. Então, é executado um processo de comparação entre cada documento recuperado e o documento exemplo. Depois de obtido o nível de similaridade entre ambos, os hyperlinks do documento recuperado são analisados, empilhados e, futuramente, serão desempilhados de acordo seus respectivos e prováveis níveis de importância. Ao final do processo de coleta de dados, outra técnica de Mineração de Textos é aplicada, objetivando selecionar os documentos mais representativos daquela coleção de textos: a Clusterização de Documentos. A implementação de uma ferramenta que contempla as heurísticas pesquisadas permitiu obter resultados práticos, tornando possível avaliar o desempenho das técnicas desenvolvidas e comparar os resultados obtidos com outras formas de recuperação de dados na Web. Com este trabalho, mostrou-se que o emprego de Mineração de Textos é um caminho a ser explorado no processo de recuperação de informação relevante na Web. / [en] This dissertation presents a study about the application of Text Mining as part of the intelligent Web crawling process. The most usual way of gathering data in Web consists of the utilization of web crawlers. Web crawlers are softwares that, once provided with an initial set of URLs (seeds), start the methodical proceeding of visiting a site, store it in disk and extract its hyperlinks that will be used for the next visits. But seeking for content in this way is an expensive and exhausting task. An intelligent web crawling process, more than collecting and storing any web document available, analyses its available crawling possibilities for finding links that, probably, will provide high relevant content to a topic defined a priori. In the approach suggested in this work, topics are not defined by words, but rather by the employment of text documents as examples. Next, pre-processing techniques used in Text Mining, including the use of a Thesaurus, analyze semantically the document submitted as example. Based on this analysis, the web crawler thus constructed will be guided toward its objective: retrieve relevant information to the document. Starting from seeds or querying through available search engines, the crawler analyzes, exactly as in the previous step, every document retrieved in Web. the similarity level between them is obtained, the retrieved document`s hyperlinks are analysed, queued and, later, will be dequeued according to each one`s probable degree of importance. By the end of the gathering data process, another Text Mining technique is applied, with the propose of selecting the most representative document among the collected texts: Document Clustering. The implementation of a tool incorporating all the researched heuristics allowed to achieve results, making possible to evaluate the performance of the developed techniques and compare all obtained results with others means of retrieving data in Web. The present work shows that the use of Text Mining is a track worthy to be exploited in the process of retrieving relevant information in Web.
103

[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING / [pt] CATEGORIZAÇÃO AUTOMÁTICA DE TEXTOS BASEADA EM MINERAÇÃO DE TEXTOS

FABIO DE AZEVEDO SOARES 15 July 2014 (has links)
[pt] A Categorização de Documentos, uma das tarefas desempenhadas em Mineração de Textos, pode ser descrita como a obtenção de uma função que seja capaz de atribuir a um documento uma categoria a que ele pertença. O principal objetivo de se construir uma taxonomia de documentos é tornar mais fácil a obtenção de informação relevante. Porém, a implementação e a execução de um processo de Categorização de Documentos não é uma tarefa trivial: as ferramentas de Mineração de Textos estão em processo de amadurecimento e ainda, demandam elevado conhecimento técnico para a sua utilização. Além disso, exercendo grande importância em um processo de Mineração de Textos, a linguagem em que os documentos se encontram escritas deve ser tratada com as particularidades do idioma. Contudo há grande carência de ferramentas que forneçam tratamento adequado ao Português do Brasil. Dessa forma, os objetivos principais deste trabalho são pesquisar, propor, implementar e avaliar um framework de Mineração de Textos para a Categorização Automática de Documentos, capaz de auxiliar a execução do processo de descoberta de conhecimento e que ofereça processamento linguístico para o Português do Brasil. / [en] Text Categorization, one of the tasks performed in Text Mining, can be described as the achievement of a function that is able to assign a document to the category, previously defined, to which it belongs. The main goal of building a taxonomy of documents is to make easier obtaining relevant information. However, the implementation and execution of Text Categorization is not a trivial task: Text Mining tools are under development and still require high technical expertise to be handled, also having great significance in a Text Mining process, the language of the documents should be treated with the peculiarities of each idiom. Yet there is great need for tools that provide proper handling to Portuguese of Brazil. Thus, the main aims of this work are to research, propose, implement and evaluate a Text Mining Framework for Automatic Text Categorization, capable of assisting the execution of knowledge discovery process and provides language processing for Brazilian Portuguese.
104

[en] CLUSTERING TEXT STRUCTURED DATA BASED ON TEXT SIMILARITY / [pt] AGRUPAMENTO DE REGISTROS TEXTUAIS BASEADO EM SIMILARIDADE ENTRE TEXTOS

IAN MONTEIRO NUNES 18 February 2016 (has links)
[pt] O presente trabalho apresenta os resultados que obtivemos com a aplicação de grande número de modelos e algoritmos em um determinado conjunto de experimentos de agrupamento de texto. O objetivo de tais testes é determinar quais são as melhores abordagens para processar as grandes massas de informação geradas pelas crescentes demandas de data quality em diversos setores da economia. O processo de deduplicação foi acelerado pela divisão dos conjuntos de dados em subconjuntos de itens similares. No melhor cenário possível, cada subconjunto tem em si todas as ocorrências duplicadas de cada registro, o que leva o nível de erro na formação de cada grupo a zero. Todavia, foi determinada uma taxa de tolerância intrínseca de 5 porcento após o agrupamento. Os experimentos mostram que o tempo de processamento é significativamente menor e a taxa de acerto é de até 98,92 porcento. A melhor relação entre acurácia e desempenho é obtida pela aplicação do algoritmo K-Means com um modelo baseado em trigramas. / [en] This document reports our findings on a set of text clusterig experiments, where a wide variety of models and algorithms were applied. The objective of these experiments is to investigate which are the most feasible strategies to process large amounts of information in face of the growing demands on data quality in many fields. The process of deduplication was accelerated through the division of the data set into individual subsets of similar items. In the best case scenario, each subset must contain all duplicates of each produced register, mitigating to zero the cluster s errors. It is established, although, a tolerance of 5 percent after the clustering process. The experiments show that the processing time is significantly lower, showing a 98,92 percent precision. The best accuracy/performance relation is achieved with the K-Means Algorithm using a trigram based model.
105

Experimentos comparativos combinando aprendizado supervisionado e tradução automática para mineração de emoçoes em textos multilíngues / Comparative experiments combining supervised learning and machine translation for multilingual emotion mining

Santos, Aline Graciela Lermen dos January 2016 (has links)
Com o avanço da Internet pelo mundo, as pessoas passaram a interagir cada vez mais com a Web, principalmente após o surgimento das redes sociais, criando conteúdo que pode ser explorado de diversas formas. Esse aumento de usuários tem sido global, ou seja, pessoas de diversos países passaram a produzir textos de diversos idiomas. Esses textos compõem um rico conteúdo para Análise de Sentimentos Multilíngue. A maior parte dos trabalhos da área se foca em Mineração de Opinião, analisando o sentimento através da polaridade. Outro tipo de sentimento que tem atraído atenção é a emoção, embora não seja amplamente explorada a Análise de Sentimentos Multilíngue usando emoção. Este trabalho utiliza técnicas geralmente usadas para Mineração de Opinião e polaridade para Análise de Sentimentos Multilíngues usando emoção. O objetivo deste trabalho é comparar diferentes combinações de aprendizado de máquina supervisionado e tradução automática para criar corpora em diferentes idiomas a partir de corpora anotados já existentes. As duas formas de utilizar as traduções comparadas são: criando classificadores de emoção separados por idiomas, chamados monolíngues, e criando um classificador composto do idioma original e das traduções, chamado multilíngue. É feito ainda um experimento cruzando dois corpora, visando avaliar o uso da tradução de um corpus com os textos originais do outro. Os resultados dos experimentos mostram não apenas o sucesso de analisar emoção usando aprendizado supervisionado e tradução automática, mas que o classificador multilíngue supera os classificadores monolíngues. O experimento cruzando os corpora mostra que para algumas emoções os corpora estão alinhados, mas que para outras é preciso que haja maior similaridade nos textos. / With the growth of the Internet around the world, people began to interact more and more with the Web, especially after the emergence of social networks, creating content that can be exploited in several ways. This increase in the number of users has been global, that is, people from different countries started producing texts in several languages. These texts comprise a rich content for Multilingual Sentiment Analysis. Most of the work in the area focus in Opinion Mining, analyzing the feeling through polarity. Another type of feeling that has attracted attention is emotion, although not extensively explored in Multilingual Sentiment Analysis. This work uses techniques commonly used for Opinion Mining and polarity for Multilingual Sentiment Analysis using emotion. The objective of this study is to compare different combinations of supervised machine learning and automatic translation to create corpora in different languages from existing annotated corpora. The two ways to use the translations compared are: creating emotion classifiers separated by languages, called monolingual, and creating a composed classifier, with the original language and it’s translations, called multilingual. An experiment crossing the two corpora used is made, to evaluate the use of the translation of one corpus with the original texts of the other. The results of the experiments show not only the success of analysing emotion using supervised machine learning and automatic translation, but that the multilingual classifier exceeds the monolingual classifiers. The experiment crossing the corpora shows that to some emotions the corpora are aligned, but for others there needs to be greater similarity in the texts.
106

Realização de melhorias na indústria mineral e calçadista, com o apoio de sistemas de informações, a partir das exigências da legislação ambiental

Noer, Renato January 1995 (has links)
Harmonizar a atividade de produção nas indústrias com as modernas exigências ambientais pode constituir-se em oportunidade de realizar melhorias contínuas ou mudanças radicais com possibilidade de beneficios econômicos para as empresas e para o meio ambiente. O presente trabalho evidencia como isto pode ser efetivado com o apoio de sistemas de informações voltados para a tomada de decisões que possibilitem melhorar o processo produtivo. A abordagem adotada favorece a integração econômico-ambiental. Os setores - participantes do estudo são a mineração a céu aberto e a indústria calçadista. A metodologia empregada é a pesquisa-ação, contando com a participação de representantes das empresas. Através da aprendizagem organizacional, o pesquisador buscou introduzir nas empresas novos procedimentos de coleta de dados e de modelagem de sistemas, visando o uso consciente de informações na otimização de custos e minimização dos impactos ambientais provocados pela atividade industrial. Sistemas de informação para a mensuração de variáveis em operações fundamentais do processo produtivo foram desenvolvidos e implantados no meio industrial. Uma das variáveis de decisão foi o custo da operação ou atividade, dentro de uma abordagem preventiva através do modelamento matemático previsional. Alternativas otimizantes com suas repercussões na variável de decisão são apresentadas para que se decida entre uma e outra dentro de uma metodologia de melhorias contínuas.Os Estudos de Casos ilustram a aplicação prática em várias empresas. Reduções substanciais de custos no desmonte de rochas com explosivos foram obtidas, o impacto ambiental das detonações foi minimizado em alguns casos, a taxa de geração de resíduos foi diminuída em algumas fábricas de calçados a partir do conhecimento do valor numérico dessa variável de decisão. / To harmonize the production operations in the industry whit the modern environmental requirements may be a good opportunity for the implementation of the continuous improvement ar radical changes with economical benefits for the enterprises and the environment toa. This work puts in evidence how this can be performed when it is supported by information systems oriented for the decision making, which may improve the production process, in an economical-ecological approach in the mining industry and shoes factories. The methodology applied is the action-research. Through the organizational learning, the researcher intends to introduce new procedures for data collection and systems modelling in the enterprises. The main objectives for the research are optimization and the minimization of the industrial impacts in the environment. lnformation systems for measurement of criticai variables in fundamental operatios of the productive process were developed and implemented in a group of industries in the study field. The cost approach was made in a preventive form using mathematical modelling. Optimizing alternatives and his consequences are presented for the decision makers in a continuous improvement methodology. The cases studied show a practical application in many industrial firms. Substancial reductions of costs in the rock blasting whith explosives were obtained and the environmental impacts were minimized in some cases. Also the scrap production rate in some shoes factories were reduced by the knowledge of the numeric value of this decision variable. The results obtained are reported case by case to demonstrate the validity of this work and to furnish a base for the reccomendations at the end.
107

Realização de melhorias na indústria mineral e calçadista, com o apoio de sistemas de informações, a partir das exigências da legislação ambiental

Noer, Renato January 1995 (has links)
Harmonizar a atividade de produção nas indústrias com as modernas exigências ambientais pode constituir-se em oportunidade de realizar melhorias contínuas ou mudanças radicais com possibilidade de beneficios econômicos para as empresas e para o meio ambiente. O presente trabalho evidencia como isto pode ser efetivado com o apoio de sistemas de informações voltados para a tomada de decisões que possibilitem melhorar o processo produtivo. A abordagem adotada favorece a integração econômico-ambiental. Os setores - participantes do estudo são a mineração a céu aberto e a indústria calçadista. A metodologia empregada é a pesquisa-ação, contando com a participação de representantes das empresas. Através da aprendizagem organizacional, o pesquisador buscou introduzir nas empresas novos procedimentos de coleta de dados e de modelagem de sistemas, visando o uso consciente de informações na otimização de custos e minimização dos impactos ambientais provocados pela atividade industrial. Sistemas de informação para a mensuração de variáveis em operações fundamentais do processo produtivo foram desenvolvidos e implantados no meio industrial. Uma das variáveis de decisão foi o custo da operação ou atividade, dentro de uma abordagem preventiva através do modelamento matemático previsional. Alternativas otimizantes com suas repercussões na variável de decisão são apresentadas para que se decida entre uma e outra dentro de uma metodologia de melhorias contínuas.Os Estudos de Casos ilustram a aplicação prática em várias empresas. Reduções substanciais de custos no desmonte de rochas com explosivos foram obtidas, o impacto ambiental das detonações foi minimizado em alguns casos, a taxa de geração de resíduos foi diminuída em algumas fábricas de calçados a partir do conhecimento do valor numérico dessa variável de decisão. / To harmonize the production operations in the industry whit the modern environmental requirements may be a good opportunity for the implementation of the continuous improvement ar radical changes with economical benefits for the enterprises and the environment toa. This work puts in evidence how this can be performed when it is supported by information systems oriented for the decision making, which may improve the production process, in an economical-ecological approach in the mining industry and shoes factories. The methodology applied is the action-research. Through the organizational learning, the researcher intends to introduce new procedures for data collection and systems modelling in the enterprises. The main objectives for the research are optimization and the minimization of the industrial impacts in the environment. lnformation systems for measurement of criticai variables in fundamental operatios of the productive process were developed and implemented in a group of industries in the study field. The cost approach was made in a preventive form using mathematical modelling. Optimizing alternatives and his consequences are presented for the decision makers in a continuous improvement methodology. The cases studied show a practical application in many industrial firms. Substancial reductions of costs in the rock blasting whith explosives were obtained and the environmental impacts were minimized in some cases. Also the scrap production rate in some shoes factories were reduced by the knowledge of the numeric value of this decision variable. The results obtained are reported case by case to demonstrate the validity of this work and to furnish a base for the reccomendations at the end.
108

[en] EXPLORING RDF KNOWLEDGE BASES THROUGH SERENDIPITY PATTERNS / [pt] EXPLORANDO BASES DE CONHECIMENTO EM RDF ATRAVÉS DE PADRÕES DE FORTUIDADE

JERONIMO SIROTHEAU DE ALMEIDA EICHLER 15 January 2019 (has links)
[pt] Fortuidade pode ser definida como a descoberta de algo que não está sendo buscado. Em outras palavras, fortuidade trata da descoberta de informação que provê valiosas intuições ao desvendar conhecimento inesperado. O tópico vem recebendo bastante atenção na literatura, uma vez que precisão pode ser justificadamente relaxada com o objetivo de aumentar a satisfação do usuário. Uma área que pode se beneficiar com fortuidade é a área de dados interligados, um gigantesco espaço de dados no qual dados são disponibilizados publicamente. Buscar e extrair informação relevante se torna uma tarefa desafiadora à medida que cada vez mais dados se tornam disponíveis nesse ambiente. Esta tese contribui para enfrentar este desafio de duas maneiras. Primeiro, apresenta um processo de orquestração de consulta que introduz três estratégias para injetar padrões de fortuidade no processo de consulta. Os padrões de fortuidade são inspirados em características básicas de eventos fortuitos, como analogia e perturbação, e podem ser usados para estender os resultados com informações adicionais, sugerindo consultas alternativas ou reordenando os resultados. Em segundo lugar, introduz uma base de dados que pode ser utilizada para comparar diferentes abordagens de obtenção de conteúdo fortuito. A estratégia adotada para construção dessa base de dados consiste em dividir o universo de dados em partições com base em um atributo global e conectar entidades de diferentes partições de acordo com o número de caminhos compartilhados. / [en] Serendipity is defined as the discovery of a thing when one is not searching for it. In other words, serendipity means the discovery of information that provides valuable insights by unveiling unanticipated knowledge. The topic is receiving increased attention in the literature, since the precision requirement may be justifiably relaxed in order to improve user satisfaction. A field that can benefit from serendipity is the Web of Data, an immense global data space where data is publicly available. As more and more data become available in this data space, searching and extracting relevant information becomes a challenging task. This thesis contributes to addressing this challenge in two ways. First, it presents a query orchestration process that introduces three strategies to inject serendipity patterns in the query process. The serendipity patterns are inspired by basic characteristics of serendipitous events, such as, analogy and disturbance, and can be used for augmenting the results with additional information, suggesting alternative queries or rebalancing the results. Second, it introduces a benchmark dataset that can be used to compare different approaches for locating serendipitous content. The strategy adopted for constructing the dataset consists of dividing the dataset into partitions based on a global feature and linking entities from different partitions according to the number of paths they share.
109

[en] APPLYING PROCESS MINING TO THE ACADEMIC ADMINISTRATION DOMAIN / [pt] APLICAÇÃO DE MINERAÇÃO DE PROCESSOS AO DOMÍNIO ACADÊMICO ADMINISTRATIVO

HAYDÉE GUILLOT JIMÉNEZ 12 December 2017 (has links)
[pt] As instituições de ensino superior mantêm uma quantidade considerável de dados que incluem tanto os registros dos alunos como a estrutura dos currículos dos cursos de graduação. Este trabalho, adotando uma abordagem de mineração de processos, centra-se no problema de identificar quão próximo os alunos seguem a ordem recomendada das disciplinas em um currículo de graduação, e até que ponto o desempenho de cada aluno é afetado pela ordem que eles realmente adotam. O problema é abordado aplicando-se duas técnicas já existentes aos registros dos alunos: descoberta de processos e verificação de conformidade; e frequência de conjuntos de itens. Finalmente, a dissertação cobre experimentos realizados aplicando-se essas técnicas a um estudo de caso com mais de 60.000 registros de alunos da PUC-Rio. Os experimentos indicam que a técnica de frequência de conjuntos de itens produz melhores resultados do que as técnicas de descoberta de processos e verificação de conformidade. E confirmam igualmente a relevância de análises baseadas na abordagem de mineração de processos para ajudar coordenadores acadêmicos na busca de melhores currículos universitários. / [en] Higher Education Institutions keep a sizable amount of data, including student records and the structure of degree curricula. This work, adopting a process mining approach, focuses on the problem of identifying how closely students follow the recommended order of the courses in a degree curriculum, and to what extent their performance is affected by the order they actually adopt. It addresses this problem by applying to student records two already existing techniques: process discovery and conformance checking, and frequent itemsets. Finally, the dissertation covers experiments performed by applying these techniques to a case study involving over 60,000 student records from PUC-Rio. The experiments show that the frequent itemsets technique performs better than the process discovery and conformance checking techniques. They equally confirm the relevance of analyses based on the process mining approach to help academic coordinators in their quest for better degree curricula.
110

[en] A MULTI-AGENT APPROACH TO DATA MINING PROCESSES: APPLICATIONS TO HEALTH CARE / [pt] UMA ABORDAGEM MULTIAGENTE PARA PROCESSOS DE MINERAÇÃO DE DADOS: APLICAÇÕES NA ÁREA DA SAÚDE

REINIER MOREJON NOVALES 02 August 2018 (has links)
[pt] A mineração de dados é um tema em alta que atrai pesquisadores de diferentes áreas, como bancos de dados, aprendizado de máquina e sistemas multiagentes. Como consequência do crescimento do volume de dados, há uma necessidade crescente de obter conhecimento desses grandes conjuntos de dados que são muito difíceis de manipular e processar com os métodos tradicionais. Os agentes de software podem desempenhar um papel significativo ao executar processos de mineração de dados de maneira mais eficiente. Por exemplo, eles podem trabalhar para realizar seleção, extração, pré-processamento e integração de dados, bem como mineração paralela, distribuída ou de múltiplas fontes. Este trabalho propõe uma abordagem (na forma de um framework) que usa agentes de software para gerenciar processos de mineração de dados. Para testar sua aplicabilidade, utilizamos vários conjuntos de dados relacionados ao domínio de saúde, representando alguns cenários de uso (hipotireoidismo, diabetes e arritmia). / [en] Data mining is a hot topic that attracts researchers from different areas, such as databases, machine learning, and multi-agent systems. As a consequence of the growth of data volume, there is a growing need to obtain knowledge from these large data sets that are very difficult to handle and process with traditional methods. Software agents can play a significant role performing data mining processes in ways that are more efficient. For instance, they can work to perform selection, extraction, preprocessing and integration of data as well as parallel, distributed, or multisource mining. This work proposes an approach (in the form of a framework) that uses software agents to manage data mining processes. In order to test its applicability, we use several data sets related to health care domain representing some usage scenarios (hypothyroidism, diabetes and arrhythmia).

Page generated in 0.0505 seconds