101 |
[pt] OS EFEITOS DA ELEIÇÃO DE UM PREFEITO MINERADOR NO BRASIL / [en] THE EFFECTS OF ELECTING A MINER MAYOR: EVIDENCE FROM BRAZILWALLACE DE JESUS INOCENCIO 06 October 2022 (has links)
[pt] Este trabalho analisa se a eleição de mineradores como prefeitos em
municípios brasileiros tem implicações sobre o gasto público ambiental e
a saúde pública. Primeiro, ao combinar diferentes bases de dados públicas
administrativas, este trabalho identifica candidatos a prefeitos que detém
uma licença de mineração. Então, eu seleciono eleições com margem de
vitória estreita para aplicar uma regressão com descontinuidade que estima
os impactos de eleger um prefeito minerador na despesa pública ambiental. Na
sequência, utilizando diferenças-em-diferenças, eu foco na eleição de prefeitos
mineradores de ouro, cuja extração artesanal é altamente tóxica, e verifico
se a potencial emissão de mercúrio pelos garimpos afeta a saúde pública em
municípios vizinhos. Em ambos os casos, este trabalho não encontra um efeito
causal estatisticamente significante, porém, a análise carece de poder estatístico
por conta do tamanho reduzido da amostra. / [en] This paper analyses whether electing a miner as mayor in a Brazilian
municipality has implications on municipal environmental expenditure and
general health. First, by merging different public administrative data, this
paper identifies candidates for municipal office in Brazil who hold a mining
permit. Then, I use close elections to apply a regression discontinuity design
to estimate the impact of electing a miner mayor on public environmental
expense. Furthermore, by using a difference-in-differences approach, I focus on
the election of mayors who mine gold, a highly contaminating activity, and
check whether potential mercury contamination due to gold mining affects
health outcomes in neighboring municipalities. In both cases, this paper does
not find a statistically significant causal effect, however, the analysis lacks
statistical power due to the small sample size.
|
102 |
[en] TEXT MINING AT THE INTELLIGENT WEB CRAWLING PROCESS / [pt] MINERAÇÃO DE TEXTOS NA COLETA INTELIGENTE DE DADOS NA WEBFABIO DE AZEVEDO SOARES 31 March 2009 (has links)
[pt] Esta dissertação apresenta um estudo sobre a utilização de
Mineração de
Textos no processo de coleta inteligente de dados na Web. O
método mais comum
de obtenção de dados na Web consiste na utilização de web
crawlers. Web
crawlers são softwares que, uma vez alimentados por um
conjunto inicial de
URLs (sementes), iniciam o procedimento metódico de visitar
um site, armazenálo
em disco e extrair deste os hyperlinks que serão utilizados
para as próximas
visitas. Entretanto, buscar conteúdo desta forma na Web é
uma tarefa exaustiva e
custosa. Um processo de coleta inteligente de dados na Web,
mais do que coletar
e armazenar qualquer documento web acessível, analisa as
opções de crawling
disponíveis para encontrar links que, provavelmente,
fornecerão conteúdo de alta
relevância a um tópico definido a priori. Na abordagem de
coleta de dados
inteligente proposta neste trabalho, tópicos são definidos,
não por palavras chaves,
mas, pelo uso de documentos textuais como exemplos. Em
seguida, técnicas de
pré-processamento utilizadas em Mineração de Textos, entre
elas o uso de um
dicionário thesaurus, analisam semanticamente o documento
apresentado como
exemplo. Baseado nesta análise, o web crawler construído
será guiado em busca
do seu objetivo: recuperar informação relevante sobre o
documento. A partir de
sementes ou realizando uma consulta automática nas máquinas
de buscas
disponíveis, o crawler analisa, igualmente como na etapa
anterior, todo
documento recuperado na Web. Então, é executado um processo
de comparação
entre cada documento recuperado e o documento exemplo.
Depois de obtido o
nível de similaridade entre ambos, os hyperlinks do
documento recuperado são
analisados, empilhados e, futuramente, serão desempilhados
de acordo seus
respectivos e prováveis níveis de importância. Ao final do
processo de coleta de
dados, outra técnica de Mineração de Textos é aplicada,
objetivando selecionar os
documentos mais representativos daquela coleção de textos:
a Clusterização de
Documentos. A implementação de uma ferramenta que contempla
as heurísticas
pesquisadas permitiu obter resultados práticos, tornando
possível avaliar o
desempenho das técnicas desenvolvidas e comparar os
resultados obtidos com
outras formas de recuperação de dados na Web. Com este
trabalho, mostrou-se
que o emprego de Mineração de Textos é um caminho a ser
explorado no
processo de recuperação de informação relevante na Web. / [en] This dissertation presents a study about the application of
Text Mining as
part of the intelligent Web crawling process. The most
usual way of gathering
data in Web consists of the utilization of web crawlers.
Web crawlers are
softwares that, once provided with an initial set of URLs
(seeds), start the
methodical proceeding of visiting a site, store it in disk
and extract its hyperlinks
that will be used for the next visits. But seeking for
content in this way is an
expensive and exhausting task. An intelligent web crawling
process, more than
collecting and storing any web document available, analyses
its available crawling
possibilities for finding links that, probably, will
provide high relevant content to
a topic defined a priori. In the approach suggested in this
work, topics are not
defined by words, but rather by the employment of text
documents as examples.
Next, pre-processing techniques used in Text Mining,
including the use of a
Thesaurus, analyze semantically the document submitted as
example. Based on
this analysis, the web crawler thus constructed will be
guided toward its objective:
retrieve relevant information to the document. Starting
from seeds or querying
through available search engines, the crawler analyzes,
exactly as in the previous
step, every document retrieved in Web. the similarity level
between them is
obtained, the retrieved document`s hyperlinks are analysed,
queued and, later, will
be dequeued according to each one`s probable degree of
importance. By the end
of the gathering data process, another Text Mining
technique is applied, with the
propose of selecting the most representative document among
the collected texts:
Document Clustering. The implementation of a tool
incorporating all the
researched heuristics allowed to achieve results, making
possible to evaluate the
performance of the developed techniques and compare all
obtained results with
others means of retrieving data in Web. The present work
shows that the use of
Text Mining is a track worthy to be exploited in the
process of retrieving relevant
information in Web.
|
103 |
[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING / [pt] CATEGORIZAÇÃO AUTOMÁTICA DE TEXTOS BASEADA EM MINERAÇÃO DE TEXTOSFABIO DE AZEVEDO SOARES 15 July 2014 (has links)
[pt] A Categorização de Documentos, uma das tarefas desempenhadas em Mineração de Textos, pode ser descrita como a obtenção de uma função que seja capaz de atribuir a um documento uma categoria a que ele pertença. O principal objetivo de se construir uma taxonomia de documentos é tornar mais fácil a obtenção de informação relevante. Porém, a implementação e a execução de um processo de Categorização de Documentos não é uma tarefa trivial: as ferramentas de Mineração de Textos estão em processo de amadurecimento e ainda, demandam elevado conhecimento técnico para a sua utilização. Além disso, exercendo grande importância em um processo de Mineração de Textos, a linguagem em que os documentos se encontram escritas deve ser tratada com as particularidades do idioma. Contudo há grande carência de ferramentas que forneçam tratamento adequado ao Português do Brasil. Dessa forma, os objetivos principais deste trabalho são pesquisar, propor, implementar e avaliar um framework de Mineração de Textos para a Categorização Automática de Documentos, capaz de auxiliar a execução do processo de descoberta de conhecimento e que ofereça processamento linguístico para o Português do Brasil. / [en] Text Categorization, one of the tasks performed in Text Mining, can be described as the achievement of a function that is able to assign a document to the category, previously defined, to which it belongs. The main goal of building a taxonomy of documents is to make easier obtaining relevant information. However, the implementation and execution of Text Categorization is not a trivial task: Text Mining tools are under development and still require high technical expertise to be handled, also having great significance in a Text Mining process, the language of the documents should be treated with the peculiarities of each idiom. Yet there is great need for tools that provide proper handling to Portuguese of Brazil. Thus, the main aims of this work are to research, propose, implement and evaluate a Text Mining Framework for Automatic Text Categorization, capable of assisting the execution of knowledge discovery process and provides language processing for Brazilian Portuguese.
|
104 |
[en] CLUSTERING TEXT STRUCTURED DATA BASED ON TEXT SIMILARITY / [pt] AGRUPAMENTO DE REGISTROS TEXTUAIS BASEADO EM SIMILARIDADE ENTRE TEXTOSIAN MONTEIRO NUNES 18 February 2016 (has links)
[pt] O presente trabalho apresenta os resultados que obtivemos com a aplicação de grande número de modelos e algoritmos em um determinado conjunto de experimentos de agrupamento de texto. O objetivo de tais testes é determinar quais são as melhores abordagens para processar as grandes massas de informação geradas pelas crescentes demandas de data quality em diversos setores da economia. O processo de deduplicação foi acelerado pela divisão dos conjuntos de dados em subconjuntos de itens similares. No melhor cenário possível, cada subconjunto tem em si todas as ocorrências duplicadas de cada registro, o que leva o nível de erro na formação de cada grupo a zero. Todavia, foi determinada uma taxa de tolerância intrínseca de 5 porcento após o agrupamento. Os experimentos mostram que o tempo de processamento é significativamente menor e a taxa de acerto é de até 98,92 porcento. A melhor relação entre acurácia e desempenho é obtida pela aplicação do algoritmo K-Means com um modelo baseado em trigramas. / [en] This document reports our findings on a set of text clusterig experiments, where a wide variety of models and algorithms were applied. The objective of these experiments is to investigate which are the most feasible strategies to process large amounts of information in face of the growing demands on data quality in many fields. The process of deduplication was accelerated through the division of the data set into individual subsets of similar items. In the best case scenario, each subset must contain all duplicates of each produced register, mitigating to zero the cluster s errors. It is established, although, a tolerance of 5 percent after the clustering process. The experiments show that the processing time is significantly lower, showing a 98,92 percent precision. The best accuracy/performance relation is achieved with the K-Means Algorithm using a trigram based model.
|
105 |
Experimentos comparativos combinando aprendizado supervisionado e tradução automática para mineração de emoçoes em textos multilíngues / Comparative experiments combining supervised learning and machine translation for multilingual emotion miningSantos, Aline Graciela Lermen dos January 2016 (has links)
Com o avanço da Internet pelo mundo, as pessoas passaram a interagir cada vez mais com a Web, principalmente após o surgimento das redes sociais, criando conteúdo que pode ser explorado de diversas formas. Esse aumento de usuários tem sido global, ou seja, pessoas de diversos países passaram a produzir textos de diversos idiomas. Esses textos compõem um rico conteúdo para Análise de Sentimentos Multilíngue. A maior parte dos trabalhos da área se foca em Mineração de Opinião, analisando o sentimento através da polaridade. Outro tipo de sentimento que tem atraído atenção é a emoção, embora não seja amplamente explorada a Análise de Sentimentos Multilíngue usando emoção. Este trabalho utiliza técnicas geralmente usadas para Mineração de Opinião e polaridade para Análise de Sentimentos Multilíngues usando emoção. O objetivo deste trabalho é comparar diferentes combinações de aprendizado de máquina supervisionado e tradução automática para criar corpora em diferentes idiomas a partir de corpora anotados já existentes. As duas formas de utilizar as traduções comparadas são: criando classificadores de emoção separados por idiomas, chamados monolíngues, e criando um classificador composto do idioma original e das traduções, chamado multilíngue. É feito ainda um experimento cruzando dois corpora, visando avaliar o uso da tradução de um corpus com os textos originais do outro. Os resultados dos experimentos mostram não apenas o sucesso de analisar emoção usando aprendizado supervisionado e tradução automática, mas que o classificador multilíngue supera os classificadores monolíngues. O experimento cruzando os corpora mostra que para algumas emoções os corpora estão alinhados, mas que para outras é preciso que haja maior similaridade nos textos. / With the growth of the Internet around the world, people began to interact more and more with the Web, especially after the emergence of social networks, creating content that can be exploited in several ways. This increase in the number of users has been global, that is, people from different countries started producing texts in several languages. These texts comprise a rich content for Multilingual Sentiment Analysis. Most of the work in the area focus in Opinion Mining, analyzing the feeling through polarity. Another type of feeling that has attracted attention is emotion, although not extensively explored in Multilingual Sentiment Analysis. This work uses techniques commonly used for Opinion Mining and polarity for Multilingual Sentiment Analysis using emotion. The objective of this study is to compare different combinations of supervised machine learning and automatic translation to create corpora in different languages from existing annotated corpora. The two ways to use the translations compared are: creating emotion classifiers separated by languages, called monolingual, and creating a composed classifier, with the original language and it’s translations, called multilingual. An experiment crossing the two corpora used is made, to evaluate the use of the translation of one corpus with the original texts of the other. The results of the experiments show not only the success of analysing emotion using supervised machine learning and automatic translation, but that the multilingual classifier exceeds the monolingual classifiers. The experiment crossing the corpora shows that to some emotions the corpora are aligned, but for others there needs to be greater similarity in the texts.
|
106 |
Realização de melhorias na indústria mineral e calçadista, com o apoio de sistemas de informações, a partir das exigências da legislação ambientalNoer, Renato January 1995 (has links)
Harmonizar a atividade de produção nas indústrias com as modernas exigências ambientais pode constituir-se em oportunidade de realizar melhorias contínuas ou mudanças radicais com possibilidade de beneficios econômicos para as empresas e para o meio ambiente. O presente trabalho evidencia como isto pode ser efetivado com o apoio de sistemas de informações voltados para a tomada de decisões que possibilitem melhorar o processo produtivo. A abordagem adotada favorece a integração econômico-ambiental. Os setores - participantes do estudo são a mineração a céu aberto e a indústria calçadista. A metodologia empregada é a pesquisa-ação, contando com a participação de representantes das empresas. Através da aprendizagem organizacional, o pesquisador buscou introduzir nas empresas novos procedimentos de coleta de dados e de modelagem de sistemas, visando o uso consciente de informações na otimização de custos e minimização dos impactos ambientais provocados pela atividade industrial. Sistemas de informação para a mensuração de variáveis em operações fundamentais do processo produtivo foram desenvolvidos e implantados no meio industrial. Uma das variáveis de decisão foi o custo da operação ou atividade, dentro de uma abordagem preventiva através do modelamento matemático previsional. Alternativas otimizantes com suas repercussões na variável de decisão são apresentadas para que se decida entre uma e outra dentro de uma metodologia de melhorias contínuas.Os Estudos de Casos ilustram a aplicação prática em várias empresas. Reduções substanciais de custos no desmonte de rochas com explosivos foram obtidas, o impacto ambiental das detonações foi minimizado em alguns casos, a taxa de geração de resíduos foi diminuída em algumas fábricas de calçados a partir do conhecimento do valor numérico dessa variável de decisão. / To harmonize the production operations in the industry whit the modern environmental requirements may be a good opportunity for the implementation of the continuous improvement ar radical changes with economical benefits for the enterprises and the environment toa. This work puts in evidence how this can be performed when it is supported by information systems oriented for the decision making, which may improve the production process, in an economical-ecological approach in the mining industry and shoes factories. The methodology applied is the action-research. Through the organizational learning, the researcher intends to introduce new procedures for data collection and systems modelling in the enterprises. The main objectives for the research are optimization and the minimization of the industrial impacts in the environment. lnformation systems for measurement of criticai variables in fundamental operatios of the productive process were developed and implemented in a group of industries in the study field. The cost approach was made in a preventive form using mathematical modelling. Optimizing alternatives and his consequences are presented for the decision makers in a continuous improvement methodology. The cases studied show a practical application in many industrial firms. Substancial reductions of costs in the rock blasting whith explosives were obtained and the environmental impacts were minimized in some cases. Also the scrap production rate in some shoes factories were reduced by the knowledge of the numeric value of this decision variable. The results obtained are reported case by case to demonstrate the validity of this work and to furnish a base for the reccomendations at the end.
|
107 |
Realização de melhorias na indústria mineral e calçadista, com o apoio de sistemas de informações, a partir das exigências da legislação ambientalNoer, Renato January 1995 (has links)
Harmonizar a atividade de produção nas indústrias com as modernas exigências ambientais pode constituir-se em oportunidade de realizar melhorias contínuas ou mudanças radicais com possibilidade de beneficios econômicos para as empresas e para o meio ambiente. O presente trabalho evidencia como isto pode ser efetivado com o apoio de sistemas de informações voltados para a tomada de decisões que possibilitem melhorar o processo produtivo. A abordagem adotada favorece a integração econômico-ambiental. Os setores - participantes do estudo são a mineração a céu aberto e a indústria calçadista. A metodologia empregada é a pesquisa-ação, contando com a participação de representantes das empresas. Através da aprendizagem organizacional, o pesquisador buscou introduzir nas empresas novos procedimentos de coleta de dados e de modelagem de sistemas, visando o uso consciente de informações na otimização de custos e minimização dos impactos ambientais provocados pela atividade industrial. Sistemas de informação para a mensuração de variáveis em operações fundamentais do processo produtivo foram desenvolvidos e implantados no meio industrial. Uma das variáveis de decisão foi o custo da operação ou atividade, dentro de uma abordagem preventiva através do modelamento matemático previsional. Alternativas otimizantes com suas repercussões na variável de decisão são apresentadas para que se decida entre uma e outra dentro de uma metodologia de melhorias contínuas.Os Estudos de Casos ilustram a aplicação prática em várias empresas. Reduções substanciais de custos no desmonte de rochas com explosivos foram obtidas, o impacto ambiental das detonações foi minimizado em alguns casos, a taxa de geração de resíduos foi diminuída em algumas fábricas de calçados a partir do conhecimento do valor numérico dessa variável de decisão. / To harmonize the production operations in the industry whit the modern environmental requirements may be a good opportunity for the implementation of the continuous improvement ar radical changes with economical benefits for the enterprises and the environment toa. This work puts in evidence how this can be performed when it is supported by information systems oriented for the decision making, which may improve the production process, in an economical-ecological approach in the mining industry and shoes factories. The methodology applied is the action-research. Through the organizational learning, the researcher intends to introduce new procedures for data collection and systems modelling in the enterprises. The main objectives for the research are optimization and the minimization of the industrial impacts in the environment. lnformation systems for measurement of criticai variables in fundamental operatios of the productive process were developed and implemented in a group of industries in the study field. The cost approach was made in a preventive form using mathematical modelling. Optimizing alternatives and his consequences are presented for the decision makers in a continuous improvement methodology. The cases studied show a practical application in many industrial firms. Substancial reductions of costs in the rock blasting whith explosives were obtained and the environmental impacts were minimized in some cases. Also the scrap production rate in some shoes factories were reduced by the knowledge of the numeric value of this decision variable. The results obtained are reported case by case to demonstrate the validity of this work and to furnish a base for the reccomendations at the end.
|
108 |
[en] EXPLORING RDF KNOWLEDGE BASES THROUGH SERENDIPITY PATTERNS / [pt] EXPLORANDO BASES DE CONHECIMENTO EM RDF ATRAVÉS DE PADRÕES DE FORTUIDADEJERONIMO SIROTHEAU DE ALMEIDA EICHLER 15 January 2019 (has links)
[pt] Fortuidade pode ser definida como a descoberta de algo que não está sendo buscado. Em outras palavras, fortuidade trata da descoberta de informação que provê valiosas intuições ao desvendar conhecimento inesperado. O tópico vem recebendo bastante atenção na literatura, uma vez que precisão pode ser justificadamente relaxada com o objetivo de aumentar a satisfação do usuário. Uma área que pode se beneficiar com fortuidade é a área de dados interligados, um gigantesco espaço de dados no qual dados são disponibilizados publicamente. Buscar e extrair informação relevante se torna uma tarefa desafiadora à medida que cada vez mais dados se tornam disponíveis nesse ambiente. Esta tese contribui para enfrentar este desafio de duas maneiras. Primeiro, apresenta um processo de orquestração de consulta que introduz três estratégias para injetar padrões de fortuidade no processo de consulta. Os padrões de fortuidade são inspirados em características básicas de eventos fortuitos, como analogia e perturbação, e podem ser usados para estender os resultados com informações adicionais, sugerindo consultas alternativas ou reordenando os resultados. Em segundo lugar, introduz uma base de dados que pode ser utilizada para comparar diferentes abordagens de obtenção de conteúdo fortuito. A estratégia adotada para construção dessa base de dados consiste em dividir o universo de dados em partições com base em um atributo global e conectar entidades de diferentes partições de acordo com o número de caminhos compartilhados. / [en] Serendipity is defined as the discovery of a thing when one is not searching for it. In other words, serendipity means the discovery of information that provides valuable insights by unveiling unanticipated knowledge. The topic is receiving increased attention in the literature, since the precision requirement may be justifiably relaxed in order to improve user satisfaction. A field that can benefit from serendipity is the Web of Data, an immense global data space where data is publicly available. As more and more data become available in this data space, searching and extracting relevant information becomes a challenging task. This thesis contributes to addressing this challenge in two ways. First, it presents a query orchestration process that introduces three strategies to inject serendipity patterns in the query process. The serendipity patterns are inspired by basic characteristics of serendipitous events, such as, analogy and disturbance, and can be used for augmenting the results with additional information, suggesting
alternative queries or rebalancing the results. Second, it introduces a benchmark dataset that can be used to compare different approaches for locating serendipitous content. The strategy adopted for constructing the dataset consists of dividing the dataset into partitions based on a global feature and linking entities from different partitions according to the number of paths they share.
|
109 |
[en] APPLYING PROCESS MINING TO THE ACADEMIC ADMINISTRATION DOMAIN / [pt] APLICAÇÃO DE MINERAÇÃO DE PROCESSOS AO DOMÍNIO ACADÊMICO ADMINISTRATIVOHAYDÉE GUILLOT JIMÉNEZ 12 December 2017 (has links)
[pt] As instituições de ensino superior mantêm uma quantidade considerável de dados que incluem tanto os registros dos alunos como a estrutura dos currículos dos cursos de graduação. Este trabalho, adotando uma abordagem de mineração de processos, centra-se no problema de identificar quão próximo os alunos seguem a ordem recomendada das disciplinas em um currículo de graduação, e até que ponto o desempenho de cada aluno é afetado pela ordem que eles realmente adotam. O problema é abordado aplicando-se duas técnicas já existentes aos registros dos alunos: descoberta de processos e verificação de conformidade; e frequência de conjuntos de itens. Finalmente, a dissertação cobre experimentos realizados aplicando-se essas técnicas a um estudo de caso com mais de 60.000 registros de alunos da PUC-Rio. Os experimentos indicam que a técnica de frequência de conjuntos de itens produz melhores resultados do que as técnicas de descoberta de processos e verificação de conformidade. E confirmam igualmente a relevância de análises baseadas na abordagem de mineração de processos para ajudar coordenadores acadêmicos na busca de melhores currículos universitários. / [en] Higher Education Institutions keep a sizable amount of data, including student records and the structure of degree curricula. This work, adopting a process mining approach, focuses on the problem of identifying how closely students follow the recommended order of the courses in a degree curriculum, and to what extent their performance is affected by the order they actually adopt. It addresses this problem by applying to student records two already existing techniques: process discovery and conformance checking, and frequent itemsets. Finally, the dissertation covers experiments performed by applying these techniques to a case study involving over 60,000 student records from PUC-Rio. The experiments show that the frequent itemsets technique performs better than the process discovery and conformance checking techniques. They equally confirm the relevance of analyses based on the process mining approach to help academic coordinators in their quest for better degree curricula.
|
110 |
[en] A MULTI-AGENT APPROACH TO DATA MINING PROCESSES: APPLICATIONS TO HEALTH CARE / [pt] UMA ABORDAGEM MULTIAGENTE PARA PROCESSOS DE MINERAÇÃO DE DADOS: APLICAÇÕES NA ÁREA DA SAÚDEREINIER MOREJON NOVALES 02 August 2018 (has links)
[pt] A mineração de dados é um tema em alta que atrai pesquisadores de diferentes áreas, como bancos de dados, aprendizado de máquina e sistemas multiagentes. Como consequência do crescimento do volume de dados, há uma necessidade crescente de obter conhecimento desses grandes conjuntos de dados que são muito difíceis de manipular e processar com os métodos tradicionais. Os agentes de software podem desempenhar um papel significativo ao executar processos de mineração de dados de maneira mais eficiente. Por exemplo, eles podem trabalhar para realizar seleção, extração, pré-processamento e integração de dados, bem como mineração paralela, distribuída ou de múltiplas fontes. Este trabalho propõe uma abordagem (na forma de um framework) que usa agentes de software para gerenciar processos de mineração de dados. Para testar sua aplicabilidade, utilizamos vários conjuntos de dados relacionados ao domínio de saúde, representando alguns cenários de uso (hipotireoidismo, diabetes e arritmia). / [en] Data mining is a hot topic that attracts researchers from different areas, such as databases, machine learning, and multi-agent systems. As a consequence of the growth of data volume, there is a growing need to obtain knowledge from these large data sets that are very difficult to handle and process with traditional methods. Software agents can play a significant role performing data mining processes in ways that are more efficient. For instance, they can work to perform selection, extraction, preprocessing and integration of data as well as parallel, distributed, or multisource mining. This work proposes an approach (in the form of a framework) that uses software agents to manage data mining processes. In order to test its applicability, we use several data sets related to health care domain representing some usage scenarios (hypothyroidism, diabetes and arrhythmia).
|
Page generated in 0.0505 seconds