Spelling suggestions: "subject:"ediscovery"" "subject:"newdiscovery""
371 |
"Desenvolvimento de um Framework para Análise Visual de Informações Suportando Data Mining" / "Development of a Framework for Visual Analysis of Information with Data Mining suport"Rodrigues Junior, Jose Fernando 22 July 2003 (has links)
No presente documento são reunidas as colaborações de inúmeros trabalhos das áreas de Bancos de Dados, Descoberta de Conhecimento em Bases de Dados, Mineração de Dados, e Visualização de Informações Auxiliada por Computador que, juntos, estruturam o tema de pesquisa e trabalho da dissertação de Mestrado: a Visualização de Informações. A teoria relevante é revista e relacionada para dar suporte às atividades conclusivas teóricas e práticas relatadas no trabalho. O referido trabalho, embasado pela substância teórica pesquisada, faz diversas contribuições à ciência em voga, a Visualização de Informações, apresentando-as através de propostas formalizadas no decorrer deste texto e através de resultados práticos na forma de softwares habilitados à exploração visual de informações. As idéias apresentadas se baseiam na exibição visual de análises numéricas estatísticas básicas, frequenciais (Frequency Plot), e de relevância (Relevance Plot). São relatadas também as contribuições à ferramenta FastMapDB do Grupo de Bases de Dados e Imagens do ICMC-USP em conjunto com os resultados de sua utilização. Ainda, é apresentado o Arcabouço, previsto no projeto original, para construção de ferramentas visuais de análise, sua arquitetura, características e utilização. Por fim, é descrito o Pipeline de visualização decorrente da junção entre o Arcabouço de visualização e a ferramenta FastMapDB. O trabalho se encerra com uma breve análise da ciência de Visualização de Informações com base na literatura estudada, sendo traçado um cenário do estado da arte desta disciplina com sugestões de futuros trabalhos. / In the present document are joined the collaborations of many works from the fields of Databases, Knowledge Discovery in Databases, Data Mining, and Computer-based Information Visualization, collaborations that, together, define the structure of the research theme and the work of the Masters Dissertation presented herein. This research topic is the Information Visualization discipline, and its relevant theory is reviewed and related to support the concluding activities, both theoretical and practical, reported in this work. The referred work, anchored by the theoretical substance that was studied, makes several contributions to the science in investigation, the Information Visualization, presenting them through formalized proposals described across this text, and through practical results in the form of software enabled to the visual exploration of information. The presented ideas are based on the visual exhibition of numeric analysis, named basic statistics, frequency analysis (Frequency Plot), and according to a relevance analysis (Relevance Plot). There are also reported the contributions to the FastMapDB tool, a visual exploration tool built by the Grupo de Bases de Dados e Imagens do ICMC-USP, the performed enhancements are listed as achieved results in the text. Also, it is presented the Framework, as previewed in this work's original proposal, projected to allow the construction of visual analysis tools; besides its description are listed its architecture, characteristics and utilization. At last, it is described the visualization Pipeline that emerges from the joining of the visualization Framework and the FastMapDB tool. The work ends with a brief analysis of the Information Visualization science based on the studied literature, it is delineated a scenario of the state of the art of this discipline along with suggestions for future work.
|
372 |
Enabling high-throughput sequencing data analysis with MOSAIKStromberg, Michael Peter January 2010 (has links)
Thesis advisor: Gabor T. Marth / During the last few years, numerous new sequencing technologies have emerged that require tools that can process large amounts of read data quickly and accurately. Regardless of the downstream methods used, reference-guided aligners are at the heart of all next-generation analysis studies. I have developed a general reference-guided aligner, MOSAIK, to support all current sequencing technologies (Roche 454, Illumina, Applied Biosystems SOLiD, Helicos, and Sanger capillary). The calibrated alignment qualities calculated by MOSAIK allow the user to fine-tune the alignment accuracy for a given study. MOSAIK is a highly configurable and easy-to-use suite of alignment tools that is used in hundreds of labs worldwide. MOSAIK is an integral part of our genetic variant discovery pipeline. From SNP and short-INDEL discovery to structural variation discovery, alignment accuracy is an essential requirement and enables our downstream analyses to provide accurate calls. In this thesis, I present three major studies that were formative during the development of MOSAIK and our analysis pipeline. In addition, I present a novel algorithm that identifies mobile element insertions (non-LTR retrotransposons) in the human genome using split-read alignments in MOSAIK. This algorithm has a low false discovery rate (4.4 %) and enabled our group to be the first to determine the number of mobile elements that differentially occur between any two individuals. / Thesis (PhD) — Boston College, 2010. / Submitted to: Boston College. Graduate School of Arts and Sciences. / Discipline: Biology.
|
373 |
O processo de extração de conhecimento de base de dados apoiado por agentes de software. / The process of knowledge discovery in databases supported by software agents.Oliveira, Robson Butaca Taborelli de 01 December 2000 (has links)
Os sistemas de aplicações científicas e comerciais geram, cada vez mais, imensas quantidades de dados os quais dificilmente podem ser analisados sem que sejam usados técnicas e ferramentas adequadas de análise. Além disso, muitas destas aplicações são voltadas para Internet, ou seja, possuem seus dados distribuídos, o que dificulta ainda mais a realização de tarefas como a coleta de dados. A área de Extração de Conhecimento de Base de Dados diz respeito às técnicas e ferramentas usadas para descobrir automaticamente conhecimento embutido nos dados. Num ambiente de rede de computadores, é mais complicado realizar algumas das etapas do processo de KDD, como a coleta e processamento de dados. Dessa forma, pode ser feita a utilização de novas tecnologias na tentativa de auxiliar a execução do processo de descoberta de conhecimento. Os agentes de software são programas de computadores com propriedades, como, autonomia, reatividade e mobilidade, que podem ser utilizados para esta finalidade. Neste sentido, o objetivo deste trabalho é apresentar a proposta de um sistema multi-agente, chamado Minador, para auxiliar na execução e gerenciamento do processo de Extração de Conhecimento de Base de Dados. / Nowadays, commercial and scientific application systems generate huge amounts of data that cannot be easily analyzed without the use of appropriate tools and techniques. A great number of these applications are also based on the Internet which makes it even more difficult to collect data, for instance. The field of Computer Science called Knowledge Discovery in Databases deals with issues of the use and creation of the tools and techniques that allow for the automatic discovery of knowledge from data. Applying these techniques in an Internet environment can be particulary difficult. Thus, new techniques need to be used in order to aid the knowledge discovery process. Software agents are computer programs with properties such as autonomy, reactivity and mobility that can be used in this way. In this context, this work has the main goal of presenting the proposal of a multiagent system, called Minador, aimed at supporting the execution and management of the Knowledge Discovery in Databases process.
|
374 |
[en] BARRADAS DE CARVALHOS MIRRORS: AN EXILE POILITICAL CHRONICLES AND HISTORIOGRAPHY / [pt] OS ESPELHOS DE BARRADAS DE CARVALHO: CRÔNICA POLÍTICA E HISTORIOGRAFIA DE UM EXILADOGUIDO FABIANO PINHEIRO QUEIROZ 10 March 2009 (has links)
[pt] Este trabalho investiga a produção historiográfica e os artigos políticos do
historiador português Joaquim Barradas de Carvalho no período em que viveu no
Brasil na condição de exilado político (entre os anos de 1964 e 1970). O principal
objetivo é demonstrar que a produção acadêmica de Barradas é influenciada e
influencia sua visão política. O pesquisador e professor da USP é um espelho do
membro do Partido Comunista Português e opositor do Salazarismo – espelho que
reflete e, ao mesmo tempo, é refletido. Verificou-se que experiência de Barradas
enquanto exilado no Brasil tem uma importância fundamental na definição de suas
posições acadêmica e política (influindo tanto na imagem que traça do Regime
Salazarista como na sua própria auto-imagem enquanto intelectual). Procura-se,
também, entender a singular forma como o historiador caracteriza o período dos
Descobrimentos – entendido como auge da História Portuguesa, e centro em torno
do qual se organizam todos os outros períodos. Com esse objetivo analisam-se as
influências teóricas na obra de Barradas, especialmente a do discurso
decadentista – grupo de autores portugueses que tinham em comum uma
denúncia da decadência da sociedade lusitana relacionada a um sentimento de
saudade do seu passado glorioso. Por fim, constatou-se que essa visão histórica
de Barradas determina e é determinada pela sua oposição ao salazarismo
(entendido como verdadeira antítese da cultura dos Descobrimentos). / [en] This work investigates the historiographic production and
the political articles from the Portuguese historian
Joaquim Barradas de Carvalho in the period
that he lived in Brazil in exile (from 1964 to 1970). The
main goal is to show that Barrdas` academic production is
influenced and it also influences his political point
of view. The researcher and USP`s professor is a mirror
from the member of the Portuguese Communist Party and
opponent to Salazarism - mirror that reflects
and is reflected at the same time. It was noticed that
Barradas - experience as an exile in Brazil has a
fundamental importance on the definition of his academic and
political positions (influencing either on the image that
he creates of the Salazarist scheme or on his own auto-
image as an intellectual person). It is also sought to
understand the singular way the author characterizes the
discoveries period seen as the peak of the Portuguese
History, and the center in which all the other
periods are organized. With this objective, it is verified
the theoretical influences on Barradas` work, specially on
the decandestist speech group of Portuguese
authors that had in common a warning for the decadence of
the Portuguese society related to a saudade feeling from
its glorious past. Finally, it is noticed that this
Baradas` historical view determines and is determined by
his opposing to salazarism (seen as a truly antithesis from
the culture of the discoveries).
|
375 |
A experiência de maternidade no contexto de descoberta tardia da gravidezGonçalves, Thomás Gomes January 2018 (has links)
Esta tese aborda o fenômeno da descoberta tardia da gravidez, situação a qual uma mulher não se dá conta que está grávida durante boa parte do processo gestacional. As poucas pesquisas psicanalíticas sobre esta situação em específico apontam para uma questão traumática inerente a história de vida de mulheres que passam por essa experiência e, que acaba se apresentando na gestação desconhecida. Atenta-se para o fato de que nenhuma pesquisa na literatura sobre o fenômeno investigou a experiência de maternidade neste contexto em particular. Com base na perspectiva psicanalítica, o objetivo desta tese foi investigar a experiência de maternidade em mulheres que descobriram tardiamente a gestação ao longo do primeiro ano de vida do bebê que nasceu sob este contexto. Participaram do estudo três mulheres que descobriram tardiamente a gravidez sendo localizadas por conveniência. Cada participante foi entrevistada três vezes: ao redor do terceiro mês de vida de seu bebê; ao sexto mês e ao primeiro ano Em cada encontro foram aplicados alguns instrumentos, sendo o principal deles, uma entrevista semi estruturada que objetiva conhecer mais sobre a situação de descoberta tardia da gravidez, a história de vida da participante, sua experiência de maternidade e a sua relação com o seu bebê. Para a análise de dados foi utilizado o relato clínico que evidencia a singularidade de cada participante em relação a sua experiência de maternidade sob tal contexto. Os resultados e a discussão dos dados apontam para a possibilidade de que a descoberta tardia da gravidez possa ser uma defesa contra a emersão de um cenário excessivo, sendo que tal contexto traumático/excessivo incide na experiência de maternidade/no acolhimento do bebê pós-parto. Tanto os resultados e a discussão se dão a partir da Psicanálise. Na parte final da tese, aponta-se a possibilidade de que os encontros com as participantes ajudaram com que esse cenário excessivo pudesse ir perdendo a sua força traumática por meio da escuta analítica. / This thesis addresses the phenomenon of late pregnancy discovery situation in which a woman is not aware that she is pregnant through a great part of pregnancy. Few psychoanalytic researches indicate that there is a traumatic issue involved in this experience. This trauma is related to these women's life story and it is updated in the unknown pregnancy situation. It is important to recall that not a single research investigated the motherhood experience in this specific context. Based on the psychoanalytic perspective, this thesis aims to investigate motherhood experience in women who had a late pregnancy discovery during their babies' first year of life. Three women participated in this study and they were all located by convenience. Each participant was interviewed three times: around their babies' third month of life; at sixth month and first year. The interview aimed to get to know more about their late pregnancy discovery experience, their life story, their motherhood experience as well as their relationship with their babies. Clinical report was used as data analysis which highlights the singularity of each participant on motherhood experience in this context. Results and discussion of the data indicated the possibility that the situation of late pregnancy discovery might be a defense against the emersion of an excessive scenario and this traumatic/excessive context has its influence in the motherhood experience/sheltering the baby after birth. In the final part of the thesis it is proposed a possibility that the encounter that the researcher had with the participants helped to decrease the traumatic force of this excessive scenario through analytic listening.
|
376 |
APLICAÇÃO DA MINERAÇÃO DE DADOS NA DESCOBERTA DE PADRÕES DO PERFIL DE ALUNOS DO CURSO DE SI-UnUCET-UEGDel-fiaco, Ronaldo de Castro 13 March 2012 (has links)
Made available in DSpace on 2016-08-10T10:40:15Z (GMT). No. of bitstreams: 1
RONALDO DE CASTRO DEL-FIACO.pdf: 3047529 bytes, checksum: b55c6c1e7ebb7f0baf421ea95eb9683a (MD5)
Previous issue date: 2012-03-13 / The Data Mining (DM) is a part of the process of Knowledge Discovery in
Databases. Its implementation requires knowledge of various areas such as computer
sciences, statistics, management sciences and the business itself. In particular, it can be
applied to discover knowledge that allows the manager to improve the quality of the
learning process in which he/she is involved. This work presents the theoretical
background of data mining, describes and analyzes a case study where the main
objective is to apply the Cross-Industry Standard Process for Data Mining - CRISP-DM
methodology to identify the profile of the student that graduates in due time from the
course of Bachelor of Information Systems of the State University of Goiás at Anápolis.
It describes the data preparation that is used in the process and identify the best
proposals for analysis of the case study. As input data, both the transcripts and the
answers of the socioeconomic and cultural questionnaire applied to the students are
used as attributes for the evaluation of decision tree algorithms implemented in the data
mining tool known as WEKA. It was possible to realize that data mining requires a
professional who mastered the theory of DM to correctly calibrate the tools and
extensive knowledge of the business in order to determine the data mining goals and
interpret the results. / A mineração de dados (Data Mining - DM) é uma parte do processo para
descobrir conhecimento em base de dados. Sua realização exige conhecimentos de
várias áreas tais como a computação, a estatística, as ciências administrativas e do
próprio negócio. Em particular, pode ser aplicada para descobrir conhecimento que
permita ao gestor educacional melhorar a qualidade do processo ensino-aprendizagem
no qual esteja envolvido. Este trabalho apresenta o embasamento teórico em mineração
de dados, descreve e analisa um estudo de caso, cujo principal objetivo é aplicar a
metodologia Cross-Industry Standard Process for Data Mining - CRISP-DM na
identificação do padrão do perfil do aluno que integraliza o curso de Bacharelado em
Sistemas de Informação da Unidade Universitária de Ciências Exatas e Tecnológicas da
Universidade de Estadual de Goiás, no tempo mínimo previsto pelo projeto pedagógico
do curso. É realizada a preparação dos dados que são utilizados no processo para,
posteriormente, identificar as melhores propostas de análise do estudo de caso. Como
dados de entrada, recorre-se às respostas do questionário socioeconômico e cultural
aplicados aos vestibulandos e ao histórico escolar dos mesmos, que são utilizados como
atributos para a avaliação dos algoritmos de árvore de decisão, através da ferramenta
WEKA. Com este estudo, foi possível perceber que, para realizar a mineração de dados,
é necessário um profissional que domine a teoria de DM, saiba calibrar uma ferramenta
computacional e tenha conhecimento aprofundado do negócio, para determinar os
objetivos da DM e interpretar os resultados encontrados.
|
377 |
DESCOBERTA DE CONHECIMENTO NA PLATAFORMA LATTES: UM ESTUDO DE CASO NO INSTITUTO FEDERAL DE GOIÁS. / KNOWLEDGE DISCOVERY IN LATTES PLATFORM: A CASE STUDY IN THE FEDERAL INSTITUTE OF GOIAS.Cavalcante, Renata de Souza Alves Paula 24 February 2014 (has links)
Made available in DSpace on 2016-08-10T10:40:21Z (GMT). No. of bitstreams: 1
RENATA DE SOUZA ALVES PAULA CAVALCANTE.pdf: 3920138 bytes, checksum: 5a8a21fa7b849ef942fb6113dc3f6635 (MD5)
Previous issue date: 2014-02-24 / Ao longo do tempo, percebeu-se que a velocidade do acúmulo de informações
era maior do que a velocidade de processamento e análise das mesmas. Não adianta
uma organização ter muita informação, se não souber dela extrair conhecimento útil. É
preciso que sejam feitas análises apuradas sobre os dados e descobrir quais são os
padrões de comportamentos existentes nos mesmos. Assim, uma organização poderá
realizar tomada de decisão de forma mais segura, baseada em fatos reais e não em
meras suposições, inclusive no âmbito da gestão de Ciência e Tecnologia. Este
trabalho teve como objetivo realizar um estudo de caso no Instituto Federal de Goiás
(IFG), aplicando o processo de Knowledge Discovery in Database (KDD), na tentativa
de identificar padrões que representem o perfil da produção científica dos docentes da
instituição. A maior parte dos dados analisados foram extraídos da Plataforma Lattes
(PL) e o período da pesquisa fixado no último triênio. Pretendeu-se obter
conhecimento sobre a produtividade dos docentes e provê-los à Pró-Reitoria de
Pesquisa e Pós-Graduação do IFG para auxiliar na sua gestão. A pesquisa aborda por
meio de um levantamento bibliográfico os conceitos sobre Gestão do Conhecimento
(GC), o processo de KDD, incluindo a Mineração de Dados (MD) com suas tarefas e
técnicas, a produção científica, a PL e o contexto atual do IFG. Dessa forma, entre os
resultados obtidos no trabalho, viu-se que a aplicação do KDD pode ser um poderoso
instrumento para a gestão das informações nas instituições de ensino.
|
378 |
SNP discovery, high-density genetic map construction, and identification of genes associated with climate adaptation, and lack of intermuscular bone in tambaqui (Colossoma macropomum) / Descoberta de SNP, construção de mapa genético de alta densidade e identificação de genes associados com adaptação climática e ausência da espinha intermuscular em tambaqui (Colossoma macropomum)Nunes, José de Ribamar da Silva 08 March 2017 (has links)
Tambaqui (Colossoma macropomum) is the largest native Characiform species from the Amazon and Orinoco river basins of South America. Tambaqui farming is growing rapidly in Brazil, its production reached 139.209 tons in 2014, what corresponds to 57.7% of increase compared with 2013. However, few genetic studies of tambaqui are currently available. The tambaqui genetic studies for cultured and wild populations need a holistic approach for a rational action facing ecological and market challenges in aquaculture. Approaches based on genetic studies have provided important tools to understand population dynamics, local adaptation, and gene function to improve selection strategies to be applied in breeding programs. The next-generation sequencing (NGS) allowed a great advance in genomic and transcriptomic approaches, especially related to non-model species. The genotype-by-sequencing (GBS) is one of this approaches based on genome complexity reduction using restriction enzymes (REs). This thesis presents the application of these approaches to provide advances in the genetic background for tambaqui studies. The GBS approach provided a high-density SNPs panel that allowed us to develop the first linkage map, and association studies with environmental variables, local adaptation, and lack of intermuscular bones, both using tambaqui as a model. This work can give us many theoretical references to be applied in genetic breeding programs for tambaqui, allowing a better understanding of genetic processes related to traits of interest in aquaculture. / O tambaqui (Colossoma macropomum) é a maior espécie nativa de Characiforme da América do Sul e é encontrado nas bacias do rio Amazonas e Orinoco. O cultivo do tambaqui está crescendo rapidamente no Brasil, sua produção atingiu 139.209 toneladas em 2014, o que corresponde a 57,7% de aumento em relação a 2013. No entanto, poucos estudos genéticos realizados com o tambaqui estão disponíveis atualmente. Estudos genéticos em tambaqui, tanto em populações cultivadas quanto em populações selvagens, necessitam de uma abordagem holística para uma ação racional frente aos desafios ecológicos e mercadológicos na aquicultura. Abordagens baseadas em estudos genéticos têm fornecido ferramentas importantes para se entender a dinâmica populacional, adaptação local e função gênica visando melhorar as estratégias de seleção a serem aplicadas em programas de melhoramento genético. O sequenciamento de nova geração (NGS) permitiu um grande avanço nas abordagens genômicas e transcriptômicas, especialmente relacionadas a espécies não-modelo. A genotipagem por sequenciamento (GBS) é uma dessas abordagens que utilizam enzimas de restrição (REs) para reduzir a complexidade do genoma. Esta tese apresenta a aplicação desta abordagem objetivando proporcionar avanços significativos nos estudos genéticos de base para tambaqui. A técnica de GBS forneceu um painel de SNPs de alta densidade que nos permitiu desenvolver o primeiro mapa de ligação e estudos de associação com variáveis ambientais, adaptação local e ausência de ossos intermusculares no tambaqui. Este trabalho pode nos dar muitas referências teóricas a serem aplicadas em programas de melhoramento genético do tambaqui, permitindo uma melhor compreensão dos processos genéticos relacionados a traços de interesse na aquicultura.
|
379 |
Modelagem de processo de extração de conhecimento em banco de dados para sistemas de suporte à decisão. / Modeling of knowledge discovery in databases for decision systems.Shiba, Sonia Kaoru 26 June 2008 (has links)
Este trabalho apresenta a modelagem de um processo de extração de conhecimento, onde a aquisição de informações para a análise de dados têm como origem os bancos de dados transacionais e data warehouse. A mineração de dados focou-se na geração de modelos descritivos a partir de técnicas de classificação baseada no Teorema de Bayes e no método direto de extração de regras de classificação, definindo uma metodologia para a geração de modelos de aprendizagem. Foi implementado um processo de extração de conhecimento para a geração de modelos de aprendizagem para suporte à decisão, aplicando técnicas de mineração de dados para modelos descritivos e geração de regras de classificação. Explorou-se a possibilidade de transformar os modelos de aprendizagem em bases de conhecimento utilizando um banco de dados relacional, disponível para acesso via sistema especialista, para a realização de novas classificações de registros, ou então possibilitar a visualização dos resultados a partir de planilhas eletrônicas. No cenário descrito neste trabalho, a organização dos procedimentos da etapa de pré-processamento permitiu que a extração de atributos adicionais ou transformação de dados fosse realizada de forma iterativa, sem a necessidade de implementação de novos programas de extração de dados. Desta forma, foram definidas todas as atividades essenciais do pré-processamento e a seqüência em que estas devem ser realizadas, além de possibilitar a repetição dos procedimentos sem perdas das unidades codificadas para o processo de extração de dados. Um modelo de processo de extração de conhecimento iterativo e quantificável, em termos das etapas e procedimentos, foi configurado vislumbrando um produto final com o projeto da base de conhecimento para ações de retenção de clientes e regras para ações específicas com segmentos de clientes. / This work presents a model of knowledge discovery in databases, where the information for data analysis comes from a repository of transactional information systems and data-warehouse. The data mining focused on the generation of descriptive models by means of classification techniques based on the Bayes\' theorem and a extraction method of classification rules, defining a methodology to propose new learning models. The process of knowledge extraction was implemented for the generation of learning models for support the make decision, applying data mining for descriptive models and generation of classification rules. This work explored the possibility of transforming the learning models in knowledge database using a relational database, to be accessible by a specialist system, to classify new records or to allow the visualization of the results through electronic tables. The organization of the procedures in the pre-processing allowed to extract additional attributes or to transform information in an interactive process, with no need of new programs to extract the information. This way, all the essential activities of the pre-processing were defined and the sequence in which these should be developed. Additionally, this allowed the repetition of the procedures with no loss of units for the process of information extraction. A model of process for the interactive and quantifiable extraction of knowledge, in terms of the stages and procedures, was idealized in order to develop a product with the project of the knowledge databases for actions of retention of clients and rules for specific actions within clients\' segments.
|
380 |
Computação Evolutiva para a Construção de Regras de Conhecimento com Propriedades Específicas / Evolutionary Computing for Knowledge Rule Construction with Specific PropertiesPila, Adriano Donizete 12 April 2007 (has links)
A maioria dos algoritmos de aprendizado de máquina simbólico utilizam regras de conhecimento if-then como linguagem de descrição para expressar o conhecimento aprendido. O objetivo desses algoritmos é encontrar um conjunto de regras de classificação que possam ser utilizadas na predição da classe de novos casos que não foram vistos a priori pelo algoritmo. Contudo, este tipo de algoritmo considera o problema da interação entre as regras, o qual consiste na avaliação da qualidade do conjunto de regras induzidas (classificador) como um todo, ao invés de avaliar a qualidade de cada regra de forma independente. Assim, como os classificadores têm por objetivo uma boa precisão nos casos não vistos, eles tendem a negligenciar outras propriedades desejáveis das regras de conhecimento, como a habilidade de causar surpresa ou trazer conhecimento novo ao especialista do domínio. Neste trabalho, estamos interessados em construir regras de conhecimento com propriedades específicas de forma isolada, i.e. sem considerar o problema da interação entre as regras. Para esse fim, propomos uma abordagem evolutiva na qual cada individuo da população do algoritmo representa uma única regra e as propriedades específicas são codificadas como medidas de qualidade da regra, as quais podem ser escolhidas pelo especialista do domínio para construir regras com as propriedades desejadas. O algoritmo evolutivo proposto utiliza uma rica estrutura para representar os indivíduos (regras), a qual possibilita considerar uma grande variedade de operadores evolutivos. O algoritmo utiliza uma função de aptidão multi-objetivo baseada em ranking que considera de forma concomitante mais que uma medida de avaliação de regra, transformando-as numa função simples-objetivo. Como a avaliação experimental é fundamental neste tipo de trabalho, para avaliar nossa proposta foi implementada a Evolutionary Computing Learning Environment --- ECLE --- que é uma biblioteca de classes para executar e avaliar o algoritmo evolutivo sob diferentes cenários. Além disso, a ECLE foi implementada considerando futuras implementações de novos operadores evolutivos. A ECLE está integrada ao projeto DISCOVER, que é um projeto de pesquisa em desenvolvimento em nosso laboratório para a aquisição automática de conhecimento. Analises experimentais do algoritmo evolutivo para construir regras de conhecimento com propriedades específicas, o qual pode ser considerado uma forma de análise inteligente de dados, foram realizadas utilizando a ECLE. Os resultados mostram a adequabilidade da nossa proposta / Most symbolic machine learning approaches use if-then know-ledge rules as the description language in which the learned knowledge is expressed. The aim of these learners is to find a set of classification rules that can be used to predict new instances that have not been seen by the learner before. However, these sorts of learners take into account the rule interaction problem, which consists of evaluating the quality of the set of rules (classifier) as a whole, rather than evaluating the quality of each rule in an independent manner. Thus, as classifiers aim at good precision to classify unseen instances, they tend to neglect other desirable properties of knowledge rules, such as the ability to cause surprise or bring new knowledge to the domain specialist. In this work, we are interested in building knowledge rules with specific properties in an isolated manner, i.e. not considering the rule interaction problem. To this end, we propose an evolutionary approach where each individual of the algorithm population represents a single rule and the specific properties are encoded as rule quality measure, a set of which can be freely selected by the domain specialist. The proposed evolutionary algorithm uses a rich structure for individual representation which enables one to consider a great variety of evolutionary operators. The algorithm uses a ranking-based multi-objective fitness function that considers more than one rule evaluation measure concomitantly into a single objective. As experimentation plays an important role in this sort of work, in order to evaluate our proposal we have implemented the Evolutionary Computing Learning Environment --- ECLE --- which is a framework to evaluate the evolutionary algorithm in different scenarios. Furthermore, the ECLE has been implemented taking into account future development of new evolutionary operators. The ECLE is integrated into the DISCOVER project, a major research project under constant development in our laboratory for automatic knowledge acquisition and analysis. Experimental analysis of the evolutionary algorithm to construct knowledge rules with specific properties, which can also be considered an important form of intelligent data analysis, was carried out using ECLE. Results show the suitability of our proposal
|
Page generated in 0.0942 seconds