421 |
Social training : aprendizado semi supervisionado utilizando funções de escolha social / Social-Training: Semi-Supervised Learning Using Social Choice FunctionsAlves, Matheus January 2017 (has links)
Dada a grande quantidade de dados gerados atualmente, apenas uma pequena porção dos mesmos pode ser rotulada manualmente por especialistas humanos. Isso é um desafio comum para aplicações de aprendizagem de máquina. Aprendizado semi-supervisionado aborda este problema através da manipulação dos dados não rotulados juntamente aos dados rotulados. Entretanto, se apenas uma quantidade limitada de exemplos rotulados está disponível, o desempenho da tarefa de aprendizagem de máquina (e.g., classificação) pode ser não satisfatória. Diversas soluções abordam este problema através do uso de uma ensemble de classificadores, visto que essa abordagem aumenta a diversidade dos classificadores. Algoritmos como o co-training e o tri-training utilizam múltiplas partições de dados ou múltiplos algoritmos de aprendizado para melhorar a qualidade da classificação de instâncias não rotuladas através de concordância por maioria simples. Além disso, existem abordagens que estendem esta ideia e adotam processos de votação menos triviais para definir os rótulos, como eleição por maioria ponderada, por exemplo. Contudo, estas soluções requerem que os rótulos possuam um certo nível de confiança para serem utilizados no treinamento. Consequentemente, nem toda a informação disponível é utilizada. Por exemplo: informações associadas a níveis de confiança baixos são totalmente ignoradas. Este trabalho propõe uma abordagem chamada social-training, que utiliza toda a informação disponível na tarefa de aprendizado semi-supervisionado. Para isto, múltiplos classificadores heterogêneos são treinados com os dados rotulados e geram diversas classificações para as mesmas instâncias não rotuladas. O social-training, então, agrega estes resultados em um único rótulo por meio de funções de escolha social que trabalham com agregação de rankings sobre as instâncias. Especificamente, a solução trabalha com casos de classificação binária. Os resultados mostram que trabalhar com o ranking completo, ou seja, rotular todas as instâncias não rotuladas, é capaz de reduzir o erro de classificação para alguns conjuntos de dados da base da UCI utilizados. / Given the huge quantity of data currently being generated, just a small portion of it can be manually labeled by human experts. This is a challenge for machine learning applications. Semi-supervised learning addresses this problem by handling unlabeled data alongside labeled ones. However, if only a limited quantity of labeled examples is available, the performance of the machine learning task (e.g., classification) can be very unsatisfactory. Many solutions address this issue by using a classifier ensemble because this increases diversity. Algorithms such as co-training and tri-training use multiple views or multiple learning algorithms in order to improve the classification of unlabeled instances through simple majority agreement. Also, there are approaches that extend this idea and adopt less trivial voting processes to define the labels, like weighted majority voting. Nevertheless, these solutions require some confidence level on the label in order to use it for training. Hence, not all information is used, i.e., information associated with low confidence level is disregarded completely. An approach called social-training is proposed, which uses all information available in the semi-supervised learning task. For this, multiple heterogeneous classifiers are trained with the labeled data and generate diverse classifications for the same unlabeled instances. Social-training then aggregates these results into a single label by means of social choice functions that work with rank aggregation over the instances. The solution addresses binary classification cases. The results show that working with the full ranking, i.e., labeling all unlabeled instances, is able to reduce the classification error for some UCI data sets used.
|
422 |
Everyday visualization: discovering more about individuals / Everyday visualization : descobrindo mais sobre indivíduosPagno, Bruno Lorandi January 2018 (has links)
As pessoas estão ficando cada vez mais interessadas no uso de monitores de atividade. A quantidade de dados de indivíduos disponível está ajudando na expansão e desenvolvimento de novas aplicações e projetos de visualizações para ser usados em casa, em ciência (e.g. para entender melhor o comportamento de populações) ou em governos interessados em desenvolver cidades inteligentes. Nesse trabalho é apresentada uma visualização simples e intuitiva que permite a exploração de dados pessoais por pessoas comuns. Com foco em ajudar as pessoas a compreenderem a si mesmas melhor e perceber coisas novas sobre seus dados. A visualização construída neste projeto é baseada em metáforas de calendários, relógios e mapas, além de utilizar gráficos de barra para explorar dados crus. A exploração desses dados se dá pela interação entre essas visualizações. Para avaliar o produto do trabalho são apresentados dois casos de uso onde alguns usuários tiveram a oportunidade de observar e discutir suas informações de dois pontos de vista diferente: exploração de dados pessoais para auto-aperfeiçoamento e o uso do Everyday Visualization por cientistas da saúde. Em nenhum dos casos houve treinamento. As visualizações resultantes agregam diversas fontes de dados, indo além de outros trabalhos de visualização casual e pessoal. Os resultados promissores demonstram a viabilidade de tais técnicas para visualização de dados pessoais. / People are becoming increasingly more interested in the use of activity monitors and selfimprovement. The availability of individuals’ data is also pushing the development of new applications and data visualization projects to be used at home, in science (e.g. to better understand the behavior of populations) or for governments interested in developing intelligent cities. In this work, we present an easy and intuitive set of visualizations to allow the exploration of personal data by common people. We focus on helping people to know themselves better and to make sense of their own data. Our visualizations are based on the metaphors of calendars, clocks, and maps, as well as on the use of bar charts to explore raw data. Data exploration is therefore guaranteed by the interaction between them. In order to evaluate our work we present two use cases, where few users observe and discuss the data from different points of view: the exploration of personal data for self-improvement purposes, and the use of Everyday Visualization by health scientists. Both use cases were ran without any training session. The resulting visualization aggregates several different data sources, going beyond many of the personal and casual visualization works. The promising results achieved demonstrated the viability of the use of such techniques for personal data visualizations and sense making.
|
423 |
Sobre não ter a memória dos peixes : a identidade em questão n'A máquina de fazer espanhóisForli, Cristina Arena January 2016 (has links)
Sabe-se que a memória constitui-se, ao longo da história, um objeto de disputas. É com base nela que os povos afirmam suas representações culturais, tendo em vista que as narrativas individuais são integrantes das narrativas coletivas. O romance A máquina de fazer espanhóis, de Valter Hugo Mãe, publicado em 2010, tem como fio condutor a memória de António Jorge da Silva, narrador-protagonista. Entende-se a memória desse narrador como um ponto de vista sobre a memória coletiva da nação portuguesa. Este trabalho, assim, tem como foco analisar o processo de constituição da identidade tanto no nível individual quanto no coletivo a partir da subjetividade de Silva. Para isso, utilizam-se os estudos de teóricos referentes aos três eixos estabelecidos nesta pesquisa, memória, história e identidade. Entre eles estão Maurice Halbwachs, Ecléa Bosi, Paul Ricoeur, Jacques Le Goff, Walter Benjamin, Maria de Fátima Marinho, Stuart Hall, Zygmunt Bauman, Boaventura de Sousa Santos e Eduardo Lourenço. Os resultados refletem não só os paradoxos existentes no que se refere às representações do passado histórico, mas também em relação às memórias e conflitos do narrador e das personagens. Esses paradoxos também revelam uma identidade fragmentada e fluida, vivida de forma ainda mais intensa pelo narrador devido à sua condição de idoso e à sua vivência no Estado Novo. / It is known that memory constitutes, throughout history, in a dispute object. It is on that basis that people claim their cultural representations, given that the individual narratives are part of collective narratives. The novel A máquina de fazer espanhóis, by Valter Hugo Mãe, published in 2010, has as the thread of the narrative the memory of Antonio Jorge da Silva, the novel's narrator-protagonist. The narrator's memory is understood as a point of view of the Portuguese nation's collective memory. This work thus focuses on analyzing the identity constitution process both individually and collectively from the subjectivity of Silva. For this, we use the theoretical studies relating to the three axes set out in this research, memory, history and identity. Among them are Maurice Halbwachs, Ecléa Bosi, Paul Ricoeur, Jacques Le Goff, Walter Benjamin, Maria de Fátima Marinho, Stuart Hall, Zygmunt Bauman, Boaventura de Sousa Santos and Eduardo Lourenço. The results reflect not only the paradoxes existing in relation to the historical past representations, but also to the memories and conflicts of the narrator and the characters. These paradoxes also reveal a fragmented and fluid identity, experienced even more intensely by the narrator because of his old condition and his experience in the New State (Estado Novo).
|
424 |
Parâmetros de capacidade de suporte de carga em solos com diferentes anos de adoção do sistema de plantio direto / Load bearing capacity parameters in soils with diferent years of no-tillage system adoptionMazurana, Michael January 2015 (has links)
As mudanças ocorridas na agricultura nos últimos 40 anos tiveram grande impacto na forma de se fazer agricultura em todo o mundo. Os principais marcos desta mudança foram a introdução de sistemas conservacionistas de solos, a revolução verde no âmbito do melhoramento de plantas e o incremento do grau de mecanização nas propriedades. Destes, o primeiro e o último são abordados, em parte, neste trabalho. A introdução do sistema de plantio direto (SPD) associado ao uso intenso de mecanização tem aumentado os problemas de ordem física como a compactação dos solos agrícolas em algum grau que compromete o desenvolvimento das plantas. Diante disso o objetivo deste trabalho foi estudar como o tempo de adoção de SPD e o tempo de aplicação de carga afetam a dinâmica de alguns atributos físicos e mecânicos em três classes de solos e relacioná-los com variáveis de plantas. Para isso foram escolhidas três classes de solos de maior expressão para uso agrícola no Sul do Brasil e, dentro de cada classe, lavouras com diferentes tempos de adoção do sistema e que tivesse o histórico de uso e manejo do solo conhecido. Os resultados mostram que variáveis físicas ou mecânicas isoladas não conseguiram captar diferenças na estrutura do solo, independentemente da classe estudada, ao passo que variáveis que medem fluxos conseguiram captar diferenças significativas entre os tempos de adoção do SPD. Além disso, os resultados apontam que a diminuição no tempo de aplicação de carga no solo não altera os valores de pressão de pré-consolidação, mas sim o índice de compressibilidade, indicando que é possível reduzir o tempo de aplicação de carga em laboratório sem comprometer os resultados. Para a condição de Argissolo, foi observado o efeito do tráfego de máquinas nos atributos de plantas medidos somente se manifestam para as condições de déficit hídrico, indicando que em condições normais de precipitação ou uso de irrigação os efeitos da compactação são de difícil observação na planta. / The changes in agriculture over the last 40 years had great impact on the way of making agriculture worldwide. Three were the principal marks: the introduction of soil conservation systems, the green revolution in the plant breeding and increase the degree of mechanization in the properties. Of these, the first and the last are presenting in this work. The introduction of the notillage system (NT) associated with intensive mechanization has increased reports of physical problems such as agricultural soils compaction in to degree that development of plants are proven. In this sense, the aim was study in different soil classes as the time of NT adoption and application load time affect the dynamics of physical and mechanical properties of these soils and relates with plant variables. Since, we choose three soil classes of greatest expression for agricultural use in southern Brazil and, within each class, with different crops adoption time system and you had the history of use and management of the known soil. The results show that physical or mechanical variables isolated failed to grasp differences in the soil structure, regardless of class studied, while variables measuring flows able to capture significant differences between NT adoptions of times. In addition, the results indicate that the decrease in load application time on the ground does not change the values of pre-compression stress mechanical variable but the compressibility index, indicating that we can cut down on laboratory load application without compromising the results. For Paleudalf condition, the effect of machinery traffic in plant attributes measured only for drought conditions observed, indicating that in normal use of rainfall or irrigation signals compaction problems are difficult to observe in plant conditions.
|
425 |
Predição de RNAs não-codificadores no transcriptoma do fungo Paracoccidioides brasiliensis usando aprendizagem de máquinaArrial, Roberto Ternes 04 1900 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Biológicas, Departamento de Biologia Celular, 2008. / Submitted by Diogo Trindade Fóis (diogo_fois@hotmail.com) on 2009-10-06T11:45:45Z
No. of bitstreams: 1
2008_RobertoTernesArrial.pdf: 1174697 bytes, checksum: deb680a64e956cb71d50d5d028a379c8 (MD5) / Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2009-11-03T17:27:16Z (GMT) No. of bitstreams: 1
2008_RobertoTernesArrial.pdf: 1174697 bytes, checksum: deb680a64e956cb71d50d5d028a379c8 (MD5) / Made available in DSpace on 2009-11-03T17:27:16Z (GMT). No. of bitstreams: 1
2008_RobertoTernesArrial.pdf: 1174697 bytes, checksum: deb680a64e956cb71d50d5d028a379c8 (MD5)
Previous issue date: 2008-04 / Paracoccidioides brasiliensis (Pb) é um fungo saprófito e dimórfico de importância clínica, pois seus propágulos, quando inalados por humanos, desencadeiam a doença conhecida como paracoccidioidomicose. No ano de 2005 foi publicado o transcriptoma do Pb, apontando diversos alvos potenciais de drogas, mas ainda assim uma parte significativa dos transcritos seqüenciados não possui proteínas homólogas identificadas. Esse trabalho sugere que alguns desses RNAs possam ser não-codificadores (ncRNAs), uma classe de moléculas biologicamente funcionais que no entanto não codificam para nenhum produto protéico. Para tanto foi feita uma abordagem exclusivamente computacional, utilizando exemplos conhecidos de mRNAs e ncRNAs para treinamento de dois algoritmos de aprendizado de máquina: naive Bayes (nB) e Máquinas de Vetores de Suporte (MVS). Diversos programas descritos na literatura e desenvolvidos localmente foram usados para obter propriedades dos transcritos e de seus produtos protéicos, de forma que os algoritmos de aprendizado de máquina fossem capazes de diferenciar satisfatoriamente um mRNA de um ncRNA. O uso de várias medidas de eficiência mostra que ambos algoritmos, MVS e nB, induziram classificadores que discriminam as duas classes de RNAs de forma muito eficiente, mas também indicam que o MVS possui uma vantagem significativa em relação à sua detecção de ncRNAs. Acurácia média mensurada por validação cruzada de 10 vezes para o MVS foi de 92,4%, e para o nB, 75,3%. Quando usados no transcriptoma de Pb, o MVS e o nB detectam, respectivamente, 970 e 262 ncRNAs, dos quais a maior parte é de transcritos sem anotação e singlets, duas características que apóiam a possibilidade de que esses transcritos sejam realmente ncRNAs. Comparações a programas relacionados mostram que o programa aqui descrito apresenta um ganho em velocidade computacional sem perda de acurácia. Foi desenvolvido nesse trabalho um programa computacional de análise ab initio, designado PORTRAIT, especializado em detecção de ncRNAs em transcriptomas de organismos pouco caracterizados. __________________________________________________________________________________________ ABSTRACT / Paracoccidioides brasiliensis (Pb) is a saprophytic and dimorphic fungus of clinical importance because its propagules, when inhaled by humans, cause the disease known as paracoccidioidomycosis. In the year 2005 the Pb transcriptome was published, pointing out several potential drug targets, but still a significative amount of sequenced transcripts lack identified homologous proteins. This work suggests that these RNAs may be non-coding RNAs (ncRNAs), a class of biologically functional molecules that do not code for any protein product. Aiming this, a strictly computational approach was made, using known examples of mRNAs and ncRNAs for training two machine learning algorithms: naive Bayes (nB) and Support Vector Machines (SVM). Several programs available from literature and locally developed were used to obtain properties from transcripts and its corresponding protein products, in such a way that machine learning algorithms could successfully discriminate between mRNA and ncRNA. Several efficiency measurements show that both algorithms, SVM and nB, induced classifiers able to efficiently discriminate the two classes of RNAs, and also indicate that SVM has a significative advantage regarding ncRNA detection. Mean accuracy as estimated by 10-fold cross-validation procedure was 92.4% for SVM and 75.3% for nB. When used in the Pb transcriptome, SVM and nB detect, respectively, 970 and 262 ncRNAs, of which the majority is composed of singlets and unnanotated transcripts, two characteristics that support the possibility that these transcripts are real ncRNAs. Comparison to related works indicates that the described program offers a computational speed improvement without hindering accuracy. This work describes the design of a computational program for ab initio analysis, named PORTRAIT, specialized in detection of ncRNAs in transcriptomes from poorly characterized organisms.
|
426 |
Fatores que influenciam a interação entre usuário e a interface de periódicos científicos eletrônicos : um estudo com autores de artigos no sistema eletrônico de editoração de revistas (SEER)Rocha, Suzana Francisca da 25 February 2014 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2014. / Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2014-04-28T14:51:17Z
No. of bitstreams: 1
2014_SuzanaFranciscaRocha.pdf: 2615421 bytes, checksum: d3f8079ff6237812322f730b8aef85d7 (MD5) / Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2014-04-28T15:59:25Z (GMT) No. of bitstreams: 1
2014_SuzanaFranciscaRocha.pdf: 2615421 bytes, checksum: d3f8079ff6237812322f730b8aef85d7 (MD5) / Made available in DSpace on 2014-04-28T15:59:25Z (GMT). No. of bitstreams: 1
2014_SuzanaFranciscaRocha.pdf: 2615421 bytes, checksum: d3f8079ff6237812322f730b8aef85d7 (MD5) / Aborda um estudo de interação entre o usuário da informação e a interface de periódicos científicos eletrônicos que utilizam o Sistema Eletrônico de Editoração de Revistas
(SEER). Tem como objetivo identificar os aspectos que influenciam a comunicação e
mediação da informação entre o usuário autor e a interface do periódico científico eletrônico que utiliza o SEER. Constitui uma pesquisa de natureza aplicada, quali-quantitativa quanto a forma de abordagem, descritiva quanto aos objetivos e com relação aos procedimentos técnicos enquadra-se como levantamento. Partiu-se do pressuposto que as TIC proporcionaram uma maior autonomia dos usuários na busca da informação, e nesse contexto a interface é responsável pela mediação da informação. Delimitaram-se dois periódicos científicos da área da Ciência da Informação a partir do trabalho de Vilan Filho, Arruda e Perucchi (2012) cujo objetivo foi indicar os periódicos mais citados da área entre os anos 2009-2010. Utilizou-se para a análise da interface dos periódicos - Ciência da Informação e Perspectivas em Ciência da Informação - o modelo de análise da estrutura de periódicos de Sarmento e Souza (2002), as heurísticas de Nielsen (1993) e Dias (2006) e a percepção dos
participantes da pesquisa mediante realização de uma tarefa: localizar um artigo específico no periódico. Os dados da pesquisa mostraram que os participantes são usuários autores
frequentes, pois acessam ambos os periódicos tanto para busca de artigos quanto para
submeter artigo. A estratégia mais utilizada foi o uso da caixa de pesquisa – com 73% - para a inserção do termo, seguida pelo menu “edições anteriores” – com 13,75%. Os usuários autores consideraram a tarefa fácil e 71% não percebeu diferenças significativas entre as duas interfaces. Apresenta recomendações para ambos os periódicos, resultantes das análises realizadas pelos modelos e pelos usuários. Conclui-se que a mediação da informação possibilitada pela interface é satisfatória para os usuários autores frequentes, os quais desejam
um sistema de busca mais avançado para uma busca de artigos mais eficiente e efetiva nos
periódicos científicos. ______________________________________________________________________________ ABSTRACT / Discusses a study of interaction between the user information and electronic journals
using the Electronic System for Journal Publishing ( SEER ) interface. Aims to identify the factors influencing communication and mediation of information between the user and the author of electronic journal that uses the SEER interface. It is a research of an applied nature ,
qualitative-quantitative approach as a form of descriptive about the objectives and procedures with regard to technical fits as lifting . It was assumed that information and communication technologies have provided greater user autonomy in seeking information , and in this context the interface is responsible for the mediation of information. Delimited are two scientific journals in the field of Information Science from work Vilan Filho, and Perucchi Arruda (2012 ) whose purpose was to indicate the most cited journals in the area between 2009-2010 .
Was used to analyze the interface of journals - Information Science and Perspectives in
Information Science - the model structure analysis of periodic Sarmento and Souza (2002 ) , the heuristics of Nielsen ( 1993) and Day (2006 ) and perception of survey participants by performing a task : find a specific article in the journal . The survey data showed that the participants are frequent perpetrators users because both access journals both for search for articles and for submitting article. The most used strategy was the use of the search box - 73
% - for the insertion of the word , followed by " Back Issues " menu - with 13.75% . The
authors considered the users easy task and 71 % did not notice significant differences between the two interfaces . Presents recommendations for both journals resulting from analyzes performed by models and by users. We conclude that mediation information made possible by the interface is satisfactory for frequent perpetrators users , who want a system more advanced search search for a more efficient and effective articles in scientific journals.
|
427 |
Novo método para assinatura e identificação de sinais de eletrocomunicação de peixes elétricos de campo fraco da espécie Gymnotus carapo / Novel method for signature and identification of electrocommunication signals of the weakly electric fish Gymnotus carapoPaulo Matias 22 February 2011 (has links)
Desenvolvemos um método capaz de reconhecer assinaturas de descargas do órgão elétrico de peixes de campo elétrico fraco da espécie Gymnotus carapo. A assinatura de um peixe é computada com base no espectro de frequências de suas descargas, extraído por meio de uma transformada de Fourier, ou com base em uma análise tempo-frequência das mesmas, realizada por meio de uma transformada complexa de dupla árvore de pacote wavelet. Com o auxílio de uma máquina de vetores de suporte, um método de classificação supervisionada, utilizamos essas assinaturas para identificar, com boa precisão (estimada em 96%), o peixe de origem de cada descarga de órgão elétrico recebida durante uma aquisição com dois peixes movimentando-se livremente em um mesmo aquário. / We developed a method capable of recognizing signatures of the electric organ discharges of the weakly electric fish Gymnotus carapo. The signature of a fish is computed based on the frequency spectrum of its discharges, extracted using a Fourier transform, or based on a time-frequency analysis, done using a dual-tree complex wavelet packet transform. With the aid of a support vector machine, a supervisioned classification method, we use these signatures to identify, with good precision (estimated at 96%), the source fish of each electric organ discharge received during an acquisition with two fish freely swimming in the same aquarium.
|
428 |
Ampliando os limites do aprendizado indutivo de máquina através das abordagens construtiva e relacional. / Extending the limits of inductive machine learning through constructive and relational approaches.Maria do Carmo Nicoletti 24 June 1994 (has links)
Este trabalho investiga Aprendizado Indutivo de Máquina como função das linguagens de descrição, utilizadas para expressar instancias, conceitos e teoria do domínio. A ampliação do poder de representação do aprendizado proporcional e abordada no contexto de indução construtiva, no domínio de funções booleanas, com a proposta de uma estratégia de composição de atributos denominada root-fringe. Avaliações experimentais dessa e de outras estratégias de construção de novos atributos foram conduzidas e os resultados analisados. Dois métodos de poda, para tratamento de ruídos, em aprendizado de arvores de decisão, foram avaliados num ambiente de indução construtiva e os resultados discutidos. Devido a limitação do aprendizado proposicional, foram investigadas formas de ampliação dos limites do aprendizado, através da ampliação do poder representacional das linguagens de descrição. Foi escolhida Programação Lógica Indutiva - PLI - que e um paradigma de aprendizado indutivo que usa restrições de Lógica de Primeira Ordem como linguagens de descrição. O aprendizado em PLI só é factível quando as linguagens utilizadas estão restritas e é fortemente controlado, caso contrário, o aprendizado em PLI se torna indecidível. A pesquisa em PLI se direcionou a formas de restrição das linguagens de descrição da teoria do domínio e de hipóteses. Três algoritmos que \"traduzem\" a teoria do domínio de sua forma intencional, para extensional, são apresentados. As implementações de dois deles são discutidas. As implementações realizadas deram origem a dois ambientes experimentais de aprendizado: o ambiente proposicional experimental, do qual fazem parte o ambiente experimental construtivo, e o ambiente experimental relacional. / This work investigates Inductive Machine Learning as a function of the description languages employed to express instances, concepts and domain theory. The enlargement of the representational power of propositional learning methods is approached via constructive induction, in the domain of boolean functions, through the proposal of a bias for composing attributes, namely, the bias root-fringe. Experimental evaluation of root-fringe, as well as other biases for constructing new attributes was conducted and the results analyzed. Two pruning methods for decision trees were evaluated in an environment of constructive induction and the results discussed. Due to the limitations of propositional learning, ways of enlarging the limits of the learning process were investigated through enlarging the representational power of the description languages. It was chosen Inductive Logic Programming - ILP - that is an inductive learning paradigm that uses restrictions of First Order Logic as description languages. Learning using ILP is only feasible when the languages are restricted and are strongly controlled; otherwise, learning in ILP becomes undecidible. Research work in ILP was directed towards restricting domain theory and hypotheses description languages. Three algorithms that \"translate\" the intentional expression of a domain theory into its extensional expression are presented. The implementations of two of them are discussed. The implementations gave rise to two experimental learning environments: the propositional environment, which includes the constructive environment, and the relational environment.
|
429 |
A evolução histórica da máquina térmica de Carnot como proposta para o ensino da Segunda Lei da TermodinâmicaPascoal, Alexandre dos Santos 29 August 2016 (has links)
Submitted by Jean Medeiros (jeanletras@uepb.edu.br) on 2016-10-19T12:54:26Z
No. of bitstreams: 1
PDF - Alexandre dos Santos Pascoal.pdf: 2352988 bytes, checksum: c311ea77167cf72630e47d718c89ef19 (MD5) / Approved for entry into archive by Secta BC (secta.csu.bc@uepb.edu.br) on 2016-10-19T17:11:33Z (GMT) No. of bitstreams: 1
PDF - Alexandre dos Santos Pascoal.pdf: 2352988 bytes, checksum: c311ea77167cf72630e47d718c89ef19 (MD5) / Made available in DSpace on 2016-10-19T17:11:34Z (GMT). No. of bitstreams: 1
PDF - Alexandre dos Santos Pascoal.pdf: 2352988 bytes, checksum: c311ea77167cf72630e47d718c89ef19 (MD5)
Previous issue date: 2016-08-29 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / History and Philosophy of Science (HFC) has gained ground as an instrument to facilitate the teaching / learning for teachers and students of the sciences. This phenomenon can be explained by the degree of difficulty to explain / understand some scientific principles, when exposed out of context. The HFCs, to situate the scientific changes in the historical and philosophical context, at the same time it facilitates understanding, enables interdisciplinary practice in the academic environment. Our work is part of this new trend and the central idea was to create an innovative proposal of teaching from a problem that we see in the physical education field; the difficulty of understanding the Second Law of Thermodynamics. To this aim, starting from the HFC and the context of the Industrial Revolution, we conducted a literature search of exploratory and qualitative character on the subject and situate the importance of Carnot machine and its relation to our problem. As a result, in addition to academic text, we built a paradidactic and a proposal for practical application in the classroom and hope that these instruments contribute to the construction of an innovative teaching proposal. / A História e Filosofia da Ciência (HFC) tem ganhado espaço como um instrumento facilitador do processo de ensino/aprendizagem para professores e estudantes da área das ciências. Esse fenômeno pode ser explicado pelo grau de dificuldade encontrada para se explicar/entender alguns princípios científicos, quando expostos de maneira descontextualizada. A HFC, ao situar as mudanças científicas no contexto histórico e filosófico, ao mesmo tempo em que facilita o entendimento, possibilita a prática interdisciplinar no ambiente acadêmico. Nosso trabalho se insere nessa nova corrente e a ideia central foi à criação de uma proposta inovadora de ensino a partir de uma problemática que constatamos no campo do ensino da física; a dificuldade de compreensão da Segunda Lei da Termodinâmica. Para tal desiderato, partindo da HFC e do contexto da Revolução Industrial, realizamos uma pesquisa bibliográfica de caráter exploratória e qualitativa sobre a temática e situamos a importância da Máquina de Carnot e a relação desta com a nossa problemática. Como resultados, além do texto acadêmico, construímos um paradidático e uma proposta de aplicação prática em sala de aula e esperamos que estes instrumentos contribuam para a construção de uma proposta inovadora de ensino.
|
430 |
Um filtro iterativo utilizando árvores de decisão / An Iterative Decision Tree Threshold FilterOscar Picchi Netto 24 September 2013 (has links)
Usar algoritmos de Aprendizado de Máquina é um dos modos ecientes de extrair as informações de grandes bases biológicas. Sabendo-se que a quantidade de dados que são coletados cresce a cada dia, o uso de alguma técnica de seleção de atributos eficiente é, em alguns casos, essencial não só para otimizar o tempo do algoritmo de Aprendizado da Máquina a ser aplicado posteriormente como também para reduzir os dados, de forma que possa ser possível testá-los, por exemplo, em uma bancada de laboratório em algumas situações específicas. O objetivo deste estudo é propor uma abordagem utilizando árvores de decisão em um filtro iterativo, visando auxiliar na extração de informação de grande bases biológicas. Pois, com uma base de menor dimensionalidade, um especialista humano pode entender melhor ou ainda utilizar um algoritmo de Aprendizado de Máquina de forma mais eficaz. O filtro proposto pode utilizar qualquer classificador com um seletor de atributos embutido e qualquer métrica pode ser utilizada para determinar se o atributo deve ser escolhido. Foi fixado, neste estudo, o algoritmo utilizado como J48 e a área embaixo da curva ROC (AUC) como métrica. Em experimentos utilizando diversas bases de dados biomédicas, o filtro proposto foi analisado e sua capacidade de compressão e desempenho foram avaliados em cinco diferentes paradigmas de aprendizado de máquina, utilizando dois limiares diferentes para a métrica escolhida. O melhor limiar obteve uma capacidade de compressão de cerca de 50% dos dados em geral e 99.4% em bases de baixa densidade, geralmente grandes bases. Os valores AUC obtidos pelo filtro quando comparados com cinco algoritmos de paradigmas de aprendizado diferentes mostraram um desempenho melhor em quatro das cinco situações avaliadas. O filtro proposto foi depois analisado e comparado com outros seletores de atributos da literatura e o indutor sozinho. Quanto ao tempo gasto pelo filtro em relação aos outros ele se apresentou no mesmo patamar de 3 dos 4 seletores testados. Quando comparado em relação ao AUC o filtro proposto se mostrou robusto nos cinco indutores analisados, não apresentando nenhuma diferença significativa em nenhum dos cenários testados. Em relação aos indutores, o filtro apresentou um desempenho melhor, mesmo que não significante, em 4 dos 5 indutores. / Using Machine Learning algorithms is an eficient way to extract information from large biological databases. But, in some cases, the amount of data is huge that using an eficient featured subset selection is, in some cases, essencial not only to optimize the learning time but also to reduce the amount of data, allowing, for example, a test in a laboratory workbench. The objective of this study is to propose an approach using decision trees in a iterative filter. The filter helps information extraction from large biological databases, since in a database with few dimensions a human specialist can understand it better or can use Machine Learning algorithms in a more efective way. The proposed lter can use any classier with embed featured subset selection and can use any performance metric to determine which attribute must be chosen. In this study, we have fixed the algorithm used within the filter as J48 and AUC was used as metric for performance evaluation. In experiments using biomedical databases, the proposed filter was analyzed and its compression capacity and performance were tested. In five diferent Machine Learning paradigms, using two diferent thresholds for the chosen metric. The best threshold was capable of reducing around 50% of the data using all databases and 99.4% on the small density bases, usually high dimensional databases. AUC values for the filter when compared with the five algorithm got a better performance in four of five tested situations. The proposed filter then was tested against others featured subset selectors from the literature, and against the inducer alone. Analyzing time the proposed lter is in the same level as 3 of 4 of the tested selectors. When tested for AUC the proposed selector shows itself robust in the five inducers tested, not showing any signicant diference in all tested scenarios. Against the inducers alone our filter showed a better performance, even not signicant, in 4 of the 5 inducers.
|
Page generated in 0.0543 seconds