• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 102
  • 9
  • 5
  • 4
  • Tagged with
  • 121
  • 121
  • 63
  • 61
  • 27
  • 24
  • 24
  • 23
  • 22
  • 20
  • 19
  • 18
  • 17
  • 17
  • 15
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Métodos baseados em aprendizagem de máquina para distinguir RNAs longos não-codificadores intergênicos de transcritos codificadores de proteínas

Vieira, Lucas Maciel 01 March 2018 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2018. / Submitted by Raquel Viana (raquelviana@bce.unb.br) on 2018-08-22T21:11:06Z No. of bitstreams: 1 2018_LucasMacielVieira.pdf: 1813707 bytes, checksum: 34477a299c2d3aee137d4312b9bceeef (MD5) / Approved for entry into archive by Raquel Viana (raquelviana@bce.unb.br) on 2018-08-22T21:13:46Z (GMT) No. of bitstreams: 1 2018_LucasMacielVieira.pdf: 1813707 bytes, checksum: 34477a299c2d3aee137d4312b9bceeef (MD5) / Made available in DSpace on 2018-08-22T21:13:46Z (GMT). No. of bitstreams: 1 2018_LucasMacielVieira.pdf: 1813707 bytes, checksum: 34477a299c2d3aee137d4312b9bceeef (MD5) Previous issue date: 2018-08-22 / Os RNAs não-codificadores (ncRNAs) constituem uma classe importante de moléculas produzidas nas células de organismos. Dentre eles, temos os ncRNAs longos (lncRNAs), uma classe de ncRNAs com predição díficil, pois podem estar sobrepostas a transcritos codificadores de proteínas (Protein Coding Transcripts - PCTs). Porém, existe uma classe de lncRNAs, os RNAs longos intergênicos (long non-condig RNAS - lincRNAS), que são lncRNAs que aparecem entre dois genes, que vêm sendo estudados devido a seus papéis regulatórios nos mecanismos celulares e sobretudo porque estão ligados a doenças como câncer. Apesar da importância destes lincRNAs, poucos métodos computacionais para distinção entre essa molécula e PCTs estão disponíveis. Além disso, os métodos existentes devem ser aplicados a organismos específicos, não podendo ser utilizados para distinguir lincRNAs de PCTs em espécies diferentes daquelas para as quais os modelos foram originalmente construídos. Na literatura, a predição de lncRNAs e lincRNAs vem sendo explorada com técnicas de Aprendizagem de Máquina. Neste contexto, este trabalho propõe dois métodos para discriminar lincRNAs de PCTs. O primeiro é um workflow para distinguir lincRNAs de PCTs em plantas, o qual utiliza ferramentas de bioinformática e Máquina de Vetores de Suporte, uma técnica de aprendizagem de máquina. O workflow foi aplicado em dois estudos de caso: cana-de-açúcar (Saccharum spp) e milho (Zea mays), tendo sido encontrados potenciais lincRNAs em ambos organismos. Além disso, um estudo de expressão diferencial de lincRNAs foi feito em cada estudo de caso, revelando possível interação desses lincRNAs com certos microorganismos que foram inoculados nas duas espécies de plantas. O segundo método propõe o uso de Ensemble para melhorar a capacidade de generalização e a robustez no método de distinguir de lincRNAs e PCTs. Este método foi aplicado em duas espécies, Homo sapiens (humano), montagem GRCh38, e Mus musculus (camundongo), montagem GRCm38. Os resultados mostram boas acurácias de 94% e 96% para humanos e camundongo, respectivamente. Deve-se notar que essas acurácias foram iguais ou melhores do que as acurácias de métodos existentes na literatura. / Non-coding RNAs (ncRNAs) constitute an important set of transcripts produced in the cells of organisms. Among them, there is a large amount of a particular class of long ncRNAs (lncRNAs) that are difficult to predict, the so-called long intergenic ncRNAs (lincRNAs), which might play essential roles in gene regulation and other cellular processes, and they can be mistaken with transcripts that code proteins. Despite the importance of these lincRNAs, there is still a lack of biological knowledge, and also a few computational methods, most of them being specific to organisms, which usually can not be successfully applied to other species, different from those that they have been originally designed to. In literature, prediction of lncRNAs performed with machine learning techniques, and lincRNA prediction has been explored with supervised learrning methods. In this context, this work proposes two methods for discriminating lincRNAs from protein coding transcripts (PCTs). The first one is a workflow to distinguish lincRNAs from PCTs in plants, considering a pipeline that includes known bioinformatics tools together with machine learning techniques, here Support Vector Machine (SVM). We discuss two case studies that were able to identify novel lincRNAs, in sugarcane (Saccharum spp) and in maize (Zea mays). From the results, we also could identify differentially expressed lincRNAs in sugarcane and maize plants submitted to pathogenic and beneficial microorganisms. The second method is the distinction of lincRNAs from PCTs using ensemble, a method that improves generalizability and robustness. We applied this method in two species, Homo sapiens (human), assembly GRCh38, and Mus musculus (mouse), assembly GRCm38. The results show good accuracies of 94% and 96% for human and mouse, respectively, which are best or at least are comparable to the accuracies presented in related works.
12

Meta-aprendizado para análise de desempenho de métodos de classificação multi-label

PINTO, Eduardo Ribas 31 January 2009 (has links)
Made available in DSpace on 2014-06-12T15:52:45Z (GMT). No. of bitstreams: 1 license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2009 / Nos últimos anos, têm surgido diversas aplicações que utilizam algoritmos de Aprendizagem de Máquina Supervisionada para resolver problemas de classificação envolvendo diversos domínios. No entanto, muitas destas aplicações se restringem a utilizarem algoritmos singlelabel, ou seja, que atribuem apenas uma classe a uma dada instância. Tais aplicações se tornam inadequadas quando essa mesma instância, no mundo real, pertence a mais de uma classe simultaneamente. Tal problema é denominado na literatura como Problema de Classificação Multi-Label. Atualmente, há uma diversidade de estratégias voltadas para resolver problemas multi-label. Algumas delas fazem parte de um grupo denominado de Métodos de Transformação de Problemas. Essa denominação vem do fato de esse tipo de estratégia buscar dividir um problema de classificação multi-label em vários problemas single-label de modo a reduzir sua complexidade. Outras buscam tratar conjuntos de dados multi-label diretamente, sendo conhecidas como Métodos de Adaptação de Algoritmos. Em decorrência desta grande quantidade de métodos multi-label existentes, é bastante difícil escolher o mais adequado para um dado domínio. Diante disso, a presente dissertação buscou atingir dois objetivos: realização de um estudo comparativo entre métodos de transformação de problemas muito utilizados na atualidade e a aplicação de duas estratégias de Meta-Aprendizado em classificação multi-label, a fim de predizer, com base nas características descritivas de um conjunto de dados, qual algoritmo é mais provável de obter um desempenho melhor em relação aos demais. As abordagens de Meta-aprendizado utilizadas no nosso trabalho foram derivadas com base em técnicas de análise de correlação e mineração de regras. O uso de Meta-Aprendizado no contexto de classificação multi-label é original e apresentou resultados satisfatórios nos nossos experimentos, o que aponta que este pode ser um guia inicial para o desenvolvimento de pesquisas futuras relacionadas
13

Modelo preditivo de mineração de dados para sucesso de redução de peso na cirurgia bariátrica

SOUZA, Starch Melo de 04 September 2014 (has links)
Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2016-05-19T16:39:35Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) _dissertacao_StarchSouza_versaoCorrigida_VF.pdf: 1638087 bytes, checksum: d684b3e778a00ee1b1ceecf59729cc5e (MD5) / Made available in DSpace on 2016-05-19T16:39:35Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) _dissertacao_StarchSouza_versaoCorrigida_VF.pdf: 1638087 bytes, checksum: d684b3e778a00ee1b1ceecf59729cc5e (MD5) Previous issue date: 2014-09-04 / CNPQ / A Cirurgia Bariátrica é um dos recursos de melhor efetividade para redução de peso nos casos de Obesidade, controle e resolução nos casos das comorbidades associadas que encontram-se sem controle terapêutico, como a Diabetes. Para aumentar as chances de sucesso terapêutico deste procedimento de grande porte, pode ser realizada uma avaliação prévia do paciente através de um modelo preditivo utilizando-se de variáveis de controle, clínicas, de comorbidades e laboratoriais. O objetivo geral desta pesquisa foi desenvolver um modelo preditivo de mineração de dados para apoio na tomada de decisão do cirurgião ao submeter pacientes com excesso de peso à cirurgia bariátrica, a partir dos dados históricos visando à sua redução de peso. A pesquisa foi do tipo clínica aplicada, transversal, retrospectiva, de caráter analítico. A amostra do estudo foi de 540 pacientes que realizaram seguimento clínico após 1 ano do procedimento cirúrgico. As cinco primeiras fases da metodologia CRISP-DM foram aplicadas na construção do modelo preditivo, e na modelagem foram aplicadas as técnicas de indução de regras, árvore de decisão e regressão logística. A variável independente (o ALVO) considerada foi o IMC ideal, entre 18,5 e 24,9 Kg/m2. O modelo preditivo de mineração de dados para pacientes submetidos à cirurgia bariátrica e com seguimento clínico de um ano, apontou que os preditores de sucesso para redução de peso foram, ser do sexo feminino, ser mais jovem, e apresentar no pré-operatório menor valor de índice de massa corpórea (IMC). O estudo apresentou regras explicativas e o modelo preditivo como auxílio na tomada de decisão, maximizando os que possuem maior expectativa de redução de peso. / The Bariatric Surgery is one of the most effective tools for weight reduction in cases of obesity, control and resolution in cases of associated comorbidities that are out therapeutic control, such as diabetes. To increase the chances of therapeutic success of this major procedure, a preliminary assessment of the patient can be carried out using a predictive model using control variables, clinics, comorbidities and laboratory variables. The objective of this research was to develop a predictive data-mining model to support the surgeon's decision to submit patients for bariatric surgery, from historical data aimed at their weight reduction. The research study was categorized as applied clinical, cross-sectional, retrospective and analytical. The study sample included 540 patients who underwent a complete year of surgery clinical follow-up. The first five phases of the CRISP-DM methodology were applied in the construction of the predictive model, and in modeling, rule induction, decision tree and logistic regression were the techniques applied. The independent variable (Target) was considered reaching the ideal BMI between 18.5 and 24.9 Kg/m2. The predictive model of data mining for patients undergoing bariatric surgery and follow-up of one year, pointed out that the success predictors for weight reduction were being female, being younger, and preoperative lower body mass index (BMI). The study presented explanatory rules and the predictive model as an aid in decision-making, maximizing those with greater expectation of weight reduction.
14

Combinação de classificadores na categorização de textos

Linden, Gustavo Sandini January 2008 (has links)
Made available in DSpace on 2013-08-07T18:42:16Z (GMT). No. of bitstreams: 1 000409150-Texto+Completo-0.pdf: 923910 bytes, checksum: 44e59b532fd1e8f249aeacfa7777f126 (MD5) Previous issue date: 2008 / This study presents and evaluates a proposal for Hierarchical Text Categorization combining k- Nearest Neighbors (k-NN) and Support VectorMachines (SVM) classifiers. The study was based on several experiments which made use of Folha-RIcol text collection in Portuguese language. The texts in this collection are hierarchically organized in categories. In the experiments, the performance of k-NN and SVM classifiers was analyzed, individually first, with a variant of hold-out evaluation methodology, and then combined. The proposed combination, referred to as k-NN+SVM, had its performance compared to the individual classifiers and also to the combination by vote. In synthesis, the k-NN+SVM combination did not present better performance to the alternative ones, however the study allowed to observe the classifiers’ behavior and its combined use, the identification of problems and possible solutions, as well as taking into consideration the document collection used. / Este trabalho apresenta e avalia uma proposta para Categorização Hierárquica de Textos com uso combinado dos classificadores k-Nearest Neighbors (k-NN) e Support Vector Machines (SVM). O estudo foi embasado numa série de experimentos os quais fizeram uso da coleção Folha-RIcol de textos em língua portuguesa, que se encontram hierarquicamente organizados em categorias. Nos experimentos realizados, os classificadores k-NN e SVM tiveram seu desempenho analisado, primeiro individualmente, com uma variante da metodologia de avaliação hold-out, e após, de modo combinado. A combinação proposta, denominada k-NN+SVM, teve seu desempenho comparado com aquele dos classificadores individuais e com o da combinação por voto. Em síntese, a combinação k-NN+SVM não apresentou desempenho superior às demais alternativas, todavia o estudo permitiu a observação do comportamento dos classificadores e seu uso combinado, a identificação de problemas e possíveis soluções, bem como algumas considerações sobre a coleção de documentos utilizada.
15

Resolução de correferência e categorias de entidades nomeadas

Moraes, Tatiane Coreixas January 2010 (has links)
Made available in DSpace on 2013-08-07T18:42:54Z (GMT). No. of bitstreams: 1 000427028-Texto+Completo-0.pdf: 957635 bytes, checksum: fbedf4df218091e4bc1e919c4ffd808b (MD5) Previous issue date: 2010 / Coreference is defined as the relationship of linguistic expressions with one same entity of the world. Automatic coreference resolution is inserted in a very important context in the area of Natural Language Processing, because many systems require this task. This level of language processing depends on world knowledge, and this is still a challenge for the area. This challenge has stimulated and became the subject of this dissertation. Accordingly, we analyzed the role of categories of named entities and, through machine learning, we checked the conditions for resolution of different categories. The results of the experiments showed that world knowledge, represented by categories of named entities, helps in this task, since the percentage of return of the system based on the categories improved in about 17% when compared to the version without the categories. / Define-se correferência como a relação entre diversos componentes linguísticos com uma mesma entidade de mundo. A resolução automática de correferência textual está inserida num contexto muito importante na área de Processamento da Linguagem Natural, pois vários sistemas necessitam dessa tarefa. O nível de processamento linguístico depende do conhecimento de mundo, e isso ainda é um desafio para a área. Esse desafio estimulou e tornou-se o objeto de estudo desta dissertação. Nesse sentido, analisamos o papel das categorias de entidades nomeadas e, através de aprendizado de máquina, verificamos as condições de resolução em diferentes categorias. Os resultados dos experimentos demonstraram que o conhecimento de mundo, representado nas categorias de entidades nomeadas, auxilia nessa tarefa, pois o percentual de retorno do sistema com base nas categorias teve uma melhora de 17% em comparação com a versão sem as categorias.
16

A Kernel matching approach for eye detection in surveillance images

Vidal, Diego Armando Benavides 23 November 2016 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Mecânica, 2016. / Submitted by Raquel Almeida (raquel.df13@gmail.com) on 2017-06-27T13:16:54Z No. of bitstreams: 1 2016_DiegoArmandoBenavidesVidal.pdf: 6256311 bytes, checksum: 032b7fb7441d8dc32be590f67a1be876 (MD5) / Approved for entry into archive by Raquel Viana (raquelviana@bce.unb.br) on 2017-08-15T10:55:01Z (GMT) No. of bitstreams: 1 2016_DiegoArmandoBenavidesVidal.pdf: 6256311 bytes, checksum: 032b7fb7441d8dc32be590f67a1be876 (MD5) / Made available in DSpace on 2017-08-15T10:55:01Z (GMT). No. of bitstreams: 1 2016_DiegoArmandoBenavidesVidal.pdf: 6256311 bytes, checksum: 032b7fb7441d8dc32be590f67a1be876 (MD5) Previous issue date: 2017-08-15 / A detecção ocular é um problema aberto em pesquisa a ser resolvido eficientemente por detecção facial em sistemas de segurança. Características como precisão e custo computacional são consider- ados para uma abordagem de sucesso. Nós descrevemos uma abordagem integrada que segmenta os ROI emitidos por um detector Viola e Jones, constrói características HOGs e aprende uma função especial para mapear essas características para um espaço dimensional elevado onde a detecção alcança uma melhor precisão. Esse mapeamento segue a eficiente abordagem de funções Kernel, que se mostrou possível mas não foi feita para esse problema antes. Um classificador SVM linear é usado para detecção ocular através dessas características mapeadas. Experimentos extensivos são mostrados com diferentes bancos de dados e o método proposto alcança uma precisão elevada com baixo custo computacional adicional do que o detector Viola e Jones. O método também podem ser estendido para lidar com outros modelos equivalentes. / Eye detection is a open research problem to be solved efficiently by face detection and human surveillance systems. Features such as accuracy and computational cost are to be considered for a successful approach. We describe an integrated approach that takes the outputted ROI by a Viola and Jones detector, construct HOGs features on those and learn an special function to mapping these to a higher dimension space where the detection achieve a better accuracy. This mapping follows the efficient kernels match approach which was shown possible but had not been done for this problem before. Linear SVM is then used as classifier for eye detection using those mapped features. Extensive experiments are shown with different databases and the proposed method achieve higher accuracy with low added computational cost than Viola and Jones detector. The approach can also be extended to deal with other appearance models.
17

A máquina de suporte vetorial aplicada em análise de séries temporais

Andrade, Yuri Medeiros de 30 June 2017 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2017. / Submitted by Raquel Almeida (raquel.df13@gmail.com) on 2017-07-20T12:11:07Z No. of bitstreams: 1 2017_YuriMedeirosdeAndrade.pdf: 1207207 bytes, checksum: d57c49f524d8870c0a3257d31861582d (MD5) / Approved for entry into archive by Raquel Viana (raquelviana@bce.unb.br) on 2017-09-19T16:37:37Z (GMT) No. of bitstreams: 1 2017_YuriMedeirosdeAndrade.pdf: 1207207 bytes, checksum: d57c49f524d8870c0a3257d31861582d (MD5) / Made available in DSpace on 2017-09-19T16:37:37Z (GMT). No. of bitstreams: 1 2017_YuriMedeirosdeAndrade.pdf: 1207207 bytes, checksum: d57c49f524d8870c0a3257d31861582d (MD5) Previous issue date: 2017-09-19 / Os modelos de aprendizado de máquina vêm tomando espaço na literatura moderna. Diversos artigos os comparam a métodos de séries temporais, pois devido à sua maleabilidade e adaptabilidade, conseguem facilmente se ajustar a diversos tipos de dados, sejam provenientes de modelos lineares ou não (Tay & Cao, 2001; Zhao et al., 2012). Este trabalho visou comparar os modelos tradicionais ARMA e GARCH à máquina de suporte vetorial para previsões um passo à frente na análise da volatilidade de séries temporais financeiras. Aqui foi analisado o desempenho de um híbrido AR-GARCH, aplicando diversas distribuições de probabilidade ao seu termo de ruído et, em relação ao desempenho de um novo método proposto por Chen et al. (2010) chamado de SVR recorrente. Modificamos o critério de parada desse novo e pouco conhecido método, para que se ajustasse melhor aos critérios estatísticos considerados por Morettin & Toloi (2006), no que diz respeito à estrutura de autocorrelação serial. Por fim, o aplicamos a dados gerados pelo modelo ARGARCH e a dois bancos de dados reais, iguais aos utilizados por Chen et al. (2010), para compararmos o desempenho do SVR recorrente, com o novo critério de parada, aos modelos GARCH, ARMA e ARGARCH. / Machine learning models have been taking space in modern literature. Several articles compare them to time series methods because, due to their malleability and adaptability, they can be easily adjusted to different types of data, whether linear or non-linear (Tay & Cao, 2001; Zhao et al., 2012). This work aimed to compare the traditional ARMA and GARCH models to the support vector machine for predictions one step ahead in the analysis of the volatility of financial time series. Here we analyzed the performance of an AR-GARCH hybrid applying several probability distributions to its noise term et, in relation to the performance of a new method proposed by Chen et al. (2010) called recurrent SVR. We modified the stopping criterion of this new and little-known method to better fit the statistical criteria considered by Morettin & Toloi (2006) regarding the serial autocorrelation structure. Finally, we applied it to data generated by the AR-GARCH model and to two real databases, the same as those used by Chen et al. (2010), to compare the performance of the recurrent SVR with the new criterion of GARCH, ARMA and AR-GARCH models.
18

A computer vision system for recognizing plant species in the wild using convolutional neural networks

Dias, René Octavio Queiroz 03 July 2017 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Mecânica, 2017. / Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2017-08-24T13:58:08Z No. of bitstreams: 1 2017_RenéOctavioQueirozDias.pdf: 17746801 bytes, checksum: 9dc00a9435aa0263edd4056fbbad2612 (MD5) / Approved for entry into archive by Raquel Viana (raquelviana@bce.unb.br) on 2017-09-26T16:44:32Z (GMT) No. of bitstreams: 1 2017_RenéOctavioQueirozDias.pdf: 17746801 bytes, checksum: 9dc00a9435aa0263edd4056fbbad2612 (MD5) / Made available in DSpace on 2017-09-26T16:44:32Z (GMT). No. of bitstreams: 1 2017_RenéOctavioQueirozDias.pdf: 17746801 bytes, checksum: 9dc00a9435aa0263edd4056fbbad2612 (MD5) Previous issue date: 2017-09-26 / Classificação de plantas tem sido um problema recorrente na comunidade de Visão Computacional. Visualmente, as plantas apresentam uma variabilidade muito grande, decorrente principalmente de efeitos sazonais, idade e fundos. Sistemas de classificação mais antigos tinham problemas para lidar com estas variações e seus bancos de dados usavam imagens mais simples com apenas partes desmembradas de plantas (como folhas e flores) e fundo branco. Com o advento das Redes Neurais Profundas, que demostraram ser bastante competitivas como classificadores de propósito geral, o objetivo é testá-las com um banco de dados de propósito mais específico, que podem tencionar mais estes classificadores tentando classificar espécies de plantas similares em poses bastante diferentes. Construiu-se um banco de dados que é focado em como o usuário comum tira retratos de plantas. Este novo banco de dados, chamado Plantas, foi feito para ter poucas restrições. Inicialmente, há 50 espécies diferentes que são usados comumente em jardinagem, e há mais de 33.000 imagens. Estas fotos foram tiradas in loco e da Internet. Depois, treinou-se com técnicas recentes do estado da arte, como os Métodos de Codificação e Redes Neurais Profundas. Nos Métodos de Codificação, são usados três codificadores: Saco de Palavras Visuais (BoVW), Vetores Fisher (FV) e Vetores de Descritores Linearmente Agregados (VLAD). Nos Métodos de Codificação, há duas fases: uma aprendizagem sem-supervisão e em seguida uma supervisionada. Em todos os métodos, o processo é parecido. Na fase sem-supervisão, obtêm-se os descritores SIFT, retira-se uma amostra destes descritores, faz uma aprendizagem da projeção da Análise de Componentes Principais e usa-se k-médias para agregar estas características em k grupos, que são o número de palavras. Aqui se separa o treinamento de BoVW e VLAD dos Vetores Fisher. Para os primeiros, cria-se uma árvore k-d para facilitar o posterior processo de pesquisa. Para os Vetores Fisher, usa-se os grupos como inicialização dos Modelos de Mistura de Distribuições Normais. Na fase de aprendizagem supervisionada, passa-se uma imagem pelos processos de obtenção dos descritores SIFT, amostragem e PCA. Então, para cada característica de uma imagem, pesquisase o grupo a qual pertencente. Para BoVW, obtém-se um histograma que conta cada palavra da imagem que tem o equivalente no dicionário. Para VLAD, obtém-se o desvio à média destas palavras, e com Vetores Fisher, além do desvio à média, calcula-se o desvio à covariância. Estes, representam os descritores finais que são posteriormente treinados com uma Máquina de Vetores de Suporte Linear (Linear-SVM). Nas redes neurais, são treinadas diferentes arquiteturas recentes como AlexNet, CaffeNet, GoogLeNet e ResNet. Elas contêm técnicas que exploram a estrutura espacial das imagens, como as camadas de convoluções, e usam técnicas de regularização que evitam sobreajuste—que era algo especialmente comum em redes com muitos parâmetros—como Dropout e Normalização em Lotes. Também foi a primeira vez em que se usou uma função de ativação que não sofre problemas de saturação, a Unidade Linear Retificada (ReLU) que tomou o lugar de Sigmóides e Tangentes Hiperbólicas. Usando estas arquiteturas, faz-se experimentos para saber como elas respondem ao novo banco de dados, e quais são as melhores especificações para obter-se a melhor acurácia e quais as razões que uma escolha é melhor que a outra. Nestes experimentos, funções de ativações mais recentes como a Unidade Linear Retificada Parametrizada (PReLU) e a Unidade Linear Exponencial (ELU) foram testadas. Também, usa-se técnicas de ajuste fino em que se reutiliza parâmetros de uma rede treinada para um certo banco de dados em outro, também conhecido como transferência de conhecimento. / Classifying plant species has been a recurrent topic in the Computer Vision community. Visually, plants present a high level of variability, mostly because of seasonal effects, age and background. Early classification systems had difficulties to deal with this variability and early databases relied on simple images, using dismembered parts of the plants, such as leaves and flowers, and a distinctive background (usually white). With the advent of Deep Neural Networks, which proved to be very competitive as a generalpurpose classifier, we aim to assess them with a more specific-purpose database, which can be further strained by trying to classify similar plant species in some very different poses. We created a new database that focus on how the common user takes plant pictures. This database, named Plantas, is meant to be highly unconstrained. Initially, it contains 50 common different species and cultivars used in gardening worldwide, and more than 33,000 images. These images were taken on site and download from the Internet. Then, we train this database with the latest state of the art techniques, such as Encoding Methods and Deep Neural Networks. We further explore neural networks by testing some recent activation functions and also fine-tuning.
19

Método baseado em aprendizado de máquina para seleção de características para distinção entre RNAs não-codificadores longos e RNAs codificadores de proteínas

Kümmel, Bruno Couto 12 December 2017 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2017. / Submitted by Raquel Almeida (raquel.df13@gmail.com) on 2018-04-10T18:44:42Z No. of bitstreams: 1 2017_BrunoCoutoK¨ummel.pdf: 3746010 bytes, checksum: fb3e186abc2f80bf5a5302719a1aa78b (MD5) / Approved for entry into archive by Raquel Viana (raquelviana@bce.unb.br) on 2018-04-12T19:37:08Z (GMT) No. of bitstreams: 1 2017_BrunoCoutoK¨ummel.pdf: 3746010 bytes, checksum: fb3e186abc2f80bf5a5302719a1aa78b (MD5) / Made available in DSpace on 2018-04-12T19:37:08Z (GMT). No. of bitstreams: 1 2017_BrunoCoutoK¨ummel.pdf: 3746010 bytes, checksum: fb3e186abc2f80bf5a5302719a1aa78b (MD5) Previous issue date: 2018-04-12 / RNAs não-codificadores longos (long non-coding RNA - lncRNAs) constitui uma classe heterogênea de RNAs que agrega transcritos com pouca capacidade de codificar proteínas e que possuem mais de 200 nucleotídeos em sua composição. Estudos recentes apontam que essas moléculas possuem funções de regulação de processos biológicos importantes dentro das células. Sabe-se também que o nível de expressão dos lncRNAs está correlacionado com diversas doenças genéticas, tais como câncer e doenças neuro-degenerativas. Este trabalho apresenta um método para seleção das características mais relevantes para modelos de aprendizado de máquina aplicados ao problema de distinguir lncRNAs de transcritos codificadores de proteínas. O método proposto, denominadoSingle Score Feature Selection (S2FS), utilizou como características as frequências de 2-mers, 3-mers e 4-mers dos transcritos, para detectar aquelas mais relevantes para distinguir lncRNAs de transcritos codificadores de proteínas. As características identificadas pelo S2FS foram avaliadas nos datasets obtidos de repositórios públicos de transcritos RNAs codicadores de proteínas e de lncRNAs de Homo sapiens, Mus musculus e Danio rerio. Para o dataset de H. sapiens, também foi utilizada a característica da ORF mais longa de cada transcrito. Os resultados obtidos indicam que o S2FS identificou boas características para os modelos de predição de lncRNAs baseados em Random Forest. Nos modelos de classificação testados, as características selecionadas pelo S2FS possibilitaram resultados melhores do que as características selecionadas por um método de seleção univariada de características baseado no escore da função χ2. / Long non-coding RNA(lncRNAs) constitutes a heterogeneous class of RNAs that includes RNAs with more than 200 nucleotides and poor capacity for coding proteins. Recent studies have indicated that these molecules act on critical biological processes inside the cells. However, their expression levels are also correlated with a number of complex human diseases, such as cancer, neuro-degenerative diseases and others. This work proposes a method for feature selection for machine learning methods applied to the task of distinguishing lncRNAs from protein coding transcripts. The proposed method, called Single Score Feature Selection (S2FS), used as features the 2-mer, 3-mer and 4-mer frequencies of the transcripts, in order to detect those more relevant to distinguish lncRNAs from protein coding transcripts. The features identified by S2FS were evaluated on datasets obtained from public repositories of protein coding transcripts and lncRNAs of Homo Sapiens, Mus musculus and Danio rerio. For the H. sapiens dataset, the longest ORF of each transcript was also used as a feature. The obtained results show that the S2FS identified good features for the lncRNA prediction models based on Random Forest. In the tested classification models, the selected features from S2FS enabled better performance results than the features selected by an univariate selection method based on the scores of a χ2 function.
20

Detecção de pornografia infantil em imagens através de técnicas de aprendizado profundo / Child pornography image detection through deep learning techniques

Vitorino, Paulo Roberto Rocha 14 December 2016 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2016. / Submitted by Fernanda Percia França (fernandafranca@bce.unb.br) on 2017-02-22T20:04:46Z No. of bitstreams: 1 2016_PauloRobertoRochaVitorino.pdf: 1808150 bytes, checksum: 9b18327b79b2cc2767d80de6ba986444 (MD5) / Approved for entry into archive by Ruthléa Nascimento(ruthleanascimento@bce.unb.br) on 2017-02-24T19:20:18Z (GMT) No. of bitstreams: 1 2016_PauloRobertoRochaVitorino.pdf: 1808150 bytes, checksum: 9b18327b79b2cc2767d80de6ba986444 (MD5) / Made available in DSpace on 2017-02-24T19:20:18Z (GMT). No. of bitstreams: 1 2016_PauloRobertoRochaVitorino.pdf: 1808150 bytes, checksum: 9b18327b79b2cc2767d80de6ba986444 (MD5) / Este trabalho apresenta uma nova abordagem para detecção de automática de pornográfica infantil em imagens, que se utiliza de técnicas de aprendizado profundo para extração das características discriminadoras de imagens, e um classificador de padrões baseado em máquinas de vetores de suporte, para determinar se as imagens contêm, ou não, pornografia infantil (PI). Adicionalmente, também é proposta técnica baseada em sacolas de palavras para resolver o problema. As soluções desenvolvidas atingem um acerto de +87% de acurácia de classificação quando separando conteúdo de pornografia infantil de conteúdos de pornografia geral e imagens normais, sobressaindo-se em relação às técnicas existentes na literatura. / In this work, we present a new method for automatic detection of sexually exploitative imagery of children (SEIC) or child pornography content. Our solution leverages cutting-edge concepts of deep learning – for extracting discriminative features from images – and the support vector machine classifier, it point out whether or not an image contains child pornography content. Moreover, it is also proposed one technique based on bags of visual words methodology to deal with this difficult problem. The developed solutions lead to as much as 87% classification accuracy when separating SEIC content from adult (adult pornography) and other seemingly innocuous content (everyday image content) clearly outperforming existing counterparts in the literature.

Page generated in 0.0933 seconds