Global ETD Search

111	Modelos agrometeorológicos para previsão de pragas e doenças em Coffea arabica L. em Minas Gerais / Aparecido, Lucas Eduardo de Oliveira. January 2019 (has links) Orientador: Glauco de Souza Rolim / Resumo: O café é a bebida mais consumida no mundo e uma das principais causas para a redução da produtividade e qualidade são os problemas fitossanitários. A estratégia mais comum de controle dessas doenças e pragas é a aplicação de fungicidas e inseticidas foliares, dependendo da intensidade dos mesmos na região. Esse método tradicional pode ser melhorado utilizando de sistemas de alertas por meio de modelos de estimativas dos índices de doenças e pragas. Este trabalho tem como OBJETIVOS: A) Calibrar as variáveis meteorológicas: temperatura do ar e precipitação pluviométrica do sistema ECMWF em relação aos dados de reais de superfície mensurados pelo sistema nacional de meteorologia (INMET) para o estado de Minas Gerais; B) Avaliar quais os elementos meteorológicos exercem maior influência nas principais pragas (broca e bicho-mineiro) e doenças (ferrugem e cercosporiose) do cafeeiro arábica nas principais localidades cafeeiras do Sul de Minas Gerais e do Cerrado Mineiro; C) Desenvolver modelos agrometeorológicos para previsão de pragas e doenças em função das variáveis meteorológicas usando algoritmos de machine learning e procurando uma antecipação temporal suficiente para tomada de decisões. MATERIAL E MÉTODOS: Para o objetivo “A” foram utilizados dados climáticos mensais de temperatura do ar (T, ºC) e precipitação pluviométrica (P, mm) provenientes do ECMWF e do INMET no período de 1979 a 2017. A evapotranspiração potencial foi estimada por Thornthwaite (1948) e balanço hídrico p... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: Coffee is the most consumed beverage in the world, but phytosanitary problems are amongst the main causes of reduced productivity and quality. The application of foliar fungicides and insecticides is the most common strategy for controlling these diseases and pests, depending on their intensity in a region. This traditional method can be improved by using alert systems with models of disease and pest indices. This work has as OBJECTIVES: A) To calibrate the meteorological variables: air temperature and rainfall of the European Center for Medium Range Weather Forecast (ECMWF) in relation to the real surface data measured by the national meteorological system (INMET) for the state of Minas Gerais; B) To evaluate which meteorological elements, and at what time, have a greater influence on the main pests (coffee borer and coffee miner) and diseases (coffee rust and cercosporiosis) of Coffee arabica in the main coffee regions of the South of Minas Gerais and Cerrado Mineiro; C) To develop agrometeorological models for pest and disease prediction in function of the meteorological variables of the South of Minas Gerais and Cerrado Mineiro using algorithms of machine learning with sufficient temporal anticipation for decision making. MATERIAL AND METHODS: To achieve goal "A" we used monthly climatic data (T, ºC) and rainfall (P, mm) from the ECMWF and INMET from 1979 to 2015. Potential evapotranspiration was estimated by Thornthwaite (1948) and water balance by Thornthwaite and Mathe... (Complete abstract click electronic access below) / Doutor Fitopatologia. Modelagem Aprendizado máquina Big data. Fitopatologia. Modelling Machine learning
112	O aprendizado do ofício : Machado de Assis e seus poemas dispersos (1854-1855) / Rodrigues, Cristiane Nascimento. January 2017 (has links) Orientador: Wilton José Marques / Banca: Pedro Marques Neto / Banca: Brunno Vinícius Gonçalves Vieira / Resumo: O objetivo do presente estudo foi averiguar como se formou o poeta Machado de Assis a partir da análise dos seus primeiros vinte poemas publicados nos periódicos Periódico dos Pobres e Marmota Fluminense nos anos de 1854 e 1855. Buscou-se a fonte primária de veiculação dos textos poéticos com o fim de observar a linha editorial, o público leitor, os colaboradores e a ortografia dos primeiros textos de um dos escritores brasileiros de maior repercussão internacional. Investigou-se também a evolução do jovem poeta em seu ofício, apesar de não ter tido seus poemas publicados na ordem em que os criava e de muitos nem sequer apresentarem a data de composição. Nesse sentido, foi necessário dispô-los e avaliá-los seguindo a ordem de publicação. Os principais pontos abordados foram a forma poética, o desenvolvimento dos temas e, além disso, as eventuais influências literárias, manifestadas na expressão, no conteúdo, nas dedicatórias e nas epígrafes. Assim, esses influxos da tradição poética têm um lugar de destaque nas análises feitas, dado que o iniciante se baseou constantemente neles em seu primeiro ano de aprendizado / Abstract: This study aims at ascertaining how Machado de Assis became a poet through his firsts twenty poems published on Periódico dos Pobres e Marmota Fluminense in 1854 and 1855. For that purpose, the primary source for the divulgation of these poetic texts was searched in order to determine the editorial line, the target public, the collaborators as well as the orthography of the firsts texts of one of the most internationally repercuted Brazilian writers of all time. This young poet's evolution as such was also analyzed, even though his texts either weren't published in the same order they were written or weren't dated. By virtue of that, it was necessary to organize and analyze them according to their publication date. The main aspects considered were poetic forms, theme development, and futhermore, the eventual literary influences exhibited by his expression, content, dedications and epigraphs. Thus, these influences brought by the poetic tradition figure as important assets, since the entrant constantly based his work on them during his firsts years as an apprentice / Mestre Literatura brasileira. Poesia brasileira. Programas de aprendizado. Brazilian poetry
113	Inferência de emoções em fragmentos de textos obtidos do Facebook / Medeiros, Richerland Pinto. January 2017 (has links) Orientador: João Fernando Marar / Banca: Antonio Carlos Sementille / Banca: Rodrigo Holdschip / Resumo: Esta pesquisa tem como objetivo analisar o uso da técnica estatística de aprendizado de máquina Maximização de Entropia, voltado para tarefas de processamento de linguagem natural na inferência de emoções em textos obtidos da rede social Facebook. Foram estudados os conceitos primordiais das tarefas de processamento de linguagem natural, os conceitos inerentes a teoria da informação, bem como o aprofundamento no conceito de um modelo entrópico como classificador de textos. Os dados utilizados na presente pesquisa foram obtidos de textos curtos, ou seja, textos com no máximo 500 caracteres. A técnica em questão foi abordada dentro do aprendizado supervisionado de máquina, logo, parte dos dados coletados foram usados como exemplos marcados dentro de um conjunto de classes predefinidas, a fim de induzir o mecanismo de aprendizado a selecionar a classe de emoção mais provável dado o exemplo analisado. O método proposto obteve índice de assertividade médio de 90%, baseado no modelo de validação cruzada. / Abstract: This research aims to analyze the use of entropy maximization machine learning statistical technique, focused on natural language processing tasks in the inferencing of emotions in short texts from Facebook social network. Were studied the primary concepts of natural language processing tasks, IT intrinsic concepts, as well as deepening the concept of Entropy model as a text classifier. All data used for this research came from short texts found in social networks and had 500 characters or less. The model was used within supervised machine learning, therefore, part of the collected data was used as examples marked within a set of predefined classes in order to induce the learning mechanism to select the most probable emotion class given the analyzed sample. The method has obtained the mean accuracy rate of 90%, based on the cross-validation model. / Mestre Emoções. Entropia. Aprendizado do computador. Emotions
114	[en] MORPHOSYNTACTIC TAGGER FOR PORTUGUESE-TWITTER / [pt] ANOTADOR MORFOSSINTÁTICO PARA O PORTUGUES-TWITTER PEDRO LARRONDA ASTI 13 October 2011 (has links) [pt] Nesta dissertação, apresentamos um processador linguístico que resolve a tarefa de Anotação morfossintática de mensagens em português postadas no Twitter. Ao analisar as mensagens escritas por brasileiros no Twitter, é fácil verificar que novos caracteres são introduzidos no alfabeto e também que novas palavras são adicionadas ao idioma. Além disso, observamos que essas mensagens são sintaticamente mal formadas. Isto impossibilita o uso nessas mensagens de diversos processadores linguísticos existentes para o português. Resolvemos esse problema considerando essas mensagens como escritas em uma nova língua, o português-twitter. O alfabeto dessa nova língua contém o alfabeto do português e o seu vocabulário contém o vocabulário da língua portuguesa. Porém, suas gramáticas são diferentes. Para construir os processadores desta nova linguagem, utilizamos a técnica de aprendizado supervisionado denominada Entropy Guided Transformation Learning (ETL). Adicionalmente, para treinar os processadores ETL, construímos um corpus anotado de mensagens em português-twitter. Não temos conhecimento da existência de outros Anotadores Morfossintáticos para o português-twitter. Porém, sabemos que, no estado-da-arte da Anotação Morfossintática para o português, a acurácia é de aproximadamente 96%, variando de acordo com o conjunto de classes escolhido. Construímos o processador composto de dois estágios, um morfológico e um contextual. Como métrica de avaliação, adotamos a acurácia, que mede quantos por cento do corpus foi anotado corretamente. Nossos resultados experimentais apresentam uma acurácia de 90,24% para o anotador proposto. Isto corresponde a um aprendizado significativo, pois o sistema inicial tem uma acurácia de apenas 76,58%. Este resultado é compatível com o aprendizado observado nos correspondentes processadores na língua portuguesa. / [en] In this paper we present a language processor that solves the task of Morphosyntactic Tagging of messages posted in Portuguese on Twitter. By analyzing the messages written by Brazilian on Twitter, it is easy to notice that new characters are introduced in the alphabet and also that new words are added to the language. Furthermore, we note that these messages are syntactically malformed. This precludes the use of existing Portuguese processors in these messages, nevertheless this problem can be solved by considering these messages as written in a new language, the Portuguese-Twitter. Both the alphabet and the vocabulary of such idiom contain features of Portuguese. However, the grammar is are different. In order to build the processors for this new language, we have used a supervised learning technique known as Entropy Guided Transformation Learning (ETL). Additionally, to train ETL processors, we have built an annotated corpus of messages in Portuguese-Twitter. We are not aware of any other taggers for the Morphosyntactic Portuguese-Twitter task, thus we have compared our tagger to the the accuracy of state-of-art Morphosyntactic Annotation for Portuguese, which has accuracy around 96% depending on the tag set chosen. To assess the quality of the processor, we have used accuracy, which measures how many tokens were tagged correctly. Our experimental results show an accuracy of 90,24% for the proposed Morphosyntatic Tagger. This corresponds to significant learning, since the initial baseline system has an accuracy of only 76,58%. This finding is consistent with the observed learning for the corresponding regular Portuguese taggers. [pt] APRENDIZADO DE MAQUINA [en] MACHINE LEARNING [pt] PORTUGUES [en] PORTUGUESE [pt] TWITTER
115	Aplicações de aprendizagem de máquinas às comunicações móveis: gerenciamento de recursos e avaliação de desempenho / Applications of machine learning in mobile communications: resources management and performance assessment Stancanelli, Elvis Miguel Galeas 04 September 2012 (has links) STANCANELLI, E. M. G. Aplicações de aprendizagem de máquinas às comunicações móveis: gerenciamento de recursos e avaliação de desempenho. 2012. 150 f. Tese (Doutorado em Teleinformática) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2012. / Submitted by Marlene Sousa (mmarlene@ufc.br) on 2012-10-31T17:19:27Z No. of bitstreams: 1 2012_tese_emgstancanelli.pdf: 9349222 bytes, checksum: 043bfa5e149b6dd9a9136dce935235b1 (MD5) / Approved for entry into archive by Marlene Sousa(mmarlene@ufc.br) on 2012-11-01T17:09:25Z (GMT) No. of bitstreams: 1 2012_tese_emgstancanelli.pdf: 9349222 bytes, checksum: 043bfa5e149b6dd9a9136dce935235b1 (MD5) / Made available in DSpace on 2012-11-01T17:09:25Z (GMT). No. of bitstreams: 1 2012_tese_emgstancanelli.pdf: 9349222 bytes, checksum: 043bfa5e149b6dd9a9136dce935235b1 (MD5) Previous issue date: 2012-09-04 / In order to bear the growth in the traffic volume expected for the coming years, the next generation of mobile communication systems relies on advanced technologies such as multiple orthogonal subcarriers and coordination of multiple transmission points. The radio resources are organized in a higher number of dimensions, making resource allocation and assessment of link-level performance more complex tasks. Based on techniques from machine learning, we investigated novel ways of addressing these tasks in order to perform them efficiently. This thesis provides two proposals: (i) clustering of transmission points and (ii) design of a link-to-system interface. In proposal (i), the k-means algorithm is used to identify the strength signal vectors that are similar to each other, leading to a decrease on the cooperation complexity. In proposal (ii), we make use of artificial neural networks to learn the behavior of link-level simulations, resulting in a link-to-system interface more reliable for certain situations on the cell-edge region. The results obtained in both proposals confirm machine learning as an appropriate approach to the problems addressed, being able to lead to alternative interpretations and efficient solutions. / De modo a suprirem o aumento de tráfego previsto para os próximos anos, os sistemas de comunicações móveis da próxima geração contam com tecnologias avançadas, como múltiplas subportadoras ortogonais e coordenação entre pontos de transmissão. Os recursos de rádio passam a ser organizados em um número maior de dimensões, tornando mais complexas tarefas como a alocação de recursos e a avaliação de desempenho do enlace. Com base em técnicas de aprendizagem de máquinas, foram investigadas novas maneiras de abordar essas tarefas, de modo a realizá-las eficientemente. Esta tese traz duas propostas: (i) agrupamento de pontos de transmissão e (ii) realização de interface enlace-a-sistema. Na proposta (i), utiliza-se o algoritmo k-médias para identificar os vetores de força do sinal similares, resultando em redução na complexidade de cooperação. Na proposta (ii), utilizam-se redes neurais artificiais para que o comportamento de simulações de enlace possa ser aprendido, resultando em uma interface enlace-a-sistema mais confiável para certas situações na região de borda de célula. Os resultados obtidos em ambas as propostas confirmam a aprendizagem de máquinas como abordagem apropriada aos problemas tratados, sendo capaz de conduzir a interpretações alternativas e soluções eficientes. Teleinformática Sistemas de comunicação móvel Simulação (Computadores) Aprendizado do computador
116	Contribuições ao problema de predição recursiva de séries temporais univariadas usando redes neurais recorrentes / Contributions to the problem of recursive prediction of univariate time series using recurrent neural networks Menezes Júnior, José Maria Pires de 02 March 2012 (has links) MENEZES JÚNIOR, J. M. P. Contribuições ao problema de predição recursiva de séries temporais univariadas usando redes neurais recorrentes. 2012. 186 f. Tese (Doutorado em Engenharia de Teleinformática)–Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2012. / Submitted by Hohana Sanders (hohanasanders@hotmail.com) on 2017-04-11T16:46:00Z No. of bitstreams: 1 2012_tese_jmpmenezesjúnior.pdf: 8865921 bytes, checksum: 029824a1fa5ffbf3ffe36c81c0b8f5f5 (MD5) / Approved for entry into archive by Marlene Sousa (mmarlene@ufc.br) on 2017-06-02T13:54:13Z (GMT) No. of bitstreams: 1 2012_tese_jmpmenezesjúnior.pdf: 8865921 bytes, checksum: 029824a1fa5ffbf3ffe36c81c0b8f5f5 (MD5) / Made available in DSpace on 2017-06-02T13:54:13Z (GMT). No. of bitstreams: 1 2012_tese_jmpmenezesjúnior.pdf: 8865921 bytes, checksum: 029824a1fa5ffbf3ffe36c81c0b8f5f5 (MD5) Previous issue date: 2012-03-02 / In this thesis, we tackle the problem of recursive prediction of univariate time series, also known as long-term prediction, using recurrent neural networks. This type of problem often emerges from nonlinear dynamical systems modelling and prediction tasks, particularly from those producing signals of chaotic nature, where one can observe the presence of long-term temporal dependencies. In recursive prediction, differently from the one-step-ahead prediction task, predicted values are fed back to the input of the neural model, a feature that makes time series with long-term temporal dependencies more difficult to deal with due to the propagation of prediction errors. That being said, in order to handle the problem of recursive prediction of univariate time series, extensions of the neural NARX (Nonlinear AutoRegressive model with eXogenous inputs) model ar eintroduced in this thesis. These extensions result from attempts to embed into the NARX model different strategies to capture temporal information, either of short-term or long-term nature. Among such strategies, we highlight the following ones: (i) simultaneous prediction of several steps ahead, also known as MIMO (multi-input, multi-output model) prediction, (ii) prediction via dynamical random projections, as in the ESN (echo state network) model, (iii) prediction via static random projections, as in the ELM (extreme learning machine) network, and (iv) prediction via hybrid recurrent models based the NARX and ELMAN networks. Additionally, a novel methodology for the design (i.e. parameter selection) and performance comparison of the proposed models is also introduced in this model with the aim of evaluating them under similar conditions and to serve as reference for further studies. For this purpose, synthetic and real-world benchmarking time series are used. The obtained results suggest that the proposed neural models present themselves as efficient alternatives to the state of the art in recursive prediction of univariate time series using recurrent neural architectures. / Nesta tese aborda-se o problema de predição recursiva de séries temporais univariadas, também chamado de predição de longo prazo, usando redes neurais recorrentes. Este tipo de problema surge, com frequência, em tarefas de modelagem e predição de sistemas dinâmicos não-lineares, principalmente os que produzem sinais de natureza caótica, em que se observa a presença de dependência temporal (memória) de longa duração. Na predição recursiva, diferentemente da predição de um passo à frente (one-step-ahead prediction), as predições são realimentadas para a entrada do modelo neural, característica esta que dificulta a predição de séries com dependência temporal longa devido à propagação do erro de predição. Isto posto, para tratar o problema de predição recursiva de séries temporais, extensões do modelo neural NARX (Nonlinear AutoRegressive model with eXogenous inputs) são propostas nesta tese. Estas extensões resultam da tentativa de incorporar à rede NARX diferentes estratégias de modelagem da informação temporal, tanto de curto quanto de longo prazo. Dentre estas estratégias, destacamse: (i) predição (simultânea) de vários passos à frente, também chamada de predição MIMO (multi-input, multi-output model), (ii) predição via projeções aleatórias dinâmicas, tal como na rede ESN (echo state network), (iii) predição via projeções aleatórias estáticas, tal como na rede ELM(extreme learning machine), e (iv) predição via modelos recorrentes híbridos baseados nas redes NARX e ELMAN. Além disso, uma metodologia para projeto (i.e. seleção de parâmetros) e comparação dos desempenhos dos modelos propostos é também desenvolvida nesta tese com o objetivo de avaliá-los sob as mesmas condições e servir de referência para estudos futuros. Para este fim, são utilizadas séries temporais sintéticas e reais comumente presentes em benchmarks de desempenho. Os resultados obtidos sugerem que os modelos propostos apresentam-se como alternativas eficientes ao estado da arte em modelos de redes neurais recorrentes para predição de séries temporais univariadas, principalmente aqueles baseados em projeções aleatórias devido ao baixo custo computacional. Teleinformática Estudos de séries temporais Redes neurais (Computação) Máquina de aprendizado extremo
117	Seleção dinâmica de subconjunto de classificadores : abordagem baseada em acurácia local / Leila Maria Vriesmann ; orientador, Alceu de Souza Britto Junior ; co-orientador, Luiz Eduardo Soares de Oliveira Vriesmann, Leila Maria January 2012 (has links) Tese (doutorado) - Pontifícia Universidade Católica do Paraná, Curitiba, 2012 / Bibliografia: p. 103-108 / A classificação pode ser considerada a principal tarefa na área de reconhecimento de padrões. Sua função é atribuir uma classe a um padrão de teste desconhecido. É sabido que métodos de classificação baseados em conjunto de classificadores frequentement / The classification may be considered the most important task in the pattern recognition area. It assigns a class to an unknown test pattern. Classification methods based on ensemble of classifiers usually present a better performance than individual cla 004 20 Informática Dissertações Reconhecimento de padrões Aprendizado do computador Algoritmos
118	Data warehouse enriquecido com métodos de aprendizado de máquina para a família Geminiviridae / Data warehouse enriched with machine learning methods for the Geminiviridae family Silva, José Cleydson Ferreira da 25 July 2016 (has links) Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2017-02-10T10:52:35Z No. of bitstreams: 1 texto completo.pdf: 3471654 bytes, checksum: 82ea26892b0d158adb1ef3c47fefcab1 (MD5) / Made available in DSpace on 2017-02-10T10:52:35Z (GMT). No. of bitstreams: 1 texto completo.pdf: 3471654 bytes, checksum: 82ea26892b0d158adb1ef3c47fefcab1 (MD5) Previous issue date: 2016-07-25 / Geminivírus infectam uma ampla faixa de plantas monocotiledôneas e dicotiledô- neas e causam expressivas perdas econômicas. A família Geminividae é uma das mais importantes famílias de vírus de plantas. Atualmente está composta por sete gêneros, é reconhecida pelo tipo de inseto vetor, hospedeiro, organização genômica e reconstrução filogenética. A amplificação por ciclo rolante permitiu que milhares de sequências completas e parciais fossem depositadas em bases de dados públi- cas. Entretanto, tais bases de dados são limitadas em ferramentas avançadas que permitam responder perguntas sofisticadas. Ao contrário de outros importantes patógenos virais, nenhum banco de dados para geminivírus que integre todas as informações relevantes foi ainda sugerido. Neste trabalho, um Data Warehouse (DW) designado geminivirus.com é proposto. Um DW amplamente enriquecido por abordagens de aprendizado de máquina que vise garantir confiabilidade e qua- lidade das sequências genômicas e seus metadados associados. As metodologias de extração, transformação dessas sequências e seus metadados foram implemen- tadas em um processo ETL (Extract, Transform and Load) específico para dados de geminivírus. Além disso, neste processo, o uso de algoritmos de aprendizado de máquina como Multilayer Perceptron (MLP), Máquina de Vetores de Suporte (SVM) e Random Forest são utilizados como classificadores taxonômicos in silico para classificar as sequências completas. Ademais, modelos de aprendizado de máquina foram propostos para classificação de genes. Os modelos para ambos os fins superam 98% de acurácia e precisão, utilizando apenas atributos extraídos da sequência genômica completa, sequência CDS (Coding DNA Sequence) e sequên- cia de aminoácidos. Também técnicas de Processamento de Linguagem Natural baseadas em teoria dos grafos foram propostas para extração de informação e co- nhecimento em resumos de artigos. Essa metodologia apresentou grande potencial para responder perguntas específicas. Explorando o grafo de texto buscando por palavras chaves que representam os mecanismos evolutivos, verificou-se que o tema recombinação é os mais estudado se comparado à mutação, migração, seleção na- tural e deriva genética. Tornando-se assim, uma técnica propicia para gerar novas hipóteses. Ao utilizar tal técnica, observou-se que ferramentas de predição de genes não foram mencionadas. Dessa oportunidade, sugerimos um método para predição e classificação de genes designado Fangorn Forest (F2). Além disso, como parte desse método sugerimos um algoritmo para predição de genes designado Millau Bridge (MB). Esse algoritmo testa todas as possíveis ORFs que uma sequência genômica completa pode codificar por meio de codons de iniciação e terminação. Além disso, identifica sítios de excisão de splicing. geminivrus.com tornou-se uma base de dados robusta capaz de proporcionar dados com boa qualidade, ferramen- tas avançadas enriquecidas por métodos de aprendizado de máquina que auxiliam pesquisadores em suas atividades de pesquisa e tomada de decisão. / Geminiviruses infect a wide range of monocot and dicot plants and cause sig- nificant economic losses. The Geminividae family is one of the most important plant virus families. Currently, it consists of seven genera and is recognized by the type of insect vector, host range, genome organization and phylogenetic re- construction. The rolling cycle amplification allowed thousands of complete and partial sequences to be made available in public databases. However, such databa- ses have limitations concerning advanced tools to answer sophisticated questions. Unlike other major viral pathogens, no database for geminiviruses that integrates all relevant information was suggested yet. In this work, a Data Warehouse (DW) designated geminivirus.org is proposed. It is a DW widely enriched by machine learning (ML) approaches designed to ensure reliability and quality of the genomic sequences and their associated metadata. The methods for extraction and trans- formation of these sequences and their metadata have been implemented using the ETL process (Extract, Transform and Load), specifically for geminivirus data. In addition, ML algorithms such as Multilayer Perceptron (MLP), Support Vector Machine (SVM), and Random Forest classifier are used as in silico taxonomic clas- sifiers to classify complete sequences. Furthermore, ML models are proposed for gene classification. All models exceed 98% accuracy and precision using only ex- tracted attributes of the complete genome sequence, Coding DNA Sequence (CDS) and protein sequence. Additionally, Natural Language Processing based on graph theory techniques have been proposed for extracting information and knowledge articles. This methodology presented great potential to answer specific questi- ons. While exploring the word graph by searching for keywords that represent evolutionary mechanisms, it was found that the subject of recombination is the most studied compared to the mutation, migration, natural selection and, genetic drift. The resulting method is demonstrated, thus, to be an interesting techni- que to generate new hypotheses. By using this technique, it was observed that gene prediction tools have not been mentioned. In this opportunity, we suggest a powerful method for prediction and classification of genes called Fangorn Forest (F2). Also as part of this method, we suggest a greedy algorithm for predicting genes designated Millau bridge (MB). This algorithm tests all possible ORFs that a complete genomic sequence can encode inspecting initiation and termination co- dons. Furthermore, it identifies splicing sites. geminivirus.org became a robust database capable of providing data with good quality, advanced tools enriched by machine learning methods that help researchers in their research activities and decision making. Aprendizado de máquina Bioinformática Biologia molecular Geminivírus Ciência da Computação
119	Casamento de padrões e operadores morfológicos adaptativos / Template matching and adaptive morphological operators Almeida Filho, Magno Prudêncio de 26 February 2016 (has links) ALMEIDA FILHO, M. P. Casamento de padrões e operadores morfológicos adaptativos. 2016. 125 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2016. / Submitted by Hohana Sanders (hohanasanders@hotmail.com) on 2016-06-28T16:29:00Z No. of bitstreams: 1 2016_dis_mpalmeidafilho.pdf: 3932596 bytes, checksum: 608da6fa1bcbe8c565ffb05cd1e8e1b9 (MD5) / Approved for entry into archive by Marlene Sousa (mmarlene@ufc.br) on 2016-07-12T14:55:18Z (GMT) No. of bitstreams: 1 2016_dis_mpalmeidafilho.pdf: 3932596 bytes, checksum: 608da6fa1bcbe8c565ffb05cd1e8e1b9 (MD5) / Made available in DSpace on 2016-07-12T14:55:18Z (GMT). No. of bitstreams: 1 2016_dis_mpalmeidafilho.pdf: 3932596 bytes, checksum: 608da6fa1bcbe8c565ffb05cd1e8e1b9 (MD5) Previous issue date: 2016-02-26 / Mathematical morphology is an approach applied in processing and image analysis problems that performs transformations in an object (image) by patterns of predefined forms. Such transformations are called morphological operators, with erosion and dilation being the elementary morphological operators. This work presents a machine learning mechanism applied for the automatic generation of templates, to be used by inexact template matching morphological operators. This model of operator is called Template Matching Adaptive Morphological Operator (OMACP), and combines the formalism of mathematical morphology through ELUTs (Elementary Look-Up Tables) with machine learning techniques. The ELUTs based template matching morphological operators already described in the literature allow inexact pattern recognition in digital images by defining a range around a reference pattern. This range has a constant value that is applied to all pixels of reference patterns, and its choice depends on parameters whose adjustments is usually performed based on empirical results, besides being highly sensitive to user idiosyncrasies. This work also proposes a mechanism, based on statistical parameters, which automates the choice of these range. Besides not consider it a constant value for all pixels of reference pattern. Such mechanism reduces the interference of a user to define the parameters of the morphological operator. To prove the effectiveness achieved with the inclusion of learning techniques and the choices mechanism of the range around the pattern reference, were performed comparative experiments between the proposed OMACP (with the inclusion of new features) with operators already studied without these features. / A morfologia matemática é uma abordagem utilizada em problemas de processamento e análise de imagens em que são realizadas transformações de um objeto (imagem) por padrões de formas pré-definidas. Tais transformações são efetuadas por operadores morfológicos, sendo a erosão e a dilatação os operadores morfológicos elementares. Neste trabalho é apresentado um mecanismo de aprendizagem destinado à geração automática de templates, a serem utilizados em operadores morfológicos de casamento inexato de padrões (em que o casamento não precisa ser perfeito). Esse modelo de operador é aqui denominado de Operador Morfológico Adaptativo de Casamento de Padrões (OMACP), e combina o formalismo da morfologia matemática através de ELUTs (Elementary Look-Up Tables) com técnicas de aprendizagem de máquina. Os operadores morfológicos para casamento de padrões via ELUTs já descritos na literatura permitem o casamento inexato de padrões, ou detecção com folga, em imagens digitais através da definição de um intervalo em torno de um padrão de referência. Esse intervalo aplicado em todos os pixels do padrão de referência possui um valor constante e sua escolha depende de parâmetros cujo ajuste normalmente é realizado tendo como base resultados empíricos, além de ser fortemente sensível a idiossincrasia do usuário. Este trabalho propõe um mecanismo, baseado em parâmetros estatísticos, que automatiza a escolha desse intervalo. Além de não considerá-lo mais um valor constante para todos os pixels do padrão de referência. Tal mecanismo reduz assim a interferência de um usuário na definição dos parâmetros do operador morfológico. Para comprovar a eficácia obtida com a inclusão tanto das técnicas de aprendizagem quanto do mecanismo de escolha do intervalo em torno do padrão de referência, foram realizados experimentos comparativos entre o OMACP proposto (com a inclusão das novas funcionalidades) com os operadores já descritos na literatura sem essas alterações. Engenharia elétrica Imagens digitais - Processamento Aprendizado do cumputador Inteligência artificial
120	Mirnacle: aprendizagem de máquina utilizando SMOTE e Random Forest para prover aumento da seletividade na predição ab initio de pre-miRNAs / Mirnacle: machine learning with SMOTE and random forest for improving se- lectivity in pre-miRNA ab initio prediction Marques, Yuri Bento 08 December 2015 (has links) Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2016-04-29T11:11:26Z No. of bitstreams: 1 texto completo.pdf: 3023292 bytes, checksum: 6695727050e9686d3b65e792748935d9 (MD5) / Made available in DSpace on 2016-04-29T11:11:26Z (GMT). No. of bitstreams: 1 texto completo.pdf: 3023292 bytes, checksum: 6695727050e9686d3b65e792748935d9 (MD5) Previous issue date: 2015-12-08 / Os microRNAs (miRNAs) são importantes reguladores da expressão gênica em plantas e animais. Assim, miRNAs estão envolvidos na maioria dos processos biológicos, tor- nando o estudo dessas moléculas um dos temas mais relevantes da biologia molecular atualmente. Uma estratégia para encontrar novos miRNAs é procurar seus precursores (pre-miRNAs), que são estruturas ligeiramente maiores (70-120 nt) e têm uma estru- tura secundária na forma de hairpin (grampo de cabelo). No entanto, caracterizar pre-miRNAs in vivo ainda é uma tarefa complexa. Como consequência disto, méto- dos in silico foram desenvolvidos para prever a localização genômica de pre-miRNAs. No entanto, as ferramentas computacionais atuais têm problemas de seletividade, isto é, uma grande quantidade de falsos positivos é reportada. Este trabalho apresenta uma extensão do método desenvolvido por Tempel e Tahi, 2012, com o objetivo de melhorar a seletividade através da técnica de aprendizagem de máquina denominada Random Forest, combinada com o método SMOTE, que lida com conjuntos de dados desbalanceados. Comparando o método proposto com outras importantes abordagens na literatura, mostramos que os procedimentos descritos neste trabalho puderam me- lhorar substancialmente a seletividade, sem comprometer a sensibilidade. Para três conjuntos de dados utilizados nos experimentos realizados, a abordagem proposta al- cançou pelo menos 97 % de sensibilidade e proporcionou um aumento de duas, vinte e seis vezes na seletividade, respectivamente, em comparação com os resultados de ferramentas computacionais atuais. / MicroRNAs (miRNAs) are key gene expression regulators in plants and animals. Thus, miRNAs are involved in the majority of biological process, making the study of these molecules one of the most relevant topics of molecular biology nowadays. A strategy to find new miRNAs is to search for its precursors (pre-miRNAs), which are slightly lar- ger structures (70-120 nt) and have a hairpin structural form. However, characterizing pre-miRNAs in vivo is still a complex task. As a consequence, in silico methods were developed to predict the genomic location of pre-miRNAs. Nevertheless, the current computational tools have problems of selectivity, i.e., a higher number of false positives is reported. This work presents an extension of the method developed by Tempel and Tahi, 2012, with the aim of improving selectivity through machine learning techniques, namely, random forests combined with the SMOTE method that copes with imbalance datasets. Comparing our method with other important approaches in the literature, we have shown that our procedures could substantially improve selectivity without com- promising sensibility. For three datasets used in our experiments, our method achieved at least 97% of sensitivity and could deliver a two-fold, 20-fold, and 6-fold increase in selectivity, respectively, compared with the best results of current computational tools. / Sem Agência de Fomento. Aprendizado do computador Bioinformática Biologia molecular Ácido ribonucleico Ciência da Computação

Search results