• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 492
  • 27
  • 26
  • 14
  • 8
  • 7
  • 7
  • 7
  • 7
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 565
  • 311
  • 93
  • 79
  • 70
  • 57
  • 56
  • 53
  • 53
  • 45
  • 43
  • 43
  • 42
  • 42
  • 40
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
131

Técnicas de otimização em alinhamentos múltiplos de sequência via Cadeias de Markov / Optimization techniques for multiple sequence alignments by Markov Chains

Nóbrega, Juliano Farias da [UNESP] 29 February 2016 (has links)
Submitted by Juliano Farias da Nobrega null (juliano@e8.com.br) on 2016-04-13T15:21:20Z No. of bitstreams: 1 dissert_juliano_unesp.pdf: 1652677 bytes, checksum: 2d05540d73450af0ce70d07689eeac2a (MD5) / Rejected by Felipe Augusto Arakaki (arakaki@reitoria.unesp.br), reason: Solicitamos que realize uma nova submissão seguindo as orientações abaixo: O arquivo submetido está sem a ficha catalográfica. A versão submetida por você é considerada a versão final da dissertação/tese, portanto não poderá ocorrer qualquer alteração em seu conteúdo após a aprovação. Corrija esta informação e realize uma nova submissão contendo o arquivo correto. Agradecemos a compreensão. on 2016-04-14T20:43:40Z (GMT) / Submitted by Juliano Farias da Nobrega null (juliano@e8.com.br) on 2016-04-15T13:45:15Z No. of bitstreams: 1 Dissertacao_Juliano_Unesp.pdf: 1798501 bytes, checksum: 97b5fd5aa56bbac1dd28b2e73b516bd4 (MD5) / Approved for entry into archive by Ana Paula Grisoto (grisotoana@reitoria.unesp.br) on 2016-04-18T13:22:17Z (GMT) No. of bitstreams: 1 nobrega_jf_me_sjrp.pdf: 1798501 bytes, checksum: 97b5fd5aa56bbac1dd28b2e73b516bd4 (MD5) / Made available in DSpace on 2016-04-18T13:22:17Z (GMT). No. of bitstreams: 1 nobrega_jf_me_sjrp.pdf: 1798501 bytes, checksum: 97b5fd5aa56bbac1dd28b2e73b516bd4 (MD5) Previous issue date: 2016-02-29 / Recentemente, a bioinformática tornou-se um recurso imprescindível para a análise e interpretação da grande quantidade de informação biológica gerada pela biologia molecular e pelos sequenciadores de última geração. O processo de comparação dessas biossequências é o ponto de partida para o estudo da evolução e diferenciação dos organismos vivos, além de ser uma das tarefas mais importantes na biologia computacional. Neste trabalho apresenta-se uma abordagem baseada na heurística de Cadeias de Markov para otimização de um algoritmo de alinhamento múltiplo de sequências biológicas, proporcionando resultados com mais qualidade e sem o comprometimento do desempenho da ferramenta MUSCLE, escolhida para dar suporte ao trabalho. As cadeias de Markov foram escolhidas como técnica de otimização devido sua eficiente aplicabilidade em diversos problemas, sobretudo na biologia computacional, pois sua metodologia probabilística torna a aplicação computacionalmente viável, contornando os problemas NP-difícil e apresentando resultados significamente precisos. / Recently, bioinformatics has become an indispensable tool for analyzing and interpreting large amounts of information biological generated by molecular biology and the next-generation sequencers. The comparison process these sequences is the starting point for the study of evolution and differentiation of living organisms as well as being one of the most important tasks in computational biology. This work presents an approach based on Markov chains heuristics for optimization of a multiple alignment algorithm of biological sequences, provides improved quality results and without compromising the performance of MUSCLE tool chosen to support the work.. Markov chains were chosen as optimization technique due to its efficient applicability in various other problems, especially in computational biology, as its probabilistic methodology makes applying computationally feasible, bypassing the NP-hard problems and stating significantly accurate results.
132

Construção e análise da rede integrada de interações entre genes humanos envolvida com a regulação da trnsição G1/S do ciclo celular plea adesão à matriz extracelular

Acencio, Marcio Luis [UNESP] 29 March 2011 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:32:14Z (GMT). No. of bitstreams: 0 Previous issue date: 2011-03-29Bitstream added on 2014-06-13T19:02:39Z : No. of bitstreams: 1 acencio_ml_dr_botib.pdf: 1267432 bytes, checksum: cf302219e637097689d48f5505b349bb (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / Virtualmente, todas as células normais, com exceção das células hematopoieticas, precisam estar aderi das à matriz extracelular para que elas possam se proliferar. Na ausência de adesão, essas células não se proliferam mais e acabam sofrendo apoptose. Porém, após transformação oncogênica, as células adquirem a capacidade de proliferação na ausência de adesão à matriz extracelular. Essa capacidade, cuja base molecular está na regulação anormal da transição G tiS do ciclo celular pela adesão, é uma das propriedades fundamentais das células cancerosas e também requisito para que essas células adquiriam sua capacidade metastática. Como as metástases correspondem a aproximadamente 90% das mortes por câncer, a elucidação dos mecanismos moleculares subjacentes à regulação da transição G IIS do ciclo celular pela adesão à matriz extracelular é, portanto, essencial para o desenvolvimento de drogas que possam inibir a formação das metástases. Com o intuito de elucidar esses mecanismos, nós adotamos neste trabalho uma abordagem estritamente computacional baseada em teoria das redes e aprendizado de máquina através do desenvolvimento de novos métodos de (i) construção de redes que representam a provável regulação entre dois diferentes processos (nesse caso, regulação da transição G l/S pela adesão à matriz extracelular), (á) predição de interações oncogênicas, (iii) determinação de sub-redes de vias de sinalização oncogênica entre dois genes de interesse em uma rede (batizado de graph2sig) e (iv) predição de potenciais alvos de drogas. A rede potencialmente envolvida na regulação da transição G l/S do ciclo celular pela matriz extracelular construída (Gccam) possui ~ 2000 genes e ~ 20.000 interações e representa ~ 78% dos processos biológicos conhecidamente envolvidos nessa regulação... / Virtually all normal cells, excluding the hematopoietic cells, require anchorage to the extracellular matrix for their proliferation and survival. When such cells are deprived of anchorage, they arrest in the G1 phase of the cell cycle and eventually undergo apoptosis. Cancer cells, on the other hand, acquire the ability to perform anchorage-independent proliferation as a result of the disruption of the regulation of the G1/S cell cycle transition by adhesion to extracellular matrix. Anchorage-independent proliferation is the foundation for tumorigenicity and metastatic capability of cancer cells. As metastases are the cause of 90% of human cancer deaths, it is crucial to decipher the molecular mechanisms underlying the regulation of the G1/S cell cycle transition by the adhesion to extracellular cell matrix. In order to decipher such mechanisms, we developed in this present work machine learning and graph theory-based computational methods for the (i) construction of networks representing the regulatory relationships between two biological processes of interest, (ii) prediction of oncogenic interactions, (iii) extraction of oncogenic signaling subnetworks between two genes and (iv) prediction of druggable genes. The network representing the regulatory relationships between G1/S cell cycle transition and adhesion to extracellular matrix, Gccam, is comprised by 2,000 genes and 20,000 interactions. Moreover, 78% of known biological process involved in the regulation of G1/S cell cycle transition by adhesion to extracellular matrix are embedded in Gccam. Through the prediction of oncogenic interactions and the extraction of oncogenic signaling subnetworks between EGFR and CDC6, genes that encode proteins likely to be relevant to anchorage-independent proliferation, we postulate the following hypotheses for the molecular mechanisms underlying the anchorage-independent proliferation: cancer... (Complete abstract click electronic access below)
133

JMSA : Java Mass Spectrometry Analyzer: ferramenta para gerenciamento e análise de banco de espectros de massa para identificação de microrganismos

Cunico, Malton William Machado January 2017 (has links)
Orientador : Prof. Dr. Leonardo Magalhães Cruz / Coorientador : Prof. Dr. Luciano Fernandes Huergo / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 10/03/2017 / Inclui referências : f. 50-52 / Resumo: A utilização da espectrometria de massa MALDI-TOF permite a identificação de microrganismos através da geração de espectros de massa, representando um perfil característico de sinais obtidos a partir de peptídeos ionizados de células inteiras ou extratos celulares. A comparação de espectros de massa obtidos de microrganismos desconhecidos contra um banco de dados de espectros de massa para microrganismos conhecidos, permite sua identificação. Essa utilização permite o usufruto de algumas vantagens frente a algumas limitações da técnica padrão, tal como agilidade na análise e redução de custos. Entretanto, faltam alternativas gratuitas aos softwares proprietários capazes de suprir características chaves na análise dos dados extraídos por tal técnica. Para auxiliar nessa análise nós criamos o JMSA, que é uma ferramenta de análise dos picos de um espectro de massa. O JMSA é capaz de facilitar a visualização comparativa, incluir dados descritivos de amostras. O JMSA também pode executar uma comparação de similaridade entre espectros selecionados. Desta forma o programa foi capaz de identificar um espectro, dado como desconhecido, em nível de espécie. O programa é capaz de ser executado consumindo poucos recursos nos principais sistemas operacionais que suportem Java, tal como MacOSX, Linux e Windows. Palavras-chave: Espectrometria de massa, Identificação de microrganismos, Análise de espectros de massa, MALDI-TOF, Desenvolvimento de software, Java. / Abstract: The use of MALDI-TOF mass spectrometry allows microorganism identification by generating mass spectra representing a characteristic profile of signals from ionized whole cell peptides or cell extracts. Comparing of mass spectra obtained from unknown microorganisms with a database of mass spectra for known microorganisms allows their identification. This usage allows the exploitation of some advantages over some limitations of the standard technique, such as agility in the analysis and reduction of costs. However, there is a lack of free alternatives to proprietary software capable of supplying key characteristics in its extracted data analysis. To assist in this analysis we have created the JMSA, which is a tool for analyzing the peaks of a mass spectrum. The JMSA is able to facilitate comparative visualization as well as include descriptive sample data. JMSA can also perform a similarity comparison of selected spectra. In this way the program was able to identify a spectrum, given as unknown, at species level. The program is able to run by consuming few resources on major operating systems that support Java, such as MacOSX, Linux and Windows. Key-words: Mass spectrometry, Identification of microorganisms, Mass spectrum analysis software, MALDI-TOF, Software development, Java.
134

Diversidade de Bacillus thuringiensis e seus genes cry e vip em amostras metagenômicas de DNA extraído do solo com cultivo de cana-de-açúcar e solo de floresta nativa em estações climáticas diferentes

Pinto, Natalia dos Santos [UNESP] 27 June 2014 (has links) (PDF)
Made available in DSpace on 2014-11-10T11:09:55Z (GMT). No. of bitstreams: 0 Previous issue date: 2014-06-27Bitstream added on 2014-11-10T11:57:42Z : No. of bitstreams: 1 000792129.pdf: 1387453 bytes, checksum: a23091891fb1b1c568aaa3170eeee7cf (MD5) / O entomopatógeno Bacillus thuringiensis têm se destacado no controle biológico de insetos-praga como alternativa viável em substituição aos inseticidas químicos. A bactéria é caracterizada pela produção de cristais protéicos em concomitância com o processo de esporulação. Esses cristais são formados por polipeptídeos que apresentam propriedade entomopatogênica frente a diversas ordens de insetos, porém são inócuos ao meio ambiente. Dessa forma, o conhecimento da diversidade de genes de B. thuringiensis presente no solo é de extrema importância para compreender sua distribuição ecológica e seus efeitos em habitats diferentes. Em paralelo, o uso de técnicas de análise envolvendo metagenômica são propostas para estudar comunidades microbianas presentes no meio ambiente, permitindo inclusive o acesso a microrganismos incultiváveis. A partir desta proposta o presente trabalho analisou a diversidade de genes codificadores das proteínas entomopatogênicas de B.thuringiensis em seqüências metagenômicas de DNA extraído de solo com cultivo de cana-de-açúcar e solo de floresta nativa em estações climáticas distintas. Foi possível identificar linhagens que possivelmente deram origem ao material genético via plataforma MG-RAST e os genes codificadores das proteínas entomopatogênicas foram identificados utilizando o software BLAST. Os resultados evidenciam uma provável influência das estações climáticas sobre a diversidade dos genes obtidos por este tipo de análise / The entomopathogen Bacillus thuringiensis is the most used alternative to control pests as opposed to the use of chemical products. This bacterium is able to produce crystals protein with entomopathogenic properties coded by the cry genes during its sporulation phase. The knowledge of the diversity of cry genes found in B. thuringiensis that is considered a soil bacterium is of extreme importance to allow us to understand the ecological distribution and its potential effects on the environment. Aside from this, the use of metagenomics techniques are being proposed to study microbial communities, as a way to overcame uncultivable microorganism. Based on such proposition this work aimed to evaluate the presence of B. thuringiensis entomopathogenic protein coding genes from metagenomic DNA extracted from soil samples on which sugar-cane has been cultivated as well as native forest soil samples obtained during different seasons of the year. It was possible to identify some strains of B. thuringiensis using the platform MG-RAST and their respective cry genes using the software BLAST. The obtained results allowed us to consider the influence of the climate on the diversity of cry genes that could be recognized by this type of analysis
135

Viroma em espécies ornamentais / Virome in ornamental plants

Brant, Pedro Maretti 17 March 2017 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Biológicas, Departamento de Fitopatologia, 2017. / Submitted by Raquel Almeida (raquel.df13@gmail.com) on 2017-06-05T18:35:12Z No. of bitstreams: 1 2017_PedroMarettiBrant.pdf: 2836357 bytes, checksum: 9d3963f4506e49546ec09c79daaa34f4 (MD5) / Approved for entry into archive by Raquel Viana (raquelviana@bce.unb.br) on 2017-06-20T21:20:25Z (GMT) No. of bitstreams: 1 2017_PedroMarettiBrant.pdf: 2836357 bytes, checksum: 9d3963f4506e49546ec09c79daaa34f4 (MD5) / Made available in DSpace on 2017-06-20T21:20:25Z (GMT). No. of bitstreams: 1 2017_PedroMarettiBrant.pdf: 2836357 bytes, checksum: 9d3963f4506e49546ec09c79daaa34f4 (MD5) Previous issue date: 2017-06-20 / A floricultura no Brasil teve início como atividade secundária da fruticultura nos estados de São Paulo e Santa Catarina no início do século XX e atualmente apresenta um crescimento anual de exportação maior que a média mundial. O Distrito Federal (DF) é o décimo em valor de mercado no país, sendo um mercado altamente promissor por apresentar a maior renda per capita do país. Com a expansão do setor, aumento na incidência das doenças e a constante introdução de mudas e sementes exóticas no país, fatores de cultivo, manejo e sanidade vegetal podem constituir um entrave à produção de ornamentais no país e DF. Ainda assim, pesquisas direcionadas a detecção precisa de espécies virais ocorrendo em plantas ornamentais são incipientes no país e escassas no DF. O estudo de viroma em combinação com as estratégias de Next Generation Sequencing (NGS), tendo o apoio das metodologias de bioinformática, têm possibilitado uma eficiente descrição de diferentes organismos presentes em diferentes amostras biológicas nos mais diversificados ambientes e proporcionado avanços significativos em diferentes campos das ciências, incluindo a virologia vegetal. Neste trabalho, um pool composto por dez espécies de plantas ornamentais provenientes do Viveiro I da NOVACAP (Companhia Urbanizadora da Nova Capital do Brasil) foi submetido ao sequenciamento NGS. Após análise dos dados gerados, por meio de diferentes técnicas de bioinformática, sequências novas foram encontradas, indicando seis prováveis novas espécies virais em diferentes gêneros e famílias. Duas prováveis espécies novas de Nucleorhabdovirus (família Rhabdoviridae) foram identificadas, sendo uma delas em Pachystachys lutea (camarão-amarelo) e a outra em Coreopsis lanceolata (margaridinha). Nesta mesma ornamental, margaridinha, identificou-se também uma provável espécie nova do gênero Umbravirus (família Tombusviridae). Outro representante da família Tombusviridae, neste caso uma espécie classificada no gênero Pelarspovirus, foi identificada em Jasminum nitidum (jasmim estrela). As demais espécies, uma do gênero Cytorhabdovirus e outra uma do gênero Potyvirus, foram detectadas no pool de amostras. Dentre essas prováveis espécies novas de vírus, duas sequências detectadas nas plantas ornamentais C. lanceolata e P. lutea apresentaram maior proximidade com os vírus Sonchus yellow net nucleorhabdovirus (SYNV) e Potato yellow dwarf nucleorhabdovirus (PYDV), respectivamente, e foram denominadas como Coreopsis mottle-associated virus (CMaV) e Pachystachys mosaic-associated virus (PMaV). Para CMaV e PMaV, o genoma total foi recuperado mediante amplificação genômica nas amostras originais utilizando primers internos sobrepostos, sendo as extremidades 3’ e 5’ recuperadas através da técnica RACE (Rapid Amplification of cDNA Ends - RACE). Após estes procedimentos, sequências foram obtidas via sequenciamento Sanger, confirmando a alta identidade com a sequência montada in silico pelo NGS. Com a sequência completa dos dois vírus procedeu-se análises filogenéticas. A partir de análises comparativas via alinhamento múltiplo de sequências (MSA), alinhamento pairwise e filogenéticas, propôs-se que CMaV e PMaV sejam prováveis espécies novas para o gênero Nucleorhabdovirus, tendo em vista a identidade nucleotídica de 56,99% entre os genomas de CMaV e SYNV e 46,99% entre PMaV e PYDV. / In Brazil, the floriculture agribusiness started as a minor activity in the São Paulo and Santa Catarina states in the early 20th century and currently its annual market growth is bigger than worldwide’s mean. The Federal District (DF) is ranked in the 10th place in terms of market value in Brazil, being a highly promising market due to the high average per capita income of its population. With the expansion of this sector, it was observed a significant increase in the incidence of diseases due to the constant transit and introduction into the country of exotic plant material and seeds. In addition, the implementation of new crop management practices is also having direct effects on disease outbreaks. These factors may affect the sustainability of the ornamental plant agribusiness sector in the country. Research efforts aiming to develop accurate diagnostic tools for viral species occurring in ornamental plants are yet incipient in the country. The virome study employing Next Generation Sequencing (NGS) techniques, combined with bioinformatics methods, has been considered as the most powerful strategy aiming to exploit the genetic diversity of organisms present in any biological sample and allowed significant advances in different fields of science, including plant virology. For this work a pool of ten ornamental plants from NOVACAP (Companhia Urbanizadora da Nova Capital do Brasil) Nursery 1 was sent to NGS. Posterior to data analysis, the sequences obtained were compared to reference genomes from DNA data banks and assembled, producing potential six plant virus sequences in different genera and families. Two probable new species from Nucleorhabdovirus (Rhabdoviridae family) were identified, one in Pachystachys lutea and other in Coreopsis lanceolata. In this ornamental plant, C. lanceolata, it was identified as well a probable new species of the genus Umbravirus (Tombusviridae family). Other member of the Tombusviridae family, now from the Pelarspovirus genus, was identified in Jasminum nitidum. Two of the assembled species, one of the Cytorhabdovirus genus and other from the Potyvirus genus, were detected in the pool only. Among these probable new viral species, two sequences that were detected in the ornamental plants C. lanceolata and P. lutea were close to the Sonchus yellow net nucleorhabdovirus (SYNV) and Potato yellow dwarf nucleorhabdovirus (PYDV) viruses, respectively, and were named as Coreopsis mottle-associated virus (CMaV) and 4 Pachystachys mosaic-associated virus (PMaV). For CMaV and PMaV, the total genome was recovered by amplifying the genome from the original samples using sintesyzed primers, while the 3’ and 5’ ends with the RACE (Rapid Amplification of cDNA Ends) technique. Posterior to these assays, sequences were obtained from Sanger sequencing method, confirming the high identity with the in silico assembled sequence from NGS. With the complete sequence of both viruses, phylogenetics assays were made. With the multiple sequence alignment (MSA), pairwise alignment and phylogenetics, we propose that CMaV and PMaV are probable new viruses from the Nucleorhabdovirus genus, as the nucleotide identity of the genome were 56.99% from CMaV and SYNV and 46.99% from PMaV and PYDV.
136

Arquitetura de um controlador de elasticidade para nuvens federadas

Vergara, Guilherme Fay 23 February 2017 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2017. / Submitted by Raquel Almeida (raquel.df13@gmail.com) on 2017-06-14T17:01:15Z No. of bitstreams: 1 2017_GuilhermeFayVergara.pdf: 4494970 bytes, checksum: a3c0a9d0810a4ddf119f2b293e093373 (MD5) / Approved for entry into archive by Raquel Viana (raquelviana@bce.unb.br) on 2017-06-20T18:21:43Z (GMT) No. of bitstreams: 1 2017_GuilhermeFayVergara.pdf: 4494970 bytes, checksum: a3c0a9d0810a4ddf119f2b293e093373 (MD5) / Made available in DSpace on 2017-06-20T18:21:43Z (GMT). No. of bitstreams: 1 2017_GuilhermeFayVergara.pdf: 4494970 bytes, checksum: a3c0a9d0810a4ddf119f2b293e093373 (MD5) Previous issue date: 2017-06-20 / Com a constante evolução das aplicações, surgiu a necessidade de se ter um ambiente no qual fosse possível processar aplicações de forma dinâmica, escalável e sob demanda. Assim, emergiu a plataforma de computação em nuvem. Nesse ambiente, os recursos são alocados conforme a demanda de utilização. Para que seja possível um aumento/decréscimo escalar no número de recursos, a característica de elasticidade é fundamental. A elasticidade é definida como a capacidade da nuvem de se adaptar às alterações na quantidade de recursos ou de solicitar/liberar recursos de acordo com a necessidade. Nesse cenário, aplicações científicas, tais como as de Bioinformática, tem se beneficiado do conceito de nuvens pela sua característica de tratar grandes quantidades de dados, que demandam significativas quantidades de recursos computacionais. Neste cenário de execuções longas com grande número de recursos a elasticidade possibilita um uso mais adequado da nuvem, alocando os recursos somente nos momentos que são necessários. Assim sendo, este trabalho propõe uma arquitetura de um Controlador de Elasticidade para nuvens federadas, que seja capaz de provisionar/desprovisionar máquinas virtuais nas diversas nuvens da federação, além de também ser capaz de aumentar/diminuir a capacidade computacional de cada um dos recursos de maneira automática. / With the constant evolution of applications, there arose a need to have an environment which was able to process applications dynamically, scalabe and on demand. Thus emerged the cloud computing platform. In this environment, resources are allocated according to demand. To be able to scale on demand, the characteristic of the elasticity is fundamental. Elasticity is defined as the ability of the cloud to adapt to changes in the amount of resources or to request/release resources as needed. In this scenario, scientific applications, such as those of Bioinformatics, have benefited from the concept of cloud computing due, to their requirement of handling large amounts of data which demand significant amounts of computational resources. This work proposes an architecture for a Elasticity Controller for federated clouds, capable of provisioning/deprovisioning virtual machines across the various clouds of the federation, as well as being able to automatically increase/decrease the computational capacity of each of the resources.
137

Estudo da diversidade tumoral e desenvolvimento de ferramentas de bioinformática para análise citogenética e molecular de neoplasias sólidas

Castro, Mauro Antônio Alves January 2009 (has links)
A progressão das neoplasias sólidas é um processo complexo, não segue uma seqüência universal e é caracterizada pela marcada heterogeneidade tumoral na ocasião do diagnóstico. Anormalidades cromossômicas, mutações somáticas e alterações epigenéticas estão entre as principais alterações celulares decorrentes da instabilidade do genoma destas neoplasias. Essa instabilidade tem importantes implicações clínicas, pois impõe dificuldades ao desenvolvimento de novos biomarcadores tumorais, tais como a baixa recorrência de mutações somáticas causalmente relacionadas ao desenvolvimento do câncer e a grande diversidade amostral. Neste trabalho estudamos alterações citogenéticos e moleculares com objetivo de caracterizar padrões de diversidade tumoral. Os resultados demonstraram que a diversidade cariotípica é específica para cada tipo de tumor e que os tumores de menor diversidade apresentam estatísticas populacionais com melhor sobrevida (79 tipos de tumores; n=12787). Além disso, desenvolvemos novos métodos computacionais baseados na teoria da informação com objetivo de mapear a diversidade de expressão gênica dos mecanismos de estabilização do genoma. Os resultados obtidos sugerem que redes de genes de apoptose e do sistema de reparo por excisão de nucleotídeos estão funcionalmente alteradas em neoplasias sólidas, com aumento da diversidade de expressão gênica e diminuição da abundância de transcritos (14 tipos de tumores; n=492). A implicação deste achado é que ele fornece evidências em favor da instabilidade genômica ao nível dos nucleotídeos, um tipo de disfunção que causa aumento da taxa de mutação somática e que está caracterizada apenas em modelos teóricos e experimentais ou em raros casos de desordens hereditárias. Por fim, a padronização dos métodos computacionais desenvolvidos resultou em duas patentes de invenção (aplicadas ao diagnóstico/prognóstico de neoplasias sólidas) e em dois produtos tecnológicos na forma de programas de computador distribuídos com licença de código aberto (aplicados ao estudo da diversidade citogenética e molecular). Endereço de acesso: http://lief.if.ufrgs.br/pub/biosoftwares/ / The progression of solid tumors does not follow a universal sequence and it is characterized by marked tumor heterogeneity. Chromosomal abnormalities, somatic mutations and epigenetic alterations are among the major cellular changes associated to genome stability impairments, which contribute substantially to this heterogeneity. The cancer genome instability has important clinical implications, since it imposes technical problems for tumor biomarker development, such as the low recurrence of somatic mutations causally related to cancer and the great sample diversity. Here, we considered different types of cytogenetic and molecular changes in order to characterize different patterns of tumor diversity. The results showed that the karyotypic diversity is specific to each tumor type and that tumors with lower diversity present better population statistics – five-year survival rates (79 types of tumors, n = 12787). Furthermore, we developed new computational methods based on information theory concepts in order to map the diversity of gene expression networks of genome maintenance mechanisms. The results suggest that two gene expression networks - apoptosis and nucleotide excision repair (NER) - are functionally altered in solid tumors, with increased gene expression diversity and decreased transcript abundance (14 types of tumors; n=492). The implication of this finding is that it provides evidence in favor of genomic instability at nucleotide level, a type of dysfunction that can increase the somatic mutation rate, which is soundly characterized only in theoretical and experimental models, or in rare inherited disorders. Finally, the standardization of the computational methods developed here gave rise to two patents (applied to the diagnosis / prognosis of solid tumors) and two bioinformatics applications released under open source license (designed for cytogenetic and molecular diversity studies). Availability: http://lief.if.ufrgs.br/pub/biosoftwares/
138

ncRNA-Agents : anotação de RNAs não-codificadores baseada em sistema multiagente

Arruda, Wosley da Costa 10 July 2015 (has links)
Tese (doutorado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2015. / Submitted by Fernanda Percia França (fernandafranca@bce.unb.br) on 2015-12-17T16:33:56Z No. of bitstreams: 1 2015_WosleydaCostaArruda.pdf: 9296287 bytes, checksum: 948dd92adae694c04c1b0c23076481e6 (MD5) / Approved for entry into archive by Raquel Viana(raquelviana@bce.unb.br) on 2015-12-17T17:05:51Z (GMT) No. of bitstreams: 1 2015_WosleydaCostaArruda.pdf: 9296287 bytes, checksum: 948dd92adae694c04c1b0c23076481e6 (MD5) / Made available in DSpace on 2015-12-17T17:05:51Z (GMT). No. of bitstreams: 1 2015_WosleydaCostaArruda.pdf: 9296287 bytes, checksum: 948dd92adae694c04c1b0c23076481e6 (MD5) / Os RNAs não-codificadores (ncRNAs) constituem um importante subconjunto dos transcritos produzidos nas células dos organismos, pois afetam diversos processos celulares. Embora existam métodos computacionais bastante eficazes para identificar proteínas, a anotação de ncRNAs é hoje objeto de pesquisa intensa, pois suas características e sinais não são ainda completamente conhecidos. Neste contexto, nesta tese, apresentamos uma arquitetura para anotação de ncRNAs baseada no paradigma de Sistema Multiagente. A implementação do sistema, denominado de ncRNA-Agents, usa agentes colaborativos, em que cada agente tem conhecimento e raciocínio (simulando os de biólogos) sobre um aspecto específico de RNA, o que contribui para uma anotação curada de ncRNA, com qualidade associada e explicações baseadas nos resultados das ferramentas usadas pelo sistema para recomendar a anotação. Além disso, foram realizados três estudos de casos com os fungos Saccharomyces cerevisiae, Paracoccidioides brasilienses e Schizosaccharomyces pombe, para avaliar o desempenho do sistema quanto a sua capacidade de anotar ncRNAs conhecidos e de predizer novos ncRNAs. Acesso público a esta ferramenta está em http://www.biomol.unb.br/ncrna-agents. ______________________________________________________________________________________________ ABSTRACT / Non-coding RNAs (ncRNAs) are an important subset of the transcripts produced in the cells of organisms, since they affect many cellular processes. Although there are efficient and fast computational methods to identify proteins, annotation of ncRNAs is now focus of intensive research once their characteristics and signals are not yet entirely known. In this context, in this thesis, we present an architecture for ncRNAs annotation based on the multi-agent system paradigm. The implementation of a system, called ncRNA-Agents, uses collaborative agents, where each agent has knowledge and reasonig (simulating biologists) about a specific aspect of RNA, which contributes to a curated ncRNA annotation, with associated quality and explanations based on the results of the tools used by the system to recommend the annotation. In addition, we performed three case studies with three fungi, Saccharomyces cerevisiae, Schizosaccharomyces pombe and Paracoccidioides brasiliensis, to evaluate the performance of the system and its ability to annotate known ncRNAs and predict new ncRNAs. This tool is publicly available at http://www.biomol.unb.br/ncrna-agents.
139

Execução eficiente do padrão de propagação de ondas irregulares na arquitetura Many Integrated Core

Gomes, Jeremias Moreira 29 January 2016 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graducação em Informática, 2016. / Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2016-04-12T15:10:12Z No. of bitstreams: 1 2016_JeremiasMoreiraGomes.pdf: 12777273 bytes, checksum: f29c6daa63ea19fb36aa50a23bb3350e (MD5) / Approved for entry into archive by Raquel Viana(raquelviana@bce.unb.br) on 2016-04-12T18:41:21Z (GMT) No. of bitstreams: 1 2016_JeremiasMoreiraGomes.pdf: 12777273 bytes, checksum: f29c6daa63ea19fb36aa50a23bb3350e (MD5) / Made available in DSpace on 2016-04-12T18:41:21Z (GMT). No. of bitstreams: 1 2016_JeremiasMoreiraGomes.pdf: 12777273 bytes, checksum: f29c6daa63ea19fb36aa50a23bb3350e (MD5) / A execução eficiente de algoritmos de processamento de imagens é uma área ativa da Bioinformática. Uma das classes de algoritmos em processamento de imagens ou de padrão de computação comum nessa área é a Irregular Wavefront Propagation Pattern (IWPP). Nessa classe, elementos propagam informações para seus vizinhos em forma de ondas de propagação. Esse padrão de propagação resulta em acessos a dados e expansões irregulares. Por essa característica irregular, implementações paralelas atuais dessa classe de algoritmos necessitam de operações atômicas, o que acaba sendo muito custoso e também inviabiliza a implementação por meio de instruções Single Instruction, Multiple Data (SIMD) na arquitetura Many Integrated Core (MIC), que são fundamentais para atingir alto desempenho nessa arquitetura. O objetivo deste trabalho é reprojetar o algoritmo Irregular Wavefront Propagation Pattern, de forma a possibilitar sua eficiente execução em processadores com arquitetura Many Integrated Core que utilizem instruções SIMD. Neste trabalho, utilizando o Intel® Xeon Phi™, foram implementadas uma versão vetorizada, apresentando ganhos de até 5:63 em relação à versão não-vetorizada; uma versão paralela utilizando fila First In, First Out (FIFO) cuja escalabilidade demonstrou-se boa com speedups em torno de 55 em relação à um núcleo do coprocessador; uma versão utilizando fila de prioridades cuja velocidade foi de 1:62 mais veloz que a versão mais rápida em GPU conhecida na literatura, e uma versão cooperativa entre processadores heterogêneos que permitem processar imagens que ultrapassem a capacidade de memória do Intel® Xeon Phi™, e também possibilita a utilização de múltiplos dispositivos na execução do algoritmo. ________________________________________________________________________________________________ ABSTRACT / The efficient execution of image processing algorithms is an active area of Bioinformatics. In image processing, one of the classes of algorithms or computing pattern that works with irregular data structures is the Irregular Wavefront Propagation Pattern (IWPP). In this class, elements propagate information to neighbors in the form of wave propagation. This propagation results in irregular access to data and expansions. Due to this irregularity, current implementations of this class of algorithms requires atomic operations, which is very costly and also restrains implementations with Single Instruction, Multiple Data (SIMD) instructions in Many Integrated Core (MIC) architectures, which are critical to attain high performance on this processor. The objective of this study is to redesign the Irregular Wavefront Propagation Pattern algorithm in order to enable the efficient execution on processors with Many Integrated Core architecture using SIMD instructions. In this work, using the Intel® Xeon Phi™ coprocessor, we have implemented a vector version of IWPP with up to 5:63 gains on non-vectored version, a parallel version using First In, First Out (FIFO) queue that attained speedup up to 55 as compared to the single core version on the coprocessor, a version using priority queue whose performance was 1:62 better than the fastest version of GPU based implementation available in the literature, and a cooperative version between heterogeneous processors that allow to process images bigger than the Intel® Xeon Phi™ memory and also provides a way to utilize all the available devices in the computation.
140

Desenvolvimento e uso do corazon: ferramenta para normalização e agrupamento de dados de expressão gênica

Ramos, Thaís de Almeida Ratis 11 May 2018 (has links)
Submitted by Automação e Estatística (sst@bczm.ufrn.br) on 2018-07-03T15:32:36Z No. of bitstreams: 1 ThaisDeAlmeidaRatisRamos_DISSERT.pdf: 5907109 bytes, checksum: 89a190289f7aa32aedb29f2dff662907 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2018-07-11T13:58:20Z (GMT) No. of bitstreams: 1 ThaisDeAlmeidaRatisRamos_DISSERT.pdf: 5907109 bytes, checksum: 89a190289f7aa32aedb29f2dff662907 (MD5) / Made available in DSpace on 2018-07-11T13:58:20Z (GMT). No. of bitstreams: 1 ThaisDeAlmeidaRatisRamos_DISSERT.pdf: 5907109 bytes, checksum: 89a190289f7aa32aedb29f2dff662907 (MD5) Previous issue date: 2018-05-11 / A criação de enciclopédias de expressão gênica possibilita a compreensão de grupos de genes que são co-expressos em diferentes tecidos e o entendimento de grupos gênicos conforme suas funções e origem. Devido à enorme quantidade de dados em larga escala, gerados em projetos de transcriptômica, houve uma demanda intensa em usar técnicas fornecidas pela inteligência artificial, que tornou-se amplamente utilizada na bioinformática. A aprendizagem não supervisionada é a tarefa de aprendizagem de máquina que analisa os dados fornecidos e determina os objetos que podem ser agrupados. Foi construída uma ferramenta amigável chamada CORAZON (Correlation Analyses Zipper Online), que implementa 3 algoritmos de aprendizagem de máquina não supervisionada (mean shift, k-means e hierárquico), 6 metodologias de normalização (Fragments Per Kilobase Million (FPKM), Transcripts Per Million (TPM), Counts Per Million (CPM), log base-2, normalização pela soma dos valores da instância e normalização pelo maior valor de atributo para cada instância) e uma estratégia para observar a influência dos atributos, para agrupamento de dados de expressão gênica. Os desempenhos dos algoritmos foram avaliados através de 5 modelos comumente usados para validar metodologias de agrupamento, cada um composto por 50 conjuntos de dados gerados aleatoriamente. Os algoritmos apresentaram acurácia variando entre 92-100%. Em seguida, a ferramenta foi aplicada para agrupar tecidos, obter conhecimentos evolutivos e funcionais dos genes, com base no enriquecimento de processos biológicos, e associar com fatores de transcrição. Para selecionar o melhor número de clusters para o k-means e o hierárquico, foram utilizados o critério de informação bayesiana (BIC), seguido da derivada da função discreta e a Silhueta. No hierárquico foi adotado o método do Ward. No total, 3 bases de dados (Uhlen, Encode e Fantom) foram analisadas e, em relação aos tecidos, foram observados grupos relacionados a glândulas, tecidos cardíacos, musculares, relacionados ao sistema reprodutivo e grupos com um único tecido, como testículo, cérebro e medula óssea. Em relação aos grupos de genes, foram obtidos vários grupos com especificidades em suas funções: detecção de estímulos envolvidos na percepção sensorial, reprodução, sinalização sináptica, sistema nervoso, sistema imunológico, desenvolvimento de sistemas e metabólicos. Também foi observado que geralmente grupos com mais de 80% de genes não codificantes, mais de 40% dos seus genes codificantes são recentes, originados em Mammalia e a minoria é do clado Eukaryota. Por outro lado, grupos com mais de 90% de genes codificantes, mais de 40% deles apareceram em Eukaryota e a minoria em Mammalia. Estes resultados mostram o potencial dos métodos do CORAZON, que podem ajudar na análise de grande quantidade de dados genômicos, possibilitando associações dos processos biológicos com RNAs não codificantes e codificantes agrupados juntos, bem como a possibilidade do estudo da história evolutiva. CORAZON está disponível gratuitamente em http://biodados.icb.ufmg.br/corazon ou http://corazon.integrativebioinformatics.me. / The creation of gene expression encyclopedias possibilities the understanding of gene groups that are co-expressed in different tissues and comprehend gene clusters according to their functions and origin. Due to the huge amount of data generated in large-scale transcriptomics projects, an intense demand to use techniques provided by artificial intelligence became widely used in bioinformatics. Unsupervised learning is the machine learning task that analyzes the data provided and tries to determine if some objects can be grouped in some way, forming clusters. We developed an online tool called CORAZON (Correlation Analyses Zipper Online), which implements three unsupervised machine learning algorithms (mean shift, k-means and hierarchical) to cluster gene expression datasets, six normalization methodologies (Fragments Per Kilobase Million (FPKM), Transcripts Per Million (TPM), Counts per million (CPM), base-2 log, normalization by the sum of the instance's values and normalization by the highest attribute value for each instance), and a strategy to observe the attributes influence, all in a friendly environment. The algorithms performances were evaluated through five models commonly used to validate clustering methodologies, each one composed by fifty randomly generated datasets. The algorithms presented accuracies ranging between 92-100%. Next, we applied our tool to cluster tissues, obtain gene’s evolutionarily knowledgement and functional insights, based on the Gene Ontology enrichment, and connect with transcription factors. To select the best number of clusters for k-means and hierarchical algorithms we used Bayesian information criterion (BIC), followed by the derivative of the discrete function and Silhouette. In the hierarchical, we adopted the Ward’s method. In total, we analyzed three databases (Uhlen, Encode and Fantom) and in relation to tissues we can observe groups related to glands, cardiac tissues, muscular tissues, tissues related to the reproductive system and in all three groups are observed with a single tissue, such as testis, brain and bone-narrow. In relation to the genes clusters, we obtained several clusters that have specificities in their functions: detection of stimulus involved in sensory perception, reproduction, synaptic signaling, nervous system, immunological system, system development, and metabolics. We also observed that clusters with more than 80% of noncodings, more than 40% of their coding genes are recents appearing in mammalian class and the minority are from eukaryota class. Otherwise, clusters with more than 90% of coding genes, have more than 40% of them appeared in eukaryota and the minority from mammalian. These results illustrate the potential of the methods in CORAZON tool, which can help in the large quantities analysis of genomic data, possibiliting the potential associations analyzes between non-coding RNAs and the biological processes of clustered together coding genes, as well as the possibility of evolutionary history study. CORAZON is freely available at http://biodados.icb.ufmg.br/corazon or http://corazon.integrativebioinformatics.me.

Page generated in 0.1509 seconds