Spelling suggestions: "subject:"genoma""
1 |
Sequenciamento e análise do genoma de derxia lacustris HL 12Trefflich, Sheyla January 2016 (has links)
Orientador : Prof. Dr. Emanuel Maltempi de Souza / Coorientador : Dr. Arnaldo Glogauer / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 29/10/2010 / Inclui referências : f. 40-43;49-51 / Resumo: As rizobactérias são bactérias de vida livre que habitam as raízes das plantas, desenvolvem uma relação de simbiose e geram benefícios aos organismos vegetais. A existência desses organismos é de grande importância na agricultura, já que a carência na absorção de nitrogênio impacta diretamente na taxa de crescimento das plantas, diminui a produtividade agrícola e originam problemas de ordem ambiental com a utilização de fertilizantes que são poluentes ao meio. A fixação biológica de nitrogênio é realizada por uma ampla gama de bactérias. Derxia lacustris HL12 é uma bactéria fixadora de nitrogênio, pertencente à classe das Betaproteobacterias, ordem Burkholderiales, família Alcaligenaceae, gênero Derxia. Esse organismo foi isolado de amostras de água provenientes de um lago na região de Taiwan. D. lacustris HL12 é a segunda bactéria inserida no gênero Derxia, de acordo com a comparação entre as sequências do gene do RNA ribossomal 16S desta e de Derxia gummosa DSM 723, que é considerado o organismo de referência. Esse organismo está depositado no NCBI e possui uma montagem com 19 contigs e um contig separado da sequencia do 16S rRNA . D. lacustris HL12 teve seu genoma sequenciado por duas vezes na plataforma Illumina Miseq. O processo de sequenciamento resultou num total de 3.532.510 reads. Seus reads possuem um tamanho médio de 300pb. Os dados brutos foram montados com os seguintes softwares: CLC, Velvet, Celera, Spades, Masurca. A melhor montagem obtida foi a realizada no software Celera, possuindo 129 contigs e percentual de GC igual a 69,20% . O software Matlab foi utilizado em ensaios de ordenação e cálculos do genoma. O software Fgap foi utilizado com os dados provenientes de todas as montagens realizadas para o fechamento dos gaps existentes no genoma. O software Bowtie foi responsável por mapear o genoma com os dados brutos. O software Mummer foi utilizado na construção do dotplot entre D. lacustris HL12 e D. gummosa DSM 723. O software Fastqc foi utilizado para analisar a qualidade dos dados brutos. O genoma de D. lacustris HL12 possui um draft com 28 contigs. Foi localizado um operon ribossomal completo.O genoma passou por uma análise de anotação para identificação de genes em algumas vias metabólicas do organismo. Foram encontrados os genes do cluster Nif, reforçando o indício do organismo fixar nitrogênio com os anotadores Sila e Rast. Palavras-chave: Fixação de nitrogênio, Sequência genômica, Derxia lacustris HL12. / Abstract: Rhizobacteria are bacteria which inhabit plant roots developing a symbiosis relationship that benefits those organisms. The existence of this kind of bacteria is of great importance to agriculture, once the need for nitrogen absorption impacts directly on plant growth rate, decreases agricultural productivity and generates environmental problems caused by the use of fertilizers. The biological nitrogen fixation is made by a large number of species. Derxia lacustris HL12 is a nitrogen fixing bacterium belonging to the class Betaproteobacterias, order Burkholderiales, family Alcaligenaceae, genus Derxia. This organism was isolated from fresh water collected from a lake in Taiwan. D. lacustris HL12 is the second bacteria inserted in the genus Derxia, in accordance with the comparison between its gene sequence of RNA ribosomal 16S and that of Derxia gummosa DSM 723, considered the reference organism. This organism is stored at the NCBI and has an assembly with 19 contigs. and one additional contig separated form 16S rRNA's sequence. D. lacustris HL12 had its genome sequenced twice using the Illumina Miseq platform. The sequencing process resulted in a total of 3,532,510 reads. The average size of its reads is of 300 pb. Raw data were assembled using the following softwares: CLC, Velvet, Celera, Spades, Masurca. The best assembly was obtained by using the Celera software and has 129 contigs and a CG percentage of 69.20%. Matlab was used in collation test runs and genome calculations. The software Fgap used the data collected from all the assemblies obtained for closing the existing gaps in the genome. The software Bowtie scanned the genome using raw data. The software Mummer was used in the construction of the dotplot between D. lacustris HL12 and D. gummosa DSM 723. The software Fastqc was employed to analyze the quality of the raw data. D. lacustris HL12's genome has a draft with 28 contigs. A complete ribosomal operon was located. The genome was submitted through an annotation analysis for the identification of the genes in some of the organism's metabolic pathways. Nif cluster genes were found using Sila and Rast annotation tools, which evinces D. lacustris HL12 as a nitrogen fixing bacteria. Key-words: Nitrogen fixation, Geonomic sequencing, Derxia lacustris HL12.
|
2 |
G-Finisher : uma nova estratégia para refinar e finalizar montagens de genomas bacterianosGuizelini, Dieval January 2016 (has links)
Orientador : Prof. Dr. Fábio de Oliveira Pedrosa / Coorientadores : Profª. Drª. Maria Berenice Reynaud Steffens e Prof. Dr. Roberto Tadeu Raittz / Tese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Biológicas, Programa de Pós-Graduação em Ciências : Bioquímica. Defesa: Curitiba, 27/07/2016 / Inclui referências: f. 113-121 / Resumo: O processo de reconstrução completa da sequência de DNA dos genomas bacterianos ainda é complexo. Apenas 13% dos projetos de sequenciamento de genomas procarióticos são concluídos. Versões rascunho da sequência do genoma são depositadas nos bancos de dados públicos, na forma fragmentada de contigs e com prováveis perdas de informações gênicas. Esta tese tem o objetivo de identificar erros de montagem e melhorar o processo de montagem de genomas de bactérias. Padrões biólogos observados em sequências genômicas e a utilização de informação a priori permitem a identificação de regiões com erros de montagem, reorganizar as sequências e melhorar a montagem do genoma. Com a finalidade de melhorar a finalização das montagens, os contigs são quebrados nos pontos de máximo e mínimo local da curva Fuzzy-GC-Skew e armazenados em nós de um grafo sem bordas. Esses nós são ordenados com base na sequência de referência e submetidos para fechamento das lacunas pelo jFGap. No método desenvolvido neste trabalho - G-Finisher -, os contigs são quebrados nos pontos críticos da curva Fuzzy GC Skew, reordenados e as lacunas fechadas com o jFGap. O G-Finisher foi testado nas 96 montagens obtidas pelo GAGE-B e reduziu na média 86% o número de contigs. G-Finisher pode facilmente melhorar os projetos de montagens de genomas de procariotos, de modo que os programas de montagem podem ser melhorados com a incorporação do G-Finisher ou com a utilização de padrões de sequências biológicas. O software e o código-fonte, escrito em Java, foram licenciados na forma do software livre e disponibilizados em http://gfinisher.sourceforge.net/. / Abstract: The process of reconstruction of complete genome from DNA sequences is still complex. Only 13% of the prokaryotic genome sequencing projects are completely finished. Draft genome sequences deposited in public databases are fragmented in contigs and may lack the full gene content. To identify assembly errors and improve the assembly process of bacterial genomes are the purpose of this work. The biological patterns observed in genomic sequences and the application of a priori information allows the identification of misassembled regions, and the reorganization and improvement of the overall genome assembly. In order to improve the finishing of genome assemblies the contigs are broken down at the peaks (all critical points) of a Fuzzy-GC-Skew-Moving-Average graph and stored in computer nodes in a graph data structure without edges. These nodes are ordered following a reference and submitted to the gap closing software jFGap. In the proposed new method - GFinisher - critical peaks in Fuzzy GC skew graphs are broken down, reassembled and closed using jFGap. The number of contigs decreases by up 86%. This has been successfully applied to the 96 genome assemblies described and provide by GAGE-B. GFinisher can easily optimize assemblies of prokaryotic draft genomes and can be used to improve the assembly programs using biological genome sequence patterns. The software was written em Java, licensed in open-source and the binaires and source code are available at http://gfinisher.sourceforge.net/.
Keywords: genome finisher, gap close, contig order, genome assembly
|
3 |
Complementação do seqüenciamento do genoma do Southern bean mosaic virus, isolado São Paulo, expressão da porção C-terminal da polimerase e produção de anti-soro policlonalOzato Junior, Tadaiti [UNESP] 16 February 2007 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:26:03Z (GMT). No. of bitstreams: 0
Previous issue date: 2007-02-16Bitstream added on 2014-06-13T18:29:23Z : No. of bitstreams: 1
ozatojunior_t_me_sjrp.pdf: 797973 bytes, checksum: 60aec21696ccdd3f5f3f798127a445e0 (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / O presente trabalho consistiu no seqüenciamento e caracterização molecular das Cadeias Abertas de Leitura (Open Reading Frames - ORFs) 2 e 3 do genoma do isolado São Paulo do Southern bean mosaic virus (SBMV-SP), completando-se o seqüenciamento de todo o genoma desse isolado. A ORF 2 codifica uma poliproteína (serino protease – VPg – RNA polimerase RNA-dependente) e a ORF 3 um produto com função desconhecida. O seqüenciamento da ORF 2 apresentou 2889 nucleotídeos, incluindo-se o códon de terminação UGA, com 962 aminoácidos deduzidos e massa molecular estimada de aproximadamente 105 kDa. Dentro da ORF 2, localiza-se a ORF 3 contendo 398 nucleotídeos, incluindo-se o códon de terminação UAA, com 132 aminoácidos e massa molecular estimada de aproximadamente 15 KDa. A análise feita a partir das seqüências das ORFS 2 e 3 do genoma do SBMV-SP, quando comparadas com outras espécies do mesmo gênero e isolados do SBMV, depositadas no GenBank, mostrou que a ORF 2 apresenta maior identidade (91,4% na seqüência de nucleotídeos e 95,0% na seqüência de aminoácidos deduzidos) com o isolado de Arkansas. Resultado similar foi obtido em relação à ORF 3 com valores de identidade de 97,0% tanto para as seqüências de nucleotídeos e aminoácidos deduzidos. Dados de filogenia corroboram os dados de identidade. Regiões conservadas do gênero Sobemovirus também foram identificadas, tais como Sítio de Ligação à Capa Protéica (CBPS), a tríade catalítica da serino protease (H-D-S) e a seqüência de heptanucleotídeos (TTTAAAC). A expressão em Escherichia coli da porção C-terminal da RNA Polimerase RNA Dependente (RpRd) produziu uma proteína de fusão de aproximadamente 67 kDa no sistema pMAL c2-x e de 30 kDa no sistema pET 28a. Quando a proteína de fusão foi injetada em coelhos houve a produção de anti-soro específico para a proteína recombinante. / The present work consisted of the sequencing and molecular characterization of the Open Reading Frames (ORFs) 2 and 3 from the São Paulo isolate genome of Southern bean mosaic virus (SBMV-SP), completing the sequencing of all the genome of this isolate. The ORF 2 encodes a polyprotein (serine protease - VPg - RNA dependent RNA polimarase) and the ORF 3 one product with unknown function. The sequencing of the ORF 2 reveals 2889 nucleotides, including the stop codon (UGA), with 962 deduced amino acids e and estimated molecular weight of approximately 105 kDa. Nested in the ORF 2 were found the ORF 3 with 398 nucleotides, including the stop codon (UAA), with 132 deduced amino acids and estimated molecular weight of approximately 15 kDa. The analysis made from the sequences of the ORFs 2 and 3 from the SBMV-SP genome, when compared with other species of the same gender and isolates of SBMV, deposited in the GenBank, showed that the ORF 2 presents higher identity (91,4% in the nucleotide sequence and 95,0% in the deduced amino acids sequence) with Arkansas isolate. Similar result was obtained in relation to the ORF 3 with identity values of 97,0% for the nucleotides and deduced amino acids sequences. Phylogeny data corroborate the identity data. Conserved regions of the Sobemovirus gender had also been identified such as Coat Protein Binding Site (CPBS), serine protease catalytic triad (H-D-S) and heptanucleotide sequence (TTTAAAC). The Expression in Escherichia coli of the C-terminal region of the RNA dependent RNA polimerase produced a fusion protein of approximately 67 kDa in pMAL c2-x system and a 30 kDa protein in pET 28a system. When the fusion protein ...(Complete abstract click electronic access below)
|
4 |
Análise do efeito causado pelos genes quitinase e catepsina dos baculovírus CfDefNPV e AcMNPV inseridos no genoma do Anticarsia gemmatalis multiple nucleopolyhedrovirusLima, Anabele Azevedo 06 1900 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Medicina, 2008. / Submitted by Ruthléa Nascimento (ruthlea@bce.unb.br) on 2008-10-24T16:48:55Z
No. of bitstreams: 1
2008_AnabeleALima.pdf: 2370665 bytes, checksum: 623c68923c82ff2824292fd7e4052e47 (MD5) / Approved for entry into archive by Luanna Maia(luanna@bce.unb.br) on 2009-02-20T11:45:19Z (GMT) No. of bitstreams: 1
2008_AnabeleALima.pdf: 2370665 bytes, checksum: 623c68923c82ff2824292fd7e4052e47 (MD5) / Made available in DSpace on 2009-02-20T11:45:19Z (GMT). No. of bitstreams: 1
2008_AnabeleALima.pdf: 2370665 bytes, checksum: 623c68923c82ff2824292fd7e4052e47 (MD5) / Baculovírus são vírus de DNA fita dupla, específicos de artrópodes, que têm
sido utilizados, principalmente, como agentes de controle biológico de insetos-praga e
como vetores de expressão de genes heterólogos. A utilização do baculovírus Anticarsia
gemmatalis multiple nucleopolyhedrovirus (AgMNPV) no controle da lagarta da soja,
A. gemmatalis, no Brasil, é o maior exemplo mundial de sucesso de um vírus utilizado
como bioinseticida. Uma das características interessantes do genoma viral do AgMNPV
está na ausência dos genes quitinase (v-chiA) e catepsina (v-cath), que por sua vez estão
presentes na maioria dos genomas dos baculovírus pertencentes ao grupo I do gênero
Nucleopolyhedrovirus (NPV). A ausência dos genes v-chiA e v-cath pode ser
responsável pela ausência de liqüefação de larvas de A. gemmatalis mortas pela
infecção do AgMNPV. Este trabalho teve como objetivo a construção de AgMNPV
recombinantes com a introdução individual ou em conjunto dos genes v-chiA e v-cath,
derivados dos vírus Autographa californica multiple nucleopolyhedrovirus (AcMNPV)
e Choristoneura fumiferana defective nucleopolyhedrovirus (CfDefNPV) no genoma
viral, para a observação dos efeitos causados pela infecção viral em larvas de A.
gemmatalis, comparativamente ao vírus AgMNPV selvagem. O DNA plasmidial do
vetor de transferência, contendo os dois genes derivados do vírus CfDefNPV, foi cotransfectado
com o DNA de um vírus recombinate derivado do AgMNPV, o vírus
vAgGalA2, em células A. gemmatalis (UFL-AG-286). O novo vírus recombinante
construído (vAgp2100Cf.v-chiA/v-cath) foi isolado pelo método de diluição seriada, em
placa de 96 poços. O vAgp2100Cf.v-chiA/v-cath foi capaz de promover a liqüefação do
corpo das larvas de A. gemmatalis após a morte das mesmas. Porém, não houve
diferenças significativas com relação à virulência, e conseqüentemente, o tempo de
morte das larvas comparado com o AgMNPV selvagem. Os AgMNPV recombinantes possuindo apenas um dos genes (v-chiA ou v-cath) ainda não foram isolados e, desta
forma, não foi possível analisar o efeito causado por esses genes separadamente, em
larvas de A. gemmatalis.
_____________________________________________________________________________________ ABSTRACT / Baculoviruses are double-stranded DNA viruses, arthropod-specific that have
been mainly used as biological-control agents of insect pests and as heterologous gene
expression vectors. The use of the Anticarsia gemmatalis multiple nucleopolyhedrovirus
(AgMNPV) in Brazil, for the control of the velvetbean caterpillar is the most successful
example of a virus used as a biological pesticide. One of the interesting features of the
AgMNPV genome is the absence of chitinase (v-chiA) e catepsin (v-cath) genes, which
in turn are present in most of the genomes of baculoviruses belonging to group I of the
Nucleopolyhedrovirus genus. The absence of v-chiA and v-cath genes may be
responsible for the lack of liquefaction of A. gemmatalis larvae killed by AgMNPV. The
aim of this work was the construction of recombinant AgMNPV with the introduction
of each gene (v-chiA or v-cath) alone or both of them, derived from the baculoviruses
Autographa californica multiple nucleopolyhedrovirus (AcMNPV) and Choristoneura
fumiferana defective nucleopolyhedrovirus (CfDefNPV) into the AgMNPV genome and
observation of the effects caused by the viral infection in A. gemmatalis larvae,
comparared with the wild-type AgMNPV infection. A recombinant transfer vector
DNA, containing both genes derived from CfDefNPV, was co-transfected with DNA
from vAgGalA2 virus, derived from AgMNPV, in A. gemmatalis (UFL-AG-286) cells.
The new recombinant AgMNPV virus construct (vAgp2100Cf.v-chiA/v-cath) was
isolated using the serial dilution method in 96 well-plates. The vAgp2100Cf.v-chiA/vcath
was able to promote liquefaction of infected A. gemmatalis larvae soon after death.
However, we have not detected significant differences with regard to virulence, and
consequently, the time of death, when compared with the wild-type AgMNPV. The
AgMNPV recombinants, containing only one of the genes (v-chiA or v-cath) have not
xx
been isolated yet, and therefore, it was not possible to analyse the effects caused from
this genes separately in A. gemmatalis larvae.
|
5 |
Sequenciamento e comparação do genoma de Aeromonas caviae 8LMMoriel, Barbara January 2017 (has links)
Orientadora : Profª. Drª. Cyntia Maria Telles Fadel-Picheth / Coorientador : Prof. Dr. Leonardo Magalhães Cruz / Tese (doutorado) - Universidade Federal do Paraná, Setor de Ciências da Saúde, Programa de Pós-Graduação em Ciências Farmacêuticas. Defesa: Curitiba, 03/07/2017 / Inclui referências : f. 85-108 / Resumo: Aeromonas sao bacilos gram-negativos, encontrados em ambientes aquaticos, capazes de causar diversas infeccoes em humanos destacando-se a diarreia. Os objetivos deste trabalho foram sequenciar o genoma da estirpe A. caviae 8LM, isolada a partir de fezes diarreicas, e realizar analises de genomica comparativa. O sequenciamento foi realizado empregando os sistemas 454 GS Junior, Illumina MiSeq e PacBio. Nas analises de genomica comparativa foram empregadas diversas ferramentas de bioinformatica para analise estrutural e do conteudo genico de estirpes de Aeromonas. O genoma de A. caviae 8LM apresenta 4,6Mb, conteudo GC de 61,7%, dispondo de 4.101 CDS e 10 operons de rRNA distribuidos proximos da origem de replicacao. Foram identificados diversos genes relacionados com virulencia incluindo motilidade e adesao, toxinas, sistemas de secrecao tipo II e VI, entre outros. As analises de genomica comparativa mostram a similaridade do genoma de A. caviae 8LM com outras estirpes da especie. As analises realizadas indicaram divergencias na identificacao de algumas Aeromonas e outras, identificadas apenas ao nivel de genero puderam ser identificadas ao nivel de especie. O pan-genoma de Aeromonas e formado por 9.785 genes e o core genoma 701 genes. Foram detectadas regioes do genoma que podem conter possiveis marcadores moleculares para a especie A. caviae. Os resultados deste trabalho trazem informacoes sobre o genoma e virulencia de A. caviae 8LM, e sugerem a presenca de possiveis marcadores moleculares com potencial para o desenvolvimento de testes diagnosticos. Palavras-chave: Aeromonas. Genoma completo. Genomica comparativa. / Abstract: Aeromonas are gram-negative bacilli, found in aquatic environments, are capable of causing several human infections, highlighting diarrhea. The proposes of this work were to sequence the genome of strain A. caviae 8LM, isolated from diarrheal feces, and carry out comparative genomics analyzes. Sequencing was performed applying the 454 GS Junior, Illumina MiSeq and PacBio systems. In comparative genomics analyzes, several bioinformatics tools were applied for structural and gene content analysis of Aeromonas strains. The genome of A. caviae 8LM presents 4.6Mb, GC content of 61.7%, 4,101 CDS and 10 distributed rRNA operons close to the origin of replication. Several genes related to virulence including motility and adhesion, toxins, type II and VI secretion systems, among others were identified. Comparative genomics analyzes exhibited the similarity of the genome of A. caviae 8LM with other strains of the species. The analyzes indicated differences in identification of some Aeromonas and others that were only identified at genus level could be identified at species level. The pan-genome of Aeromonas consists of 9,785 genes and the core genome 701 genes. Genomic regions containing possible molecular markers for A. caviae species were detected. The results of this work provide information about the genome and virulence of A. caviae 8LM, and suggest the presence of possible molecular markers with potential for the development of diagnostic tests. Key-words: Aeromonas. Complete genome. Comparative genomics.
|
6 |
Ordenação por transposições baseado no formalismo algébricoSantos, Héderson Pereira dos 14 December 2006 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2006. / Submitted by Luana Patrícia de Oliveira Porto (luana_porto_23@hotmail.com) on 2009-09-29T22:25:03Z
No. of bitstreams: 1
2006_HedersonPereiraSantos.pdf: 829940 bytes, checksum: 2a5c9eb3eec94eeac21dfc0bcdb86756 (MD5) / Approved for entry into archive by Luanna Maia(luanna@bce.unb.br) on 2009-10-02T15:12:08Z (GMT) No. of bitstreams: 1
2006_HedersonPereiraSantos.pdf: 829940 bytes, checksum: 2a5c9eb3eec94eeac21dfc0bcdb86756 (MD5) / Made available in DSpace on 2009-10-02T15:12:08Z (GMT). No. of bitstreams: 1
2006_HedersonPereiraSantos.pdf: 829940 bytes, checksum: 2a5c9eb3eec94eeac21dfc0bcdb86756 (MD5)
Previous issue date: 2006-12-14 / Biologia Computacional é uma área da Ciência da Computação que tem por objetivo o estudo e aplicação de técnicas e ferramentas computacionais aos problemas da Biologia Molecular. Dentre os problemas pesquisados, encontra-se o de evolução molecular, onde são estudados métodos para comparar seqüências de espécies distintas, baseados em eventos mutacionais. Estes métodos geram medidas de distância, que podem ser empregadas para verificar o relacionamento em termos evolutivos entre dois organismos. Uma técnica de computar distância é comparar blocos, formados por um ou mais genes, de genomas de dois organismos. O nosso trabalho pertence à área de Rearranjo de Genomas que, de forma genérica, visa resolver o problema combinatorial de encontrar uma seqüência mínima de eventos de rearranjo (mutações) que transformam um genoma em outro. Estudamos um evento de rearranjo específico – transposição, que move uma porção de genes de um local para outro dentro do mesmo cromossomo. Este evento gera o problema da ordenação por transposições, que consiste em computar e encontrar a menor seqüência de transposições que transformam um genoma em outro. Neste trabalho propusemos dois algoritmos de aproximação baseados no formalismo algébrico de Dias e Meidanis para o problema de ordenação por transposições. Implementamos estes algoritmos utilizando a linguagem Java e comparamos os resultados obtidos com outros encontrados na literatura. Este trabalho visa contribuir para encontrar a complexidade do problema de ordenação por transposições que ainda não é conhecida. _________________________________________________________________________________________ ABSTRACT / Computational Biology is an area that aims to study and to apply techniques and computational tools to problems of molecular biology. One of these problems is molecular evolution, in which methods are proposed for comparing sequences of distinct species, based on mutational events. These methods generate distance measures that could be employed to verify the evolutionary relationship between two organisms. A technique to compute distance is to compare blocks, composed by one ore more genes, of the genomes of two organisms. This work belongs to the field of genome rearrangement, that has the objective to solve the combinatorial problem of finding a minimum sequence of rearrangement events that transform a genome into another. We studied a particular rearrangement event - transposition, that moves a portion of genes from a local to another inside one chromosome. This event generates the problem of sorting by transpositions, that consists in computing and finding the minimum sequence of transpositions that transform a genome into another. In this work, we proposed two approximation algorithms based on the algebraic formalism of Dias and Meidanis to solve the problem of sorting by transpositions. We implemented these algorithms using the Java language, and compared the results obtained with the results of other algorithms found in the literature. This work aims to contribute to find the complexity of this problem still unknown.
|
7 |
Mapeamento comparativo do cromossomo 14 bubalino (Bubalus bubalis), em painel de células somáticas híbridas irradiadas / River buffalo (Bubalus bubalis) chromossome 14 comparative mapping in radiated hybrid somatic cell panelGalvão, Stéphan Ramos 13 March 2009 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Agronomia e Medicina Veterinária, 2009. / Submitted by Elna Araújo (elna@bce.unb.br) on 2010-04-23T17:28:47Z
No. of bitstreams: 1
2009_StephanRamosGalvao.pdf: 4652549 bytes, checksum: a95d88106cdab378590665eaf681c5df (MD5) / Approved for entry into archive by Daniel Ribeiro(daniel@bce.unb.br) on 2010-05-19T19:27:58Z (GMT) No. of bitstreams: 1
2009_StephanRamosGalvao.pdf: 4652549 bytes, checksum: a95d88106cdab378590665eaf681c5df (MD5) / Made available in DSpace on 2010-05-19T19:27:58Z (GMT). No. of bitstreams: 1
2009_StephanRamosGalvao.pdf: 4652549 bytes, checksum: a95d88106cdab378590665eaf681c5df (MD5)
Previous issue date: 2009-03-13 / O desenvolvimento de ferramentas genômicas e a geração de informações moleculares para o búfalo (Bubalus bubalis) ainda estão em uma fase inicial em relação a outras espécies de interesse zootécnico. Nesse contexto, esse trabalho será de grande importância para a condução de estudos para identificação das bases genéticas e mecanismos moleculares que resultam em diferenças significativas entre bubalinos e bovinos, tanto na fisiologia quanto na qualidade e composição da carne e leite. A ferramenta genômica de última geração para construção de mapas físicos é o painel de células somáticas híbridas irradiadas (Painel RH), que permite a utilização de marcadores derivados de seqüências gênicas conservadas entre espécies e úteis para mapeamento comparativo. Recentemente, um consócio internacional foi estabelecido para a construção de um mapa RH bubalino de primeira geração, e o presente estudo foi realizado como contribuição a esse consórcio. Foram testadas condições de amplificação para 49 marcadores derivados de genes do cromossomo bovino 13 (BTA13), que possui alto grau de sintenia com o cromossomo bubalino 14 (BBU14). Obteve-se condições ideais de amplificação para um total de 37 marcadores, que foram testados no mínimo duas vezes em todas as linhagens do Painel para minimizar a ocorrência de resultados falsos positivos ou negativos. O software Carthagene foi utilizado para analisar os dados e gerar o mapa. Marcadores com LOD dois pontos < 3 foram excluídos da análise final. O mapa produzido contém um total de 28 marcadores, com taxa de retenção média de 20,7%. Para a construção do mapa comparativo, ancorou-se o mapa RH gerado ao mapa citogenético bubalino, e comparou-se a localização dos genes mapeados no mapa da Montagem do Genoma Bovino v4.0. O resultado obtido mostrou uma alta conservação sintênica entre os cromossomos BTA13 e BBU14, com algumas discordâncias, que não foram sustentadas pelo mapa final gerado pelo consórcio. Este estudo foi importante para a construção do primeiro mapa RH do genoma do búfalo de rio. _________________________________________________________________________________ ABSTRACT / The development of genomic tools and the generation of molecular data for the river buffalo (Bubalus bubalis) are still in an initial phase in relation to other species of interest to animal production activities. In this context, this work will be of great importance for studies geared to identifying the genetic basis and molecular mechanisms that result in significant differences between buffaloes and cattle, both in production physiology and meat and milk quality and composition. The last generation genomic tool for constructing physical maps is the Radiation Hybrid Panel (RH Panel), because it allows the use of markers derived from related species and useful for comparative mapping. Recently, an international consortium was established for the construction of a first generation buffalo RH map, and the present study was carried out as a contribution to the International Consortium. PCR amplification conditions were tested for 49 markers derived from bovine gene sequences located on chromosome 13 (BTA13), which has a high degree of sinteny with buffalo chromosome 14 (BBU14). Ideal amplification conditions were obtained for a total of 37 markers, which were tested at least twice in all RH cell linesto minimise the occurrence of false positive or negative scorings. The program Carthagene was used to analyze the data and generate the RH map. The result obtained showed high syntenic conservation between chromosomes BTA13 and BBU14, with some discrepancies, which were not supported by final map generated by the consortium. This study was important for the construction of the first generation RH genome map of river buffalo.
|
8 |
Descoberta e análise da variabilidade interespecífica de pequenos RNAs via sequenciamento de nova geração em EucalyptusPappas, Marília de Castro Rodrigues 08 March 2013 (has links)
Tese (doutorado)—Universidade de Brasília, Instituto de Ciências Biológicas, Departamento de Biologia Celular, 2013. / Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2013-09-23T13:35:37Z
No. of bitstreams: 1
2013_MariliaCastroRodriguesPappas.pdf: 2808206 bytes, checksum: 757337280322f40347a940024364534c (MD5) / Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2013-09-23T14:32:44Z (GMT) No. of bitstreams: 1
2013_MariliaCastroRodriguesPappas.pdf: 2808206 bytes, checksum: 757337280322f40347a940024364534c (MD5) / Made available in DSpace on 2013-09-23T14:32:44Z (GMT). No. of bitstreams: 1
2013_MariliaCastroRodriguesPappas.pdf: 2808206 bytes, checksum: 757337280322f40347a940024364534c (MD5) / Há pouco mais de uma década foi descrita a função de mais uma classe de elementos regulatórios chamados de micro RNAs - miRNAs. Inicialmente descritos como reguladores pós transcricionais envolvidos no processo desenvolvimento, estes já tiveram papel validado em uma ampla gama de processos como germinação, determinação de morfologia e respostas a estresse biótico e abiótico. A descrição desta classe de reguladores em Eucalyptus contribui com o conhecimento científico deste importante e vasto gênero inserindo mais um relevante elemento na anotação do recente genoma de referência de Eucalyptus grandis. Para a identificação em escala genômica de miRNAs em Eucalyptus, foi realizado um sequenciamento de pequenos RNAs em larga escala em amostras de folha e xilema em desenvolvimento nas duas principais espécies plantadas do gênero - E. grandis e E. globulus. Com o objetivo de otimizar o processo de descoberta de locos de pequenos RNAs, as amostras de folha e xilema de E. grandis usadas no sequenciamento foram da mesma árvore BRASUZ1, usada no sequenciamento do genoma de referência de Eucalyptus. O sequenciamento permitiu, além da descoberta de pequenos RNAs, uma análise da variabilidade interespecífica pelo mapeamento das sequências de ambas as espécies contra o genoma de E. grandis. A caracterização in silico das sequências obtidas com o sequenciamento obedeceu a uma sequência de passos iniciada pela busca, por similaridade de sequência, visando a identificação de sequências de miRNAs de famílias conservadas em outras espécies e já descritas anteriormente. Em seguida, a identificação de potenciais novos miRNAs obedeceu a uma sequência de critérios já descritos. As sequências de pequenos RNAs foram mapeadas fisicamente no genoma identificando assim os potenciais locos dos genes MIR e permitindo a validação in silico pela análise da estrutura secundária compatível com os parâmetros de precursores, satisfazendo a primeira premissa para a validação de um novo miRNA. Os números totais obtidos mostram claramente a cautela que deve existir na análise de dados de sequenciamento de pequenos RNAs. Dentre os grandes números obtidos, parte é Há pouco mais de uma década foi descrita a função de mais uma classe de elementos regulatórios chamados de micro RNAs – miRNAs. Inicialmente descritos como reguladores pós transcricionais envolvidos no processo desenvolvimento, estes já tiveram papel validado em uma ampla gama de processos como germinação, determinação de morfologia e respostas a estresse biótico e abiótico. A descrição desta classe de reguladores em Eucalyptus contribui com o conhecimento científico deste importante e vasto gênero inserindo mais um relevante elemento na anotação do recente genoma de referência de Eucalyptus grandis. Para a identificação em escala genômica de miRNAs em Eucalyptus, foi realizado um sequenciamento de pequenos RNAs em larga escala em amostras de folha e xilema em desenvolvimento nas duas principais espécies plantadas do gênero – E. grandis e E. globulus. Com o objetivo de otimizar o processo de descoberta de locos de pequenos RNAs, as amostras de folha e xilema de E. grandis usadas no sequenciamento foram da mesma árvore BRASUZ1, usada no sequenciamento do genoma de referência de Eucalyptus. O sequenciamento permitiu, além da descoberta de pequenos RNAs, uma análise da variabilidade interespecífica pelo mapeamento das sequências de ambas as espécies contra o genoma de E. grandis. A caracterização in silico das sequências obtidas com o sequenciamento obedeceu a uma sequência de passos iniciada pela busca, por similaridade de sequência, visando a identificação de sequências de miRNAs de famílias conservadas em outras espécies e já descritas anteriormente. Em seguida, a identificação de potenciais novos miRNAs obedeceu a uma sequência de critérios já descritos. As sequências de pequenos RNAs foram mapeadas fisicamente no genoma identificando assim os potenciais locos dos genes MIR e permitindo a validação in silico pela análise da estrutura secundária compatível com os parâmetros de precursores, satisfazendo a primeira premissa para a validação de um novo miRNA. Os números totais obtidos mostram claramente a cautela que deve existir na análise de dados de sequenciamento de pequenos RNAs. Dentre os grandes números obtidos, parte é representada por contaminantes como RNA ribossômico e de cloroplasto. Dentre os pequenos RNAs regulatórios, diferentes classes e subclasses estão representadas e os critérios para declarar uma sequência de pequeno RNA como um miRNA devem ser cuidadosamente observados. A validação experimental das sequências de potenciais novos miRNAs foi, inicialmente, realizada via northern blot de algumas das sequências mais expressas em cada uma das amostras sequenciadas. Uma validação em larga escala foi realizada utilizando um microarranjo contendo milhares das sequências putativas de miRNAs descobertas no sequenciamento. Além da análise interespecífica, foram utilizadas amostras
de tecidos distintos – folha, xilema, ovário e plântulas – visando uma análise da variabilidade de expressão entre tecidos. A predição de alvos para os candidatos a novos miRNAs foi realizada in silico buscando por sequências que apresentem complementariedade às sequências dos miRNAs utilizando o banco de transcritos de Eucalyptus disponível publicamente no site que hospeda os genomas sequenciados pelo JGI (phytozome.net). A análise dos dados de sequenciamento em larga escala revelou aspectos interessantes do repertório de pequenos RNAs. Sequências de 21 nucleotídeos altamente expressas nas amostras sequenciadas foram caracterizadas como pequenos RNAs
interferentes (siRNAs) secundários, ou trans-acting siRNAs (tasi-RNAs), sintetizados em fase a partir da clivagem de transcritos alvo por miRNAs. A identificação de alvos desses tasiRNAs revelou um mecanismo conservado de regulação da expressão de genes envolvidos na defesa contra patógenos, notadamente, os da família caracterizada pelos domínios protéicos NBS-LRR (NB-ARC – leucine rich repeat), e de genes da família PPR
(pentatricopeptide repeat). ______________________________________________________________________________ ABSTRACT / A decade ago function of another class of regulatory elements called micro RNAs –
miRNAs – was elucidated. Initially described as post-transcriptional regulators involved in development, these elements had been proved to regulate a wide range of processes such as germination, morphology and responses to biotic and abiotic stress. The description of miRNAs in Eucalyptus contributes to scientific knowledge of this important and vast genre inserting another important element in the annotation of Eucalyptus grandis reference genome. For genome wide identification of Eucalyptus miRNAs, large scale sequencing was
performed in leaves and developing xylem in the two most planted species for cellulose production - E. grandis and E. globulus. In order to optimize the discovery process of small RNAs loci, samples of E. grandis leaf and xylem used were from the same tree BRASUZ1, used for the reference genome. Interspecific analysis was conducted based on mapping of the sequences from both species against the genome of E. grandis. In silico characterization started by searching for sequence similarity against miRBase conserved miRNAs. The identification of potential new miRNA sequence followed the criteria already described. Sequences of small RNAs derived from large-scale sequencing were mapped against the genome thereby identifying potential MIR loci and enabling validation by in silico analysis of secondary structure compatible with miRNA precursor parameters satisfying the first premise for the validation of a new miRNA. Total number of sequences otained clearly shows that caution must exist in small RNA sequencing data analysis. Great part of sequences is represented by contaminants such as ribosomal and chloroplast RNA. Among the small regulatory RNAs, different classes and subclasses are represented and the criteria for declaring a sequence of small RNA as a miRNA should be carefully observed.
Experimental validation of potentially new miRNA sequences was first performed
via northern blot of some of the more expressed sequences in each of the samples. A large-
scale validation was then performed using a microarray containing thousands of sequences of putative miRNAs discovered in sequencing. Besides interspecific analysis, samples from different tissues - leaf, xylem, ovary and seedlings – were used to evaluate tissue variability. Target prediction for putative new miRNAs was performed in silico. A search for complementary sequences to the miRNAs was performed using Eucalyptus transcript database publicly available on the website that hosts the genomes sequenced at JGI (phytozome.net). Data analysis from large scale sequencing revealed interesting aspects of small RNAs repertoire. Highly expressed 21 nucleotide sequences were characterized as small interfering RNAs (siRNAs), or trans-acting siRNAs (tasi-RNAs), synthesized in phase from cleavage of transcripts targeted by miRNAs. Identification of targets for these
tasiRNAs revealed a conserved mechanism regulating the expression of genes involved in defense against pathogens, especially those from the family characterized by NBS-LRR protein domains (NB-ARC - leucine rich repeat) and PPR gene family (pentatricopeptide repeat).
|
9 |
Um algoritmo algébrico para o Problema da Distância de Transposição em Rearranjo de GenomasSilva, Luiz Augusto Garcia da 01 December 2013 (has links)
Dissertação (Mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação
Mestrado em Informática, 2013. / Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2014-04-16T13:34:05Z
No. of bitstreams: 1
2013_LuizAugustoGarciaSilva.pdf: 810446 bytes, checksum: 291c6f45324fb72ea0a2f50ea0f10dc2 (MD5) / Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2014-04-16T14:54:51Z (GMT) No. of bitstreams: 1
2013_LuizAugustoGarciaSilva.pdf: 810446 bytes, checksum: 291c6f45324fb72ea0a2f50ea0f10dc2 (MD5) / Made available in DSpace on 2014-04-16T14:54:51Z (GMT). No. of bitstreams: 1
2013_LuizAugustoGarciaSilva.pdf: 810446 bytes, checksum: 291c6f45324fb72ea0a2f50ea0f10dc2 (MD5) / Em Biologia Computacional, eventos mutacionais afetando grandes porções de um genoma são estudados na área de Rearranjo de Genomas. Particularmente, a transposição
é um evento mutacional que troca de posição dois blocos contíguos de genes em um
cromossomo. Este evento gera o problema da distância de transposição (PDT), que consiste
em encontrar o número mínimo de transposições necessárias para transformar um cromossomo em outro. Recentemente, foi mostrado que o PDT é NP-difícil. Na literatura, muitos algoritmos foram propostos para resolver este problema, seguindo abordagens diferentes. Neste trabalho, utilizaremos o formalismo algébrico proposto por Meidanis e Dias, para a modelagem de cromossomos e transposições, e resultados clássicos de Grupos de Permutações para propor um algoritmo de aproximação com razão 2 para o problema da distância de transposição. Embora existam algoritmos com razão de aproximação melhores, a contribuição do presente trabalho é teórica, pois propõe uma solução para o problema da distância de
transposição utilizando apenas resultados conhecidos de Teoria de Grupos de Permuta-
ções, desvinculada do formalismo clássico Bafna e Pevzner. É importante notar que nosso
algoritmo simula, de forma natural, a solução baseada em grafo de ciclos de Bafna e Pevzner. Nossa solução poderá ser automatizada em parte, e acreditamos que indica caminhos novos, que possibilitarão tanto diminuir a razão de aproximação quanto obter uma outra prova usando resultados de Grupos de Permutações para mostrar que o problema da distância de transposição é NP-difícil. O algoritmo proposto foi implementado na linguagem de programação Java. Utilizamos um sistema de álgebra computacional, chamado GAP, para computar operações envolvendo permutações. O algoritmo foi auditado na ferramenta GRAAu, o que permitiu a comparação de todas as distâncias de transposições dadas por nosso algoritmo, para todas as permutações de tamanho 2 até 11, com os valores exatos. Os resultados dessa auditoria foram comparados com outros encontrados na literatura. ______________________________________________________________________________ ABSTRACT / In computational biology, mutational events a ecting large portions of a genome are
studied in genome rearrangements. Particularly, transposition is a mutational event that changes two contiguous blocks of genes inside a single chromosome. This event generates the problem of transposition distance, which is to nd the minimum number of transpositions transforming a chromosome into another. Recently, this problem was proved to be NP-hard. In the literature many algorithms were proposed to solve this problem, taking into account di erent approaches. In the present work, we will use the algebraic formalism for chromosome modeling and transpositions proposed by Meidanis and Dias, and classic results
of Permutation Groups to suggest a 2-approximation algorithm for the transposition
distance problem. Although there are better approximation algorithms, the contribution of this work is the proposition of a solution to the transposition distance problem using only known results of Permutation Groups Theory, dissociated from the classic formalism proposed by Bafna and Pevzner. It is worth noting that our algorithm simulates, in a natural way, the solution based on Bafna and Pevzner's cycle graph. Our solution can be automated in part, and we believe that it indicates new ways that enable to decrease the approximation ratio and to achieve another proof, using results of Permutation Groups, to show that the problem of transposition distance is NP-hard. The proposed algorithm was implemented using Java programming language. We have used a computer algebra system, called GAP, to compute operations involving permutations.
The algorithm was also audited in GRAAu tool, which allowed the comparison of all transposition distances given by our algorithm, for all permutations of size 2 to 11, with the exact values. The results of this audit were compared with others found in the literature.
|
10 |
Caracterização da proteina H-NS relacionada a patogenicidade de Xylella fastidiosaPaula, Debora Pires 03 August 2018 (has links)
Orientador: Anete Pereira de Souza / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Biologia / Made available in DSpace on 2018-08-03T21:21:35Z (GMT). No. of bitstreams: 1
Paula_DeboraPires_D.pdf: 9756766 bytes, checksum: 96b35bf286242ed96ae379799d977a9a (MD5)
Previous issue date: 2004 / Doutorado
|
Page generated in 0.083 seconds