• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 492
  • 27
  • 26
  • 14
  • 8
  • 7
  • 7
  • 7
  • 7
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 565
  • 311
  • 93
  • 79
  • 70
  • 57
  • 56
  • 53
  • 53
  • 45
  • 43
  • 43
  • 42
  • 42
  • 40
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
51

Sistema de gerenciamento e análise de dados por bioinformática / Not available

Pablo Rodrigo Sanches 10 October 2006 (has links)
Os projetos para estudo de genomas ou genes expressos partem de uma etapa de seqüenciamento no qual são gerados em laboratório dados brutos, ou seja, seqüências de DNA sem significado biológico. Estas seqüências de DNA possuem códigos responsáveis pela produção de RNAs e proteínas. O grande desafio dos pesquisadores consiste em analisar essas seqüências e obter informações biologicamente relevantes. Durante esta análise diversos programas de computador, além de um grande volume de dados armazenados em fontes de dados biológicas, são utilizados. Assim sendo, o presente trabalho prop6s a elaboração de um sistema computacional que permite a análise de dados sobre biologia molecular e facilite a instanciação do software dependendo do ambiente de trabalho e tipo de projeto de análise. Para este sistema foi dado o nome de Sistema de Gerenciamento de Análise de Dados por Bioinformática - SGADBio. O trabalho apresenta o desenvolvimento do sistema baseado em metodologias de Engenharia de Software, além dos módulos e funções disponíveis. Seqüências oriundas de um projeto de ESTs do fungo dermatófito Trichophyton rubrum, geradas em um laboratório de biologia molecular, foram submetidas ao sistema para análise. Os resultados são expressivos, demonstrando que o sistema é adequado e capaz de adaptar se a projetos envolvendo seqüenciamento / Projects involving the study of genomes and expressed genes typically initiate with the raw data generated by laboratory sequencing of DNA, devoid of any biological meaning. However, such sequences contain the codes for the production of RNAs and proteins. One of the great challenges faced by researchers is the analysis of such sequences in order to obtain biologically meaningful information. Several computer programs and auxiliary databases are used for that purpose. The present work reports on the development of a computational system capable of supporting biology data analysis and it can be instantiated in order to suit specific working environments and analyses projects. This system has been called Management and Data Analysis System for Applications in Bioinformatics- SGADBio. This work presents the development of the system based on Software Engineering methodologies, as well as the involved modules and functionalities. Sequences from an EST project involving the dermatophyte fungus Trichophyton rubrum, generated in a molecular biology laboratory, were submitted to the system for analysis. The results are expressive, corroborating the versatility of the system for adaptation to sequencing projects
52

Sistema de gerenciamento e análise de dados por bioinformática / Not available

Sanches, Pablo Rodrigo 10 October 2006 (has links)
Os projetos para estudo de genomas ou genes expressos partem de uma etapa de seqüenciamento no qual são gerados em laboratório dados brutos, ou seja, seqüências de DNA sem significado biológico. Estas seqüências de DNA possuem códigos responsáveis pela produção de RNAs e proteínas. O grande desafio dos pesquisadores consiste em analisar essas seqüências e obter informações biologicamente relevantes. Durante esta análise diversos programas de computador, além de um grande volume de dados armazenados em fontes de dados biológicas, são utilizados. Assim sendo, o presente trabalho prop6s a elaboração de um sistema computacional que permite a análise de dados sobre biologia molecular e facilite a instanciação do software dependendo do ambiente de trabalho e tipo de projeto de análise. Para este sistema foi dado o nome de Sistema de Gerenciamento de Análise de Dados por Bioinformática - SGADBio. O trabalho apresenta o desenvolvimento do sistema baseado em metodologias de Engenharia de Software, além dos módulos e funções disponíveis. Seqüências oriundas de um projeto de ESTs do fungo dermatófito Trichophyton rubrum, geradas em um laboratório de biologia molecular, foram submetidas ao sistema para análise. Os resultados são expressivos, demonstrando que o sistema é adequado e capaz de adaptar se a projetos envolvendo seqüenciamento / Projects involving the study of genomes and expressed genes typically initiate with the raw data generated by laboratory sequencing of DNA, devoid of any biological meaning. However, such sequences contain the codes for the production of RNAs and proteins. One of the great challenges faced by researchers is the analysis of such sequences in order to obtain biologically meaningful information. Several computer programs and auxiliary databases are used for that purpose. The present work reports on the development of a computational system capable of supporting biology data analysis and it can be instantiated in order to suit specific working environments and analyses projects. This system has been called Management and Data Analysis System for Applications in Bioinformatics- SGADBio. This work presents the development of the system based on Software Engineering methodologies, as well as the involved modules and functionalities. Sequences from an EST project involving the dermatophyte fungus Trichophyton rubrum, generated in a molecular biology laboratory, were submitted to the system for analysis. The results are expressive, corroborating the versatility of the system for adaptation to sequencing projects
53

Identificación de genes candidatos para la biosíntesis y degradación de glucosinolatos mediante herramientas bioinformáticas

Huamaní Parado, Kelvin January 2009 (has links)
Los glucosinolatos son compuestos cianogénicos naturales que se degradan por la acción de tioglucosidasas endógenas (mirosinasas) para dar lugar a isotiocianatos, tiocianatos y nitrilos; muchos de ellos han captado la atención por sus diversas propiedades biológicas, entre otras, como agentes preventores del cáncer, biopesticidas, antiafrodisiacos. Luego del secuenciamiento del genoma de Arabidopsis, se ha elucidado mejor la ruta de biosíntesis de los glucosinolatos, identificandose los primeros reguladores de la ruta, estudios de su función, así como relaciones evolutivas entre rutas parecidas. / Glucosinolates are natural cyanogenic compounds that are broken down by the action of endogenous tioglucosidases (mirosinases) to produce isothiocyanates, thiocyanate, and nitriles; many of them call the attention to researchers by diverse biological properties, such as cancer preventing, biopesticides, anti-aphrodisiacs. After the sequencing of Arabidopsis genome was completed, the glucosinolates biosynthetic process has been better elucidated, identifying the first regulators of the pathway, function research, and also the evolution relationship between similar pathways.
54

Estudis computacionals sobre beta-amilasa, una molècula enzimàtica tipus barril (beta/alfa) 8: relacions evolutives i transicions estructurals al centre catalític..

Pujadas Anguiano, Gerard 05 May 1998 (has links)
pendent
55

Modelo de predição da conformação tridimensional de proteínas globulares a partir do método ab initio utilizando rede neural com uma função de base radial

Pereira, Max Roberto January 2006 (has links)
Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Engenharia de Produção. / Made available in DSpace on 2012-10-22T16:02:12Z (GMT). No. of bitstreams: 0 / O sequenciamento de genomas inteiros é, sem dúvida, uma grande conquista, mas o significado dessa massa acumulada de dados está apenas começando a ser desvendado. O acúmulo de uma grande quantidade de dados biológicos, relativo à pesquisa de genes e proteínas provou ser necessário abstrair o significado biológico desses dados. Esse grande volume de dados tem sido acumulado desde o lançamento das pesquisas em biologia molecular depois da proposta do modelo de dupla-hélice do DNA e a aplicação do sequenciamento de proteínas e do próprio DNA. A predição da estrutura tridimensional de uma proteína, conhecida também como estrutura terciária, em função de sua seqüência de DNA ou seqüência de aminoácidos é o objeto de estudo desse trabalho. Desenvolver um modelo e conseqüentemente uma aplicação computacional para agregar informação ao processo de predição dessa estrutura é o norteador principal do trabalho. Dado que as proteínas são construídas a partir da informação contida no DNA, uma vez conhecido o gene pode-se deduzir a seqüência de aminoácidos. É necessário então, determinar sua estrutura. Para determinar a estrutura de uma proteína é necessário analisar as seqüências de DNA e de aminoácidos, procurando então padrões na geração destas estruturas. Constata-se, portanto, que o conhecimento da estrutura de proteínas em nível atômico permitirá descrever como a forma particular de uma proteína determina, por sua vez, a sua função. Dessa forma, o problema consiste em determinar a relação entre seqüência e estrutura. Considerou-se a Inteligência Artificial (IA) vital para o estudo do modelo computacional, pois devido à dimensão das cadeias de DNA e a complexidade do processo biológico, torna-se inviável uma solução puramente algorítmica. O modelo de predição utiliza uma rede neural com função de base radial (RBF), que determina as estruturas secundárias de uma seqüência e as transforma em coordenadas para uma visualização tridimensional. O modelo apresentou resultados compatíveis com abordagens que utilizam outros métodos já mencionados na literatura. Percebe-se que o papel da estrutura tridimensional de uma proteína face ao seu contexto funcional na biologia molecular, a transição da seqüência de aminoácidos para a estrutura funcional, a importância dessa estrutura para os profissionais da área, e conseqüentemente desse setor para a sociedade, e por fim, a importância de desenvolver modelos e métodos computacionais mais precisos, são assuntos que merecem estudos mais aprofundados.
56

Avaliação da expressão gênica diferencial entre folhas e tecidos vasculares de Eucalyptus grandis

Jahns, Marina Tagliaro January 2008 (has links)
No presente trabalho está descrita a análise de experimentos de microarranjos de DNA realizados pelos pesquisadores do Projeto GENOLYPTUS em conjunto com a empresa NimbleGen Systems Inc. (Reykjavik, Iceland), assim como a validação dos resultados gerados por essa análise, com a finalidade de encontrar genes diferencialmente expressos entre folhas e xilema de E. grandis para futuro estudo. O processo de análise dos microarranjos de DNA envolveu a busca por um software com programas estatísticos adequados ao estudo de grande quantidade de dados com mínima probabilidade de erro. A comprovação dos resultados gerados pelo software escolhido foi realizada com o uso da técnica da reação em cadeia da DNA-polimerase quantitativa (em tempo real) precedida de transcrição reversa (qRT-PCR). Alguns dos genes mais diferencialmente expressos foram selecionados para esta etapa, juntamente com alguns genes com expressão não tão alta. Os genes mais expressos nas folhas que foram escolhidos codificam para; (i) uma proteína semelhante à metalotioneína do tipo 3 (MT-3); (ii) uma glicolato-oxidase; (iii) uma catalase; (iv) uma fosforribulocinase precursora de cloroplasto (PRK); (v) um fator de transcrição MYB do tipo MYB142 e, (vi) uma proteína tipo “dedo-de-zinco”. Os genes mais expressos no xilema escolhidos foram os que codificam (i e ii) duas proteínas expressas em Arabidopsis thaliana; (iii) uma proteína hipotética expressa em Nicotiana benthamiana; (iv) uma descarboxilase de UDPglicuronato do tipo 2, (v) uma quitinase do tipo ELP; (vi) uma celulosesintase tipo 3; (vii) um fator de transcrição MYB; (viii) uma cafeoil-CoA-3- O-metiltransferase (CCoAOMT) e; (ix) uma proteína rica em prolina híbrida do tipo 2 (HyPRP2). Os resultados das qRT-PCRs demonstraram que o experimento de microarranjo e seus resultados foram consistentes e válidos, embora os primeiros tenham demonstrado valores de expressão freqüentemente mais altos. Acreditamos que tanto a análise dos microarranjos de DNA quanto a equivalência das amostras (duplicatas) biológicas estudadas foram totalmente sustentadas pelos resultados da qRT-PCR, pois foram robustas o suficiente para estimar um grande número de genes simultaneamente e indicar aqueles mais importantes como candidatos para futuras análises. / In the present work it is described the analysis of DNA microarray experiments developed by GENOLYPTUS researchers together with Nimblegen Systems Inc. (Reykjavik, Iceland), as well as the validation of the generated results with the aim to find differentially expressed genes between leaves and xylem tissue of E. grandis for further study. The DNA microarray analysis process comprised the search for software containing statistical programs satisfactory for studying an enormous amount of data with a very low false discovery rate. The confirmation of the generated data by the chosen software was made with the use of quantitative (real-time) reverse-transcription followed by polymerase chain reaction (qRT-PCR). Some of the most differentially expressed genes were selected for this step, along with some genes with average expression. Leaf chosen genes were those that codify (i) a metallothionein-like protein type 3 (MT-3), (ii) a glycolate oxidase, (iii) a catalase, (iv) a precursor phosphoribulokinase (PRK) from chloroplast, (v) a MYB transcription factor (MYB142), and (vi) a CONSTANS-LIKE 16 zincfinger protein. Xylem chosen genes were those codifying (i and ii) two expressed proteins from Arabidopsis thaliana, (iii) a hypothetic protein expressed in Nicotiana benthamiana, (iv) a putative UDP-glucuronate decarboxylase type 2, (v) a chitinase type ELP (ectopic deposition of lignin in pith), (vi) a cellulose synthase type 3, (vii) a MYB transcription factor, (viii) a caffeoyl-CoA 3-O-methyltransferase (CCoAOMT), and (ix) a hybrid proline-rich protein type 2 (HyPRP2). Our qRT-PCR results proved the full consistency and validation of the microarray experiments, although the relative expression ratios of the first were often higher. We believe that our microarray analysis as well as the equivalence of biological samples (duplicates) were fully supported by the qRT-PCR findings since they were robust enough to evaluate a massive number of genes and able to point out important candidate genes.
57

Peptídeos virais imunogênicos como determinantes de reatividade cruzada no sistema imune

Vieira, Gustavo Fioravanti January 2008 (has links)
A identificação de epitopos e motivos virais para serem utilizados na imunização de humanos e animais é um objetivo importante e essencial em pesquisa imunológica. No momento, com novas ferramentas de bioinformática, diferentes abordagens são possíveis. A importância da bioinformática reside na possibilidade de trabalhar com grandes quantidades de dados de forma que, várias etapas experimentais do desenvolvimento de vacinas podem ser abreviadas. Quando buscamos por motivos virais (objetivando a vacinação) é necessário estar ciente de todos os passos envolvidos na seleção e apresentação de peptídeos ao sistema imune. Devemos considerar que muitos peptídeos podem ser gerados a partir de uma única proteína, mas apenas uma fração destes peptídeos é realmente apresentada ao sistema imune, pois os peptídeos devem ser capazes de atravessar diferentes “bottlenecks” e apenas aqueles apresentando características específicas serão capazes de estimular o sistema imune. As abordagens apresentadas nesta tese incluem o estabelecimento de um banco de dados de epitopos virais descritos na literatura e a comparação desses epitopos buscando identificar características similares entre eles. Os epitopos selecionados foram classificados de acordo com suas propriedades físico-químicas (polaridade e carga dos grupos R de seus aminoácidos). Das 69 sequências de epitopos incluídas em nossa base de dados, 31 (44,93%) apresentaram, em sítios potenciais de ancoragem ao MHC, aminoácidos com resíduos não-polares. A partir desses resultados é possível inferir o seguinte motivo consenso: X [AGPVLIM] X(6) [AGPVLIM] para epitopos virais. As sequências virais foram então comparadas àquelas de outras proteínas buscando verificar se elas são exclusivamente representadas em vírus: 1) primeiro os epitopos foram comparados a todas as sequências depositadas no GenBank (independente da origem); 2) a seguir, as comparações foram direcionadas a sequências de origem humana. A segunda abordagem foi usada para verificar o potencial de indução de reações autoimunes. As sequências de saída foram classificadas de acordo com seu organismo de origem. Das 31 sequências alinhadas de acordo com a similaridade dos resíduos de ancoragem, 29 (93,54%) apresentaram similaridade significante (estabelecida como 80% ou mais) com outras sequências virais. Destas, 12 (38,71%) apresentavam similaridade apenas com outras sequências de origem viral, nove (29,03%) apresentavam similaridade com sequências de origem bacteriana e duas (6,45%) apresentavam similaridade com sequências humanas, sugerindo que a grande maioria dos epitopos virais pode ser utilizada no desenvolvimento de vacinas. A habilidade dos epitopos serem gerados pela via de processamento de antígenos foi também testada. Uma parte das proteínas citosólicas sofre o processo de ubiquitinação que as dirige para o complexo enzimático proteolítico, denominado proteossomo. Do total de epitopos, cinquenta (73,53%) apresentaram uma sequência que permitia um corte exato na extremidade carbóxi terminal. Este número alcançou 86,67% (26 epitopos), quando restringimos a análise aos epitopos apresentando os resíduos de ancoragem compartilhados, sugerindo que a maioria dos epitopos apresentava os requerimentos clássicos para o processamento antigênico. Das estruturas do Protein Data Bank e de dados de modelagem, foi possível observar que os sítios de clivagem preditos na região amino terminal dos epitopos eram estruturalmente relacionados a alças na estrutura da proteína original (66,7%). Estes dados sugerem que há uma clivagem preferencial em alças (χ2=6.09 p=0.047). O banco de dados de ligantes peptídicos do EpiJen foi utilizado para avaliar a capacidade dos epitopos em serem carreados pelo complexo da TAP. A partir dessa comparação observamos que o motivo predito estava mais representado do que todas outras possíveis sequências entre as saídas, sugerindo novamente que estas características são necessárias à seleção e apresentação de epitopos. Concluindo, sugerimos que é possível identificar padrões entre epitopos derivados de virus e que a predição de motivos virais conservados pode ser aplicada ao desenvolvimento de vacinas. Além disso, considerando a existência de reatividade cruzada, sugerimos que é possível imunizar contra uma quantidade consideravelmente grande de alvos virais utilizando um número de epitopos reduzido. Estudos sobre os aspectos e características dos epitopos virais são o primeiro passo rumo a uma nova geração de vacinas. / The identification of epitopes and viral motifs to be used in the immunization of both humans and other animals is an important and essential objective in immunology research. At present, with the new tools of the bioinformatics different approaches are possible. The importance of the bioinformatics is exemplified by its capacity to handle a large amount of data in order to bypass several methodological steps in vaccine development. When searching for conserved viral motifs it is necessary to be aware of all the steps involved in peptide selection and presentation. In this way, we should consider that many different peptides can be generated from a given protein, but only a fraction of these peptides will actually be presented to the immune system. The approaches presented in this thesis include the establishment of a viral epitope databank from sequences described in the literature and the comparison of these epitopes in order to identify similar features among then. The selected epitopes were classified according to their physicochemical properties (i.e. polarity and charge of their amino acid–R groups). From the 69 sequences of epitopes included in our database, 31 (44.93%) presented, in potential MHC anchor sites, amino acids whit non-polar residues. From this, it is possible to infer the following consensus motif: X [AGPVLIM] X(6) [AGPVLIM]. The viral sequences were then compared to those of other proteins in order to verify if they are exclusively represented in viruses: 1) first, the epitopes were compared to all sequences stored in GenBank (disregarding their origin); 2) then, the comparisons were directed to the sequences from human origin. The output sequences were classified according to the organism of origin. From the 31 sequences aligned according to their anchor residues, 29 (93.54%) presented significant similarity (established as 80% or above) with other viral sequences. From these, 12 (38.71%) presented similarity only with other sequences from viral origin, nine (29.03%) presented similarity with sequences from bacterial origin and two (6.45%) presented significant similarity to human sequences, suggesting that a great majority of these viral epitopes could be used in vaccine development. The hability of the epitopes to be generated by antigen processing pathway was also tested. A fraction of all cytosolic proteins suffers the ubiquitination process that directs them to the proteolytic enzymatic complex, called proteasome. From the whole databank, fifty epitopes (73.53%) presented a sequence that allowed a precise cut at the carboxy terminal region. This number reached 86.67% (26 epitopes) when we restricted this analysis to the epitopes presenting the shared anchor residues, suggesting that the majority of the epitopes presented the classical requirements to antigenic processing. From the Protein Data Bank structures and from the modelling data, we could observe that the predicted cleavage sites on the amino-terminal region of the epitopes were structurally related to loops on the structure of the original protein (66.7%), suggesting a preferential cleavage at loops (χ2=6.09 p=0.047). The TAP ligands peptide database of EpiJen was used in order to evaluate the epitopes capacity to be carried by the TAP complex. We were able to observe that our predicted motif was present more frequently than every other possible sequence among the outputs, again suggesting that this feature is necessary to epitope selection and presentation. In conclusion, we suggest that it is possible to identify patterns among virus-derived epitopes and that the prediction of viral conserved motifs would allow the development of vaccines. Also, considering the existence of cross reactivity, we suggest that it will be possible to cover a considerably large amount of targets using a limited number of viral peptides. Equally important is the immunogenicity of viral peptides, since only a fragment and not the whole viral particle will challenge the immune system, therefore reducing risks of undesired immune responses. Studies on viral epitopes features and characteristics are the first step towards a new generation of vaccines.
58

Análise do controle metabólico in silico da via glicolítica da Saccharomyces cerevisiae

Aguiar, Rodrigo Souza January 2015 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Química, Florianópolis, 2015. / Made available in DSpace on 2015-11-17T03:11:43Z (GMT). No. of bitstreams: 1 336047.pdf: 2532161 bytes, checksum: eb3193d707e6ab5dead059b772dd0565 (MD5) Previous issue date: 2015 / Saccharomyces cerevisiae é o principal micro-organismo produtor de etanol, empregado no Brasil. Devido a alta capacidade de adaptação a processos contínuos de produção, esse fungo possui caracterização genética muito bem definida, viabilizando otimizações de isoenzimas. Uma vez que alta concentração de glicose no meio reacional inibe-o, modificações genéticas foram realizadas a fim de que a sacarose fosse incorporada e submetida à hidrólise enzimática intracelular, obtendo glicose e frutose, evitando também contaminações e reduzindo a produção de células. Quantificou-se tais modificações pela Análise de Controle Metabólico (MCA). As entradas de glicose, via difusão facilitada (HXT) ou pelo simporte de sacarose (ATPase) e posterior hidrólise desta, foram avaliadas pelos coeficientes de controle dessas respectivas enzimas. Através das elasticidades de glicose intracelular, frutose-6- fosfato, quantificou-se localmente a influência de NAD e ATP em enzimas reguladoras e produtoras de compostos de interesse. Logo, a preferência entre rotas metabólicas foi identificada pela relação entre tais influências globais e locais, através dos coeficientes de resposta particionado, revelando quantitativamente a contribuição da permease no saldo energético e seu efeito consequente na rede metabólica. A interdisciplinaridade realizada entre MCA e Análise Dinâmica revelou o ganho de processo como uma elasticidade dimensional discreta. Dessa forma, perturbações em degrau na glicose extracelular revelaram as contribuições locais do substrato em cada reação do modelo estruturado, provando que esse recurso in silico deve ser usado paralelamente a análises cinéticas microbianas, para orientar a pesquisa e descrever a lógica metabólica pela técnica da MCA.<br> / Abstract : Saccharomyces cerevisiae is the most useful microorganism in Brazilian ethanol production. Because of its great ability in adaptation to continuous process, this fungus has a complete genetic characterization, allowing optimization of isoenzymes. Once high glucose concentration on reaction media inhibits it, genetic modifications were done in order to embody sucrose and hydrolyze it, freeing glucose and fructose, also avoiding contamination and reducing cell production. Such modifications were quantified by Metabolic Control Analysis (MCA). Glucose incomings, through facilitated diffusion (HXT) or sucrose symport (ATPase) and then its hydrolysis, were evaluated by their respective control coefficients. Through elasticities of intracellular glucose, fructose 6-phosphate, local influences of NAD and ATP over regulatory enzymes and high-value metabolite production were quantified. Therefore, the preference among metabolic routes was identified by the partitioned response coefficients, which are relations between local and global influences, uncovering quantitatively the permease contribution to energetic balance and then its effect at metabolic web. The interdisciplinarity between MCA and Dynamic Analysis defines the static gain as a dimensional and discrete elasticity. In order that, degree perturbations at extracelllular glucose reveal the substrate local contributions at each reaction defined on the estructured model, proving that in silico source must be used with microbian kinetic analysis, guiding the research and unveil the metabolic logic through MCA principles.
59

Usando uma abordagem filogenômica para o estudo dos protozoários

Ocaña, Kary Ann del Carmen Soriano January 2010 (has links)
Submitted by Tatiana Silva (tsilva@icict.fiocruz.br) on 2012-12-27T17:46:12Z No. of bitstreams: 1 kary_a_c_s_ocana_ioc_bcm_0010_2010.pdf: 8676624 bytes, checksum: 38b44fc6cba3d4b68c651cbcf281a044 (MD5) / Made available in DSpace on 2012-12-27T17:46:12Z (GMT). No. of bitstreams: 1 kary_a_c_s_ocana_ioc_bcm_0010_2010.pdf: 8676624 bytes, checksum: 38b44fc6cba3d4b68c651cbcf281a044 (MD5) Previous issue date: 2010 / Fundação Oswaldo Cruz.Instituto Oswaldo Cruz. Rio de janeiro, RJ, Brasil / A reconstrução da história evolutiva, assim como o estabelecimento de hipóteses que demonstrem as relações filogenéticas dos protozoários bem como dos genes codificados pelos Elementos Genéticos Móveis (EGM) requerem o uso de várias abordagens e ferramentas, as quais não se encontram disponíveis de maneira integrada nem de maneira amigável. Diferentes abordagens filogenéticas, filogenômicas e evolutivas são necessárias para a inferência da filogenia de espécies e o estudo de genes pouco conservados como a transcriptase reversa, o gene mais representativo da classe I dos EGM, os retrotransposons. Os principais algoritmos filogenéticos e os programas que os executam têm sido unificados num único sistema: ARPA, escrito na linguagem de programação PYTHON. O sistema ARPA e a interface webestão hospedados na FIOCRUZ e estão disponíveis no endereço http://arpa.biowebdb.org. Eles estão sendo integrados ao sistema de banco de dados ProtozoaDB (http://protozoadb.biowebdb.org) e ao sistema de anotação semi-automática Stingray (http://stingray.biowebdb.org/). Uma abordagem baseada nos fundamentos da filogenômica eevolução foi utilizada para desenvolver cinco objetivos: (i) analisar e inferir a filogeniados genes relacionados à resistência de drogas em protozoários, (ii) reconstruir a árvore de espéciesde protozoários, (iii) realizar estudos de filogenômica dos EGM em protozoários, (iv) inferir a filogenia da telomerase e dos elementos de retrotransposição em Tri-tryps e (v) adaptar e ampliar o esquema Phylo ao banco de dados GUS para o armazenamento da informação filogenética. Os principais resultados obtidos para cada objetivosão: (i) As inferências filogenéticas dos genes AQP, hsp70, GP63, TRYR e MRPA relacionados à resistência a drogas em protozoários demonstrou a viabilidade das execuçõesdo sistema ARPA; (ii) a árvore de espécies de protozoários usando a abordagem da supermatriz provou ser confiável, e o teste PTP e a estatística G1 demonstraram que os dados moleculares deste estudo possuem sinal filogenético; (iii) o RAXML foi o programa mais consistente ao lidar com os diferentes níveis de polimorfismos destes genes, a detecção in silicoda seleção positiva destes genes foi detectada nas análises pareadas dos modelos M1-M2 e M7-M8, porém o par M0-M3 indicou uma alta variabilidade da razão ωentre os sítios; (iv) foi observada a monofilia para a telomerase a que está mais relacionada à transcriptase reversa dos retrotransposons não-LTR; (iv) um novo esquema Phylo foi concebido e incorporado no GUS 3.5 estendendo-o a fim de armazenar os dados obtidos de inferências filogenéticas. As principais conclusões são: (i) O sistema ARPA é uma alternativa viável, eficiente, fácil e de tempo reduzido para as análises filogenômicas. O RAXML foi considerado o programa mais consistente e foi observado que as árvores construídas usando as sequências inteiras e/ou as trimadas com o TRIMAL apresentaram os melhores resultados. A abordagem da supermatriz apresentou melhores resultados do que a superárvore; (ii) as relações entre os grupos de protozoários estão de acordo com estudos anterioresda literatura, os quais determinaram também uma monofilia para os protozoários. A inclusão de mais dados/genes é necessária para obter uma árvore robusta; (iii) foram reconstruídas as árvores dos genes dos EGM e inferida a filogenia para cada um deles. O modelo M3 indicou uma alta variabilidade da razão ωentre os sítios e os modelos M7 e M8 indicaram a presença de seleção positiva para todos os genes dos EGM; (iv) a telomerase formou um grupo monofilético mais relacionado à transcriptase reversa dos retrotransposons não-LTR; (v) o esquema Phylo armazena os dados obtidos de experiências filogenéticas, mantendo as relações de herança filogenética entre cada um dos táxons, o que permite realizar consultas usando as informações dos ramos, dos nós e táxons da árvore. / The reconstruction of the evolutionary history, as well as the establishment of the hypotheses that demonstrate the phylogenetic relationships of the genes encoded by Mobile Genetic Elements (MGEs) require the use of various tools and approaches, which are not available in a friendly or integrated interface. Different phylogenetics, phylogenomics and evolutionary approaches are necessary for the inference of the species phylogeny. These same approaches are required on the study of less conserved genes as the reverse transcriptase that is the most representative gene of the class I of the MGEs, the retrotransposons. The main phylogenetic algorithms and programs developed by our group have been unified into a single system - the ARPA - written in the programming language PYTHON. The ARPA system and the web interface are hosted at FIOCRUZ and are available at http://arpa.biowebdb.org. They are currently being integrated to the database system ProtozoaDB (http://protozoadb.biowebdb.org) and to the semi-automatic annotation system Stingray (http://stinngray.biowebdb.org/). An approach based on the fundamentals of evolution andphylogenomics has been applied to achieve five different objectives: (i) to analyze and to infer the phylogeny to the genes related to drug resistance in protozoan genomes, (ii) to reconstruct a protozoan species tree, (iii) to conduct phylogenomic studies of MGEs in Protozoa, (iv) to infer phylogeny from the telomerase and the retrotransposable elements in Tri-Tryps and (v) to adapt and to extend the schema Phylo to the GUS database, for storing phylogenetic informations. The results obtained for topics were: (i) The construction of the phylogenetic trees of the genes, AQP, hsp70, GP63, TRYR and MRPA which are related to drug resistance in protozoan demonstrated the viability of the executions of theARPA system. (ii) The protozoan species tree using the supermatrix approach proved to be reliable. The PTP Test and the Statistical G1 demonstrated that the molecular data of this study have phylogenetic signal. (iii) The PAUP-AV was shown to be the most consistent program and thePHYML was the least to deal with different levels of polymorphisms of these genes. The in silicodetection of the positive selection in MGEs genes in Protozoa was detected in the paired analysis of the models M1-M2 and M7-M8, but the pair M0-M3 indicated a high variability of the ratio ωbetween the sites. (iv) It was found that a monophyly is present for the telomerase, which was the most closely related to the transcriptase of the non-LTR retrotransposons. (v) A new Phylo schema was designed and incorporated into the GUS 3.5 extending its service to store the dataobtained from phylogenetic experiments. As conclusions: (i) The ARPA system is a viable, efficient, easy and reduced time alternative for phylogenomic analysis. The RAXML was considered the most consistent program and was observed that the trees constructed using the entire and/or the trimmed sequences with TRIMAL showed the best results. The supermatrix approach showed better results than the supertree. (ii) The relationships between protozoangroups are in agreement with previous studies, which also determined a monophyly for protozoan. The inclusion of more data/genes is required to obtain a consistent tree. (iii) In the trees of the EGM, the PAUP-AV was the most consistent and the PHYML the least to deal with different levels of polymorphisms of these genes. The model M3 showed a high variability of ωratio among sites and the models M7 and M8 indicated the presence of positive selection forall genes of EGM. (iv) The telomerase formed a monophyletic group more related to the reverse transcriptase of the non-LTR retrotransposons. (v) The scheme Phylo stores the data obtained from phylogenetic experiences, keeping the inheritance of phylogenetic relationships between each of the taxa, which can perform queries using information from the branches, nodes and taxaof the tree.
60

Avaliação da expressão gênica diferencial entre folhas e tecidos vasculares de Eucalyptus grandis

Jahns, Marina Tagliaro January 2008 (has links)
No presente trabalho está descrita a análise de experimentos de microarranjos de DNA realizados pelos pesquisadores do Projeto GENOLYPTUS em conjunto com a empresa NimbleGen Systems Inc. (Reykjavik, Iceland), assim como a validação dos resultados gerados por essa análise, com a finalidade de encontrar genes diferencialmente expressos entre folhas e xilema de E. grandis para futuro estudo. O processo de análise dos microarranjos de DNA envolveu a busca por um software com programas estatísticos adequados ao estudo de grande quantidade de dados com mínima probabilidade de erro. A comprovação dos resultados gerados pelo software escolhido foi realizada com o uso da técnica da reação em cadeia da DNA-polimerase quantitativa (em tempo real) precedida de transcrição reversa (qRT-PCR). Alguns dos genes mais diferencialmente expressos foram selecionados para esta etapa, juntamente com alguns genes com expressão não tão alta. Os genes mais expressos nas folhas que foram escolhidos codificam para; (i) uma proteína semelhante à metalotioneína do tipo 3 (MT-3); (ii) uma glicolato-oxidase; (iii) uma catalase; (iv) uma fosforribulocinase precursora de cloroplasto (PRK); (v) um fator de transcrição MYB do tipo MYB142 e, (vi) uma proteína tipo “dedo-de-zinco”. Os genes mais expressos no xilema escolhidos foram os que codificam (i e ii) duas proteínas expressas em Arabidopsis thaliana; (iii) uma proteína hipotética expressa em Nicotiana benthamiana; (iv) uma descarboxilase de UDPglicuronato do tipo 2, (v) uma quitinase do tipo ELP; (vi) uma celulosesintase tipo 3; (vii) um fator de transcrição MYB; (viii) uma cafeoil-CoA-3- O-metiltransferase (CCoAOMT) e; (ix) uma proteína rica em prolina híbrida do tipo 2 (HyPRP2). Os resultados das qRT-PCRs demonstraram que o experimento de microarranjo e seus resultados foram consistentes e válidos, embora os primeiros tenham demonstrado valores de expressão freqüentemente mais altos. Acreditamos que tanto a análise dos microarranjos de DNA quanto a equivalência das amostras (duplicatas) biológicas estudadas foram totalmente sustentadas pelos resultados da qRT-PCR, pois foram robustas o suficiente para estimar um grande número de genes simultaneamente e indicar aqueles mais importantes como candidatos para futuras análises. / In the present work it is described the analysis of DNA microarray experiments developed by GENOLYPTUS researchers together with Nimblegen Systems Inc. (Reykjavik, Iceland), as well as the validation of the generated results with the aim to find differentially expressed genes between leaves and xylem tissue of E. grandis for further study. The DNA microarray analysis process comprised the search for software containing statistical programs satisfactory for studying an enormous amount of data with a very low false discovery rate. The confirmation of the generated data by the chosen software was made with the use of quantitative (real-time) reverse-transcription followed by polymerase chain reaction (qRT-PCR). Some of the most differentially expressed genes were selected for this step, along with some genes with average expression. Leaf chosen genes were those that codify (i) a metallothionein-like protein type 3 (MT-3), (ii) a glycolate oxidase, (iii) a catalase, (iv) a precursor phosphoribulokinase (PRK) from chloroplast, (v) a MYB transcription factor (MYB142), and (vi) a CONSTANS-LIKE 16 zincfinger protein. Xylem chosen genes were those codifying (i and ii) two expressed proteins from Arabidopsis thaliana, (iii) a hypothetic protein expressed in Nicotiana benthamiana, (iv) a putative UDP-glucuronate decarboxylase type 2, (v) a chitinase type ELP (ectopic deposition of lignin in pith), (vi) a cellulose synthase type 3, (vii) a MYB transcription factor, (viii) a caffeoyl-CoA 3-O-methyltransferase (CCoAOMT), and (ix) a hybrid proline-rich protein type 2 (HyPRP2). Our qRT-PCR results proved the full consistency and validation of the microarray experiments, although the relative expression ratios of the first were often higher. We believe that our microarray analysis as well as the equivalence of biological samples (duplicates) were fully supported by the qRT-PCR findings since they were robust enough to evaluate a massive number of genes and able to point out important candidate genes.

Page generated in 0.0884 seconds