211 |
Desenvolvimento de Pipelines para análise de EST, bibliotecas ITS e 16S para estudos genômicos em formigas Attini /Ferro, Milene. January 2013 (has links)
Orientador: Maurício Bacci Júnior / Banca: André Rodrigues / Banca: Henrique Ferreira / Banca: Flávio Henrique da Silva / Banca: Claudio José Von Zuben / Resumo: As formigas Attini são destacadas pragas agrícolas e invertebrados modelos em estudos em genômica, metagenômica, sistemática e evolução molecular. Tais estudos têm gerado milhares de sequências nucleotídicas, cuja análise demanda o uso de diferentes programas de Bioinformática em processamentos automatizados. Pensando nisso, foram desenvolvidos protocolos para análises de ESTs e de bibliotecas de sequências ITS e 16S obtidas de formigas Attini. Foi desenvolvida uma arquitetura baseada no padrão MVC e J2EE responsável por todos os processos cliente-servidor. Os protocolos foram implementados na forma de pipelines em que cada componente é um serviço web em REST acoplado a arquitetura desenvolvida. bESTscan realiza a anotação de sequências EST transcriptômicas, 16Scan e ITScan realizam análises de ecologia microbiana, para bactérias (sequências 16S) e para fungos (sequências ITS) respectivamente, bem como identifica as sequências através de pesquisas em bancos de dados públicos. O sistema computacional desenvolvido automatiza a anotação de sequências para um pequeno volume de sequências como as obtidas por Sanger ou para grande volume de dados como as geradas por Sequenciadores de Nova Geração, reduzindo o tempo de processamento e facilitando a análise dos resultados. Todos os pipelines desenvolvidos foram validados com sequências de Attini, obtidas por Sanger e Illumina, geradas a partir de diferentes projetos do nosso laboratório e estão disponíveis na web nos endereços http://evol.rc.unesp.br/lem/?q=bioinformatics / Abstract: The Attini ants are agricultural pests and invertebrate models for studies on genomics, metagenomics, molecular systematics and evolution. These studies have generated thousands of nucleotide sequences whose analysis requires the use of different Bioinformatics tools and automated processing. We developed automated sequence annotation protocols for ESTs and ITS and 16S libraries analysis for Attini ants. We developed an architecture model based on J2EE and MVC patterns which is responsible for all client-server processes and each tool in the pipeline is a REST web service coupled in the architecture model developed. The bESTscan pipeline to perform the EST transcriptome annotation, 16Scan e ITScan realize microbial ecology studies for both, bacteria (16S sequences) and for fungi (ITS sequences), as well as identify sequences through public databases. The computer system developed automates the annotation for both a small volume of sequences obtained by Sanger and for a large number of data generated by the Next Generation Sequencers (NGS), reducing processing time and with high performance. Pipelines were developed and validated using sequences Sanger and Illumina generated with different projects from our laboratory and are available at http://evol.rc.unesp.br/lem/?q=bioinformatics / Doutor
|
212 |
Reconstrução filogenética de procariotos com base em famílias de genes homólogos / Phylogenetic reconstruction of prokaryotes based on homologous gene familiesVivian Mayumi Yamassaki Pereira 03 April 2017 (has links)
A comparação de genomas é uma importante tarefa na qual a bioinformática pode ser aplicada, uma vez que ela permite a identificação de genes patogênicos, o que, por sua vez, pode auxiliar a combater ou a prevenir o surgimento de doenças. A partir da comparação de genomas, também é possível realizar a análise filogenética, que permite entender as relações evolutivas entre diferentes organismos. Em genomas de bactérias, essa análise geralmente é realizada com base no gene 16S rRNA. Entretanto, apesar de ser amplamente utilizado, filogenias com base nesse gene podem ter dificuldades para diferenciar organismos muito próximos evolutivamente. Essa importância da comparação de genomas e a necessidade de uma metodologia que permita distinguir organismos evolutivamente próximos na análise filogenética motivaram este trabalho, que teve como objetivo implementar ferramentas computacionais para identificar genes homólogos em genomas e, com base nesses genes, gerar filogenias e analisar se é possível distinguir os organismos evolutivamente próximos nessas filogenias. Para tanto, as ferramentas desenvolvidas para identificação de genes homólogos recebem resultados de alinhamentos e os filtram, de modo que dois genes são considerados homólogos se o alinhamento entre eles satisfizer os limiares definidos. Após a identificação das famílias de genes homólogos, tabelas são geradas com informações a respeito dos genes homólogos em cada genoma e, com base nessas tabelas, é possível gerar matrizes de distância e utilizar métodos de agrupamento hierárquico para a geração da filogenia ou realizar alinhamentos múltiplos com os genes identificados para posterior reconstrução filogenética. Além disso, também é possível representar os genes e famílias de genes homólogos por meio de um grafo, que pode auxiliar na escolha dos limiares para filtrar os alinhamentos. Para demonstrar e analisar a aplicabilidade das ferramentas desenvolvidas e das abordagens adotadas, experimentos foram realizados utilizando genomas de bactérias do gênero Xanthomonas, que contém um grande grupo de bactérias que causam doenças em plantas. Os resultados obtidos foram então comparados com filogenias de referência e com resultados de outros experimentos realizados. Essas comparações demonstraram que as famílias de genes homólogos podem ser úteis para distinguir genomas de organismos muito próximos evolutivamente, apesar de que essa abordagem apresentou dificuldades para separar os grupos de genomas mais distantes. Em contrapartida, na filogenia gerada a partir da região 16S rRNA, foi possível diferenciar esses organismos mais distantes, mas não foi possível distinguir os organismos muito próximos. Por fim, os experimentos realizados fornecem indícios de que as ferramentas desenvolvidas e as abordagens adotadas podem ser úteis para diferenciar genomas muito próximos evolutivamente de outros procariotos além das bactérias estudadas neste trabalho / Genome comparison is an important task on which bioinformatics can be used because it allows the identification of pathogen genes which can aid the combat of diseases and to avoid the emerging of new ones. Genome comparison also allows the phylogenetic analysis which provides the understanding of evolutional relations of different organisms. In bacterial genomes, this analysis is commonly based on 16S rRNA gene. Unfortunately, it can present some difficulties to distinguish closely related organisms. This importance of genome comparison and the necessity of a methodology to distinguish organisms that are closely related motivated this study, which aimed the development of computational tools to identify homologous genes in genomes, to use these genes to reconstruct phylogenies and to analyze if it is possible to distinguish closely related organisms on these phylogenies. To achieve this purpose, the developed tools to identify homologous genes receive the alignments results and filter it, such that two genes are homologous if their alignment satisfies the thresholds. After the identification of homologous gene families, the tools generates tables with information about the homologous genes presents in each genome and with these tables it is possible to create distance matrix to be used by hierarchical clustering methods to generate phylogenies or it is possible to perform multiple alignments with the identified genes to accomplish a phylogenetic reconstruction. Besides that, it is possible to represent the genes and homologous gene families in a graph, which can aid the choice of the thresholds to filter the alignments. To demonstrate and analyze the applicability of the developed tools and the approaches chosen in this study, experiments were performed using genomes of the bacterial genus Xanthomonas, which include a group of phytopathogenic bacteria. The results obtained were compared with reference phylogenies and with results of other experiments. These comparisons showed that homologous gene families can be used to differentiate closely related organisms, despite the fact that it presented difficulties to distinguish the groups of genomes that were evolutionarily far from each other. On the other hand, the phylogeny based on 16S rRNA region allows to distinguish the groups of genomes that were distant, but it was not possible to differentiate closely related organisms. As a conclusion, the experiments performed give pieces of evidence that the developed tools and the approaches adopted can be useful to distinguish genomes of closely related organisms of other prokaryotes besides the bacterias considered in this study
|
213 |
Análise do ensino de genética e genômica em cursos de graduação em enfermagem no Brasil / Analysis of genetics and genomics teaching in undergraduate nursing programs in BrazilLuis Carlos Lopes Junior 25 February 2013 (has links)
Após a conclusão do Projeto Genoma Humano, uma quantidade imensurável de conhecimentos genômicos surgiu e, atualmente, se torna essencial sua integração à prática profissional de enfermeiros. Esses conhecimentos vêm transformando o modelo de atenção à saúde, com implicações para a enfermagem e repercussões no ensino, na assistência e na pesquisa. Embora já seja reconhecida a importância da genética e da genômica na educação de enfermeiros, levantamentos realizados em diversos países mostram que esses conteúdos ainda são limitados nos cursos de graduação desses profissionais, sendo desconhecida a situação nas escolas de enfermagem do Brasil. O principal objetivo desse estudo foi identificar as oportunidades existentes de educação em genética e genômica, oferecidas por cursos brasileiros que graduam enfermeiros. Trata-se de pesquisa exploratória, tipo survey, com delineamento transversal e abordagem quantitativa, realizada no período de fevereiro de 2011 a novembro de 2012. A amostra de conveniência compreendeu 311 Instituições de Ensino Superior cadastradas junto ao Ministério da Educação. Após aprovação do Comitê de Ética em Pesquisa, os dados foram coletados por meio de questionário eletrônico, com questões sobre: a instituição, o docente, o ensino de genética e/ou de genômica e as \"Competências Essenciais de Enfermagem e Diretrizes Curriculares para Genética e Genômica\". Esse instrumento foi validado por meio da Técnica Delphi, seguido por estudo-piloto. Os dados foram armazenados no SurveyMonkey (ferramenta de questionário online), exportados diretamente para planilhas do Microsoft Excel e analisados por meio de estatística descritiva. Responderam ao questionário 138 coordenadores de cursos de enfermagem (44,4%) e 49 docentes de genética (61,2%). A disciplina de genética está presente na maioria dos cursos investigados (67,3%), sendo obrigatória em 81,6% destes, com carga horária média de 36hs. É ministrada, principalmente, por biólogos (77,6%), mestres (83,7%) e doutores (63,3%) nessa área. Seu enfoque principal tem sido em conteúdos de biologia molecular e de genética básica. A estratégia de ensino-aprendizagem mais utilizada na disciplina é a de aulas teóricas (81,6%), com avaliação somativa (57,1%). Quanto às \"Competências Essenciais\", a maioria dos coordenadores e docentes de genética concordou com as seguintes: \"O enfermeiro facilita ao cliente a referência a serviços de genética e genômica especializados, quando necessário.\" (63,8%; 71,5%); e \"O enfermeiro identifica clientes que possam se beneficiar de informações e/ou serviços de genéticas e genômica, com base nos dados coletados.\" (58%;73,4%), respectivamente. Esses dados demonstram que esses profissionais parecem ter ainda uma visão um tanto conservadora sobre o ensino de genética/genômica para enfermagem. Os resultados desse estudo têm potencial para oferecer subsídios a reflexões sobre o preparo da força de trabalho em enfermagem na era genômica, em consonância com o Sistema Único de Saúde brasileiro. Vislumbra-se que essa pesquisa poderá contribuir com o estabelecimento de diretrizes que possam ser úteis na elaboração dos currículos de graduação e pós-graduação de enfermeiros, bem como no planejamento de atividades de educação permanente, no Brasil e em outros países de língua portuguesa. Dessa forma, estudantes e profissionais de enfermagem poderão alcançar as competências essenciais no cuidado em saúde baseado em genômica. / After the conclusion of the Human Genome Project, an immeasurable quantity of genomic knowledge emerged and, nowadays, its integration into nurses\' professional practice has become essential. This knowledge has transformed the health care model, entailing implications for nursing and repercussions for teaching, care and research. Despite the acknowledged importance of genetics and genomics in nurses\' education, surveys in different countries show that these contents remain limited in these professionals\' undergraduate programs, while the situation in Brazilian nursing schools is yet unknown. The main goal of this study was to identify existing educational opportunities in genetics and genomics, offered in Brazilian undergraduate nursing programs. An exploratory survey with a cross-sectional design and quantitative approach was undertaken between February 2011 and November 2012. The convenience sample comprised 311 Higher Education Institutions registered at the Ministry of Education. After receiving approval from the Institutional Review Board, the data were collected through an electronic questionnaire, including questions about: the institution, lecturer, genetics and/or genomics teaching and \"Essential Nursing Competences and Curricula Guidelines for Genetics and Genomics\". To validate this instrument, the Delphi Technique was applied, followed by a pilot test. The data were stored in the SurveyMonkey (online questionnaire tool), directly exported to Microsoft Excel worksheets and analyzed using descriptive statistics. In total, 138 nursing program coordinators (44.4%) and 49 genetics lecturers (61.2%) answered the questionnaire. The genetics course is present in most programs investigated (67.3%) and compulsory in 81.6%, with a mean hour load of 36hs. Lecturers are mainly biologists (77.6%) holding an M.Sc. (83.7%) and Ph.D. (63.3%) in the area. Their main focus has been on molecular biology and basic genetics contents. The teaching-learning strategy that has been most used in the course involves theoretical classes (81.6%), with summative evaluation (57.1%). As regards the \"Essential Competences\", most coordinators and genetics faculty agreed with the following: \"The nurse provides clients with easy referral to specialized genetics and genomics services, when necessary.\" (63.8%; 71.5%); and \"The nurse identifies clients who can benefits from genetics and/or genomics information and/or services, based on the collected data.\" (58%; 73.4%), respectively. These data demonstrate that these professionals seem to maintain a rather conservative view on genetics/genomics teaching for nursing. The study results can support reflections on how to prepare the nursing workforce in the genomics era, in accordance with the Brazilian Unified Health System. This research can contribute to the establishment of guidelines to elaborate undergraduate and graduate nursing program curricula, as well as to the planning of continuing education activities in Brazil and other Portuguese-speaking countries. This will enable nursing students and professionals to achieve essential competences in genomics-based health care.
|
214 |
Estudo de genômica comparativa de corynebacterium pseudotuberculosis linhagem 226 (biovar ovis)DIAS, Larissa Maranhão 10 March 2015 (has links)
Submitted by Edisangela Bastos (edisangela@ufpa.br) on 2015-05-25T19:30:16Z
No. of bitstreams: 2
license_rdf: 22974 bytes, checksum: 99c771d9f0b9c46790009b9874d49253 (MD5)
Dissertacao_EstudoGenomicaComparativa.pdf: 2070568 bytes, checksum: 0bf9cef9795e0bbc867e1bd89a8d5a30 (MD5) / Approved for entry into archive by Ana Rosa Silva (arosa@ufpa.br) on 2015-05-27T13:23:20Z (GMT) No. of bitstreams: 2
license_rdf: 22974 bytes, checksum: 99c771d9f0b9c46790009b9874d49253 (MD5)
Dissertacao_EstudoGenomicaComparativa.pdf: 2070568 bytes, checksum: 0bf9cef9795e0bbc867e1bd89a8d5a30 (MD5) / Made available in DSpace on 2015-05-27T13:23:20Z (GMT). No. of bitstreams: 2
license_rdf: 22974 bytes, checksum: 99c771d9f0b9c46790009b9874d49253 (MD5)
Dissertacao_EstudoGenomicaComparativa.pdf: 2070568 bytes, checksum: 0bf9cef9795e0bbc867e1bd89a8d5a30 (MD5)
Previous issue date: 2015 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Corynebacterium pseudotuberculosis é uma bactéria Gram-positiva, intracelular facultativa, nãoesporulante, não-capsulada e sem mobilidade, contudo possui fímbria, e pode assumir formas
cocóides e filamentosas (pleomórfica), além disto, apresenta crescimento ótimo à 37°C. Este patógeno apresenta dois biovares: ovis que geralmente acomete pequenos ruminantes, e causa a doença linfadenite caseosa, e biovar equi, mais comum em equinos, bovinos, camelídeos, e bubalinos causando a Linfangite ulcerativa. A infecção por esta bactéria pode levar a condenação das carcaças e redução de lã (em ovinos e caprinos), leite e carne destes animais, e consequentemente a perdas econômicas para a indústria agropecuária mundial. Atualmente, ainda não existe uma vacina eficaz para estas doenças. A fim de obter um maior entendimento biológico entre as espécies o presente trabalho tem como objetivo principal analisar, por meio da
genômica comparativa a linhagem C. pseudotuberculosis 226 biotipo ovis isolada de um caprino
na Califórnia com outras linhagens do biovarar ovis e equi. Na análise de sintenia entre as
linhagens foi possível identificar que a linhagem 226 apresenta alta conservação da ordem gênica
entre as linhagens do biótipo ovis. Através de análises filogenômicas foi possível identificar que
as linhagens I19 e 267 apresentaram maior e menor proximidade filogenética com a linhagem
226. A linhagem 1/06-A foi a que apresentou maior proximidade filogenômica entre as linhagens
do biovar equi, quando comparadas a linhagem 226. Foram preditas 8 ilhas de patogenicidade,
estando presente na ilha 1 os genes relacionados a virulência de C. pseudotuberculosis mais bem
descritos na literatura. Não houveram regiões novas relacionadas a genes de virulência entre
nenhuma das linhagens. Foram identificados 248 genes ortólogos entre as linhagens I19, 267 e
226 e 282 genes ortólogos entre as linhagens 258,1/06-A e 226. Com base nesse estudo é possível
inferir que as linhagens do biovar ovis possuem um repertório gênico pouco variado e que as
linhagens do biovar equi apresentam uma quantidade menor de genes compartilhados com a
linhagem 226, corroborando com a diversidade gênica entre os biovares. / Corynebacterium pseudotuberculosis is a gram-positive, facultative intracellular, non-sporulating
and non-encapsulated bacterium, it is non-motile although it has fimbriae, and can assume
coccoid or filamentous forms (pleomorphic). Its optimum growth temperature is 37°C. This
pathogen has two biovars: ovis, which usually affects small ruminants and causes caseous
lymphadenitis, and biovar equi, more common in equines, bovines, camelids and bubalines,
causing ulcerative lymphangitis. Its infection can lead to carcass condemnation and reduction in
wool production (in ovines and caprines), milk production and meat production and,
consequently, economic losses for the agricultural industry worldwide. Currently there is no
effective vaccine against those illnesses. To obtain a better understanding of these species
biologically, the main objective of this work is to analyze, using comparative genomics, the strain
C. pseudotuberculosis 226 biovar ovis, isolated from a caprine in California, comparing it to
other strains from biovars ovis and equi. The synteny analysis revealed highly conserved gene
order between strain 226 and other biovar ovis strains. Phylogenomic analyses showed that the
strains I19 and 267 are, respectively, the closest and the more distant phylogenetically from strain
226. Among biovar equi strains, the one with the greater phylogenomic proximity to strain 226
was strain 1/06-A. Eight pathogenicity islands were predicted, with C. pseudotuberculosis best
characterized virulence genes in literature being present in island 1. No new regions related to
virulence genes could be found compared to other strains. 248 orthologous genes could be found
between strains I19, 267 and 226, while 282 orthologous genes could be found between strains
258, 1/06-A and 226. Based in this study it is possible to assume that strains from biovar ovis
have a little varied gene repertory and strains from biovar equi have less genes shared with strain
226, reinforcing the genetic diversity between these biovars.
|
215 |
Testes de associação em região de QTL ligados do cromossomo 1 da galinha doméstica / Association tests on linked-QTL region of chicken chromosome 1Attilio, Dênia Borges 14 April 2014 (has links)
Atualmente, o Brasil é considerado o maior exportador mundial e terceiro maior produtor mundial de carne de frango. Este destaque é resultado, principalmente, do melhoramento animal baseado na estimação do valor genético a partir da mensuração de fenótipos e informações de pedigree. Entretanto, é comum que a seleção não seja feita para cada característica isoladamente devido à correlação genética entre elas. Esta correlação tem como causas a pleiotropia ou a ligação genética. Com este trabalho objetivou-se detectar associações entre características fenotípicas de interesse para a avicultura e SNPs em uma região do cromossomo 1 (168 - 208 cM e 57 - 71 Mbp), onde possíveis QTL ligados foram previamente mapeados. Utilizou-se o Beadchip de SNPs de 60k para genotipar 14 animais da geração Parental (machos TT e fêmeas CC) e 28 F1 da população TCTC desenvolvida pela Embrapa Suínos e Aves. A linhagem TT apresentou maior variabilidade genotípica que CC, porém, os F1 foram superiores às linhagens Parentais com base no número de heterozigotos e MAF. O polimorfismo com maior ocorrência em ambas as gerações foram as transições com 84,3%. Foram selecionados 144 SNPs mais informativos com base na heterozigosidade dos cinco casais F1 que geraram os 453 F2. Houve redução de heterozigotos e MAF em F2, em função da média de F1, decorrente de certo grau de parentesco e endogamia entre os animais que compuseram esta geração. Os blocos de haplótipos construídos demonstraram que os machos TT apresentaram 25 blocos, fêmeas CC (17), F1 (32) e F2 (23) com tamanho médio de 278, 467, 242 e 160 kpb, respectivamente. Foi evidenciado que 236 (42,7%) correlações fenotípicas foram significativas, das quais o maior número constatado foi entre PB_MS e outras 17 características e, o maior valor estimado foi entre PB_MS e EE_MS (-0,90). Do total esperado de 3.456 testes de associação, 609 (17,6%) foram considerados significativos (p < 0,05), sendo 424 (69,6%) com efeito aditivo e 185 com efeito de dominância (30,4%). PV41 apresentou maior número de associações (123), enquanto DOR não foi associado a nenhum SNP. Proporcionalmente, o maior número de SNPs foi associado próximo ao QTL pleiotrópico 2 para 17 características. Já os maiores níveis de significância (p < 9,59 x 10-8) para o efeito aditivo foram evidenciados para SNPs localizados próximos ao QTL pleiotrópico 1 e associados somente com PV41, a saber: Gga_rs13869715 (A < C), Gga_rs13870613 (T < C), Gga_rs14827719 (A < G), GGaluGA019336 (T < C) e GGaluGA019533 (A < C). Foram detectadas associações ainda não descritas na literatura para GP3541, CA3541, INT, PES, CAB, FIG, COR, MOE, PUL, HEM, COL, TRI, TC, PB_MS, EE_MS, CZ_MS. Finalmente, foram indicados possíveis genes candidatos posicionais e funcionais, tais como, IGF1, MYBPC1, MTPN, SOX-5, FGFR1OP2 e TTLL12 que poderão ser empregados na análise de expressão gênica. / Actually, Brazil is considered the world\'s first- and third-biggest exporter and producer of poultry meat, respectively. These performances are mainly consequence of animal breeding based on the estimation of breeding value combining phenotypes and pedigree information. However, usually the selection is not carried out for each trait separately due to genetic correlation between them. This correlation is caused by pleiotropy or linkage. We aimed to detect associations between phenotypic traits of interest to poultry industry and SNPs on a region of chromosome 1 (168 - 208 cM and 57 - 71 Mbp), where putative linked-QTL were previously mapped. A chicken 60k SNP BeadChip was used to genotype 14 animals from Parental generation (TT males and CC females) and 28 F1 of the TCTC population that was developed by Embrapa Swine and Poultry. The TT line showed greater genotypic variability than CC, however, F1 were higher than Parental generation based on the number of heterozygotes and MAF. The polymorphism more frequent in both generations was the transitions with 84.3%. The 144 most informative SNPs were selected based on heterozygosity of the five F1 couples which generated the 453 F2. There was a reduction of heterozygotes and MAF in F2, based on the F1 mean value, as consequence of some degree of relationship and inbreeding between animals that formed this generation. Haplotype blocks demonstrated that the TT males showed 25 blocks, CC female (17) F1 (32) and F2 (23) with an average size of 278, 467, 242 and 160 kbp, respectively. It was observed that 236 (42.7%) phenotypic correlations were significant. Out of these, the highest number was found between PB_MS and other 17 traits and the highest estimated value was between PB_MS and EE_MS (-0.90). Out of 3,456 expected association tests, 609 (17.6 %) were considered significant (p < 0.05), being 424 (69.6%) with additive effect and 185 with dominance effect (30.4%). PV41 presented the highest number of associations (123), while DOR was not associated to any SNP. Proportionally, the highest number of SNPs was associated close to the pleiotropic QTL 2 with 17 traits. On the other hand, the highest significance levels (p < 9.59 x 10-8) for the additive effect were evidenced for SNPs located close to the pleiotropic QTL 1 and associated only with PV41 (Gga_rs13869715 (A < C), Gga_rs13870613 (T < C), Gga_rs14827719 (A < G), GGaluGA019336 (T < C) and GGaluGA019533 (A < C)). Novel associations were detected for GP3541, CA3541, INT, PES, CAB, FIG, COR, MOE, PUL, HEM, COL, TRI, TC, PB_MS, EE_MS, CZ_MS when we compared our results with literature. Finally, putative positional and functional candidate genes were indicated such as IGF1, MYBPC1, MTPN, SOX-5, FGFR1OP2 and TTLL12, which may be used in gene expression analysis.
|
216 |
Exploração de uma biblioteca genômica de Passiflora edulis f. flavicarpa por sequenciamento de BAC-ends / Exploitation of a genomic library of Passiflora edulis f. flavicarpa using BAC-end sequencingSantos, Anselmo Azevedo dos 03 July 2013 (has links)
O maracujá-amarelo (Passiflora edulis f. flavicarpa) é uma frutífera de importância econômica no Brasil, sendo apreciado para a produção de suco concentrado e para o consumo in natura, além de ser usado pela indústria farmacêutica na extração da passiflorina. O presente trabalho visou à exploração da biblioteca genômica inserida em BACs (Ped-B-Flav) por meio da técnica de BAC-end sequencing, visando prover os primeiros insights sobre a composição e organização genômica da espécie, além de gerar novos candidatos a marcadores moleculares. Ao todo foram realizadas 9.979 reações de sequenciamento com eficiência média de 89 %, resultando em 8.821 BES de alta qualidade, com tamanho variando entre 100 pb e 1.255 pb, tendo em média 596 pb, totalizando cerca de 5,7 Mpb de informação genômica. Foram identificados, ao todo, 610 potenciais novos marcadores microssatélites. Os motivos de tetranucleotídeos foram os mais abundantes, ou seja, 28,9 % do total, sendo as repetições AATT aquelas observadas com maior frequência, com 131 ocorrências. Foram identificados e classificados 4.394 (19,69 %) elementos repetitivos. Dentre estes elementos, os grupos dos retrotransposons gypsy e copia-like foram os mais abundantes, correspondendo a 10,08 % e 7,93 % das ocorrências, respectivamente. Além disso, foram encontradas 767 (8,7 %) sequências com alta identidade a regiões codificadoras de proteínas. Estas sequências foram classificadas e anotadas de acordo com o vocabulário controlado GeneOntology. Análises de mapeamento genômico comparativo revelaram três regiões microssintênicas com o genoma de Populus trichocarpa, uma com o genoma de Vitis vinifera e uma com o genoma de Arabdopisis thaliana, além de evidenciarem uma série de regiões rearranjadas em relação aos genomas de referência. O presente estudo mostrou que os BES de Passiflora edulis são uma excelente fonte de informações sobre o genoma da espécie, principalmente no que tange à diversidade gênica, identificação de elementos transponíveis e ao potencial para o desenvolvimento de novos marcadores genéticos. Igualmente, foi possível empregar essas sequências na identificação de regiões microssintênicas entre o genoma do maracujá-amarelo e de outras espécies vegetais próximas. / Yellow passion fruit (Passiflora edulis f. flavicarpa) is of considerable economic importance to Brazil. It is used to produce juice concentrate and also marketed for consumption as a fresh fruit. In the pharmaceutical industry, it is used to produce passiflora extract. The aim of this study was to explore the BAC (Bacterial Artificial Chromosome) genomic library (Ped-B-Flav) using BAC-end sequencing (BES) to provide some initial insights into the composition and organization of the species genome, and to generate new candidates for molecular markers. Altogether, 9,979 sequencing reactions were performed, with an average efficiency of 89 %, resulting in 8,821 high-quality BES, of average length ranging from 100 bp to 1255 bp, and consisting of an average 596 bp, totaling some 5.7 Mb of genomic information. In all, we identified 610 potential new microsatellite markers. Tetranucleotide motifs (28.9%) were the most abundant and AATT was the most frequently observed motif, with 131 occurrences. We identified and classified 4,394 (19.69 %) repetitive elements. Retrotransposon gypsy (10.8%) and copia-like (7.93%) elements were the most abundant. Furthermore, we found 767 (8.7 %) sequences very similar to those of protein coding regions. These sequences were classified and annotated according to gene ontology controlled vocabulary. Comparative genomic mapping revealed three regions showing microsynteny with the genome of Populus trichocarpa, one with Vitis vinifera genome and one with the Arabdopisis thaliana genome. In addition it revealed a series of rearranged regions in comparison to the reference genomes. This study showed that Passiflora edulis BES form an excellent source of information on the genome of the species, especially in regard to genetic diversity, identification of transposable elements and potential for the development of new genetic markers. It was also possible, using these sequences, to identify regions showing microsynteny with other plant species.
|
217 |
Bridging genomics and quantitative genetics of Eucalyptus: genome-wide prediction and genetic parameter estimation for growth and wood properties using high-density SNP data / Conectando a genômica à genética quantitativa de Eucalyptus: predição genômica e estimação de parâmetros genéticos para crescimento e propriedades de madeira usando alta densidade de SNPsLima, Bruno Marco de 25 April 2014 (has links)
Convergence of quantitative genetics and genomics is becoming the way that fundamental genetics and applied breeding will be carried out in the next decades. This study bridges the quantitative genetics of complex growth and wood properties traits with genomic technologies towards a more innovative approach to tree breeding. Planted forests play a major role to fulfill the growing world demand for wood products and energy. Eucalypts stand out for their high productivity and versatile wood resulting from the advanced breeding programs associated to clonal propagation and modern silviculture. Despite their fast growth, breeding cycles still take several years and wood properties assessment is limited to a sample of trees in the late stages of selection due to the costs involved in wood phenotyping, not exploitingthe range of genetic variation in wood properties. In this study, we examined fifteen traits including growth and wood chemical and physical properties in 1,000 individuals sampled from an elite Eucalyptus breeding population. Near-infrared spectroscopy (NIRS) models were developed and used for high-throughput phenotyping of wood traits.Highdensity data for 29,090 SNPs was used to obtain accurate pedigree-record-free estimates of trait variance components, heritabilities, genetic and phenotypic correlations, based on a realized relationship matrix, comparing them to pedigree-based estimates. To the best of our knowledge, this is the first study to do this in plants. NIRS predictions were accurate for wood chemical traits and wood density, and variably successful for physical traits. Heritabilities were medium for growth (0.34 to 0.44), high for wood chemical traits (0.56 to 0.85) and variable for wood physical traits (0.11 to 0.63). High positive correlations among growth traits and negative between cellulose and lignin content were observed, while correlations between wood chemical and physical traits and between growth and wood quality traits were low although significant. Phenotypes and SNP markers were then used to build genomic predictive models using a marker density higher than any previous genomic selection study in trees (1 SNP/21 kbp). Two models (RR-BLUP and Bayesian LASSO) that differ regarding the assumed distribution of marker effects were used for genomic predictions. Predictions were compared to those obtained by phenotypic BLUP. Predictive abilities very similar by the two models and strongly correlated to the heritabilities. Accurate genomic-enabled predictions were obtained for wood chemical traits related to lignin, wood density and growth, although generally 15 to 25% lower than those achieved by phenotypic BLUP prediction. Nevertheless, genomic predictions yielded a coincidence above 70% in selecting the top 30 trees ranked by phenotypic selection for growth, wood density and S:G ratio, and 60% when tandem selection was applied. The results of this study open opportunities for an increased use of highthroughput NIRS phenotyping and genome-wide SNP genotyping in Eucalyptus breeding, allowing accurate pedigree-record-free estimation of genetic parameters and prediction of genomic breeding values for yet to be phenotyped trees. These applications should become routine in tree breeding programs for the years to come, significantly reducing the length of breeding cycles while optimizing resource allocation and sustainability of the breeding endeavor. / A convergência da genética quantitativa com a genômica está se tornando a maneira pela qual a genética fundamental e aplicada serão conduzidas nas próximas décadas. Este estudo buscou conectar a genética de fenótipos complexos de crescimento e propriedades de madeira às tecnologias genômicas, em uma abordagem inovadora para o melhoramento florestal. Florestas plantadas têm papel fundamental para satisfazer a crescente demanda mundial por produtos madeireiros e energia. O eucalipto,com sua alta produtividade e madeira versátil, é resultado de programas avançados de melhoramento associados à propagação clonal e silvicultura moderna. Apesar de seu rápido crescimento, ciclos de melhoramento ainda levam muitos anos e a avaliação detalhada de propriedades da madeira é limitada a apenas uma amostra das árvores em estágios avançados de seleção, devido aos altos custos de fenotipagem, não explorando assim toda a variação genética disponível. Neste estudo, examinamos quinze caracteres, incluindo crescimento e propriedades químicas e físicas da madeira, em 1000 indivíduos amostrados de uma população elite de melhoramento. Modelos de espectroscopia de infravermelho próximo (NIRS) foram desenvolvidos e utilizados para fenotipagem de alto desempenho de propriedades de madeira. Genotipagem de alta densidade com 29.090 SNPs foi utilizada para obter estimativas acuradas de componentes de variância, herdabilidades e correlações genéticas baseadas em uma matriz de parentesco realizado, ou seja,sem o uso de pedigree. Este é o primeiro estudo de que temos conhecimento a fazer isso em plantas. Predições NIRS foram precisas para caracteres químicos da madeira e densidade, e apresentaram sucesso variável para caracteres físicos. As herdabilidades foram médias para crescimento (0,34 a 0,44), altas para caracteres químicos de madeira (0,56 a 0,85) e variáveis para caracteres físicos da madeira (0,11 a 0,63). Altas correlações positivas entre caracteres de crescimento e negativas entre celulose e lignina foram observadas, enquanto correlações entre caracteres químicos e físicos da madeira foram baixas, porém significativas. Fenótipos e marcadores SNP foram em seguida utilizados na construção de modelos preditivos com a maior densidade de marcadores já utilizada em estudos de seleção genômica em espécies florestais (1 SNP/21 kpb). Dois modelos de predição (RR-BLUP e LASSO Bayesiano)foram usados nas predições genômicas e comparados ao BLUP fenotípico. Os modelos apresentaram capacidades preditivas similares, fortemente correlacionadas às herdabilidades. Predições genômicas precisas foram obtidas para caracteres relacionados à lignina, densidade e crescimento, embora geralmente 15 a 25% menores do que as predições obtidas por BLUP fenotípico. Contudo, predições genômicas alcançaram coincidências acima de 70% na seleção das melhores 30 árvores ranqueadas pela seleção fenotípica para crescimento, densidade e relação S:G, e de 60% quando seleção em tandem foi aplicada. Os resultados deste estudo abrem enormes oportunidades para o uso combinado de fenotipagem NIRS e genotipagem com SNPs no melhoramento do eucalipto, permitindo estimativas acuradas de parâmetros genéticos e a predição de valores genéticos genômicos para plantas jovens ainda não fenotipadas. Estas aplicações deverão se tornar rotineiras nos programas de melhoramento florestal nos próximos anos, reduzindo significativamente a duração dos ciclos de seleção e, consequentemente, otimizando a alocação de recursos e a sustentabilidade do melhoramento.
|
218 |
Identificação de polimorfismos em genes candidatos associados com características de desempenho, carcaça, desenvolvimento muscular e qualidade de carne em Gallus gallus / Identification of candidate genes polymorphisms in associated with of performance, carcass, muscular development and meat quality traits in Gallus gallusFelicio, Andrezza Maria 29 June 2012 (has links)
O Brasil se mantém na posição de maior exportador mundial de carne de frango, e o terceiro em produção, abaixo apenas dos Estados Unidos e da China. O grande avanço na produtividade avícola é devido principalmente ao melhoramento genético. As novas tecnologias na área da genômica animal podem oferecer ferramentas que auxiliam na seleção assistida por marcadores. O presente trabalho teve como objetivo identificar polimorfismos em seis genes (FGFBP1, FGFBP2, CAPN1, CAPN3, MyoG e MSTN) de uma população experimental, validá-los em uma população comercial e realizar a associação dos polimorfismos com características de interesse econômico na avicultura. Para a identificação de polimorfismos foram utilizadas 11 aves (F1) pertencentes à uma população experimental da Embrapa Suínos e Aves, e um polimorfismo de cada gene foi selecionado para a genotipagem em média de 180 animais da geração F2 da população experimental da Embrapa e 311 frangos de corte de uma população comercial através de sondas TaqMan®. SNP 2014G>A (FGFBP1) foi associado com peso eviscerado (PE), e os genótipos do SNP 651G>A (FGFBP2) foram associados com perdas de água por exsudação (EXSU) e teor de vermelho da carne (a*). O polimorfismo g.2554T>C (CAPN1) foi associado com peso vivo aos 35 a 42 dias, peso da coxa, peso do peito, peso da carcaça e luminosidade da carne. O SNP g.15486C>T (CAPN3) foi associado com rendimento da coxa, perdas de água por cozimento da carne e força de cisalhamento da carne. O polimorfismo g.2947A>G (MyoG) foi associado com porcentagem de proteína e cinzas na matéria mineral, porcentagem de cinzas na matéria seca, peso eviscerado, peso de pernas e peso à seleção aos 38 dias. Para o SNP g.324C>T (MSTN) foram observados associações com peso do fígado, conversão alimentar, peso ao abate e peso eviscerado. Os resultados obtidos neste trabalho permitem a indicação dos polimorfismos do tipo SNP, aqui apresentados, como marcadores moleculares, os quais são ferramentas importantes para programas de melhoramento avícola que objetivam seleção de animais geneticamente superiores para características de desempenho, carcaça, desenvolvimento muscular e qualidade de carne. / Brazil is the worlds largest chicken meat exporter, and the third in production, behind the United States and China. The great advance in productivity is due mainly to poultry breeding. New technologies in the field of animal genomics that have provided tools such as marker-assisted selection. This study aimed to identify polymorphisms in six genes (FGFBP1, FGFBP2, CAPN1, CAPN3, MyoG and MSTN) of an experimental population, validate them in a business population and perform the association of polymorphisms with traits of economic interest in poultry. To identify polymorphisms, we used 11 birds (F1) belonging to an experimental population of Embrapa Swine and Poultry, and a polymorphism of each gene was selected for genotyping on average of 180 chickens from an F2 experimental population from Embrapa and 311 broilers from a commercial population using TaqMan® probes. SNP 2014G>A (FGFBP1) was associated with gutted weight (GW), and the genotypes of SNP 651G>A (FGFBP2) were associated with water loss by exudation (EXSU) and meat red content (a*). Polymorphism g.2554T>C (CAPN1) was associated with body weight at 35 to 42 days, thigh weight, breast weight, carcass weight and meat lightness content. The SNP g.15486C>T (CAPN3) was associated with thigh performance, water losses by cooking the meat and meat shear force. Polymorphism g.2947A>G (MyoG) was associated with protein percentage and ash in the mineral matter, ash percentage in dry matter, gutted weight, leg weight and weight to selection for 38 days. The SNP g.324C>T (MSTN) showed associations with liver weight, feed conversion, slaughter weight and gutted weight. The results indicate that the type polymorphisms SNP shown here as molecular markers, which are important tools for breeding programs aimed at poultry selection of genetically superior animals for of performance, carcass, muscle development and meat quality traits.
|
219 |
Novel Bayesian networks for genomic prediction of developmental traits in biomass sorghum / Novas redes Bayesianas para predição genômica de caracteres de desenvolvimento em sorgo biomassaSantos, Jhonathan Pedroso Rigal dos 02 August 2019 (has links)
Sorghum (Sorghum bicolor L. Moench spp.) is a bioenergy crop with several appealing biological features to be explored in plant breeding for increasing efficiency in bioenergy production. The possibility to connect the influence of quantitative trait loci over time and between traits highlight the Bayesian networks as a powerful probabilistic framework to design novel genomic prediction models. In this study, we phenotyped a diverse panel of 869 sorghum lines in four different environments (2 locations in 2 years) with biweekly measurements from 30 days after planting (DAP) to 120 DAP for plant height and dry biomass at the end of the season. Genotyping-by-sequencing was performed, resulting in the scoring of 100,435 biallelic SNP markers. We developed and evaluated several genomic pre- diction models: Bayesian Network (BN), Pleiotropic Bayesian Network (PBN), and Dynamic Bayesian Network (DBN). Assumptions for BN, PBN, and DBN were independence, dependence between traits, and dependence between time points, respectively. For benchmarking, we used multivariate GBLUP models that considered only time points for plant height (MTi- GBLUP), and both time points for plant height and dry biomass (MTr-GBLUP) modeling unstructured variance-covariance matrix for genetic effects and residuals. Coincidence indices (CI) were computed for understanding the success in selecting for dry biomass using plant height measurements, as well as a coincidence index based on lines (CIL) using the posterior draws from the Bayesian networks to understand genetic plasticity over time. In the 5-fold cross-validation scheme, prediction accuracies ranged from 0.48 (PBN) to 0.51 (MTr- GBLUP) for dry biomass and from 0.47 (DBN-DAP120) to 0.74 (MTi-GBLUP-DAP60) for plant height. The forward-chaining cross-validation showed a substantial increment in prediction accuracies when using the DBN model, with r = 0.6 (train on slice 30:45 to predict 120 DAP) to 0.94 (train on slice 30:90 to predict 105 DAP) compared to the BN and PBN, and similar to multivariate GBLUP models. Both the CI and CIL indices showed that the ranking of promising inbred lines changed minimally after 45 DAP for plant height. These results suggest that 45 DAP is an optimal developmental stage for imposing the two-level indirect selection framework, where indirect selection for plant height at the end of the season (first-level target trait) can be done based on its ranking with 45 DAP (secondary trait) as well as for dry biomass (second-level target trait). With the advance of robotic technologies for field-based phenotyping, the development of novel approaches such as the two-level indirect selection framework will be imperative to boost genetic gain per unit of time. / O sorgo (Sorghum bicolor L. Moench spp.) é uma cultura bioenergética com várias características atrativas para serem exploradas no melhoramento de plantas para aumentar a eficiência de produção de bioenergia. A possibilidade de conectar informações genômicas em caracteres quantitativos ao longo do tempo, e entre caracteres, destacam as Redes Bayesianas como uma ferramenta probabilística poderosa para delinear novos modelos de predição genômica. Neste estudo, um painel diverso de 869 linhagens de sorgo foi fenotipado em quatro ambientes diferentes (2 locais em 2 anos) com medidas a cada duas semanas de 30 a 120 dias após o plantio (DAP), para altura de plantas e biomassa seca no fim da safra. Um procedimento de Genotipagem por sequenciamento foi executado, resultando na chamada de 100.435 marcadores baseados em Polimorfismos de Nucleotídeos Únicos (SNPs) bialélicos. Neste estudo foram desenvolvidos e avaliados os modelos de predição genômica: Rede Bayesiana (BN), Rede Bayesiana Pleiotrópica (PBN), e Rede Bayesiana Dinâmica (DBN). Os pressupostos para BN, PBN, e DBN foram independência, dependência entre caracteres, e dependência entre pontos no tempo, respectivamente. Para fins comparativos, formulações de modelos multivariados GBLUP foram utilizados considerando dependência entre pontos de tempo para altura de plantas (MTi-GBLUP), e ambos os pontos de tempo para a altura de plantas e biomassa seca (MTr-GBLUP), modelando matriz de variância-covariância não estruturada para efeitos genéticos e residuais. Índices de coincidência (IC) foram calculados para entender o sucesso na seleção indireta de biomassa seca usando medidas de altura de plantas, bem como um índice de coincidência baseado em linhagens (CIL), usando as amostras das posteriores das redes Bayesianas para entender a plasticidade genética ao longo do tempo. No esquema de validação cruzada 5-fold, as acurácias das predições variaram de 0,48 (PBN) a 0,51 (MTr-GBLUP) para biomassa seca e de 0,47 (DBN-DAP120) a 0,74 (MTi-GBLUP-DAP60) para altura de plantas. A validação cruzada forward-chaining mostrou um incremento substancial nas acurácias das predições ao usar o modelo DBN, com r = 0,6 (treinando no intervalo 30:45 para prever 120 DAP) até 0,94 (treinando no intervalo 30:90 para prever 105 DAP) em comparação com o BN e PBN, e semelhante aos modelos multivariados GBLUP. Os índices CI e CIL mostraram que o ranking de linhagens promissoras mudou minimamente após 45 DAP para altura de plantas. Estes resultados sugerem que 45 DAP é um estágio de desenvolvimento ideal para impor a estrutura de seleção indireta em dois níveis, onde a seleção indireta para a altura da planta no final da estação (caractere alvo de primeiro nível) pode ser feita com base na sua classificação com 45 DAP (caractere secundário), bem como para a biomassa seca (caractere alvo de segundo nível). Com o avanço das tecnologias robóticas para a fenotipagem baseada em campo, o desenvolvimento de novas abordagens, como a estrutura de seleção indireta em dois níveis, serão imperativas para aumentar o ganho genético por unidade de tempo.
|
220 |
Genômica organelar e evolução de Genlisea e Utricularia (lentibulariaceae)Silva, Saura Rodrigues da. January 2018 (has links)
Orientador: Vitor Fernandes Oliveira de Miranda / Resumo: Utricularia e Genlisea são gêneros irmãos de plantas carnívoras da família Lentibulariaceae. Possuem aproximadamente 260 espécies representadas em diversas formas de vida. Para o Brasil foram catalogadas 82 espécies, das quais 27 são consideradas endêmicas. Além de dispor das armadilhas carnívoras mais complexas entre plantas, algumas de suas espécies apresentam os menores genomas e as maiores taxas de mutações entre as angiospermas relatadas até o momento. A respeito de seus genomas organelares, os estudos são pífios. Neste contexto, há a necessidade de se investigar como são os genomas organelares, suas estruturas, seus genes e como se deu a evolução das organelas nos gêneros. Portanto este estudo teve como objetivo, a partir de sequenciamento de nova geração e montagem de genomas, estudar e comparar os genomas organelares de Utricularia e Genlisea. Neste âmbito, foram montados e sequenciados os cloroplastos das espécies Utricularia foliosa, U. reniformis, G. aurea, G. filiformis, G. pygmaea, G. repens e G. tuberosa, e o genoma mitocondrial de U. reniformis. Os resultados obtidos revelaram que possivelmente há relação entre forma de vida e presença de genes ndhs nos gêneros, em razão de que para as espécies terrestres há deleção e “pseudogenização” de genes ndhs, já as espécies aquáticas detêm todo repertório de ndhs intacto. A partir das evidências encontradas, foi possível constatar transferência horizontal de genes, inclusive de genes ndhs, em mitocôndrias. / Abstract: Utricularia and Genlisea are sister genera in the carnivorous family Lentibulariaceae. There are aprproximately 260 species representing diverse life forms. For Brasil there are 82 species, 27 considered endemic. At the moment, besides having the most complex carnivorous traps between all plants, some of its species have miniature genomes and the highest mutational rates among angiosperms. There are few studies regarding its organellar genome. In this context, it is necessary to investigate how are these organellar genomes, its structure, genes, and how evolutionary forces govern these organelles in the different genera. Therefore, the aim of this study is to study and compare the organellar genomes of Utricularia and Genlisea, using next generation sequencing and genome assembly. In this context, chloroplasts of the species Utricularia foliosa, U. reniformis, Genlisea aurea, G. filiformis, G. pygmaea, G. repens and G. tuberosa, and the mitochondrial genome of U. reniformis were assembled and sequenced. The results show that possibly there is a connection between life form and the presence of ndhs genes in the genera, since for the terrestrial species there are ndhs genes that are deleted and pseudogenization, in contrary to the aquatic species which have all intact ndhs repertoir. Concerning the evidences, it was possible to verify horizontal transfer of ndhs and other genes as there are chloroplasts genes in the mitochondria. / Doutor
|
Page generated in 0.0604 seconds