• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 407
  • 55
  • 3
  • 3
  • 3
  • 3
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 466
  • 179
  • 130
  • 93
  • 72
  • 65
  • 61
  • 50
  • 46
  • 45
  • 45
  • 44
  • 43
  • 43
  • 39
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
221

Estudo de associação genômica e perfil de expressão gênica de folículos antrais em novilhas das raças nelore e angus, associadas ao fenótipo de alta e baixa população folicular / Genomic association and gene expression profile in antral follicles from nelore and angus heifers associated with the high and low follicle count phenotype

Favoreto, Maurício Gomes [UNESP] 27 February 2015 (has links) (PDF)
Made available in DSpace on 2016-05-17T16:51:06Z (GMT). No. of bitstreams: 0 Previous issue date: 2015-02-27. Added 1 bitstream(s) on 2016-05-17T16:54:36Z : No. of bitstreams: 1 000863483.pdf: 1230854 bytes, checksum: 5f969e218afa238395f61e6225eb65c2 (MD5) / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / Animais com alta população folicular (APF) antral possuem melhor desempenho reprodutivo quando comparados a animais de baixa população folicular (BPF). Essa variação no número de folículos antrais pode estar associada a diferentes perfis hormonais e de expressão de genes reguladores da ativação e crescimento folicular. Objetivou-se com o presente trabalho: 1) avaliar o perfil global de expressão gênica de folículos antrais em animais com APF e BPF nas raças Nelore (Bos indicus) e Aberdeen Angus (Bos taurus) e 2) identificar diferenças genotípicas através de um estudo de associação genômica (GWAS - Genome Wide Association Study) usando polimorfismos de nucleotídeo de sítio único (SNPs). Inicialmente foram avaliadas 155 novilhas da raça Nelore e 132 da raça Angus com idade e peso semelhantes. Os animais foram sincronizados e a contagem dos folículos realizada através de ultrassonografia 24 a 48 horas após o início do estro. Os grupos APF e BPF foram formados com base na média do número de folículos ± desvio padrão nas duas raças. Para avaliar o perfil global de expressão gênica usou-se a técnica do microarranjo. Um total de 15 novilhas Nelore (6 APF e 9 BPF) e 17 novilhas Angus (9 APF e 8 BPF) foram abatidas 12 a 24 horas após a ovulação e os ovários transportados ao laboratório. Foi realizado um pool de RNA extraído de três folículos (≤ 4 mm) individualmente (um pool por animal) dissecados do ovário. A análise dos dados procedeu-se no FlexArray 1.6.1.1 e os genes com fold change > 1,5 e P ≤ 0,05 foram considerados diferencialmente expressos. Para o estudo de GWAS 72 novilhas da raça Nelore (32 APF e 40 BPF) e 48 da raça Angus (21APF e 27 BPF) foram selecionadas. O DNA foi extraído do sangue e/ou bulbo capilar e a genotipagem foi realizada com o chip 777 HD bovine Illumina®. Os SNPs foram submetidos ao controle de qualidade usando como critérios de exclusão: call rate (IDCR) ≤ 90%,... / Animals with high antral follicle count (HFC) have a better reproductive performance when compared with animals with low follicle count (LFC). This variation in the number of antral follicles can be associated with different hormonal profiles and expression of genes regulating activation and follicular growth. The objective of the present work was: 1) to evaluate the global gene expression of antral follicles in animals with HFC and LFC in Nelore (Bos indicus) and Aberdeen Angus (Bos taurus) heifers and 2) to identify genotypic differences through a genomic wide association study (GWAS) using single nucleotide polymorphisms (SNP). Initially, 155 Nelore heifers and 132 Angus heifers with similar body weight and age were selected. The animals were synchronized and follicle count was done through ultrasound 24 to 48 h after estrus. The groups LFC and HFC were formed using the average of follicles ± standard deviation in both breeds. To evaluate the global gene expression profile we use a microarray chip. A total of 15 Nelore heifers (6 HFC and 9 LFC) and 17 Angus heifers (9 HFC and 8 LFC) were slaughter 12 to 24 h after ovulation and ovaries were transported to the laboratory. A pool of RNA from three follicles (< 4 mm) from each animal was used to the analysis using FlexArray 1.6.1.1 and the genes with fold change > 1.5 and P ≤ 0.05 were considered differentially expressed. For the GWAS study 72 Nelore heifers (32 HFC and 40 LFC) and 48 Angus heifers (21 HFC and 27 LFC) were selected. The DNA was extracted from blood and hair bulb and genotyping was done using the 777 HD Illumina chip. The SNPs were submitted to a quality control test using an exclusion criteria: call rate (IDCR) ≤ 90%, MAF ≤ 0.02, call rate (SNPCR) ≤ 0.98 and HWE ≤ 1 x 10-5. After the quality control test the SNPs were submitted to the Cochran-Armitage test to the association of phenotype/genotype in both breeds. The genes differentially expressed and the genes ... / FAPESP: 11/17370-0
222

Métodos de redução de dimensionalidade aplicados na seleção genômica para características de carcaça em suínos / Dimensionality reduction methods applied to genomic selection for carcass traits in pigs

Azevedo, Camila Ferreira 26 July 2012 (has links)
Made available in DSpace on 2015-03-26T13:32:15Z (GMT). No. of bitstreams: 1 texto completo.pdf: 1216352 bytes, checksum: 3e5fbc09a6f684ddf7dbb4442657ce1f (MD5) Previous issue date: 2012-07-26 / The main contribution of molecular genetics is the direct use of DNA information to identify genetically superior individuals. Under this approach, genome-wide selection (GWS) can be used with this purpose. GWS consists in analyzing of a large number of SNP markers widely distributed in the genome, and due to the fact that the number of markers is much larger than the number of genotyped individuals (high dimensionality) and also to the fact that such markers are highly correlated (multicollinearity). However, the use of methodologies that address the adversities is fundamental to the success of genome wide selection. In view of, the aim of this dissertation was to propose the application of Independent Component Regression (ICR), Principal Component Regression (PCR), Partial Least Squares (PLS) and Random Regression Best Linear Unbiased Predictor, whereas carcass traits in an F2 population of pigs originated from the cross of two males from the naturalized Brazilian breed Piau with 18 females of a commercial line (Large White × Landrace × Pietrain), developed at the University Federal of Viçosa. The specific objectives were, to estimate Genomic Breeding Value (GBV) for each individual and estimate the effects of SNP markers in order to compare methods. The results showed that ICR method is more efficient, since provided most accurate genomic breeding values estimates for most carcass traits. / A principal contribuição da genética molecular no melhoramento animal é a utilização direta das informações de DNA no processo de identificação de animais geneticamente superiores. Sob esse enfoque, a seleção genômica ampla (Genome Wide Selection GWS), a qual consiste na análise de um grande número de marcadores SNPs (Single Nucleotide Polymorphisms) amplamente distribuídos no genoma, foi idealizada. A utilização dessas informações é um desafio, uma vez que o número de marcadores é muito maior que o número de animais genotipados (alta dimensionalidade) e tais marcadores são altamente correlacionados (multicolinearidade). No entanto, o sucesso da seleção genômica ampla deve-se a escolha de metodologias que contemplem essas adversidades. Diante do exposto, o presente trabalho teve por objetivo propor a aplicação dos métodos de regressão via Componentes Independentes (Independent Component Regression ICR), regressão via componentes principais (Principal Component Regression PCR), regressão via Quadrados Mínimos Parciais (Partial Least Squares PLSR) e RR-BLUP, considerando características de carcaça em uma população F2 de suínos proveniente do cruzamento de dois varrões da raça naturalizada brasileira Piau com 18 fêmeas de linhagem comercial (Landrace × Large White × Pietrain), desenvolvida na Universidade Federal de Viçosa. Os objetivos específicos foram estimar Valores Genéticos Genômicos (Genomic Breeding Values GBV) para cada indivíduo avaliado e estimar efeitos de marcadores SNPs, visando a comparação dos métodos. Os resultados indicaram que o método ICR se mostrou mais eficiente, uma vez que este proporcionou maiores valores de acurácia na estimação do GBV para a maioria das características de carcaça.
223

Identificação de regiões com variações no número de cópias dos segmentos de DNA em bovinos de leite /

Chud, Tatiane Cristina Seleguim. January 2018 (has links)
Orientador: Danísio Prado Munari / Coorientador: Marcos Vinícius Gualberto Barbosa da Silva / Coorientador: Fernando Sebastian Baldi Rey / Banca: Humberto Tonhati / Banca: Adriana Santana do Carmo / Banca: Daniel Guariz Pinheiro / Banca: Marcos Eli Buzanskas / Resumo: Com o avanço das tecnologias genômicas, permitiu-se detectar no genoma de humanos e animais domésticos elevado número de variações estruturais cromossômicas, como variação no número de cópias (CNV). No melhoramento genético de animais domésticos, CNVs podem auxiliar no entendimento da variabilidade genética de características de importância econômica, pois a maioria dessas regiões influenciam a expressão de genes com funções biológicas específicas. Com a finalidade de verificar possíveis relações de CNVs com características de sanidade, reprodutivas e produtivas em rebanhos leiteiros, o objetivo deste trabalho foi detectar e caracterizar CNVs em bovinos da raça composta Girolando (Gir X Holandês), identificar CNVs específicas em animais Girolando oriundas de animais da raça Gir e Holandês e investigar a diferenciação populacional entre as três raças por meio da variação no número de cópias nas regiões próximas aos genes anotados no genoma bovino. Para detecção das CNVs por meio dos dados de painel de polimorfismo de nucleotídeo único (SNP), no capítulo 2, foram utilizados registros de 1.607 vacas genotipadas com painel de SNP de média densidade (50K SNP) e de 280 touros genotipados com painel de alta densidade (HD SNP). A detecção foi realizada por meio do modelo oculto de Markov implementado pelo programa PennCNV. Foram utilizados dois touros ressequenciados para identificação das CNVs pelo método "read -depth" por meio dos dados de sequenciamento de nova-geração (NGS). Um t... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: The advances of the genomic technologies has enabled to identify a high number of chromosomal structural variations in human and domestic animal genomes, such as copy number variation (CNV). In animal breeding, CNVs may assist to understand genetic variability of the economic important traits due most of the CNVs influence gene expression with specific biological functions. To identify possible CNVs linked to health, reproductive and productive traits in dairy cattle, the objective of this work was to detect and to describe CNVs in Girolando cattle (Gir x Holstein), to identify breed-specific CNV regions in Girolando from Gir and Holstein, and to investigate the population differentiation among the breeds using the copy number located on regions within annotated genes. In chapter 2, the CNV detection using single-nucleotidepolymorphism (SNP) panel was carried out on 1.607 females genotyped with the medium-density SNP panel (50K SNP) and 280 bulls genotyped with high-density panel (HD SNP) using Hidden Markov model implemented by PennCNV software. CNV calling also was perform using read-depth method applied on next-generation sequencing (NGS) data from two bulls resenquenced. A total of 203 and 213 CNVs candidate's regions were picked using 50K e HD panels, respectively. Deletions and duplications related to parasite resistance, to disease susceptibility, and to reproductive efficiency was observed mainly located on chromosome BTA 5 and BTA 17. The detection and characterizati... (Complete abstract click electronic access below) / Doutor
224

Epidemiologia Genômica de Vibrio cholerae da Epidemia de Cólera na América Latina / Genomic Epidemiology of the Vibrio cholerae from the Latin American Cholera Epidemic

Marin, Michel Francisco Abanto January 2013 (has links)
Submitted by Alessandra Portugal (alessandradf@ioc.fiocruz.br) on 2013-09-24T18:59:28Z No. of bitstreams: 1 MIchel Francisco Abanto Marin_Tese.pdf: 17075383 bytes, checksum: 82ec8815a4daba1b96b41d8a1b92b852 (MD5) / Made available in DSpace on 2013-09-24T18:59:28Z (GMT). No. of bitstreams: 1 MIchel Francisco Abanto Marin_Tese.pdf: 17075383 bytes, checksum: 82ec8815a4daba1b96b41d8a1b92b852 (MD5) Previous issue date: 2013 / Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Vice Direção de Ensino, Informação e Comunicação. Rio de Janeiro, RJ, Brasil. / Vibrio cholerae é o agente causal da cólera, uma infecção ancestral, epidêmica e pandêmica, que é um dos principais problemas de saúde pública no mundo. A humanidade já passou por, pelo menos, seis pandemias de cólera e, atualmente, vive no contexto da sétima pandemia. V. cholerae é classificado em mais de 200 sorogrupos e alguns biotipos. Linhagens de V. cholerae O1 do biotipo clássico e do biotipo El Tor estão relacionadas à sexta (1899–1923) e à sétima (1960 -….) pandemias de cólera, respectivamente. A sétima pandemia chegou à América Latina em 1991 sendo que, inicialmente, sua origem foi relacionada ao Sudoeste Asiático, região endêmica e epidêmica de cólera. Uma segunda hipótese sugere uma origem ambiental local. A partir do início deste século, a epidemia se extinguiu, restando apenas eventuais relatos de casos isolados. Sob a ótica da genética e genômica do V. cholerae, estudamos a linhagem da epidemia da América Latina (AL). Nossos objetivos eram inferir sua origem e identificar marcadores genômicos que possibilitassem seu monitoramento. Utilizamos informações obtidas in vitro e in silico para estabelecer relações genéticas entre isolados de V. cholerae de antes, durante e depois da epidemia que atingiu a América Latina. Analisamos regiões do genoma core e do genoma acessório. Realizamos análises de genômica comparativa com informação de 355 V. cholerae, clínicos e ambientais, de diferentes anos e regiões geográficas. Com base em três genes do genoma core, nossos resultados mostram que a linhagem da epidemia da AL pertence ao clado El Tor, e por sua vez, os genótipos dos principais determinantes de virulência ctxB e tcpA, (genoma acessório), os agrupa com isolados do início da sétima pandemia, incluindo o canônico N16961. As análises genômicas e filogenéticas revelaram a presença de um profago (WASA1) e de uma variante exclusiva da ilha genômica VSP-II. A VSP-II da linhagem da AL é caracterizada por seu gene da integrase e uma inserção de 7 Kb, que contém três genes putativos. Curiosamente, os dois marcadores, que fazem parte do genoma acessório desta linhagem, WASA1 e VSP-II, apresentam relação de similaridade com elementos genéticos identificados em Vibrio vulnificus/Vibrio parahaemolyticus e Vibrio vulnificus/V. cholerae do ambiente, respectivamente. Estes marcadores seriam, portanto, uma fração do mobiloma que evoluiu e se fixou na linhagem de V. cholerae da epidemia da América Latina. / Vibrio cholerae is the causative agent of cholera, an ancestral, epidemic and pandemic infection, which is a major public health concern worldwide. Mankind has gone through at least six cholera pandemics and currently lives in the context of the seventh pandemic. V. cholerae is classified into more than 200 serogroups and some biotypes. V. cholerae O1 classical and El Tor biotype are related to the sixth (1899 to 1923) and seventh (1960 - ....) cholera pandemics, respectively. The seventh pandemic reached Latin America (LA) in 1991 and its origin was related, immediately, to Southwest Asia, where cholera is endemic and epidemic. A second hypothesis emerged suggesting a regional environmental origin. Since the beginning of this century, the LA epidemic ended, occurring only occasional case reports. Here, we studied, from the perspective of V. cholerae genetics and genomics, the lineage of the LA cholera epidemic. Our objectives were to infer their origin and identify genomic markers that would enable its monitoring. In order to establish the genetic relationships among V. cholerae strains isolated before, during and after the epidemic in Latin America, we used in vitro and in silico approaches. Comparative analyzes, targeting the core and accessory genome of 355 clinical and environmental V. cholerae strains, from different years and geographical regions, were performed. MLSA (multi locus sequence analysis), based on three genes of the core genome, revealed that the LA epidemic lineage belongs to the El Tor clade. Additionally, the genotypes of the major virulence determinants, ctxB and tcpA (accessory genome), show that the LA lineage is related with strains from the beginning of the seventh pandemic, including the canonical N16961. Considering this large set of genomes, we confirm the prophage WASA1 as a LA lineage marker. The LA lineage is also characterized by an unique VSP-II genomic island. The VSP-II AL harbors a particular integrase gene and a 7.0 kb insert which contains three putative genes. Interestingly, the two LA markers, WASA1 and VSP-II, which are part of its accessory genome, have similarity with genetic elements identified in Vibrio vulnificus / Vibrio parahaemolyticus and V. vulnificus / environmental V. cholerae, respectively. Therefore, these two elements are a fraction of the V. cholerae mobilome that evolved and fixed in the LA lineage.
225

Aplicação de técnicas de validação estatística e biológica em agrupamento de dados de expressão gênica / Daniele Yumi Sunaga ; orientador, Júlio Cesar Nievola

Sunaga, Daniele Yumi January 2006 (has links)
Dissertação (mestrado) - Pontifícia Universidade Católica do Paraná, Curitiba, 2006 / Inclui bibliografia / O crescimento exponencial dos dados de expressão gênica provenientes da tecnologia de microarranjo de DNA é acompanhado pelo aumento da necessidade de ferramentas computacionais eficientes que auxiliem o processo de análise e interpretação desses dados. T
226

Caracterização de seqüências expressas do genoma café potencialmente relacionadas com a resistência a doenças / Caracterization of expressed sequences from coffee genome potentially related with the resistance to diseases

Alvarenga, Samuel Mazzinghy 16 July 2007 (has links)
Made available in DSpace on 2015-03-26T13:42:37Z (GMT). No. of bitstreams: 1 texto completo.pdf: 1133771 bytes, checksum: 640defa7d0749c719bdf5d760421654a (MD5) Previous issue date: 2007-07-16 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Sequences potentially involved with the coffee resistance were identified, by in silico analyses, using information generated by the Projeto Brasileiro do Genoma Café (PBGC). For that, three strategies were used. Initially, keywords related to the plants resistance mechanism to pathogens were searched in scientific literature and used as drivers for data mining. Using the available tools at the PBGC bioinformatics platform, ESTs (Expressed Sequence Tags) related to each one of these words were identified. The search for similarities between some published sequences and sequences from the PBGC, by using the BLAST program was another strategy. The Electronic Northern, a tool developed by the Laboratório de Genômica e Expressão (LGE), was also used. Those strategies allowed the identification of 14,060 sequences of the PBGC. These sequences were similar to proteins known to be related to de plant disease defense process, for instance chitinase, kinase protein, cytochrome P450, disease resistance protein, pathogenesis related protein, LRR and NBS proteins, hypersensibility induced protein among others. The biological processes with witch these sequences are involved included metabolism, transport, transcription regulation, protein folding, biosynthesis and others. The ontology-based global analysis for molecular function showed that the genes are involved with metabolism, external stimulus response, cellular differentiation, nucleic acid binding, nucleotide binding, defense response, apoptosis and others. Aiming to verify the involvement of these sequences with the coffee tree resistance to leaf rust, 40 primers were designed to amplify the mined sequences. The primers were synthesized using the computational program Primer3 and their stability was tested by the program PrimerSelect. Different PCR conditions were tested. Using optimized reaction and amplification conditions, those 40 primers were tested in 12 resistant and 12 susceptible genotypes to Hemileia vastatrix, fungus that causes coffee leaf rust. Twenty nine of those resulted in unique and sharp bands, and only one of these was polymorphic. The 40 primers permitted to find one molecular marker polymorphic between the resistant and susceptible genotypes. This marker amplifies a region of the DNA which corresponds to a Coffea Arabica ORF for disease resistance protein. / Seqüências potencialmente envolvidas na resistência do cafeeiro a doenças foram identificadas, por meio de análise in silico, a partir das informações geradas pelo Projeto Brasileiro do Genoma Café (PBGC). Para isso foram usadas três estratégias. Inicialmente, palavras-chave correspondentes a termos relacionados aos mecanismos de resistência de plantas a patógenos foram identificadas na literatura e utilizadas como iscas para a mineração dos dados. Com o auxílio de ferramentas disponíveis na plataforma de bioinformática do PBGC, foram identificadas ESTs (Expressed Sequence Tags) relacionadas a cada uma destas palavras. Outra estratégia utilizada foi a busca por similaridades entre algumas seqüências públicas envolvidas com a resistência do cafeeiro a doenças com as seqüências do PBGC, por meio do programa BLAST. Utilizou-se, também, o Electronic Northern, uma ferramenta desenvolvida pelo Laboratório de Genômica e Expressão (LGE). A mineração, usando as três estratégias, identificou 14.060 seqüências do PBGC. Essas seqüências apresentaram similaridade com proteínas conhecidamente relacionadas com o processo de defesa da planta contra doenças como, por exemplo, quitinase, proteína quinase, citocromo P450, proteína de resistência a doenças, proteína relacionada com patogênese, proteínas com domínio LRR e NBS, proteínas induzidas por hipersensibilidade, entre outras. Os processos biológicos com os quais essas seqüências estão envolvidas incluíram metabolismo, transporte, regulação da transcrição, enovelamento de proteínas, biossíntese entre outros. A análise global baseada em ontologia de função molecular das seqüências obtidas mostrou que os genes estão envolvidos com metabolismo, resposta a estímulos externos, diferenciação celular, ligação a ácidos nucléicos, ligação a nucleotídeos, resposta de defesa, apoptose entre outras. Visando verificar o envolvimento destas seqüências com a resistência do cafeeiro à ferrugem foram desenhados 40 primers para amplificar algumas das seqüências mineradas. Os primers foram desenhados com o programa computacional Primer3 e a estabilidade desses foi verificada por meio do programa PrimerSelect. Diferentes concentrações dos componentes da reação de PCR foram analisadas. Utilizando as condições de reação e amplificação otimizadas, os 40 primers foram testados em 12 genótipos resistentes e 12 susceptíveis a Hemileia vastatrix, fungo causador da ferrugem. Vinte e nove destes 40 primers resultaram em bandas únicas e bem definidas, sendo um polimórfico. Este trabalho permitiu obter, até o momento, um marcador molecular polimórfico entre os indivíduos resistentes e susceptíveis. Esse marcador, denominado CARF 005, amplifica uma região do DNA que corresponde a uma ORF parcial de Coffea arabica que codifica uma proteína de resistência a doenças.
227

Seleção genômica em diferentes estruturas populacionais no melhoramento vegetal / Genomic selection in different population structures in plant breeding

Valente, Mágno Sávio Ferreira 13 March 2014 (has links)
Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2015-12-02T08:26:01Z No. of bitstreams: 1 texto completo.pdf: 633408 bytes, checksum: ef63b5983b6ac3dabc7684d97112ecee (MD5) / Made available in DSpace on 2015-12-02T08:26:01Z (GMT). No. of bitstreams: 1 texto completo.pdf: 633408 bytes, checksum: ef63b5983b6ac3dabc7684d97112ecee (MD5) Previous issue date: 2014-03-13 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / A seleção genômica pode modificar significativamente a forma como é feita a seleção nos programas de melhoramento, aumentando a acurácia do processo seletivo e os ganhos por unidade de tempo. A eficiência da seleção genômica pode ser avaliada por meio da confiabilidade do valor genético (GBV) estimado por modelos de predição em comparação ao valor genético real do indivíduo. Embora a maioria dos estudos sobre a eficiência da seleção genômica considerar em seus modelos de análise apenas uma população e suas gerações, o pesquisador pode estar interessado em selecionar indivíduos de outras subestruturas da população de referência ou até mesmo de outras populações em que o desequilíbrio de ligação (LD) entre marcador e QTL pode ser diferente. No entanto, a obtenção dos GBVs em um contexto de utilização de múltiplas populações ou amostras pode não ser vantajosa, sendo necessário avaliar a perda de acurácia com a estimação e avaliação dos efeitos dos marcadores em diferentes cenários. Embora o conceito de seleção genômica dependa do LD entre QTL e marcadores, a confiabilidade do valor genético pode ser fortemente influenciada por diversos outros fatores e assim, não apresentar reais vantagens, por exemplo, em relação à seleção fenotípica. Para investigar isso, foram simuladas populações de milho pipoca com diferentes padrões de LD e variância genética. Foram considerados dois caracteres (produção de grãos e capacidade de expansão) determinados por 100 QTLs de mesmo efeito (10 QTLs por grupo de ligação), três densidades de SNPs (um SNP a cada 0,1, 1 e 10cM), duas herdabilidades (0,3 e 0,7) e seis populações representadas na geração 0 e considerando 5 gerações de acasalamento ao acaso, totalizando 144 cenários. Para cada cenário, 30 simulações foram realizadas e 500 plantas foram genotipadas. Em cenário adicional, a fim de avaliar o efeito das relações de parentesco na eficiência da seleção genômica, foram simuladas populações estruturadas em família S1 (FS1), famílias de meios irmãos (FMI), famílias de irmãos completos (FMI) e em população de polinização aberta (OP). A acurácia de predição dos GBVs foi obtida pela correlação entre os valores genéticos paramétricos e os valores genéticos estimados por RR-BLUP. Como resultados, verificamos que a eficiência da seleção genômica em relação à seleção fenotípica é inversamente proporcional a herdabilidade e que para populações com maior LD, menores densidades de marcadores (1SNP/cM) podem ser usadas sem afetar drasticamente a acurácia de predição. No entanto, ao considerar populações de baixo LD e menor variância genética, o uso de maiores densidades de SNP (1SNP/0,1cM) seria necessária a fim de obter acurácia do valor genético maior que 0,55 e 0,70 em herdabilidade de 0,3 e 0,7, respectivamente. Nossos resultados também evidenciaram a necessidade de grande parte dos alelos presentes na população de seleção estejam representados na população de referência. Assim, os modelos de predição do GBV não podem ser usados em populações que apenas possuem estruturas genéticas similares à população onde os efeitos dos marcadores foram estimados, pois a acurácia do GBV tendeu a zero nestes casos. Alem disso, quando diferentes amostras de uma mesma população foram usadas como população de referência e de seleção, houve redução de pelo menos 8 % de acurácia ao considerar a população de seleção em mesma geração da população de referência e redução de no mínimo 22% considerando distanciamento de 5 gerações de acasalamento ao acaso. A estruturação dos indivíduos em famílias de maior relacionamento resultou em maior eficiência da seleção genômica, assim como, um menor tamanho efetivo entre as populações teve impacto positivo sobre os valores de acurácia. Neste caso, a acurácia dos valores genéticos estimados em FS1, para capacidade de expansão em herdabilidade 0,3, foi superior em aproximadamente 15, 30 e 50% em relação à acurácia obtida para FIC, FMI e OP, respectivamente. / Genomic selection can change significantly the way in which the selection is made in breeding programs, by increasing the selective accuracy and earns per unit time. The efficiency of genomic selection can be evaluated through the reliability of the genomic breeding values (GBVs) estimated by prediction models compared to the true breeding values of the individuals. Although most studies about the efficiency of genomic selection consider in the analyses only models with one population and its generations, the researcher may be often interested in individuals from other substructures of the reference population, or even from other populations in which the linkage disequilibrium (LD) between marker and QTL may be different. However, the GBVs prediction in a context of using multiple populations or samples may not be advantageous, being necessary to calculate the decrease in accuracy with estimation and evaluation of the marker effects in different scenarios. Although the concept of genomic selection depends on LD between markers and QTL, the reliability of the breeding value can be strongly influenced by many other factors and thus, do not present real advantage in relation to phenotypic selection, for example. Aiming to investigate these facts, popcorn populations with different patterns of LD and genetic variances were simulated. The dataset refers to grain yield and expansion volume, both controlled by 100 QTLs with the same effect (10 QTLs on each linkage group), three SNP densities (one SNP each 0.1, 1, and 10 cM), two heritabilities (0.3 and 0.7) and six populations represented in generation 0 and considering 5 generations of random mating, totaling 144 scenarios. For each scenario, 30 simulations were carried out and 500 plants were genotyped. To evaluate the effect of family relationships on the efficiency of genomic selection, populations structured in S1, half-sib (HSF), full-sib families (FSF) and open-pollinated (OP) populations were simulated as an additional scenario. The prediction accuracy of the GBVs was obtained through the correlation between the true breeding values and breeding values predicted by RR-BLUP. The results showed that the efficiency of genomic selection in relation to phenotypic selection is inversely proportional to the heritability and low marker densities (1SNP/cM) can be used without affect drastically the prediction accuracy for populations with high LD. However, high SNP density (1SNP/0.1cM) would be required to obtain prediction accuracy greater than 0.55 and 0.70, for the heritabilities of 0.3 and 0.7, respectively, in populations with low LD and genetic variance. Our results also showed that, most of the alleles present in the population under selection must be represented in the reference population. Thus, the prediction model of the GBVs cannot be used in populations who have only similar genetic structures in relation to the population where the marker effects were estimated, because the GBV accuracy tends to zero in these cases. Furthermore, when different samples of the same population were used both as reference and selection populations, there was at least 8% reduction in accuracy when compared to considering the selection population in the same generation of the reference population and, a minimum 22% reduction when considering an interval of five generations of random mating. Individuals structured in families with greater relationship resulted in greater efficiency of genomic selection, as well as, a lower effective size, and had a positive impact on the accuracy. In this case, the prediction accuracy using S1 families was approximately 15, 30 and 50% higher for expansion volume in heritability of 0.3, when compared to the accuracy obtained for FSF, HSP and OP populations, respectively.
228

Assessment of genome-wide prediction by using Bayesian regularized neural networks / Avaliação de predições genômicas utilizando redes neurais com regularização Bayesiana

Glória, Leonardo Siqueira 25 May 2015 (has links)
Submitted by Amauri Alves (amauri.alves@ufv.br) on 2015-12-02T16:52:21Z No. of bitstreams: 1 texto completo.pdf: 4119749 bytes, checksum: abab366057d5b5d02a6202d32f277b7c (MD5) / Made available in DSpace on 2015-12-02T16:52:21Z (GMT). No. of bitstreams: 1 texto completo.pdf: 4119749 bytes, checksum: abab366057d5b5d02a6202d32f277b7c (MD5) Previous issue date: 2015-05-25 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Recentemente, há um aumento de interesse na utilização de métodos não paramétricos, tais como redes neurais artificiais (RNA), na área de seleção genômica ampla (SGA). Uma classe especial de RNA é aquela com regularização Bayesiana, a qual não exige um conhecimento a priori da arquitetura genética da característica, tais como outros métodos tradicionais de SGA (RR-BLUP, Bayes A, B, Cπ, BLASSO). O objetivo do presente estudo foi aplicar a RNA baseado em regularização Bayesiana na predição de valores genéticos genômicos utilizando conjuntos de dados simulados a fim de selecionar os marcadores SNP mais relevantes por meio de dois métodos diferentes. Objetivou-se ainda estimar herdabilidades para as características consideradas e comparar os resultados da RNA com dois métodos tradicionais (RR-BLUP e Lasso Bayesiano). A arquitetura mais simples da rede neural com regularização Bayesiana obteve os melhores resultados para as duas características avaliadas, os quais foram muito similares às metodologias tradicionais RR-BLUP e Lasso Bayesiano (BLASSO). A identificação de importância dos SNPs baseada nas RNA apresentaram correlações entre os efeitos verdadeiros e simulados de 0,61 e 0,81 para as características 1 e 2, respectivamente. Estas foram maiores do que aquelas produzidas pelo método tradicional BLASSO (0,55 e 0,71, para característica 1 e 2 respectivamente). Em relação a herdabilidade (assumindo o valor verdadeiro igual a 0,35), a RNA mais simples obteve valor de herdabilidade igual a 0,33, enquanto os métodos tradicionais a subestimaram (com média igual igual a 0,215). / Recently there is an increase interest to use nonparametric methods, such as artificial neural networks (ANN). In animal breeding, an especial class of ANN called Bayesian Regularized Neural Network (BRNN) has been preferable since it not demands a priori knowledge of the genetic architecture of the characteristic as assumed by the most used parametric methods (RR-BLUP, Bayes A, B, Cπ, BLASSO). Although BRNN has been shown to be effective for genomic enable prediction. The aim of the present study was to apply the ANN based on Bayesian regularization to genome-enable prediction regarding simulated data sets, to select the most relevant SNP markers by using two proposed methods, to estimate heritabilities for the considered traits, and to compare the results with two traditional methods (RR-BLUP and BLASSO). The simplest Bayesian Regularized Neural Network (BRNN) model gave consistent predictions for both traits, which were similar to the results obtained from the traditional RR-BLUP and BLASSO methods. The SNP importance identification methods based on BRNN proposed here showed correlation values (0.61 and 0.81 for traits 1 and 2, respectively) between true and estimated marker effects higher than the traditional BLASSO (0.55 and 0.71, respectively for traits 1 and 2) method. With respect to h 2 estimates (assuming 0.35 as true value), the simplest BRNN recovered 0.33 for both traits, thus outperforming the RR-BLUP and BLASSO, that, in average, estimated h 2 equal to 0.215.
229

Genomic prediction of additive and non-additive effects in a pine breeding and simulated population / Predição genômica de efeitos aditivos e não aditivos em uma população de melhoramento de pinus e em populações simuladas

Almeida Filho, Janeo Eustáquio de 17 February 2016 (has links)
Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2016-04-22T13:42:06Z No. of bitstreams: 1 texto completo.pdf: 2115910 bytes, checksum: 9ac26b919d7cf610eba0b2e44061dcc7 (MD5) / Made available in DSpace on 2016-04-22T13:42:06Z (GMT). No. of bitstreams: 1 texto completo.pdf: 2115910 bytes, checksum: 9ac26b919d7cf610eba0b2e44061dcc7 (MD5) Previous issue date: 2016-02-17 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / A predição do mérito genético dos indivíduos é um dos maiores desafios no melhoremento de plantas e animais. A predição é difícil por que as características importantes possuem natureza complexa, onde alguns caracteres possuem poucos genes de efeito maior, enquanto que outros são controlados por um elevado número de genes de efeito pequeno, além disso, efeitos não-additivos como dominância e epistasia podem ser importantes para o controle da variação genética. Para obter altas acurácias na predição é importante usar o modelo que corresponde com a arquitetura genética da característica e adicionalmente a adequada partição das várias fontes de variação genética (aditiva, dominancia e epistasia) é desejada para várias aplicações como capacidade geral e específica de combinação. No capítulo 1 foi revisado os aspectos gerais da predição genômica (GP), a aplicação dessa abordagem com diferentes propósitos em características com distintas arquiteturas genéticas e no final alguns modelos estatísticos aplicado na GP. No capítulo 2 foi avaliado modelos de regressão genômica (WGR) aditivos e aditivo-dominante com diferentes prioris, essas são premissas sobre a presença ou não de marcas com efeito maior. Adicionalmente no capítulo 3 foi avaliado a inclusão da informação oriunda do pedigree na predição genômica, usando os modelos BayesA aditivo e aditivo-dominante e também com o RKHS, que teoricamente pode predizer os efeitos aditivo e não aditivos confundidos. Esses modelos foram aplicados na altura de árvores (HT) aos 6 anos de idade, diâmetro na altura do peito (DBH) e resistência a ferrugem, mesurados em 923 indivíduos de pinos oriundos de uma população estruturada em 71 irmãos completos e genotipados com 4722 marcadores genéticos. Também foram simulados 6 características com distintas arquiteturas genéticas (poligenica e oligogênica com três leveis de dominância) para esses estudos. As populações simuladas usadas nessas características foram derivadas a partir de um programa de melhoramento padrão de pinos. No capítulo 2 para as caracteríticas oligogenica simuladas e para resistência a ferrugem o BayesA e BayesB forneceram as melhores acurácias para predição genotípica, porem as diferentes priores usadas em WGR produziram resultados similares para HT e para característica poligênicas simuladas. Contudo a inclusão da dominância nos modelos WGR aumentaram a acurácia apenas para características simuladas com elevado efeito de dominância e para HT. Quando o BayesB foi ajustado em uma geração para predizer na geração seguinte, a inclusão da dominância aumentou as acurácias apenas para características oligogenicas simuladas com elevada dominancia. Independente do modelo adotado, a acurácia da predição genotípica total decresceu com o aumento dos efeitos de dominancia nas características simuladas. Então esses resultados refletem que a predição da dominancia foi complexa quando comparado com a predição dos efeitos aditivos, e para a aplicações posteriores dos efeitos de dominância, algumas propriedades genéticas da população devem ser avaliadas como MAF e número de meios irmãos e irmãos completos. No capítulo 3, a inclusão do informação oriunda do pedigree no modelo genômico, não produziu acurácias mais elevadas quando comparado com os modelos que usaram apenas informações de marcadores, e ambos modelos foram substancialmente mais acurados que o modelo baseado apenas em informação de pedigree. Em HT, DBH e características poligênicas simuladas com efeitos aditivos e dominantes, os modelos baseados em RKHS mostraram acurácias ligeiramente superiores que o BayesA para predição genotípica total, enquanto que o BayesA foi a melhor opção para resistência a ferrugem e características oligogenicas. Para a predição dos valores de melhoramento o BayesA aditivo foi o melhor modelo. / The prediction of individual genetic merit is one of most important challenges in plant and animal breeding. Prediction is difficult because the important traits have a complex nature, where some traits have few genes with major effects, while others are controlled by a large number of genes with small effects. Non-additive effects such as dominance and epistasis can also be important for controlling the genetic variation. In order to achieve higher accuracies in the prediction, it is important to use the model that matches the genetic architecture of trait. The proper partition of the various sources of genetic variation (additive, dominance and epistasis) is desired for several applications, such as exploring the overall and specific combination ability. In Chapter 1, the general remarks of genomic prediction (GP) are reviewed, with the application of this approach with different proposals in distinct genetic architecture traits, together with some statistic models applied in GP. In Chapter 2, the additive and additive-dominance whole-genomic-regression (WGR) models are evaluated with different priors, together with assumptions regarding the presence or not of markers with major effects. Chapter 3 evaluates the inclusion of pedigree information in genomic prediction with additive- and additive-dominance BayesA and also with RKHS model that can theoretically predict confused additive and non- additive effects. These models were applied in tree height (HT), diameter at breast height (DBH) and rust resistance in 923 loblolly pine individuals at 6 years of age from a structured population of 71 full-sib families genotyped with 4722 genetic markers. Six traits were also simulated with distinct genetic architectures (polygenic and oligogenic traits with three dominance levels) for these studies. The simulated population for these traits was derived from a standard pine breeding program. In the oligogenic simulated traits and rust resistance in chapter 2, BayesA and BayesB provided greater accuracies for genotypic prediction; however, the different priors of WGR yielded similar results for HT and simulated polygenic traits. Therefore, the inclusion of dominance effects in WGR increases the accuracy only for simulated traits with high dominance effects and HT. When BayesB was fitted in one generation for predicting the next generation, the dominance inclusion increased the accuracies only for the oligogenic simulated trait with high dominance. Regardless of the model adopted, the accuracy of whole genotypic prediction decreased with the increase of dominance effects in simulated traits. Thus, these results reflect that dominance prediction is complex when compared to additive prediction, and for downstream applications of dominance effects, some genetic properties of the population should be evaluated, such as MAF and the number of half and full-sibs. In chapter 3, the inclusion of pedigree information in genomic model did not yield higher accuracies than models based in only marker information, and both models were substantially more accurate than models basedonly on pedigree. In HT, DBH and in polygenic traits simulated with additive-dominance effects, the RKHS-based models showed slightly higher accuracies than BayesA for whole genotypic prediction, while BayesA-based models were the best option for rust resistance and oligogenic simulated traits. For the prediction of breeding values, the BayesA additive was the best model.
230

Isolamento, caracterização e genômica comparativa de patógenos de mastite bovina / Isolation, characterization, and comparative genomics of bovine mastitis pathogens

Silva, Danielle Mendes 29 February 2016 (has links)
Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2016-06-07T15:27:28Z No. of bitstreams: 1 texto completo.pdf: 1815676 bytes, checksum: 0d62c2dc57ee0ade1ba91497365e0867 (MD5) / Made available in DSpace on 2016-06-07T15:27:28Z (GMT). No. of bitstreams: 1 texto completo.pdf: 1815676 bytes, checksum: 0d62c2dc57ee0ade1ba91497365e0867 (MD5) Previous issue date: 2016-02-29 / Fundação de Amparo à Pesquisa do Estado de Minas Gerais / A mastite bovina é considerada por muitos autores a principal doença do rebanho leiteiro. Staphylococcus aureus e Streptococcus agalactiae são patógenos contagiosos comumente associados à forma subclínica e persistente da doença. A caracterização de estirpes em circulação nos rebanhos é de extrema importância na definição de estratégias de manejo para o controle da doença e de marcadores de prognóstico da mastite. No capítulo 1, 175 amostras positivas para o teste California Mastitis (CMT) foram coletadas de vacas holandesas e análises microbiológicas revelaram a presença de S. agalactiae em 34,2% das amostras. Em 36% das amostras foi observado o crescimento de bactérias pertencentes a outros grupos, em especial com S. aureus. A tipagem de S. agalactiae pela metodologia multilocus de repetições em tandem de número variável (MLVA) revelou seis genótipos (SagT1-T6), sendo SagT1 o mais prevalente no rebanho e também o mais frequentemente isolado de infecções mistas com S. aureus. Os isolados de S. agalactiae foram fortes produtores de biofilme in vitro e produziram hemólise do tipo beta. A análise de virulência dos isolados em larvas de Galleria mellonella definiu os tipos SagT3 e SagT1 como os mais e menos virulentos, respectivamente. Porém, dois isolados pertencentes a esses tipos não invadiram nem apresentaram efeito citotóxico em células epiteliais bovinas MAC-T. No capítulo 2, genomas de quatro estirpes de S. aureus causadoras de mastite subclínica, sendo SAU302 e SAU1364 isoladas de infecções persistentes e SAU170 e SAU1269 de infecções não persistentes, foram sequenciados. Uma grande conservação foi encontrada entre os genomas, como tamanho médio de 2,6 Mb, 32,8% de conteúdo GC e 2589 CDS. A tipagem por MLST classificou SAU170, SAU302, e SAU1364 como ST126, um tipo frequentemente encontrado em rebanhos brasileiros, e SAU1269, como ST1, associado a infecções humanas e bovinas. A comparação entre os genomas sequenciados e uma referência construída com genomas de dois isolados de mastite bovina, revelou uma identidade maior que 90% para a maioria dos genes anotados. A análise filogenética dos isolados sequenciados agrupou em ramos separados isolados de diferentes manifestações, sugerindo que algumas das particularidades compartilhadas entre isolados podem estar relacionados à persistência das infecções causadas por eles. A análise de polimorfismos de nucleotídeo único (SNPs) mostrou SNPs em genes relacionados à adesão das células bacterianas ao hospedeiro e na sequência de agrC, proteína receptora do sinal de quorum-sensing em S. aureus, alguns deles importantes para estrutura da proteína. / Bovine mastitis is considered the main disease of the dairy herd. Staphylococcus aureus and Streptococcus agalactiae are contagious pathogens commonly associated with subclinical and persistent form of the disease. The characterization of circulating strains in herds is of utmost importance to define management strategies to the control of the disease and to identify mastitis prognostic markers. In the first chapter, 175 milk samples positive for the California Mastitis Test (CMT) were collected from Holstein cows and microbiological analyzes revealed the presence of S. agalactiae in 34.2% of samples. The growth of bacteria belonging to other groups, in particular S. aureus, was seen in 36% of the milk samples. Multilocus variable-number tandem repeat analysis (MLVA) revealed the presence of six genotypes (SagT1-T6) of S. agalactiae in the herd with SagT1 being the most prevalent and also the most frequently isolated from mixed infections with S. aureus. S. agalactiae isolates were beta-hemolytic and strong in vitro biofilm producers. Virulence analysis in Galleria mellonella larvae defined the SagT3 and SagT1 types as the most and the less virulent, respectively. However, invasion and cytotoxicity in MAC-T cells did not reveal any difference between them. In Chapter 2, the genomes of four strains of Staphylococcus aureus causing subclinical mastitis, SAU302 and SAU1364 isolated from persistent infections and SAU170 and SAU1269 from non-persistent infections, were sequenced. A major conservation was found among them like the average size (2.6 Mb), the GC content (32.8%), and the CDS (2589). Multilocus Sequencing typing classified SAU170, SAU302 and SAU1364 as ST126, a type often found in Brazilian herds, while SAU1269 was classified as ST1, commonly associated with human and bovine infections. Comparative analyses with the genome of S. aureus RF122, a strain that causes severe mastitis, showed more than 90% of identity with annotated genes. Phylogenetic analysis grouped the sequenced genomes into separate branches suggesting that some of the characteristics shared between the isolates can be related to the persistence of infections. Single nucleotide polymorphisms (SNP) were found in genes related to bacterial adhesion and in agrC that codes for a receptor protein involved in quorum-sensing signaling in S. aureus, some of them important for protein structure.

Page generated in 0.0411 seconds