Os genes HLA (Antígenos leucocitários humanos) estão localizados no Complexo Principal de Histocompatibilidade humano (o MHC), e possuem os maiores níveis de variação do genoma, com milhares de alelos, altas taxas de heterozigose e diversidade nucleotídica. No presente estudo, nosso objetivo foi a identificação dos principais alvos da seleção natural nos genes HLA. Para isso, propusemos duas abordagens que resultaram na redação de dois manuscritos. Na primeira abordagem, nós testamos a hipótese de que os principais alvos da atuação da seleção natural nas moléculas HLA seriam os aminoácidos que compões os sítios que ancoram os peptídeos antigênicos (os bolsões B e F da região de ligação de peptídeos (PBR)). Para isso, utilizamos um conjunto de dados de 6.435 e 6.409 indivíduos genotipados para os genes HLA-A e -B respectivamente, gerados para o 13º Workshop Internacional de Histocompatibilidade (IHW) e pertencentes a 55 populações espalhadas por todos os continentes. Nós estimamos a diversidade nucleotídica (&PI;) das sequências que codificam para os bolsões B e F e comparamos esses dados com os obtidos de outros bolsões da PBR. Concomitantemente, utilizamos a classificação de alelos dos locos HLA-A e -B em supertipos, que são agrupamentos alélicos com similaridades nos perfis de ligação de peptídeos, devido a semelhanças em aminoácidos específicos dos bolsões B e F. Nós descrevemos os padrões observados de variação dos supertipos e desenvolvemos um teste de hipótese onde comparamos os estimadores observados de diferenciação populacional (Gst) e diversidade genética (taxa de heterozigose (He) e número de alelos (k)) com os obtidos a partir de 10.000 réplicas constituídas por agrupamentos aleatórios de alelos. O bolsão B foi a região que apresentou os maiores níveis de diversidade no gene HLA-B (p <0,00001, teste de soma de ranques de Mann-Whitney) e boa parte de sua variação está estruturada entre os supertipos desse mesmo loco. Além disso, os padrões observados de variação nos supertipos de HLA-B não foram reproduzidos pelos agrupamentos aleatórios de alelos (com 98 % das simulações apresentando valores de Gst menores do que os observados, utilizando as amostras africanas, europeias e asiáticas). Esse resultado indicou que os supertipos e consequentemente as especificidades do bolsão B estão significativamente estruturas entre as populações, um indicativo de adaptações locais aos patógenos específicos de diferentes regiões geográficas. Esses mesmos padrões não foram reproduzidos na análise do loco HLA-A, pois boa parte da variação no PBR desse gene não está localizada nos bolsões B e F. Além disso, as simulações envolvendo os supertipos de HLA-A reproduziram mais frequentemente os padrões observados de variação, indicando que os bolsões B e F não são os principais alvos da seleção nesse gene, ou que os níveis de seleção em HLA-A sejam menores dos atuantes em HLA-B. Na segunda abordagem, o nosso principal objetivo foi a identificação de genes que contribuíram para a adaptação local das populações nativas das Américas, que teria ocorrido durante o recente processo de colonização desse continente. Nós sequenciamos os exons 2 e 3 dos loci de classe I HLA-B e -C e o exon 2 do loco de classe II -DRB1 em 635, 524 e 568 indivíduos, respectivamente, pertencentes a 32 populações nativas do continente Americano. Os dados de sequência foram utilizados na estimativa das frequências alélicas, taxa de heterozigose (He), grau de compartilhamento de alelos entre populações (medido pela distância de Prevosti) e desvios de neutralidade utilizando o teste D de Tajima. Nós também comparamos os padrões de variação das taxas de heterozigose obtidas a partir dos loci HLA ao longo do continente com os obtidos a partir de um conjunto de 61 microssatélites espalhados ao longo do genoma, permitindo-nos a diferenciação dos padrões provavelmente gerados pela história demográfica ou seleção natural. O loco HLA-B apresentou o maior número de pares de populações em que não observamos compartilhamento de alelos (44 pares contra 4 e 6 para os loci HLA-C e -DRB1, respectivamente) sendo que a região leste da América do Sul (SAE) foi a que apresentou os menores níveis de compartilhamento de alelos com outras regiões das Américas (39 dos 44 pares de populações continham uma população SAE). Essa maior diferenciação do gene HLA-B nas populações SAE é uma consequência da presença de alelos exclusivos dessa região, originados por eventos de conversão genica e/ou recombinação envolvendo alelos presentes em outras regiões do continente. As populações SAE também apresentaram níveis elevados de variação para o gene HLA-B, resultado evidenciado pela falta de correlação entre a diminuição da taxa de heterozigose e o aumento da distância em relação ao Estreito de Bering (r2 = -0,1117, p > 0,05), o que contrasta com a tendência geral observada nos microssatélites e genes HLA -C e -DRB1 (r2 = -0,1957, -0,2261 e -0,2637, respectivamente (p < 0,05)). Finalizando, as populações SAE apresentaram valores de D de Tajima maiores (p <0,001, teste de soma de ranques de Mann-Whitney) e mais significativos (p < 0,0000005, aplicando um teste binomial exato) no loco HLA-B, quando comparadas às populações das outras regiões. Essas diferenças entre regiões geográficas não foram observadas nos genes HLA-C e -DRB1, corroborando a explicação seletiva para o aumento da frequência dos alelos de HLA-B originados por conversão gênica/recombinação em resposta aos novos desafios ambientais das regiões tropicais na América do Sul. As conclusões obtidas a partir de ambas as abordagens do presente trabalho apontam o gene HLA-B como o principal alvo da seleção natural, uma vez que esse loco concentra as maiores evidências de atuação de seleção natural recente quando comparado aos demais genes HLA analisados. Nós também demonstramos com as análises intragênicas que o bolsão B do PBR de HLA-B concentra por boa parte das diferenças observadas entre as populações, implicando em diferenças nos perfis de apresentação de peptídeos entre essas mesmas populações, o que pode ser interpretado como um indicativo de adaptações locais aos conjuntos de patógenos presentes em distintas regiões geográficas / The Classical HLA genes (Human Leucocyte Antigens) are located in the human Major Histocompatibility Complex (the MHC) and present the highest levels of variation on the Human genome, with thousands of alleles associated with high levels of heterozygosis and nucleotide diversity. In the present study, our goal was the identification of the main targets of natural selection on the HLA genes. We proposed two different approaches to address this issue resulting in two manuscripts. At the first approach, we performed an intragenic analysis, verifying if the amino acids at the peptide-binding region (PBR) anchor positions (the B and F pockets) exhibit higher evidences of evolution under natural selection when compared with the remaining regions of the HLA molecules. To do so, we used a dataset generated for the 13th International Histocompatibility Workshop (IHW), composed by 6,435 and 6,409 individuals genotyped for HLA-A and -B respectively, belonging to 55 populations scattered along all the continents. We measured the levels of nucleotide diversity (π) of the sequences coding for the B and F pockets and compared them with the remaining PBR pockets. Concomitantly, we applied the supertype classification which consists in groups of HLA-A and -B alleles which bind overlapping sets of peptides, as a consequence of sharing specific amino acids at B and F pockets and described the patterns of supertype variation in the observed data. Next, we developed a hypothesis test in which the observed patterns of population differentiation (Gst) and variability (heterozygosity (He) and number of alleles (k)), using the supertype definition, were compared with 10,000 replicates of random assigned groups of alleles. At the HLA-B locus, the B pocket presented the highest levels of variation (p < 0.00001, Wilcoxon rank sum test) and concentrated most of the differences between supertypes. Our simulations results revealed that the reassignment of alleles into random groups could not reproduce the observed patterns of population differentiation (with 98% of the simulations presenting Gst values smaller than the observed, using the African, European and Asiatic samples), indicating that supertypes and more specifically the B pocket specificities are significantly structured among populations, which could be an indicative of adaptations to local pathogens. We did not observe the same patterns at the HLA-A locus which presented relative lower levels of variation at B and F pockets when compared with the remaining PBR regions, and simulated values of Gst and He which often reproduced the observed data. At the second approach, our main objective was the identification of genes that contributed for local adaptation on Native American Populations because of the relatively recent colonization of the new American environments. We sequenced the exons 2 and 3 of the HLA-B and -C class I loci and the exon 2 of the -DRB1 class II locus in 635, 524 and 568 individuals, respectively, belonging to 32 different Native American Populations scattered along all the Americas. We estimated the allele frequencies, expected heterozygosity (He), degree of allelic sharing between populations (measured by the Prevost\'s Distance) and departure from neutral expectation using the Ewens-Watterson (EW) and Tajima\'s D test. Concomitantly, we used a dataset of 61 microsatellites scattered along the genome as a demographic control, comparing the degree of variation of the heterozygosity along the continent. The HLA-B locus showed the highest number of pairs of populations in which we did not observe any sharing of alleles (44 pairs against 4 and 6 for HLA-C and -DRB1 loci, respectively) and the Eastern South American (SAE) region was the one presenting the smallest levels of allelic sharing with other American regions at this locus (39 out the 44 pair of populations contained a SAE population). The presence of exclusive gene conversion and/or recombination alleles accounts for the higher differentiation of SAE populations at the -B locus. The -B locus also exhibited a higher level of variation at SAE populations which was evidenced
Identifer | oai:union.ndltd.org:IBICT/oai:teses.usp.br:tde-16042014-142152 |
Date | 21 January 2014 |
Creators | Rodrigo dos Santos Francisco |
Contributors | Diogo Meyer, Lygia da Veiga Pereira Carramaschi, Anna Carla Renata Krepel Goldberg, Paulo Alberto Otto, Karin Braun Prado |
Publisher | Universidade de São Paulo, Ciências Biológicas (Biologia Genética), USP, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Source | reponame:Biblioteca Digital de Teses e Dissertações da USP, instname:Universidade de São Paulo, instacron:USP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0033 seconds