• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 141
  • 139
  • 114
  • 1
  • 1
  • Tagged with
  • 395
  • 338
  • 298
  • 295
  • 294
  • 294
  • 294
  • 273
  • 203
  • 152
  • 127
  • 66
  • 31
  • 24
  • 22
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Caracterización de Septin 4, un gen que codifica un potencial sustrato de Parkin en Drosophila.

Muñoz i Soriano, Verònica 07 April 2008 (has links)
No description available.
2

Proposal, evaluation and application of two new methodologies for genetic profiling in association studies

Urrea Gales, Víctor 22 April 2015 (has links)
L'objectiu de l'epidemiologia genètica és comprendre els efectes dels gens i els factors ambientals en la salut humana. Un aspecte important és l’estudi del paper de la variabilitat genètica en el risc de malalties comunes com la diabetis, malalties cardiovasculars, càncer, Alzheimer, etc. Aquesta tesi es centra en la identificació de múltiples variants genètiques per predir el risc a la malaltia i presenta dues aproximacions metodològiques per a la identificació de perfils genètics en presència d'epistasi. Un efecte epistàtic o una interacció genètica apareix quan l'efecte conjunt de diversos marcadors genètics sobre el fenotip observat no queda explicat pels seus efectes marginals. La principal dificultat en l'estudi de les interaccions genètiques és que generalment s'analitzen centenars o milers de marcadors genètics, i això fa inviable l'anàlisi de totes les possibles interaccions, des del punt de vista computacional. Les metodologies presentades permeten explorar interaccions d'ordre alt amb un cost computacional raonable. També s’aborda la simulació de dades amb propietats similars a les d’estudis d’associació genètica. / The aim of genetic epidemiology is to understand the effects of genes and environmental factors on human health. An important issue is the role of the genetic variability in the risk for common diseases such as diabetes, cardiovascular disease, cancer, Alzheimer's, etc. This thesis is focused on the identification of genetic variants at multiple loci for prediction of disease risk and presents two new methodological approaches to address genomic profiling in presence of epistasis. An epistatic effect or a genetic interaction is present when the combined effect of several genetic markers on the observed phenotype is not explained by their marginal effects. The main difficulty in the study of genetic interactions is that usually hundreds or thousands of genetic markers are analysed, which makes the analysis of all possible interactions unfeasible, from a computational point of view. The proposed methodologies allow higher order interactions to be explored with a reasonable computational cost. Another prominent issue addressed in this thesis is the simulation of data with similar properties to real genetic association studies.
3

Mechanisms controlling the selective iron and zinc biofortification of rice

Banakar, Raviraj 05 February 2016 (has links)
L’arròs es un cultiu bàsic, consumit per mes de 3 billons de persones. Es una font pobra en ferro (Fe) i zinc (Zn) per la qual cosa les poblacions pobres que depenen de l’arros per a la seva supervivència, sofreixen d’anèmia por deficiència de ferro (IDA) i zinc (ZnD). La desnutrició es un repte important, especialment en els països en desenvolupament on no hi ha les mesures nutritives comunes als països industrialitzats (una dieta variada, programes de fortificació i suplements dietètics). El bio-enriquiment mitjançant l’enginyeria genètica del contingut de Fe y Zn en arròs es una estratègia prometedora y pot resultar en un augmentant de les seves concentracions. Amb l’objectiu d’aconseguir arròs que acumuli nivells mes elevats de Fe y Zn he obtingut una població d’arròs transgènic mitjançant transformació combinatòria amb quatre gens implicats en l’absorció, transport, acumulació i biodisponibilitat d’aquestos dos minerals. Aquesta població combinatòria m’ha servit per a identificar els mecanismes antagònics i sinèrgics que son essencials per a controlar l’acumulació de Fe i Zn. / El arroz es un cultivo básico para más de 3 billones de personas. El arroz es una fuente pobre de hierro (Fe) y zinc (Zn) por lo cual las poblaciones pobres que dependen del arroz para su supervivencia, sufren de anemia por deficiencia de hierro (IDA) y zinc (ZnD). La desnutrición es un reto importante, especialmente en los países en desarrollo donde están ausentes las medidas que son comunes en los países industrializados (dieta variada, programas de fortificación y suplementos dietéticos). El bio-enriquecimiento mediante la ingeniería genética del contenido de Fe y Zn en arroz es una estrategia prometedora para aumentar sus concentraciones. Con el objetivo de producir granos con más alto nivel de Fe y Zn he obtenido una población de arroz transgénico mediante transformación combinatoria con cuatro genes implicados en la absorción, transporte, acumulación y biodisponibilidad de estos dos minerales. Esta población combinatoria me sirvió para identificar los mecanismos antagónicos y sinérgicos que son esenciales para controlar la acumulación de Fe y Zn. / Rice is staple crop for more than 3 billion people, since rice is poor source of iron (Fe) and zinc (Zn) world’s poorest people who depend on rice for their survival suffer from iron deficiency anaemia (IDA) and zinc deficiency (ZnD). Malnutrition is a significant challenge, particularly in the developing world where measures that are commonplace in industrialized countries (varied diet, fortification schemes, and dietary supplements) are largely absent. Biofortification of rice with Fe and Zn by genetic engineering is a promising strategy to increase Fe and Zn concentration. I established a combinatorial transgenic rice population by transformation with four genes involved in uptake, transport, accumulation and bioavailability of Fe and Zn, aiming to produce grains containing higher level of these two minerals. This combinatorial population helped to identify key antagonistic and synergistic mechanisms controlling Fe and Zn accumulation.
4

Caracterització del gen Acetoacetil-CoA sintetasa

Aguiló Payeras, Francesca 13 November 2008 (has links)
CATALÀ: La cetogènesi és un procés mitocondrial a partir del qual es sintetitzen els cossos cetònics: acetona, acetoacetat i 3-hidroxibutirat, que són emprats com a font d'energia en el mitocondri dels teixits extrahepàtics a través de l'acció de la Succinil-CoA:3-cetoàcid-CoA transferasa (SCOT). Alternativament, en el citosol dels teixits lipogènics, l'acetoacetat pot ser activat a acetoacetil-CoA, a través de l'enzim Acetoacetil-CoA sintetasa (AACS), proporcionant unitats acetil-CoA de manera independent i anàloga al citrat produït en el mitocondri, transferit al citosol i escindit per l'ATP-citrat liasa.1. Estudi de la funcionalitat de la seqüència del cDNA del gen AACS humà predit. Hem demostrat que la seqüència predita del cDNA del gen AACS humà codifica per una proteïna funcional. Els valors de les constants de Michaellis-Menten (Km) de la proteïna GST-AACS son de 37.6M, 155.24M i 2.3M per l'acetoacetat, l'ATP i el CoA, respectivament. A més, l'enzim AACS humà és inhibit a 15 M de CoA. 2. Estudi de les modificacions posttraduccionals de la proteïna AACS humana.L'anàlisi de la seqüència aminoacídica de la proteïna AACS humana revela la presència de diversos residus de lisina com a putatius llocs d'acetilació. La substitució de la Lys634 per Arg provoca una disminució de l'estat d'acetilació de la proteïna però no l'aboleix totalment. Mitjançant la deleció de l'extrem COOH-terminal hem pogut concloure que aquesta regió és determinant per a l'estat d'acetilació, encara que no es pot descartar la possibilitat d'altres residus de lisina acetilables en l'extrem NH2-terminal.3. Aportació al procés de la colesterogènesi del gen AACS humà.S'ha analitzat l'efecte de la sobreexpressió de la proteïna AACS humana en el procés de la colesterogènesi, mitjançant la generació d'un sistema induïble BDTMTet-On Gene Expression system en cèl·lules HeLa. L'acetoacetil-CoA, fruit de la reacció catalitzada per l'AACS, és incorporat de manera preferencial cap a la síntesi de colesterol, implicant que l'esquelet de quatre carbonis de l'acetoacetat o bé la seva forma activa, l'acetoacetil-CoA, no s'equilibra completament amb el pool de dos carbonis representat per l'acetat i l'acetil-CoA. Una de les hipòtesis que explicarien aquest fet és la possible existència d'interaccions (channeling) entre els primers enzims de la via de la colesterogènesi, és a dir, entre l'AACS i l'HMGCS1. No obstant això, els nostres experiments mostren que ambdues proteïnes no interaccionen ni de manera directa ni indirecta.4. Estudi dels mecanismes de regulació transcripcional del gen AACS humà.Hem caracteritzat els elements necessaris per a que es produeixi l'activitat basal del gen AACS humà i hem estudiar la seva regulació transcripcional per factors de transcripció implicats en l'homeòstasi lipídica: LXR, SREBPs i PPAR. Els nostres resultats mostren que l'Inr és funcional, i que les caixes GC presents en el promotor proximal del gen AACS uneixen el factor de transcripció Sp1, important en la mediació de l'activitat basal d'aquest promotor. Els putatius LXRE i SRE, localitzants en el promotor in silico, no són funcionals. En canvi, PPARregula l'expressió del gen AACS d'una manera no canònica a través de la proteïna Sp1 i mitjançant la interacció amb les caixes GC. 5. Regulació de l'expressió del gen AACS de rata en diferents situacions fisiològiques: ritme circadiari.L'expressió del gen AACS està sotmesa a regulació circadiària, produint-se el zenit d'expressió en fetge i en TAB a l'inici de la fase fosca, coincidint amb el període de màxima activitat dels rosegadors. El patró d'expressió del factor de transcripció SREBP-1 i de l'AACS en fetge és paral·lel, suggerint que SREBP-1c podria ser responsable de mitjançar la regulació de l'expressió de l'AACS en aquest òrgan en les situacions fisiològiques estudiades: dejuni/realimentació en les fases diürna i nocturna, i administració d'insulina. / Acetoacetyl-CoA synthetase (AACS, acetoacetate-CoA ligase, EC 6.2.1.16) is a cytosolic ketone body (acetoacetate)-specific ligase found in several lipogenic tissues that might play an important role in the provision of Acetyl-CoA units for lipogenesis. Transfer of acetyl as acetoacetate, from the mitochondria to the cytosol, would operate in parallel with transfer via citrate and ATP-citrate lyase.1. Kinetic parameters of the human AACS.The KM values for acetoacetate, ATP and CoA were 37.6 M, 155.24 M, and 2.3 M respectively. CoA exerts an inhibitory effect when concentration raised over 15 M.2. Study of the posttranslational protein modification of human AACS.Sequence analysis of human AACS protein shows the presence of multiple lysine residues as a target of acetylation modification. The invariant lysine of the PX4GK domain, is not relevant for total levels of human AACS acetylation because the mutation of Lys-633 to arginine, did not abrogate the reactivity with the α-acetyl-lysine antibody. However the replacement of Lys-634 with arginine yielded a decrease in the acetylation status of human AACS protein. 3. Human AACS and cholesterogenesis.We studied the effect of human AACS overexpression in HeLa cells using the BDTMTet-On Gene Expression system. As previosly reported, acetoacetate is used preferentially for cholesterol biosynthesis although we couldn't observe a substrate channeling in the early steps of cholesterogenesis.4. Study of the mechanisms of transcriptional regulation of human AACS gene.We isolated the human AACS promoter, characterized the elements required to initiate transcription and analyzed the expression of the gene in response to LXR, SREBPs and PPAR, all known important factors for lipidic homeostasis. We show that the human AACS promoter contains an Inr sequence and several GC boxes that are determinant for its basal activity. We also show that PPAR transcriptionally induces the expression of the AACS gene by a non-canonical mechanism, since it is recruited to the AACS promoter by direct interaction with Sp1. 5. Circadian rhythm.AACS transcriptional regulation is under the control of circadian rhythm in liver and BAT but not in brain. Our results suggest that circadian expression in liver is driven by the rhytmic expression of SREBP-1c.
5

Desarrollo y transferibilidad de los microsatélites en Prunus y su aplicación en estudios de variabilidad

Mnejja Abd Mouleh, Mourad 27 February 2015 (has links)
The Prunus genus belongs to the Rosaceae family and includes stone fruit crops such as peach (P. persica), apricot (P. armeniaca), European plum (P. domestica), Japanese plum (P. salicina), sweet cherry (P. avium) and sour cherry (P. cerasus), as well as almond (P. dulcis), a species cultivated for its seeds. This work aims to develop simple-sequence repeat (SSR) or microsatellite markers in almond and Japanese plum, the only two diploid Prunus species lacking these markers when this thesis began, and to study their variability in a collection of cultivars of each species. In addition, we studied the transferability of the microsatellites obtained from Prunus in other cultivated rosaceous species, including six Prunus species, and three other genus: apple (Malus x domestica), pear (Pyrus comunis) and octoploid strawberry (Fragaria x ananassa). To develop new microsatellite markers, we used two methods: one from enriched DNA genomic library (for sequences CT/AG), for which we obtained 31 SSRs in almond and 27 in Japanese plum, and another using the available sequences of ESTs (expressed sequence tags) of almond (22 SSRs) and peach (25 SSRs). All these microsatellites were polymorphic in a set of eight cultivars of their respective species. We used the obtained markers in an extensive collection of almond varieties (30) to study their genetic variability using 47 microsatellites derived from this species (25 genomic and 22 derived from ESTs). A similar study was conducted in 38 varieties of Japanese plum with 27 genomic SSRs obtained in this species. These markers were highly variable in both species, with an average of 7.3 alleles per locus in almond and 7.2 in Japanese plum, allowing us to distinguish individually all the studied genotypes. Our data indicated that the SSRs of the same species are more variable than those developed in other related species. In addition, in almond we found that the microsatellites derived from ESTs, and particularly those located in coding regions, were less variable than those obtained from genomic sequence. The grouping of the studied varieties in function of their genetic distance (dendrogram) or their population structure was quite similar both in almond and Japanese plum. The almond varieties were grouped by their geographical origin and their flowering time, whereas the Japanese plum varieties, of recent origin and largely developed in the United States, were clustered according to the breeding programs of the different States they were obtained. A total of 145 Prunus SSRs [25 genomic from almond, peach and Japanese plum, 25 ESTs derived from peach, 22 ESTs derived from almond and 23 derived from apricot (10 genomic and 13 from ESTs)] were chosen to study transferability, all polymorphic and identifying a single locus in the origin species. These microsatellites were studied in eight varieties of the following nine species: almond, peach, European plum, Japanese plum, apricot, sweet cherry, apple, pear and strawberry. Eighty-three percent (83%) of these markers amplified bands of the expected size in the other Prunus species and 63.9% were polymorphic, indicating the high transferability within this genus. This transferability decreased as the genetic distance between the species origin of the SSR and the studied species increased. Thus, only 16.3% of the tested SSRs were transferable to species of other rosaceous genera (apple, pear and strawberry). No significant differences were detected between microsatellites of different origins (genomic and ESTs) regarding their transferability, nor their capacity to detect variability. From the studied SSRs, 31 amplified and were polymorphic in all tested Prunus species. Twelve, selected to cover the whole genome, were proposed as the universal set for the analysis of variability in Prunus.
6

Expressió i modulació de gens del desenvolupament ossi: elscasos de la fibrodisplàsia ossificadora progressiva (FOP) i de l'heteroplàsia òssia progressiva (POH)

Tarrús de Vehí, Marc 26 June 2003 (has links)
L'estudi dels processos moleculars implicats en la regulació de l'osteogènesi s'ha realitzat en base a dues malalties humanes diferents, les quals estan caracteritzades per la formació ectòpica d'os de naturalesa diversa: la FOP (la fibrodisplàsia ossificadora progressiva) amb formació d'os endocondral i la POH (l'heteroplàsia òssia progressiva) amb formació d'os d'origen intramenbranós.Mitjançant un procés meticulosament regulat, l'esquelatogènesi embrionària humana transforma cèl·lules mesenquimàtiques en sistemes orgànics articulats ben definits espaialment com són el cartílag i l'os. Un dels enigmes per resoldre en la biologia de l'esquelet fa referència als senyals moleculars que són necessaris i suficients per induir una adequada formació de l'esquelet. En condicions normals d'esquelatogènesi, un augment en l'elaboració i activitat del morfogen BMP-4 es troba finament regulat per un nombrós grup de senyals negatius que inclouen -però no es limiten a- antagonistes extracel·lulars de BMP-4 com ara noggin, gremlin, follistatin i chordin, generats per mecanismes de retroalimentació complexos. A mes la formació ectopica d'os també implica altres gens com ara GNAS1, codificador de la subunitat a de les proteïnes G i responsable de la POH.Encara no ha estat identificat el gen que causa la FOP, els resultats obtinguts poden, de fet, ajudar a identificar el gen mutat mitjançant una atenció central en porcions del camí de transducció de senyal de les BMPs. Aquí és on el gen responsable de FOP té més possibilitats de recaure i ja que els nostres resultats indiquen l'existència d'un defecte en la senyalització entre l'estímul de BMP-4 i els seus cognats antagonistas noggin i gremlin, és molt probable que la mutació responsable de FOP s'ubiqui en un dels gens codificadors de proteïnes mediadores o reguladores del camí de senyalització de la BMP-4.En l'estudi relacionat amb la POH, s'ha demostrat que existeixen múltiples formes del gen GNAS1/gnas que s'expressen en cèl·lules preosteoblàstiques MC3T3-E1 de ratolí i també en LCLs humanes. Quan les cèl·lules s'orienten cap a un llinatge osteogènic, s'observen notables diferències en l'expressió dels transcrits de gnas. La inhibició de les isoformes Nesp55 i de la nova forma de Gsa i una activació progressiva de les isoformes XLalpha, antisentit i Gsa amb l'exó 3 exclòs, en conjunt, pot proporcionar un mecanisme coordinat que involucri la unitat transcripcional de gnas en el procés de diferenciació osteogènica de les cèl·lules pluripotents, suggerint que la predisposició de hMCS a dirigir-se a llinatges osteogènics o adipogènics està governada per múltiples interaccions entre els diferents transcrits de gnas. A més, els nostres resultats indiquen que els nivells reduïts fins a la meitat en individus POH podrien influir en processos "downstream" que condueixen a un fenotip osteogènic competent.Aquest treball de recerca ha permès situar en un mateix pla d'estudi processos d'osteogènesi de naturalesa diversa, els quals es desencadenen per camins de transducció alternatius. Les rutes de transducció del senyal de factors TGF-b_, com el morfogen BMP-4 _i proteïnes G s'entrecreuen les unes amb les altres (Cross-talking). Les mutacions en els gens codificadors de proteïnes mediadores o reguladores del camí de senyalització de BMP-4 i els defectes en els camins de senyalització de receptors acoblats a les proteïnes G poden contribuir directament o indirecta a la patogènesi de moltes malalties amb formació heterotòpica d'os. / The molecular processes that control the regulation of osteogenesis were studied in two different human bone disorders characterized by the formation of ectopic bone of distinct nature, FOP (fibrodysplasia ossificans progressiva) with endocondral bone formation and POH (progressive osseous heteroplasia) with bone formation of intramenbranous origin.Through a tightly regulated process, human embryonic skeletogenesis transforms mesenchymal cells into articulated organic systems well defined spatially as are bone and cartilage. One of the enigmas to solve in skeleton biology are the molecular signals that are necessary and sufficient to trigger a proper formation of the skeleton. In normal skeletogenesis, an increase in the elaboration and activity of morforgen BMP-4 is finely regulated by a number of negative signals that include- but is not limited to- extracellular antagonist of BMP-4 as noggin, gremlin, follistatin i chordin, generated by complex feedbacks mechanisms. Moreover, ectopic bone formation also results from an alteration in other genes as GNAS1, GNAS1 codifies for the a subunit of heterotrimeric G proteins which is responsible for POH.Still has not been identified the gene that causes FOP. The results obtained in this work can, in fact , help to identify the mutated gene through a central attention to some portions of the BMPs transductional pathway, here is were the gene FOP has more changes to be found since our results indicate of the existence of a defect in the signaling between the stimulus BMP-4 and its cognates antagonist noggin and gremlin, is quite probable that the mutation responsible for FOP is located in one of the genes that codifies for intermediate or regulatory proteins of the BMP-4 signaling pathway.We have shown in the study related to POH that exist multiple forms of the gene GNAS1/gnas which are expressed in mice preosteoblastic MC3T3-E1 cells. When cells are directed to an osteogenic linage, several remarkable differences are observed in the expression of the gnas transcripts. The inhibition of isoforms Nesp55 and the new form of Gsa and a progressive activation of isoforms XLalpha, antisense and Gsa without exon 3, in general could supply a coordinate mechanism that involves the GNAS1 trascriptional unit in the process of osteogenic differentiation of the pluripotent mesenchymal cells, suggesting that the commitment of hMCS to differentiated to osteogenic and adipogenic lineages is governed by multiple interactions among the gnas transcrits. In addition, our results indicate that the reduced levels of the different GNAS1 transcripts in POH individuals could somehow influence in the downstream signals that conduct that drive into a competent osteogenic phenotype.This research work has let us to situated at the same study plane two different osteogenic processes of diverse nature which are trigger by alternative transductional pathways The signal transductional pathways of TGF-b, as morphogen BMP-4, and G proteins cross talk one with the othert. Mutations at the genes that codify for intermediate and regulatory proteins of BMP-4 signaling pathways and defects in the signaling pathways of receptors coupled to G proteins can contribute directly or indirectly to the pathogenesis of several disorders of bone ectopic formation.
7

Barley adaptation to stress prone environments

Visioni, Andrea 19 July 2012 (has links)
Multi environment trials conducted over mapping population are often used to test genotypes in a set of environments that represent the target environmental range. The first part of this work is the evaluation of the ‘Nure’ x ‘Tremois’ double-­‐haploid mapping population, together with an association panel comprising 185 barley varieties representative of the barley germplasm cultivated in the Mediterranean basin. Plant material was tested across eighteen site by year field trials combination, in six countries across the Mediterranean basin. Trials were growth at sites contrasting for natural rainfall (high vs low on the base of past meteorological data) or at the same site with one being rainfed and the other with supplementary irrigation. Trials conducted for two years in each one of the sites and this allowed tocollect a huge data series comprising agronomical traits defining grain yield and yield components, phenological and environmental data, subsequently used to identify genomic regions involved in barley adaptation. The 118 doubled haploid lines of the mapping population were genotyped with Diversity Array Technology® (DaRT) marker assay and subsequently a total of 15 CAPS and SSCP marker for candidate genes involved in phenology regulation and abiotic stress response were added to the linkage map based on DaRT markers. Data collected were firstly used to perform QTLs analysis with composite interval mapping for any environment/ trait combination, results showed eight QTLs for grain yield, days to heading and grain yield components. . The two mostly frequents QTLs for grain yield and days to heading were located on barley chromosome 1H (3 trials), 2H (8 trials) and 5H (5 trials) overlapping respectively HvFT3 gene, the earliness per se locus (eam6/Eps-­‐2) and the vernalization gene Vrn_H1. A further QTL multi-­‐environment analysis was performed and revealed that across the 18 field trials QTL for eam6/Eps-­‐2 (2H) and Vrn-­‐H1 (5H) were commons for days to heading and grain yield. We use all the environmental information collected to check QTLs sensitivities to co-­‐environmental co-­‐variables. Most of significant associations collected were related to temperature and temperature-­‐based variables troughtout the growing cycle. Eam6/Eps-­‐2 showed non-­‐crossover QTL.E interaction, while for Vrn-­‐H1 crossover interactions were revealed. The 185 barley accession were genotyped with 1536 SNPs and data collected for this population for cold resistance in two field trials in Spain an Italy, the first trial was characterized by an exceptional winter, while the second was previously know has frost-­‐prone environment. Results from genome wide association analysis showed 13 positive associations with specific genomic regions. Interestingly several of these QTL were coincident with the position of previously mapped loci for cold tolerance, on chromosomes 2HL, 4HL and 5HL. / Els assajos en localitats múltiplas de poblacions de mapeo s'utilitzen freqüentment per a testar genotips en un conjunt d'ambients representatius de la condicions climàtiques on es volen introduir aquests genotips. La primera part d'això treball ha estat l'avaluació de la població de mapeo ‘Nure x Tremois’ constituïda de 118 de doble haploides d'ordi, juntament amb panell d'associació que comprèn 185 varietats d'ordi representatives del germoplasma conreat en la conca Mediterrània. El material vegetal ha estat assajat en una combinació de divuit camps per any desllorigats en sis països de la conca mediterrània. Els assajos s'han portat a terme en camps amb diferent disponibilitat d'aigua, classificats sobre la base de les dades relatives a les freqüència i quantitat de les precipitacions o en el mateix lloc amb un camp en secà i altre regat. Els assajos es van portar a terme per dos anys en cada localitat i això va permetre la recollida d'un gran volum de dades que comprenen caràcters agronómicos relacionats amb rendiment i components del rendiment, dades fenológicos i ambientals. Aquestes dades es van utilitzar després per a la identificació de regions genomicas involucrades en l'adaptació de l'ordi a l'ambient. Els 118 dobles haploides de la població ‘Nure x Tremois’ es genotiparon amb marcadors DaRT (Diversity Array Technology), després un set de 15 marcadors CAPS I SCCP per a gens candidats involucrats en la regulació de les fases fenológicas van ser afegits al mapa de lligament construït amb els marcadors DaRT. Les dades van ser utilitzats per a fer una anàlisi de QTL amb procediment ‘Composite Interval Mapping’ para cada combinació ambienti/ caràcter. Es van trobar diversos QTLs per rendiment i data d'espigolat i components del rendiment. Els QTL mes freqüents trobats per rendiment i data de floració i components del rendiment estan localitzats en els cromosomes 1H (3 camps), 2H (8 camps) i 5H (5 camps) coincidents respectivament amb HvFT3 locus, eam6/Eps-­‐2 (earliness per se) locus i amb el locus de vernalización Vrn-­‐H1. Una ulterior anàlisi de QTL feta amb el mètode “Multi Environment Trial” ha revelat que els QTL localitzats en el locus eam6/Eps-­‐2 (cromosoma 2H) i Vrn-­‐H1 (cromosoma 5H) són comunes per rendiment i data de floració en els 18 camps d'assaig. Per això utilitzem tots el dades ambientals col·leccionades durant tot el cicle del cultiu per a investigar la sensibilitat de dites QTL a les co-­‐variables ambientals. La majoria de les associacions oposades estan relacionades amb temperatures i variables relacionades amb aquestes. Eam6/Eps-­‐2 mostra una interacció de tipus quantitatiu amb aquestes variables mentre Vrn-­‐H1 mostra una interacció de tipus qualitatiu amb aquestes variables. Les 185 varietats assajades van ser genotipadas amb 185 SNPs i fenotipadas per resistència a fred en dos assajos uneixo a Espanya i altre a Itàlia. El primer assaig va ser caracteritzat per un hivern excepcionalment fred, mentre el d'Itàlia ha estat utilitzat en passat per testar resistència a fred a causa de els hiverns rígids que solen registrar-­‐se en aquesta localitat. Les dades van ser utilitzats per a portar a terme la analisis GWAS “Genome Wide Association Analysis” . Els resultats van permetre identificar 13 regions genomicas involucrades en la resistència a frio. Entre elles tres regions coincideixen amb loci ja mapeados i coneguts per ser involucrats en la resposta a frio en los cromosomes 2HL, 4HL i 5HL. / Los ensayos en localidades múltiplas de poblaciones de mapeo se utilizan frecuentemente para testar genotipos en un conjunto de ambientes representativos de la condiciones climáticas donde se quieren introducir dichos genotipos. La primera parte de esto trabajo ha sido la evaluación de la población de mapeo ‘Nure x Tremois’ constituida de 118 de doble haploides de cebada, junto con panel de asociación que comprende 185 variedades de cebada representativas del germoplasma cultivado en la cuenca Mediterránea. El material vegetal ha sido ensayado en una combinación de dieciocho campos por año dislocados en seis países de la cuenca mediterránea. Los ensayos se han llevado a cabo en campos con diferente disponibilidad de agua, clasificados en base a los datos relativos a las frecuencia y cantidad de las precipitaciones o en el mismo sitio con un campo en secano y otro regado. Los ensayos se llevaron a cabo por dos años en cada localidad y esto permitió la recogida de un gran volumen de datos que comprenden caracteres agronómicos relacionados con rendimiento y componentes del rendimiento, datos fenológicos y ambientales. Dichos datos se utilizaron después para la identificación de regiones genomicas involucradas en la adaptación de la cebada al ambiente. Los 118 dobles haploides de la población ‘Nure x Tremois’ se genotiparon con marcadores DaRT (Diversity Array Technology), después un set de 15 marcadores CAPS Y SCCP para genes candidatos involucrados en la regulación de las fases fenológicas fueron añadidos al mapa de ligamento construido con los marcadores DaRT. Los datos fueron utilizados para hacer una análisis de QTL con procedimiento ‘Composite Interval Mapping’ para cada combinación ambiente/ carácter. Se encontraron varios QTLs por rendimiento y fecha de espigado y componentes del rendimiento. Los QTL mas frecuentes encontrados por rendimiento y fecha de floración y componentes del rendimiento están localizados en los cromosomas 1H (3 campos), 2H (8 campos) y 5H(5 campos) coincidentes respectivamente con HvFT3 locus, eam6/Eps-­‐2 (earliness per se) locus y con el locus de vernalización Vrn-­‐H1. Una ulterior análisis de QTL hecha con el método “Multi Environment Trial” ha revelado que los QTL localizados en el locus eam6/Eps-­‐2 (cromosoma 2H) y Vrn-­‐H1 (cromosoma 5H) son comunes por rendimiento y fecha de floración en los 18 campos de ensayo. Por esto utilizamos todos lo datos ambientales coleccionadas durante todo el ciclo del cultivo para investigar la sensibilidad de dichos QTL a las co-­‐variables ambientales. La mayoría de las asociaciones encontradas están relacionadas con temperaturas y variables relacionadas con estas. Eam6/Eps-­‐2 muestra una interacción de tipo cuantitativo con dichas variables mientras Vrn-­‐H1 muestra una interacción de tipo cualitativo con dichas variables. Las 185 variedades ensayadas fueron genotipadas con 185 SNPs y fenotipadas por resistencia a frío en dos ensayos uno en España y otro en Italia. El primer ensayo fue caracterizado por un invierno excepcionalmente frío, mientras el de Italia ha sido utilizado en pasado por testar resistencia a frío debido a los inviernos rígidos que suelen registrarse en dicha localidad. Los datos fueron utilizados para llevar a cabo la analisis GWAS “Genome Wide Association Analysis”. Los resultados permitieron identificar 13 regiones genomicas involucradas en la resistencia a frio. Entre ellas tres regiones coinciden con loci ya mapeados y conocidos por ser involucrados en la respuesta a frio en los cromosomas 2HL, 4HL y 5HL.
8

Development and application of bioinformatic tools for the representation and analysis of genetic diversity

Casillas Viladerrams, Sònia 20 February 2008 (has links)
La variació genètica és la pedra angular de l'evolució biològica. La descripció i explicació de les forces que controlen la variació genètica dins i entre poblacions és el principal objectiu de la genètica de poblacions. L'obtenció d'un número explosiu de seqüències nucleotídiques a diferents gens i espècies ha canviat radicalment les perspectives de la genètica de poblacions, transformant-la des d'una ciència empírica insuficient fins a un esforç interdisciplinari de gran abast, on els aparells de generació de noves seqüències a gran escala s'integren amb eines bioinformàtiques per a l'extracció i gestió de dades, juntament amb avançats models teòrics i estadístics per a la seva interpretació. Aquesta tesi és un projecte de bioinformàtica i genètica de poblacions complet, l'objectiu principal del qual és l'estudi de la diversitat genètica a les poblacions. S'ha dut a terme en tres passos seqüencials: (i) el desenvolupament d'eines per a l'extracció, processat, filtrat i control de qualitat de seqüències nucleotídiques, (ii) la generació de bases de dades de coneixement a partir de les dades obtingudes a la primera part i (iii) la prova d'hipòtesis que requereixen de dades de varies espècies i loci. A la primera part de la tesi hem desenvolupat PDA (Pipeline Diversity Analysis), una aplicació Web de codi obert que permet l'exploració del polimorfisme a grans conjunts de seqüències de DNA heterogènies. Aquesta eina es nodreix dels milions de seqüències haplotípiques d'estudis individuals que hi ha emmagatzemades a les principals bases de dades moleculars i genera dades de genètica de poblacions que poden ser utilitzades per a descriure patrons de variació nucleotídica a qualsevol espècie o gen. Totes les dades extretes i analitzades a la primera part de la tesi són utilitzades a la segona part per a crear un recurs via Web complet que proporciona col·leccions de seqüències polimòrfiques amb les seves mesures de diversitat associades en el gènere Drosophila (DPDB, Drosophila Polymorphism Database). Aquest recurs ha significat un repte ambiciós que ha permès posar a prova l'eficiència del sistema creat a la primera part.Finalment, s'inclouen dos estudis que utilitzen els mòduls d'extracció i anàlisi de dades desenvolupats a la primera part. En el primer, hem estudiat patrons de variació genètica per a inferir selecció negativa i positiva a seqüències conservades no codificadores a Drosophila. Per a aquest estudi hem utilitzat dades de re-seqüenciació a D. melanogaster junt amb dades genòmiques comparatives a d'altres espècies de Drosophila per a demostrar que les regions fredes de mutació no poden explicar aquests blocs conservats. Els resultats mostren que les seqüències conservades no codificadores són mantingudes per l'acció de la selecció purificadora. El segon estudi es centra en l'evolució codificant dels gens Hox, una classe de factors de transcripció essencials en el desenvolupament primerenc que estan involucrats en l'especificació de les regions al llarg de l'eix anteroposterior del cos. Hem mesurat les taxes de divergència nucleotídica i de fixació d'insercions i delecions a tres gens Hox, i les hem comparat amb les de tres gens derivats de Hox i un conjunt de gens no Hox per a provar la hipòtesi que els gens Hox evolucionen lentament. Els resultats mostren que tant el número de substitucions no sinònimes com el grau de constrenyiment funcional no són significativament diferents entre els gens Hox i els no Hox, i que els gens Hox i els derivats de Hox contenen significativament més insercions i delecions que els gens no Hox a les seves seqüències codificants. Per tant, els gens Hox evolucionen més ràpidament que altres gens essencials expressats al desenvolupament primerenc, amb patrons d'expressió complexos o amb introns llargs rics en elements cis-reguladors.Resumint, els treballs presentats a aquesta tesi tanquen un cicle complet de projecte bioinformàtic, incloent tots els passos necessaris des de l'extracció de dades fins a la generació de nou coneixement científic. És més, el resultat de cada pas és la llavor per a múltiples possibles estudis en el següent pas, i per tant aquesta tesi té moltes aplicacions per a la comunitat científica. / La variación genética es la piedra angular de la evolución biológica. La descripción y explicación de las fuerzas que controlan la variación genética dentro y entre poblaciones es el principal objetivo de la genética de poblaciones. La obtención de un número explosivo de secuencias nucleotídicas en distintos genes y especies ha cambiado radicalmente las perspectivas de la genética de poblaciones, transformándola desde una ciencia empírica insuficiente a un esfuerzo interdisciplinario de un gran alcance, donde los aparatos de generación de nuevas secuencias a gran escala se integran con herramientas bioinformáticas para la extracción y gestión de datos, junto a avanzados modelos teóricos y estadísticos para su interpretación.Esta tesis es un proyecto de bioinformática y genética de poblaciones completo, cuyo objetivo es el estudio de la diversidad genética en las poblaciones, que se ha llevado a cabo en tres pasos secuenciales: (i) el desarrollo de herramientas para la extracción, procesado, filtrado y control de calidad de secuencias nucleotídicas, (ii) la generación de bases de datos de conocimiento a partir de los datos obtenidos en la primera parte y (iii) la puesta a prueba de hipótesis que requieren de datos de varias especies y loci. En la primera parte de la tesis hemos desarrollado PDA (Pipeline Diversity Analysis), una aplicación Web de código abierto que permite la exploración del polimorfismo en grandes conjuntos de secuencias de DNA heterogéneas. Esta herramienta se alimenta de los millones de secuencias haplotípicas de estudios individuales que hay almacenados en las principales bases de datos moleculares y genera datos de genética de poblaciones que pueden ser utilizados para describir patrones de variación nucleotídica en cualquier especie o gen. Todos los datos extraídos y analizados en la primera parte de la tesis son utilizados en la segunda parte para crear un recurso vía Web completo que proporciona colecciones de secuencias polimórficas con sus medidas de diversidad asociadas en el género Drosophila (DPDB, Drosophila Polymorphism Database). Este recurso ha significado un reto ambicioso que ha permitido poner a prueba la eficiencia del sistema creado en la primera parte.Finalmente, se incluyen dos estudios que utilizan los módulos de extracción y análisis de datos desarrollados en la primera parte. En el primero, hemos estudiado los patrones de variación genética en secuencias conservadas no codificadoras para inferir selección negativa y positiva en Drosophila. En este estudio hemos utilizado datos de re-secuenciación en D. melanogaster junto con datos genómicos comparativos en otras especies de Drosophila para demostrar que las regiones frías de mutación no pueden explicar estos bloques conservados. Los resultados muestran que las secuencias conservadas no codificadoras se mantienen por la acción de la selección purificadora. El segundo estudio se centra en la evolución codificadora de los genes Hox, una clase de factores de transcripción esenciales en el desarrollo temprano que están involucrados en la especificación de las regiones a lo largo del eje anteroposterior del cuerpo. Hemos medido las tasas de divergencia nucleotídica y de fijación de inserciones y deleciones en tres genes Hox, y las hemos comparado con las de tres genes derivados de Hox y un conjunto de genes no Hox para probar la hipótesis que los genes Hox evolucionan lentamente. Los resultados muestran que tanto el número de sustituciones no sinónimas como el grado de constreñimiento funcional no son significativamente distintos entre los genes Hox y los no Hox, y que los genes Hox y los derivados de Hox contienen significativamente más inserciones y deleciones que los genes no Hox en sus secuencias codificadoras. Así, los genes Hox evolucionan más rápidamente que otros genes esenciales expresados en el desarrollo temprano, con patrones de expresión complejos o con intrones largos ricos en elementos cis-reguladores.En síntesis, los trabajos presentados en esta tesis cierran un ciclo completo de proyecto bioinformático, incluyendo todos los pasos necesarios desde la extracción de datos hasta la generación de nuevo conocimiento científico. Es más, el resultado de cada paso es la semilla para múltiples posibles estudios en el siguiente paso, y por lo tanto esta tesis tiene muchas aplicaciones para la comunidad científica. / Genetic variation is the cornerstone of biological evolution. The description and explanation of the forces controlling genetic variation within and between populations is the main goal of population genetics. The deciphering of an explosive number of nucleotide sequences in different genes and species has changed radically the scope of population genetics, transforming it from an empirically insufficient science into a powerfully explanatory interdisciplinary endeavor, where high-throughput instruments generating new sequence data are integrated with bioinformatic tools for data mining and management, and advanced theoretical and statistical models for data interpretation. This thesis is an integrative and comprehensive bioinformatics and population genetics project whose central topic is the genetic diversity of populations. It is accomplished in three sequential steps: (i) the development of tools for data mining, processing, filtering and quality checking of raw data, (ii) the generation of databases of knowledge from refined data obtained in the first step, and (iii) the testing of hypotheses that require multi-species and/or multi-locus data. In the first part of the thesis, we have developed PDA Pipeline Diversity Analysis , an open-source, web-based tool that allows the exploration of polymorphism in large datasets of heterogeneous DNA sequences. This tool feeds from the millions of haplotypic sequences from individual studies that are stored in the main molecular biology databases, and generates high-quality, population genetics data that can be used to describe patterns of nucleotide variation in any species or gene. All the extracted and analyzed data resulting from the first part of this thesis is used in the second step to create a comprehensive on-line resource that provides searchable collections of polymorphic sequences with their associated diversity measures in the genus Drosophila (DPDB Drosophila Polymorphism Database ). This resource means an ambitious pledge to test the efficiency of the system created in the first part.Finally, two different studies that make use of the modules of data mining and analysis developed are shown. First, we study patterns of sequence variation to infer constraint and adaptation in Drosophila conserved noncoding sequences (CNSs). For this study we have used population genetics re-sequencing data from D. melanogaster together with comparative genomic data from other Drosophila species. We show that patterns of nucleotide sequence evolution in Drosophila CNSs are incompatible with the notion that mutational cold-spots explain these conserved blocks. Rather, the results support the hypothesis that CNSs are maintained by the action of purifying selection. The second study focuses on the coding evolution of Hox genes, a class of essential transcription factors expressed early in development that are involved in the specification of regional identities along the anteroposterior body axis. We have measured the rates of nucleotide divergence and fixation of insertions and deletions of three Hox genes, and compared them with those of three Hox-derived genes and a set non-Hox genes to test the hypothesis that Hox genes evolve slowly. Our results show that both the number of nonsynonymous substitutions and the degree of functional constraint are not significantly different between Hox and non-Hox genes, and that Hox and Hox-derived genes contain significantly more insertions and deletions than non-Hox genes in their coding sequences. Thus, Hox genes evolve faster than other essential genes expressed early in development, with complex expression patterns or with long introns rich in cis-regulatory elements.As a whole, the works presented in this thesis round a complete bioinformatics project off, including all the necessary steps from mining the data to generating new scientific knowledge. More interestingly, the outcome of each step is the seed of multiple possible studies in the next step, and thus this thesis has many applications for the scientific community.
9

Functional analysis of position effects of inversion 2j in Drosophila buzzatii: gene CG13617 silencing and its adpative significance

Puig Font, Marta 23 December 2010 (has links)
És sabut de fa molt temps que les inversions cromosòmiques son mantenides per selecció natural a les poblacions de Drosophila. No obstant, els mecanismes moleculars que generen aquest valor adaptatiu encara no es coneixen. A les poblacions naturals de D. buzzatii, la inversió 2j forma un polimorfisme equilibrat amb l’ordenació 2st, en què els individus 2j tenen una mida més gran y un temps de desenvolupament més llarg en comparació amb els 2st. En aquest treball hem posat a provat la hipòtesi de que un efecte de posició d’un dels punts de trencament podria ser la causa d’aquests canvis fenotípics. Per a fer-ho hem analitzat l’expressió d’un gen adjacent al punt de trencament proximal, CG13617, en línies de D. buzzatii amb i sense la inversió 2j. Hem trobat que els embrions 2j presenten un nivell d’expressió de CG13617 cinc vegades menor causat per un RNA antisense originat en una còpia d’un transposó de la família Galileo inserit al punt de trencament. Les conseqüències funcionals de la reducció de l’expressió de CG13617 s’han investigat utilitzant la tècnica de RNA interferència per reproduir aquest silenciament a D. melanogaster. Els experiments de microarrays i RT-PCR en temps real comparant larves de primer estadi amb i sense expressió de CG13617 han revelat que 41 gens mostren nivells d’expressió reduïts quan CG13617 és silenciat, mentre que cap gen presenta un increment. A més, hi ha un excés significatiu de gens implicats en la replicació del DNA i el cicle celular entre els afectats pel silenciament de CG13617. Nou de deu d’aquests gens van ser analitzats a D. buzzatii i també tenen un nivell d’expressió reduït en embrions 2j, però no en larves de primer estadi, una fase en què la diferència d’expressió de CG13617 entre ordenacions cromosòmiques és menor i el RNA antisense ja no es transcriu. Per a esbrinar la possible funció d’aquest gen hem dut a terme un exhaustiu anàlisi de seqüències nucleotídiques i proteiques en els 12 genomes de Drosophila disponibles i també en altres organismes. La proteïna CG13617 conté un dit de zinc tipus C2H2 molt conservat, tres regions que poden formar coiled coils, dues seqüències PEST i senyals de localització i exportació nuclear. També presenta similitud amb la proteïna humana DZIP1 i amb Iguana, un component de la via de senyalització Hedgehog al peix zebra, fet que indica que el seu paper dins la cèl·lula podria estar relacionat amb el transport de factors de transcripció cap a dins i cap a fora del nucli. Aquests resultats suggereixen que el gen CG13617 podria estar implicat en la regulació de la replicació del DNA i que l’efecte de posició en els portadors de la inversió 2j podria contribuir a explicar les diferències fenotípiques observades entre els individus 2st i 2j, així com el valor adaptatiu d’aquesta inversió. / Chromosomal inversions have been known for a long time to be maintained by natural selection in Drosophila populations. However, the molecular mechanisms underlying their adaptive value remain uncertain. In D. buzzatii natural populations, inversion 2j forms a balanced polymorphism with the 2st arrangement, in which 2j individuals have a larger size and a longer developmental time compared to 2st carriers. In this work we tested the hypothesis that a position effect of one of the inversion breakpoints could be the cause of these phenotypic changes by analyzing the expression of a gene adjacent to the proximal breakpoint, CG13617, in D. buzzatii lines with and without inversion 2j. We have found that in 2j embryos an antisense RNA originated in a copy of a Galileo family transposon inserted at the breakpoint causes a 5-fold decrease of the expression level of CG13617. In order to investigate the functional consequences of the reduction in CG13617 expression, we have used RNA interference to reproduce this silencing in D. melanogaster. Microarray and real-time RT-PCR experiments comparing first instar larvae with and without CG13617 expression revealed that 41 genes show reduced expression levels when CG13617 is silenced, while none is up-regulated. Interestingly, genes involved in DNA replication and cell cycle are significantly enriched among those affected by CG13617 silencing. Nine out of ten of these genes analyzed in D. buzzatii also show a reduced expression level in 2j embryos, but not in first instar larvae, a stage where the CG13617 expression difference between chromosomal arrangements is lower and the antisense RNA is no longer transcribed. To gain insight into the potential function of this gene we have carried out a comprehensive nucleotide and protein sequence analysis in the 12 available Drosophila genomes and also in other organisms. CG13617 protein contains a conserved C2H2 zinc finger, three coiled coil regions, two PEST sequences, and putative nuclear localization and export signals, and shows similarity to human DZIP1 and zebrafish Iguana (a component of the Hedgehog signaling pathway) proteins, which indicates that its cellular role could be related to the transport of transcription factors in and out of the nucleus. These results suggest that gene CG13617 could be involved in the regulation of DNA replication and that the position effect in 2j carriers might contribute to explain the phenotypic differences observed between 2st and 2j individuals as well as the adaptive value of the inversion.
10

Mètode Bayesià per a l’anàlisi d’Haplotips en estudis d’Associació Genètica. Aplicació a dades d’Esquizofrènia i Càncer

Iniesta Benedicto, Raquel 23 November 2010 (has links)
Els avenços que a les darreres dècades han protagonitzat les tècniques de genotipatge i de seqüenciació, unit al desenvolupament de tècniques estadístiques especialitzades i sofisticades, han permès elaborar noves vies de recerca per comprendre l’etiologia de malalties complexes l’origen de les quals, en molts casos, és multifactorial. Així com s’han establert factors ambientals que poden modular el risc de patir certes malalties, també s’han detectat variants genètiques que hi poden estar involucrades. Patologies com la diabetis, el càncer, l’esquizofrènia o l’asma es veuen influenciades per factors genètics en interacció amb factors ambientals. Al capdavant d’aquestes investigacions es troben els mapes de polimorfismes. El polimorfisme més comú al genoma humà és la variació en una sola base de la seqüència genòmica, l’anomenat ”Single Nucleotide Polimorphismï conegut per les seves inicials ”SNP”. Degut a la seva abundància, els SNPs són molt adients per generar mapes genètics i han esdevingut els marcadors més utilitzats en estudis d’associació genètica. Si bé des de fa dècades l’estudi del genoma humà s’ha centrat principalment en analitzar les variacions en la seqüència genòmica, des d’inicis de l’any 2000 sabem per diversos estudis que aquestes variacions tendeixen a donar-se en bloc. D’altra banda, també s’ha demostrat que les recombinacions genètiques que es donen al llarg del genoma no es produeixen de manera uniforme. Per aquest motiu, el genoma presenta zones que es transmeten en bloc, de progenitors a descendents, i que poden incloure blocs de variacions. Aquestes zones de baixa recombinació que es segreguen en bloc són els anomenats haplotips. Els haplotips poden facilitar el descobriment de gens relacionats amb malalties que pateixen els éssers humans. L’inter`Les en l’assignació d’haplotips i l’anàlisi de l’associació entre haplotips i malaltia en mostres d’individus no relacionats ha crescut incommensurablement als darrers anys degut a l’èmfasi que projectes com HapMap han situat sobre l’anàlisi d’haplotips. Ara bé, la deter-minació dels haplotips donada una mostra de genotips per un conjunt d’individus no sempre és immediata, havent de recórrer a tècniques específiques per tal de separar els cromosomes. Les tècniques de tipus molecular són les que aporten menys error però desafortunadament són cares i això dificulta el seu ús, sobretot en estudis poblacionals que tracten amb mostres grans. Per superar aquesta limitació, les investigacions han tendit a utilitzar la inferència estadística com a via més usual a l’hora de determinar els haplotips. La inferència sobre les freqüències haplotípiques és una bona solució per reconstruir la mostra haplotípica, però cal tenir present els efectes que el fet de treballar amb estimacions comportarà sobre tots els càlculs que es realitzin amb la mostra. En aquest sentit, resulta interessant dedicar esfor¸cos per tal d’intentar minimitzar la propagació d’aquests errors en les anàlisis d’associació genètica amb haplotips. Tot i que existeix diversitat de programes per fer anàlisis haplotípiques aplicables a mostres d’individus no relacionats, molts d’ells presenten limitacions que esdevenen una bona mo-tivació per intentar cercar d’altres alternatives teòriques i computacionals per tractar més eficientment la problemàtica dels haplotips. En aquesta tesi doctoral es presenta el desenvolupament i la implementació informàtica d’un mètode per estimar haplotips i els efectes associats a diversos tipus de fenotips. El marc teòric amb que s’ha treballat és la inferència Bayesiana combinada amb tècniques de Markov Chain Monte Carlo que optimitzin les qües-tions computacionals. L’eina resultat és el paquet BayHap, publicada com a paquet a l’entorn estadístic R. El programa s’ha validat sobre escenaris de dades simulats i sobre dades reals. L’aplicació mostra millores en l’estimació d’efectes associats a haplotips amb baixa freqüència i alhora ofereix la possibilitat de dur a terme l’anàlisi d’haplotips sota un punt de vista bayesià amb les avantatges que aquest fet ofereix. / Nowadays, haplotypic information has become vitally important to clarify the genetic basis of the etiology of some common diseases. Comparing DNA of healthy and diseased individuals let us to describe changes in the genomic sequence that could modify the risk of su ering from the disease. Association studies are the framework where this class of analysis are carried out. The DNA variations more often analyzed due to its high frequency along the genome are the Single Nucleotide Polimorphisms. One \SNP" is the change in only one nucleotide between individuals at the same position of their genomes. Is well known that there are zones in the genomic sequence with a low rate of recombinations, that are inherited as a block by the o spring. These zones are called haplotypes, and everyone carries two of them. On the other hand, in the last decade researchers have stated that mutations as SNPs are also transmitted in blocks, situated in haplotypic zones. For all of this, the knowledge of haplo- types corresponding to a sample of genotypes observed for some SNPs of a set of unrelated individuals could be very helpful to better understand the genetic association with a phe- notype of interest. Initiatives as the international HapMap project have strongly motivated the scienti c community to use haplotypes in association analysis. Unfortunately, in the absence of family data, obtaining haplotypic information is not straightforward. Since every cell of the human organism contains 22 pairs of homologous chromosomes, plus the sexual chromosome, for each chromosomical location at the autosomal chromosomes there are two bases, one for each homologous chromosome at the same position of the DNA sequence. Given that current lab techniques usually only report genotypic data and do not provide the chromosome for each base, individuals with two or more heterozygous sites have uncertain haplotypes because there is more than one possible haplotype pair compatible with their genotype. To overcome this limitation, research has tend to use statistical inference as the most common way to determine haplotype information. Although statistical inference of haplotypes frequencies is a good solution to reconstruct the haplotypes sample researchers have to take into account the error propagation in posterior analysis. This is an encouraging situation to apply e orts in order to minimize unwanted e ects. Even though there are some programs to do haplotypic analysis over unrelated individuals, most of them have unresolved questions as could be the estimation of association between disease and low frequency haplotypes. In this work we develop and implement a method to infer haplotypes and association with many types of phenotypes. The theoretical frame- work in which we based our algorithm is the bayesian inference and Markov Chain Monte Carlo techniques. The resulting application is an R package called BayHap available from de repository of packages of this free statistical environment. The program was validated through computational simulations and also applied over real data. The application shows better performance than other algorithms in case of low frequencies haplotypes. In addition, the package o ers the chance of make analysis through a bayesian point of view, with all the strength this fact can suppose.

Page generated in 0.0514 seconds