1 |
Caracterización de Septin 4, un gen que codifica un potencial sustrato de Parkin en Drosophila.Muñoz i Soriano, Verònica 07 April 2008 (has links)
No description available.
|
2 |
Proposal, evaluation and application of two new methodologies for genetic profiling in association studiesUrrea Gales, Víctor 22 April 2015 (has links)
L'objectiu de l'epidemiologia genètica és comprendre els efectes dels gens i els factors ambientals en la salut humana. Un aspecte important és l’estudi del paper de la variabilitat genètica en el risc de malalties comunes com la diabetis, malalties cardiovasculars, càncer, Alzheimer, etc. Aquesta tesi es centra en la identificació de múltiples variants genètiques per predir el risc a la malaltia i presenta dues aproximacions metodològiques per a la identificació de perfils genètics en presència d'epistasi. Un efecte epistàtic o una interacció genètica apareix quan l'efecte conjunt de diversos marcadors genètics sobre el fenotip observat no queda explicat pels seus efectes marginals. La principal dificultat en l'estudi de les interaccions genètiques és que generalment s'analitzen centenars o milers de marcadors genètics, i això fa inviable l'anàlisi de totes les possibles interaccions, des del punt de vista computacional. Les metodologies presentades permeten explorar interaccions d'ordre alt amb un cost computacional raonable. També s’aborda la simulació de dades amb propietats similars a les d’estudis d’associació genètica. / The aim of genetic epidemiology is to understand the effects of genes and environmental factors on human health. An important issue is the role of the genetic variability in the risk for common diseases such as diabetes, cardiovascular disease, cancer, Alzheimer's, etc. This thesis is focused on the identification of genetic variants at multiple loci for prediction of disease risk and presents two new methodological approaches to address genomic profiling in presence of epistasis. An epistatic effect or a genetic interaction is present when the combined effect of several genetic markers on the observed phenotype is not explained by their marginal effects. The main difficulty in the study of genetic interactions is that usually hundreds or thousands of genetic markers are analysed, which makes the analysis of all possible interactions unfeasible, from a computational point of view. The proposed methodologies allow higher order interactions to be explored with a reasonable computational cost. Another prominent issue addressed in this thesis is the simulation of data with similar properties to real genetic association studies.
|
3 |
Mechanisms controlling the selective iron and zinc biofortification of riceBanakar, Raviraj 05 February 2016 (has links)
L’arròs es un cultiu bàsic, consumit per mes de 3 billons de persones. Es una font pobra en ferro (Fe) i zinc (Zn) per la qual cosa les poblacions pobres que depenen de l’arros per a la seva supervivència, sofreixen d’anèmia por deficiència de ferro (IDA) i zinc (ZnD). La desnutrició es un repte important, especialment en els països en desenvolupament on no hi ha les mesures nutritives comunes als països industrialitzats (una dieta variada, programes de fortificació i suplements dietètics). El bio-enriquiment mitjançant l’enginyeria genètica del contingut de Fe y Zn en arròs es una estratègia prometedora y pot resultar en un augmentant de les seves concentracions. Amb l’objectiu d’aconseguir arròs que acumuli nivells mes elevats de Fe y Zn he obtingut una població d’arròs transgènic mitjançant transformació combinatòria amb quatre gens implicats en l’absorció, transport, acumulació i biodisponibilitat d’aquestos dos minerals. Aquesta població combinatòria m’ha servit per a identificar els mecanismes antagònics i sinèrgics que son essencials per a controlar l’acumulació de Fe i Zn. / El arroz es un cultivo básico para más de 3 billones de personas. El arroz es una fuente pobre de hierro (Fe) y zinc (Zn) por lo cual las poblaciones pobres que dependen del arroz para su supervivencia, sufren de anemia por deficiencia de hierro (IDA) y zinc (ZnD). La desnutrición es un reto importante, especialmente en los países en desarrollo donde están ausentes las medidas que son comunes en los países industrializados (dieta variada, programas de fortificación y suplementos dietéticos). El bio-enriquecimiento mediante la ingeniería genética del contenido de Fe y Zn en arroz es una estrategia prometedora para aumentar sus concentraciones.
Con el objetivo de producir granos con más alto nivel de Fe y Zn he obtenido una población de arroz transgénico mediante transformación combinatoria con cuatro genes implicados en la absorción, transporte, acumulación y biodisponibilidad de estos dos minerales. Esta población combinatoria me sirvió para identificar los mecanismos antagónicos y sinérgicos que son esenciales para controlar la acumulación de Fe y Zn. / Rice is staple crop for more than 3 billion people, since rice is poor source of iron (Fe) and zinc (Zn) world’s poorest people who depend on rice for their survival suffer from iron deficiency anaemia (IDA) and zinc deficiency (ZnD). Malnutrition is a significant challenge, particularly in the developing world where measures that are commonplace in industrialized countries (varied diet, fortification schemes, and dietary supplements) are largely absent. Biofortification of rice with Fe and Zn by genetic engineering is a promising strategy to increase Fe and Zn concentration. I established a combinatorial transgenic rice population by transformation with four genes involved in uptake, transport, accumulation and bioavailability of Fe and Zn, aiming to produce grains containing higher level of these two minerals. This combinatorial population helped to identify key antagonistic and synergistic mechanisms controlling Fe and Zn accumulation.
|
4 |
Caracterització del gen Acetoacetil-CoA sintetasaAguiló Payeras, Francesca 13 November 2008 (has links)
CATALÀ: La cetogènesi és un procés mitocondrial a partir del qual es sintetitzen els cossos cetònics: acetona, acetoacetat i 3-hidroxibutirat, que són emprats com a font d'energia en el mitocondri dels teixits extrahepàtics a través de l'acció de la Succinil-CoA:3-cetoàcid-CoA transferasa (SCOT). Alternativament, en el citosol dels teixits lipogènics, l'acetoacetat pot ser activat a acetoacetil-CoA, a través de l'enzim Acetoacetil-CoA sintetasa (AACS), proporcionant unitats acetil-CoA de manera independent i anàloga al citrat produït en el mitocondri, transferit al citosol i escindit per l'ATP-citrat liasa.1. Estudi de la funcionalitat de la seqüència del cDNA del gen AACS humà predit. Hem demostrat que la seqüència predita del cDNA del gen AACS humà codifica per una proteïna funcional. Els valors de les constants de Michaellis-Menten (Km) de la proteïna GST-AACS son de 37.6M, 155.24M i 2.3M per l'acetoacetat, l'ATP i el CoA, respectivament. A més, l'enzim AACS humà és inhibit a 15 M de CoA. 2. Estudi de les modificacions posttraduccionals de la proteïna AACS humana.L'anàlisi de la seqüència aminoacídica de la proteïna AACS humana revela la presència de diversos residus de lisina com a putatius llocs d'acetilació. La substitució de la Lys634 per Arg provoca una disminució de l'estat d'acetilació de la proteïna però no l'aboleix totalment. Mitjançant la deleció de l'extrem COOH-terminal hem pogut concloure que aquesta regió és determinant per a l'estat d'acetilació, encara que no es pot descartar la possibilitat d'altres residus de lisina acetilables en l'extrem NH2-terminal.3. Aportació al procés de la colesterogènesi del gen AACS humà.S'ha analitzat l'efecte de la sobreexpressió de la proteïna AACS humana en el procés de la colesterogènesi, mitjançant la generació d'un sistema induïble BDTMTet-On Gene Expression system en cèl·lules HeLa. L'acetoacetil-CoA, fruit de la reacció catalitzada per l'AACS, és incorporat de manera preferencial cap a la síntesi de colesterol, implicant que l'esquelet de quatre carbonis de l'acetoacetat o bé la seva forma activa, l'acetoacetil-CoA, no s'equilibra completament amb el pool de dos carbonis representat per l'acetat i l'acetil-CoA. Una de les hipòtesis que explicarien aquest fet és la possible existència d'interaccions (channeling) entre els primers enzims de la via de la colesterogènesi, és a dir, entre l'AACS i l'HMGCS1. No obstant això, els nostres experiments mostren que ambdues proteïnes no interaccionen ni de manera directa ni indirecta.4. Estudi dels mecanismes de regulació transcripcional del gen AACS humà.Hem caracteritzat els elements necessaris per a que es produeixi l'activitat basal del gen AACS humà i hem estudiar la seva regulació transcripcional per factors de transcripció implicats en l'homeòstasi lipídica: LXR, SREBPs i PPAR. Els nostres resultats mostren que l'Inr és funcional, i que les caixes GC presents en el promotor proximal del gen AACS uneixen el factor de transcripció Sp1, important en la mediació de l'activitat basal d'aquest promotor. Els putatius LXRE i SRE, localitzants en el promotor in silico, no són funcionals. En canvi, PPARregula l'expressió del gen AACS d'una manera no canònica a través de la proteïna Sp1 i mitjançant la interacció amb les caixes GC. 5. Regulació de l'expressió del gen AACS de rata en diferents situacions fisiològiques: ritme circadiari.L'expressió del gen AACS està sotmesa a regulació circadiària, produint-se el zenit d'expressió en fetge i en TAB a l'inici de la fase fosca, coincidint amb el període de màxima activitat dels rosegadors. El patró d'expressió del factor de transcripció SREBP-1 i de l'AACS en fetge és paral·lel, suggerint que SREBP-1c podria ser responsable de mitjançar la regulació de l'expressió de l'AACS en aquest òrgan en les situacions fisiològiques estudiades: dejuni/realimentació en les fases diürna i nocturna, i administració d'insulina. / Acetoacetyl-CoA synthetase (AACS, acetoacetate-CoA ligase, EC 6.2.1.16) is a cytosolic ketone body (acetoacetate)-specific ligase found in several lipogenic tissues that might play an important role in the provision of Acetyl-CoA units for lipogenesis. Transfer of acetyl as acetoacetate, from the mitochondria to the cytosol, would operate in parallel with transfer via citrate and ATP-citrate lyase.1. Kinetic parameters of the human AACS.The KM values for acetoacetate, ATP and CoA were 37.6 M, 155.24 M, and 2.3 M respectively. CoA exerts an inhibitory effect when concentration raised over 15 M.2. Study of the posttranslational protein modification of human AACS.Sequence analysis of human AACS protein shows the presence of multiple lysine residues as a target of acetylation modification. The invariant lysine of the PX4GK domain, is not relevant for total levels of human AACS acetylation because the mutation of Lys-633 to arginine, did not abrogate the reactivity with the α-acetyl-lysine antibody. However the replacement of Lys-634 with arginine yielded a decrease in the acetylation status of human AACS protein. 3. Human AACS and cholesterogenesis.We studied the effect of human AACS overexpression in HeLa cells using the BDTMTet-On Gene Expression system. As previosly reported, acetoacetate is used preferentially for cholesterol biosynthesis although we couldn't observe a substrate channeling in the early steps of cholesterogenesis.4. Study of the mechanisms of transcriptional regulation of human AACS gene.We isolated the human AACS promoter, characterized the elements required to initiate transcription and analyzed the expression of the gene in response to LXR, SREBPs and PPAR, all known important factors for lipidic homeostasis. We show that the human AACS promoter contains an Inr sequence and several GC boxes that are determinant for its basal activity. We also show that PPAR transcriptionally induces the expression of the AACS gene by a non-canonical mechanism, since it is recruited to the AACS promoter by direct interaction with Sp1. 5. Circadian rhythm.AACS transcriptional regulation is under the control of circadian rhythm in liver and BAT but not in brain. Our results suggest that circadian expression in liver is driven by the rhytmic expression of SREBP-1c.
|
5 |
Desarrollo y transferibilidad de los microsatélites en Prunus y su aplicación en estudios de variabilidadMnejja Abd Mouleh, Mourad 27 February 2015 (has links)
The Prunus genus belongs to the Rosaceae family and includes stone fruit crops such as peach (P. persica), apricot (P. armeniaca), European plum (P. domestica), Japanese plum (P. salicina), sweet cherry (P. avium) and sour cherry (P. cerasus), as well as almond (P. dulcis), a species cultivated for its seeds. This work aims to develop simple-sequence repeat (SSR) or microsatellite markers in almond and Japanese plum, the only two diploid Prunus species lacking these markers when this thesis began, and to study their variability in a collection of cultivars of each species. In addition, we studied the transferability of the microsatellites obtained from Prunus in other cultivated rosaceous species, including six Prunus species, and three other genus: apple (Malus x domestica), pear (Pyrus comunis) and octoploid strawberry (Fragaria x ananassa).
To develop new microsatellite markers, we used two methods: one from enriched DNA genomic library (for sequences CT/AG), for which we obtained 31 SSRs in almond and 27 in Japanese plum, and another using the available sequences of ESTs (expressed sequence tags) of almond (22 SSRs) and peach (25 SSRs). All these microsatellites were polymorphic in a set of eight cultivars of their respective species.
We used the obtained markers in an extensive collection of almond varieties (30) to study their genetic variability using 47 microsatellites derived from this species (25 genomic and 22 derived from ESTs). A similar study was conducted in 38 varieties of Japanese plum with 27 genomic SSRs obtained in this species. These markers were highly variable in both species, with an average of 7.3 alleles per locus in almond and 7.2 in Japanese plum, allowing us to distinguish individually all the studied genotypes. Our data indicated that the SSRs of the same species are more variable than those developed in other related species. In addition, in almond we found that the microsatellites derived from ESTs, and particularly those located in coding regions, were less variable than those obtained from genomic sequence.
The grouping of the studied varieties in function of their genetic distance (dendrogram) or their population structure was quite similar both in almond and Japanese plum. The almond varieties were grouped by their geographical origin and their flowering time, whereas the Japanese plum varieties, of recent origin and largely developed in the United States, were clustered according to the breeding programs of the different States they were obtained.
A total of 145 Prunus SSRs [25 genomic from almond, peach and Japanese plum, 25 ESTs derived from peach, 22 ESTs derived from almond and 23 derived from apricot (10 genomic and 13 from ESTs)] were chosen to study transferability, all polymorphic and identifying a single locus in the origin species. These microsatellites were studied in eight varieties of the following nine species: almond, peach, European plum, Japanese plum, apricot, sweet cherry, apple, pear and strawberry. Eighty-three percent (83%) of these markers amplified bands of the expected size in the other Prunus species and 63.9% were polymorphic, indicating the high transferability within this genus. This transferability decreased as the genetic distance between the species origin of the SSR and the studied species increased. Thus, only 16.3% of the tested SSRs were transferable to species of other rosaceous genera (apple, pear and strawberry). No significant differences were detected between microsatellites of different origins (genomic and ESTs) regarding their transferability, nor their capacity to detect variability.
From the studied SSRs, 31 amplified and were polymorphic in all tested Prunus species. Twelve, selected to cover the whole genome, were proposed as the universal set for the analysis of variability in Prunus.
|
6 |
Expressió i modulació de gens del desenvolupament ossi: elscasos de la fibrodisplàsia ossificadora progressiva (FOP) i de l'heteroplàsia òssia progressiva (POH)Tarrús de Vehí, Marc 26 June 2003 (has links)
L'estudi dels processos moleculars implicats en la regulació de l'osteogènesi s'ha realitzat en base a dues malalties humanes diferents, les quals estan caracteritzades per la formació ectòpica d'os de naturalesa diversa: la FOP (la fibrodisplàsia ossificadora progressiva) amb formació d'os endocondral i la POH (l'heteroplàsia òssia progressiva) amb formació d'os d'origen intramenbranós.Mitjançant un procés meticulosament regulat, l'esquelatogènesi embrionària humana transforma cèl·lules mesenquimàtiques en sistemes orgànics articulats ben definits espaialment com són el cartílag i l'os. Un dels enigmes per resoldre en la biologia de l'esquelet fa referència als senyals moleculars que són necessaris i suficients per induir una adequada formació de l'esquelet. En condicions normals d'esquelatogènesi, un augment en l'elaboració i activitat del morfogen BMP-4 es troba finament regulat per un nombrós grup de senyals negatius que inclouen -però no es limiten a- antagonistes extracel·lulars de BMP-4 com ara noggin, gremlin, follistatin i chordin, generats per mecanismes de retroalimentació complexos. A mes la formació ectopica d'os també implica altres gens com ara GNAS1, codificador de la subunitat a de les proteïnes G i responsable de la POH.Encara no ha estat identificat el gen que causa la FOP, els resultats obtinguts poden, de fet, ajudar a identificar el gen mutat mitjançant una atenció central en porcions del camí de transducció de senyal de les BMPs. Aquí és on el gen responsable de FOP té més possibilitats de recaure i ja que els nostres resultats indiquen l'existència d'un defecte en la senyalització entre l'estímul de BMP-4 i els seus cognats antagonistas noggin i gremlin, és molt probable que la mutació responsable de FOP s'ubiqui en un dels gens codificadors de proteïnes mediadores o reguladores del camí de senyalització de la BMP-4.En l'estudi relacionat amb la POH, s'ha demostrat que existeixen múltiples formes del gen GNAS1/gnas que s'expressen en cèl·lules preosteoblàstiques MC3T3-E1 de ratolí i també en LCLs humanes. Quan les cèl·lules s'orienten cap a un llinatge osteogènic, s'observen notables diferències en l'expressió dels transcrits de gnas. La inhibició de les isoformes Nesp55 i de la nova forma de Gsa i una activació progressiva de les isoformes XLalpha, antisentit i Gsa amb l'exó 3 exclòs, en conjunt, pot proporcionar un mecanisme coordinat que involucri la unitat transcripcional de gnas en el procés de diferenciació osteogènica de les cèl·lules pluripotents, suggerint que la predisposició de hMCS a dirigir-se a llinatges osteogènics o adipogènics està governada per múltiples interaccions entre els diferents transcrits de gnas. A més, els nostres resultats indiquen que els nivells reduïts fins a la meitat en individus POH podrien influir en processos "downstream" que condueixen a un fenotip osteogènic competent.Aquest treball de recerca ha permès situar en un mateix pla d'estudi processos d'osteogènesi de naturalesa diversa, els quals es desencadenen per camins de transducció alternatius. Les rutes de transducció del senyal de factors TGF-b_, com el morfogen BMP-4 _i proteïnes G s'entrecreuen les unes amb les altres (Cross-talking). Les mutacions en els gens codificadors de proteïnes mediadores o reguladores del camí de senyalització de BMP-4 i els defectes en els camins de senyalització de receptors acoblats a les proteïnes G poden contribuir directament o indirecta a la patogènesi de moltes malalties amb formació heterotòpica d'os. / The molecular processes that control the regulation of osteogenesis were studied in two different human bone disorders characterized by the formation of ectopic bone of distinct nature, FOP (fibrodysplasia ossificans progressiva) with endocondral bone formation and POH (progressive osseous heteroplasia) with bone formation of intramenbranous origin.Through a tightly regulated process, human embryonic skeletogenesis transforms mesenchymal cells into articulated organic systems well defined spatially as are bone and cartilage. One of the enigmas to solve in skeleton biology are the molecular signals that are necessary and sufficient to trigger a proper formation of the skeleton. In normal skeletogenesis, an increase in the elaboration and activity of morforgen BMP-4 is finely regulated by a number of negative signals that include- but is not limited to- extracellular antagonist of BMP-4 as noggin, gremlin, follistatin i chordin, generated by complex feedbacks mechanisms. Moreover, ectopic bone formation also results from an alteration in other genes as GNAS1, GNAS1 codifies for the a subunit of heterotrimeric G proteins which is responsible for POH.Still has not been identified the gene that causes FOP. The results obtained in this work can, in fact , help to identify the mutated gene through a central attention to some portions of the BMPs transductional pathway, here is were the gene FOP has more changes to be found since our results indicate of the existence of a defect in the signaling between the stimulus BMP-4 and its cognates antagonist noggin and gremlin, is quite probable that the mutation responsible for FOP is located in one of the genes that codifies for intermediate or regulatory proteins of the BMP-4 signaling pathway.We have shown in the study related to POH that exist multiple forms of the gene GNAS1/gnas which are expressed in mice preosteoblastic MC3T3-E1 cells. When cells are directed to an osteogenic linage, several remarkable differences are observed in the expression of the gnas transcripts. The inhibition of isoforms Nesp55 and the new form of Gsa and a progressive activation of isoforms XLalpha, antisense and Gsa without exon 3, in general could supply a coordinate mechanism that involves the GNAS1 trascriptional unit in the process of osteogenic differentiation of the pluripotent mesenchymal cells, suggesting that the commitment of hMCS to differentiated to osteogenic and adipogenic lineages is governed by multiple interactions among the gnas transcrits. In addition, our results indicate that the reduced levels of the different GNAS1 transcripts in POH individuals could somehow influence in the downstream signals that conduct that drive into a competent osteogenic phenotype.This research work has let us to situated at the same study plane two different osteogenic processes of diverse nature which are trigger by alternative transductional pathways The signal transductional pathways of TGF-b, as morphogen BMP-4, and G proteins cross talk one with the othert. Mutations at the genes that codify for intermediate and regulatory proteins of BMP-4 signaling pathways and defects in the signaling pathways of receptors coupled to G proteins can contribute directly or indirectly to the pathogenesis of several disorders of bone ectopic formation.
|
7 |
Barley adaptation to stress prone environmentsVisioni, Andrea 19 July 2012 (has links)
Multi
environment
trials
conducted
over
mapping
population
are
often
used
to
test
genotypes
in
a
set
of
environments
that
represent
the
target
environmental
range.
The
first
part
of
this
work
is
the
evaluation
of
the
‘Nure’
x
‘Tremois’
double-‐haploid
mapping
population,
together
with
an
association
panel
comprising
185
barley
varieties
representative
of
the
barley
germplasm
cultivated
in
the
Mediterranean
basin.
Plant
material
was
tested
across
eighteen
site
by
year
field
trials
combination,
in
six
countries
across
the
Mediterranean
basin.
Trials
were
growth
at
sites
contrasting
for
natural
rainfall
(high
vs
low
on
the
base
of
past
meteorological
data)
or
at
the
same
site
with
one
being
rainfed
and
the
other
with
supplementary
irrigation.
Trials
conducted
for
two
years
in
each
one
of
the
sites
and
this
allowed
tocollect
a
huge
data
series
comprising
agronomical
traits
defining
grain
yield
and
yield
components,
phenological
and
environmental
data,
subsequently
used
to
identify
genomic
regions
involved
in
barley
adaptation.
The
118
doubled
haploid
lines
of
the
mapping
population
were
genotyped
with
Diversity
Array
Technology®
(DaRT)
marker
assay
and
subsequently
a
total
of
15
CAPS
and
SSCP
marker
for
candidate
genes
involved
in
phenology
regulation
and
abiotic
stress
response
were
added
to
the
linkage
map
based
on
DaRT
markers.
Data
collected
were
firstly
used
to
perform
QTLs
analysis
with
composite
interval
mapping
for
any
environment/
trait
combination,
results
showed
eight
QTLs
for
grain
yield,
days
to
heading
and
grain
yield
components.
.
The
two
mostly
frequents
QTLs
for
grain
yield
and
days
to
heading
were
located
on
barley
chromosome
1H
(3
trials),
2H
(8
trials)
and
5H
(5
trials)
overlapping
respectively
HvFT3
gene,
the
earliness
per
se
locus
(eam6/Eps-‐2)
and
the
vernalization
gene
Vrn_H1.
A
further
QTL
multi-‐environment
analysis
was
performed
and
revealed
that
across
the
18
field
trials
QTL
for
eam6/Eps-‐2
(2H)
and
Vrn-‐H1
(5H)
were
commons
for
days
to
heading
and
grain
yield.
We
use
all
the
environmental
information
collected
to
check
QTLs
sensitivities
to
co-‐environmental
co-‐variables.
Most
of
significant
associations
collected
were
related
to
temperature
and
temperature-‐based
variables
troughtout
the
growing
cycle.
Eam6/Eps-‐2
showed
non-‐crossover
QTL.E
interaction,
while
for
Vrn-‐H1
crossover
interactions
were
revealed.
The
185
barley
accession
were
genotyped
with
1536
SNPs
and
data
collected
for
this
population
for
cold
resistance
in
two
field
trials
in
Spain
an
Italy,
the
first
trial
was
characterized
by
an
exceptional
winter,
while
the
second
was
previously
know
has
frost-‐prone
environment.
Results
from
genome
wide
association
analysis
showed
13
positive
associations
with
specific
genomic
regions.
Interestingly
several
of
these
QTL
were
coincident
with
the
position
of
previously
mapped
loci
for
cold
tolerance,
on
chromosomes
2HL,
4HL
and
5HL. / Els
assajos
en
localitats
múltiplas
de
poblacions
de
mapeo
s'utilitzen
freqüentment
per
a
testar
genotips
en
un
conjunt
d'ambients
representatius
de
la
condicions
climàtiques
on
es
volen
introduir
aquests
genotips.
La
primera
part
d'això
treball
ha
estat
l'avaluació
de
la
població
de
mapeo
‘Nure
x
Tremois’
constituïda
de
118
de
doble
haploides
d'ordi,
juntament
amb
panell
d'associació
que
comprèn
185
varietats
d'ordi
representatives
del
germoplasma
conreat
en
la
conca
Mediterrània.
El
material
vegetal
ha
estat
assajat
en
una
combinació
de
divuit
camps
per
any
desllorigats
en
sis
països
de
la
conca
mediterrània.
Els
assajos
s'han
portat
a
terme
en
camps
amb
diferent
disponibilitat
d'aigua,
classificats
sobre
la
base
de
les
dades
relatives
a
les
freqüència
i
quantitat
de
les
precipitacions
o
en
el
mateix
lloc
amb
un
camp
en
secà
i
altre
regat.
Els
assajos
es
van
portar
a
terme
per
dos
anys
en
cada
localitat
i
això
va
permetre
la
recollida
d'un
gran
volum
de
dades
que
comprenen
caràcters
agronómicos
relacionats
amb
rendiment
i
components
del
rendiment,
dades
fenológicos
i
ambientals.
Aquestes
dades
es
van
utilitzar
després
per
a
la
identificació
de
regions
genomicas
involucrades
en
l'adaptació
de
l'ordi
a
l'ambient.
Els
118
dobles
haploides
de
la
població
‘Nure
x
Tremois’
es
genotiparon
amb
marcadors
DaRT
(Diversity
Array
Technology),
després
un
set
de
15
marcadors
CAPS
I
SCCP
per
a
gens
candidats
involucrats
en
la
regulació
de
les
fases
fenológicas
van
ser
afegits
al
mapa
de
lligament
construït
amb
els
marcadors
DaRT.
Les
dades
van
ser
utilitzats
per
a
fer
una
anàlisi
de
QTL
amb
procediment
‘Composite
Interval
Mapping’
para
cada
combinació
ambienti/
caràcter.
Es
van
trobar
diversos
QTLs
per
rendiment
i
data
d'espigolat
i
components
del
rendiment.
Els
QTL
mes
freqüents
trobats
per
rendiment
i
data
de
floració
i
components
del
rendiment
estan
localitzats
en
els
cromosomes
1H
(3
camps),
2H
(8
camps)
i
5H
(5
camps)
coincidents
respectivament
amb
HvFT3
locus,
eam6/Eps-‐2
(earliness
per
se)
locus
i
amb
el
locus
de
vernalización
Vrn-‐H1.
Una
ulterior
anàlisi
de
QTL
feta
amb
el
mètode
“Multi
Environment
Trial”
ha
revelat
que
els
QTL
localitzats
en
el
locus
eam6/Eps-‐2
(cromosoma
2H)
i
Vrn-‐H1
(cromosoma
5H)
són
comunes
per
rendiment
i
data
de
floració
en
els
18
camps
d'assaig.
Per
això
utilitzem
tots
el
dades
ambientals
col·leccionades
durant
tot
el
cicle
del
cultiu
per
a
investigar
la
sensibilitat
de
dites
QTL
a
les
co-‐variables
ambientals.
La
majoria
de
les
associacions
oposades
estan
relacionades
amb
temperatures
i
variables
relacionades
amb
aquestes.
Eam6/Eps-‐2
mostra
una
interacció
de
tipus
quantitatiu
amb
aquestes
variables
mentre
Vrn-‐H1
mostra
una
interacció
de
tipus
qualitatiu
amb
aquestes
variables.
Les
185
varietats
assajades
van
ser
genotipadas
amb
185
SNPs
i
fenotipadas
per
resistència
a
fred
en
dos
assajos
uneixo
a
Espanya
i
altre
a
Itàlia.
El
primer
assaig
va
ser
caracteritzat
per
un
hivern
excepcionalment
fred,
mentre
el
d'Itàlia
ha
estat
utilitzat
en
passat
per
testar
resistència
a
fred
a
causa
de
els
hiverns
rígids
que
solen
registrar-‐se
en
aquesta
localitat.
Les
dades
van
ser
utilitzats
per
a
portar
a
terme
la
analisis
GWAS
“Genome
Wide
Association
Analysis”
.
Els
resultats
van
permetre
identificar
13
regions
genomicas
involucrades
en
la
resistència
a
frio.
Entre elles
tres
regions
coincideixen
amb
loci
ja
mapeados
i
coneguts
per
ser
involucrats
en
la
resposta
a
frio
en
los
cromosomes
2HL,
4HL
i
5HL. / Los
ensayos
en
localidades
múltiplas
de
poblaciones
de
mapeo
se
utilizan
frecuentemente
para
testar
genotipos
en
un
conjunto
de
ambientes
representativos
de
la
condiciones
climáticas
donde
se
quieren
introducir
dichos
genotipos.
La
primera
parte
de
esto
trabajo
ha
sido
la
evaluación
de
la
población
de
mapeo
‘Nure
x
Tremois’
constituida
de
118
de
doble
haploides
de
cebada,
junto
con
panel
de
asociación
que
comprende
185
variedades
de
cebada
representativas
del
germoplasma
cultivado
en
la
cuenca
Mediterránea.
El
material
vegetal
ha
sido
ensayado
en
una
combinación
de
dieciocho
campos
por
año
dislocados
en
seis
países
de
la
cuenca
mediterránea.
Los
ensayos
se
han
llevado
a
cabo
en
campos
con
diferente
disponibilidad
de
agua,
clasificados
en
base
a
los
datos
relativos
a
las
frecuencia
y
cantidad
de
las
precipitaciones
o
en
el
mismo
sitio
con
un
campo
en
secano
y
otro
regado.
Los
ensayos
se
llevaron
a
cabo
por
dos
años
en
cada
localidad
y
esto
permitió
la
recogida
de
un
gran
volumen
de
datos
que
comprenden
caracteres
agronómicos
relacionados
con
rendimiento
y
componentes
del
rendimiento,
datos
fenológicos
y
ambientales.
Dichos
datos
se
utilizaron
después
para
la
identificación
de
regiones
genomicas
involucradas
en
la
adaptación
de
la
cebada
al
ambiente.
Los
118
dobles
haploides
de
la
población
‘Nure
x
Tremois’
se
genotiparon
con
marcadores
DaRT
(Diversity
Array
Technology),
después
un
set
de
15
marcadores
CAPS
Y
SCCP
para
genes
candidatos
involucrados
en
la
regulación
de
las
fases
fenológicas
fueron
añadidos
al
mapa
de
ligamento
construido
con
los
marcadores
DaRT.
Los
datos
fueron
utilizados
para
hacer
una
análisis
de
QTL
con
procedimiento
‘Composite
Interval
Mapping’
para
cada
combinación
ambiente/
carácter.
Se
encontraron
varios
QTLs
por
rendimiento
y
fecha
de
espigado
y
componentes
del
rendimiento.
Los
QTL
mas
frecuentes
encontrados
por
rendimiento
y
fecha
de
floración
y
componentes
del
rendimiento
están
localizados
en
los
cromosomas
1H
(3
campos),
2H
(8
campos)
y
5H(5
campos)
coincidentes
respectivamente
con
HvFT3
locus,
eam6/Eps-‐2
(earliness
per
se)
locus
y
con
el
locus
de
vernalización
Vrn-‐H1.
Una
ulterior
análisis
de
QTL
hecha
con
el
método
“Multi
Environment
Trial”
ha
revelado
que
los
QTL
localizados
en
el
locus
eam6/Eps-‐2
(cromosoma
2H)
y
Vrn-‐H1
(cromosoma
5H)
son
comunes
por
rendimiento
y
fecha
de
floración
en
los
18
campos
de
ensayo.
Por
esto
utilizamos
todos
lo
datos
ambientales
coleccionadas
durante
todo
el
ciclo
del
cultivo
para
investigar
la
sensibilidad
de
dichos
QTL
a
las
co-‐variables
ambientales.
La
mayoría
de
las
asociaciones
encontradas
están
relacionadas
con
temperaturas
y
variables
relacionadas
con
estas.
Eam6/Eps-‐2
muestra
una
interacción
de
tipo
cuantitativo
con
dichas
variables
mientras
Vrn-‐H1
muestra
una
interacción
de
tipo
cualitativo
con
dichas
variables.
Las
185
variedades
ensayadas
fueron
genotipadas
con
185
SNPs
y
fenotipadas
por
resistencia
a
frío
en
dos
ensayos
uno
en
España
y
otro
en
Italia.
El
primer
ensayo
fue
caracterizado
por
un
invierno
excepcionalmente
frío,
mientras
el
de
Italia
ha
sido
utilizado
en
pasado
por
testar
resistencia
a
frío
debido
a
los
inviernos
rígidos
que
suelen
registrarse
en
dicha
localidad.
Los
datos
fueron
utilizados
para
llevar
a
cabo
la
analisis
GWAS
“Genome
Wide
Association
Analysis”.
Los
resultados
permitieron
identificar
13
regiones
genomicas
involucradas
en
la
resistencia
a
frio.
Entre
ellas
tres
regiones
coinciden
con
loci
ya
mapeados
y
conocidos
por
ser
involucrados
en
la
respuesta
a
frio
en
los
cromosomas
2HL,
4HL
y
5HL.
|
8 |
Development and application of bioinformatic tools for the representation and analysis of genetic diversityCasillas Viladerrams, Sònia 20 February 2008 (has links)
La variació genètica és la pedra angular de l'evolució biològica. La descripció i explicació de les forces que controlen la variació genètica dins i entre poblacions és el principal objectiu de la genètica de poblacions. L'obtenció d'un número explosiu de seqüències nucleotídiques a diferents gens i espècies ha canviat radicalment les perspectives de la genètica de poblacions, transformant-la des d'una ciència empírica insuficient fins a un esforç interdisciplinari de gran abast, on els aparells de generació de noves seqüències a gran escala s'integren amb eines bioinformàtiques per a l'extracció i gestió de dades, juntament amb avançats models teòrics i estadístics per a la seva interpretació. Aquesta tesi és un projecte de bioinformàtica i genètica de poblacions complet, l'objectiu principal del qual és l'estudi de la diversitat genètica a les poblacions. S'ha dut a terme en tres passos seqüencials: (i) el desenvolupament d'eines per a l'extracció, processat, filtrat i control de qualitat de seqüències nucleotídiques, (ii) la generació de bases de dades de coneixement a partir de les dades obtingudes a la primera part i (iii) la prova d'hipòtesis que requereixen de dades de varies espècies i loci. A la primera part de la tesi hem desenvolupat PDA (Pipeline Diversity Analysis), una aplicació Web de codi obert que permet l'exploració del polimorfisme a grans conjunts de seqüències de DNA heterogènies. Aquesta eina es nodreix dels milions de seqüències haplotípiques d'estudis individuals que hi ha emmagatzemades a les principals bases de dades moleculars i genera dades de genètica de poblacions que poden ser utilitzades per a descriure patrons de variació nucleotídica a qualsevol espècie o gen. Totes les dades extretes i analitzades a la primera part de la tesi són utilitzades a la segona part per a crear un recurs via Web complet que proporciona col·leccions de seqüències polimòrfiques amb les seves mesures de diversitat associades en el gènere Drosophila (DPDB, Drosophila Polymorphism Database). Aquest recurs ha significat un repte ambiciós que ha permès posar a prova l'eficiència del sistema creat a la primera part.Finalment, s'inclouen dos estudis que utilitzen els mòduls d'extracció i anàlisi de dades desenvolupats a la primera part. En el primer, hem estudiat patrons de variació genètica per a inferir selecció negativa i positiva a seqüències conservades no codificadores a Drosophila. Per a aquest estudi hem utilitzat dades de re-seqüenciació a D. melanogaster junt amb dades genòmiques comparatives a d'altres espècies de Drosophila per a demostrar que les regions fredes de mutació no poden explicar aquests blocs conservats. Els resultats mostren que les seqüències conservades no codificadores són mantingudes per l'acció de la selecció purificadora. El segon estudi es centra en l'evolució codificant dels gens Hox, una classe de factors de transcripció essencials en el desenvolupament primerenc que estan involucrats en l'especificació de les regions al llarg de l'eix anteroposterior del cos. Hem mesurat les taxes de divergència nucleotídica i de fixació d'insercions i delecions a tres gens Hox, i les hem comparat amb les de tres gens derivats de Hox i un conjunt de gens no Hox per a provar la hipòtesi que els gens Hox evolucionen lentament. Els resultats mostren que tant el número de substitucions no sinònimes com el grau de constrenyiment funcional no són significativament diferents entre els gens Hox i els no Hox, i que els gens Hox i els derivats de Hox contenen significativament més insercions i delecions que els gens no Hox a les seves seqüències codificants. Per tant, els gens Hox evolucionen més ràpidament que altres gens essencials expressats al desenvolupament primerenc, amb patrons d'expressió complexos o amb introns llargs rics en elements cis-reguladors.Resumint, els treballs presentats a aquesta tesi tanquen un cicle complet de projecte bioinformàtic, incloent tots els passos necessaris des de l'extracció de dades fins a la generació de nou coneixement científic. És més, el resultat de cada pas és la llavor per a múltiples possibles estudis en el següent pas, i per tant aquesta tesi té moltes aplicacions per a la comunitat científica. / La variación genética es la piedra angular de la evolución biológica. La descripción y explicación de las fuerzas que controlan la variación genética dentro y entre poblaciones es el principal objetivo de la genética de poblaciones. La obtención de un número explosivo de secuencias nucleotídicas en distintos genes y especies ha cambiado radicalmente las perspectivas de la genética de poblaciones, transformándola desde una ciencia empírica insuficiente a un esfuerzo interdisciplinario de un gran alcance, donde los aparatos de generación de nuevas secuencias a gran escala se integran con herramientas bioinformáticas para la extracción y gestión de datos, junto a avanzados modelos teóricos y estadísticos para su interpretación.Esta tesis es un proyecto de bioinformática y genética de poblaciones completo, cuyo objetivo es el estudio de la diversidad genética en las poblaciones, que se ha llevado a cabo en tres pasos secuenciales: (i) el desarrollo de herramientas para la extracción, procesado, filtrado y control de calidad de secuencias nucleotídicas, (ii) la generación de bases de datos de conocimiento a partir de los datos obtenidos en la primera parte y (iii) la puesta a prueba de hipótesis que requieren de datos de varias especies y loci. En la primera parte de la tesis hemos desarrollado PDA (Pipeline Diversity Analysis), una aplicación Web de código abierto que permite la exploración del polimorfismo en grandes conjuntos de secuencias de DNA heterogéneas. Esta herramienta se alimenta de los millones de secuencias haplotípicas de estudios individuales que hay almacenados en las principales bases de datos moleculares y genera datos de genética de poblaciones que pueden ser utilizados para describir patrones de variación nucleotídica en cualquier especie o gen. Todos los datos extraídos y analizados en la primera parte de la tesis son utilizados en la segunda parte para crear un recurso vía Web completo que proporciona colecciones de secuencias polimórficas con sus medidas de diversidad asociadas en el género Drosophila (DPDB, Drosophila Polymorphism Database). Este recurso ha significado un reto ambicioso que ha permitido poner a prueba la eficiencia del sistema creado en la primera parte.Finalmente, se incluyen dos estudios que utilizan los módulos de extracción y análisis de datos desarrollados en la primera parte. En el primero, hemos estudiado los patrones de variación genética en secuencias conservadas no codificadoras para inferir selección negativa y positiva en Drosophila. En este estudio hemos utilizado datos de re-secuenciación en D. melanogaster junto con datos genómicos comparativos en otras especies de Drosophila para demostrar que las regiones frías de mutación no pueden explicar estos bloques conservados. Los resultados muestran que las secuencias conservadas no codificadoras se mantienen por la acción de la selección purificadora. El segundo estudio se centra en la evolución codificadora de los genes Hox, una clase de factores de transcripción esenciales en el desarrollo temprano que están involucrados en la especificación de las regiones a lo largo del eje anteroposterior del cuerpo. Hemos medido las tasas de divergencia nucleotídica y de fijación de inserciones y deleciones en tres genes Hox, y las hemos comparado con las de tres genes derivados de Hox y un conjunto de genes no Hox para probar la hipótesis que los genes Hox evolucionan lentamente. Los resultados muestran que tanto el número de sustituciones no sinónimas como el grado de constreñimiento funcional no son significativamente distintos entre los genes Hox y los no Hox, y que los genes Hox y los derivados de Hox contienen significativamente más inserciones y deleciones que los genes no Hox en sus secuencias codificadoras. Así, los genes Hox evolucionan más rápidamente que otros genes esenciales expresados en el desarrollo temprano, con patrones de expresión complejos o con intrones largos ricos en elementos cis-reguladores.En síntesis, los trabajos presentados en esta tesis cierran un ciclo completo de proyecto bioinformático, incluyendo todos los pasos necesarios desde la extracción de datos hasta la generación de nuevo conocimiento científico. Es más, el resultado de cada paso es la semilla para múltiples posibles estudios en el siguiente paso, y por lo tanto esta tesis tiene muchas aplicaciones para la comunidad científica. / Genetic variation is the cornerstone of biological evolution. The description and explanation of the forces controlling genetic variation within and between populations is the main goal of population genetics. The deciphering of an explosive number of nucleotide sequences in different genes and species has changed radically the scope of population genetics, transforming it from an empirically insufficient science into a powerfully explanatory interdisciplinary endeavor, where high-throughput instruments generating new sequence data are integrated with bioinformatic tools for data mining and management, and advanced theoretical and statistical models for data interpretation. This thesis is an integrative and comprehensive bioinformatics and population genetics project whose central topic is the genetic diversity of populations. It is accomplished in three sequential steps: (i) the development of tools for data mining, processing, filtering and quality checking of raw data, (ii) the generation of databases of knowledge from refined data obtained in the first step, and (iii) the testing of hypotheses that require multi-species and/or multi-locus data. In the first part of the thesis, we have developed PDA Pipeline Diversity Analysis , an open-source, web-based tool that allows the exploration of polymorphism in large datasets of heterogeneous DNA sequences. This tool feeds from the millions of haplotypic sequences from individual studies that are stored in the main molecular biology databases, and generates high-quality, population genetics data that can be used to describe patterns of nucleotide variation in any species or gene. All the extracted and analyzed data resulting from the first part of this thesis is used in the second step to create a comprehensive on-line resource that provides searchable collections of polymorphic sequences with their associated diversity measures in the genus Drosophila (DPDB Drosophila Polymorphism Database ). This resource means an ambitious pledge to test the efficiency of the system created in the first part.Finally, two different studies that make use of the modules of data mining and analysis developed are shown. First, we study patterns of sequence variation to infer constraint and adaptation in Drosophila conserved noncoding sequences (CNSs). For this study we have used population genetics re-sequencing data from D. melanogaster together with comparative genomic data from other Drosophila species. We show that patterns of nucleotide sequence evolution in Drosophila CNSs are incompatible with the notion that mutational cold-spots explain these conserved blocks. Rather, the results support the hypothesis that CNSs are maintained by the action of purifying selection. The second study focuses on the coding evolution of Hox genes, a class of essential transcription factors expressed early in development that are involved in the specification of regional identities along the anteroposterior body axis. We have measured the rates of nucleotide divergence and fixation of insertions and deletions of three Hox genes, and compared them with those of three Hox-derived genes and a set non-Hox genes to test the hypothesis that Hox genes evolve slowly. Our results show that both the number of nonsynonymous substitutions and the degree of functional constraint are not significantly different between Hox and non-Hox genes, and that Hox and Hox-derived genes contain significantly more insertions and deletions than non-Hox genes in their coding sequences. Thus, Hox genes evolve faster than other essential genes expressed early in development, with complex expression patterns or with long introns rich in cis-regulatory elements.As a whole, the works presented in this thesis round a complete bioinformatics project off, including all the necessary steps from mining the data to generating new scientific knowledge. More interestingly, the outcome of each step is the seed of multiple possible studies in the next step, and thus this thesis has many applications for the scientific community.
|
9 |
Functional analysis of position effects of inversion 2j in Drosophila buzzatii: gene CG13617 silencing and its adpative significancePuig Font, Marta 23 December 2010 (has links)
És sabut de fa molt temps que les inversions cromosòmiques son mantenides per selecció natural a les poblacions de Drosophila. No obstant, els mecanismes moleculars que generen aquest valor adaptatiu encara no es coneixen. A les poblacions naturals de D. buzzatii, la inversió 2j forma un polimorfisme equilibrat amb l’ordenació 2st, en què els individus 2j tenen una mida més gran y un temps de desenvolupament més llarg en comparació amb els 2st. En aquest treball hem posat a provat la hipòtesi de que un efecte de posició d’un dels punts de trencament podria ser la causa d’aquests canvis fenotípics. Per a fer-ho hem analitzat l’expressió d’un gen adjacent al punt de trencament proximal, CG13617, en línies de D. buzzatii amb i sense la inversió 2j. Hem trobat que els embrions 2j presenten un nivell d’expressió de CG13617 cinc vegades menor causat per un RNA antisense originat en una còpia d’un transposó de la família Galileo inserit al punt de trencament. Les conseqüències funcionals de la reducció de l’expressió de CG13617 s’han investigat utilitzant la tècnica de RNA interferència per reproduir aquest silenciament a D. melanogaster. Els experiments de microarrays i RT-PCR en temps real comparant larves de primer estadi amb i sense expressió de CG13617 han revelat que 41 gens mostren nivells d’expressió reduïts quan CG13617 és silenciat, mentre que cap gen presenta un increment. A més, hi ha un excés significatiu de gens implicats en la replicació del DNA i el cicle celular entre els afectats pel silenciament de CG13617. Nou de deu d’aquests gens van ser analitzats a D. buzzatii i també tenen un nivell d’expressió reduït en embrions 2j, però no en larves de primer estadi, una fase en què la diferència d’expressió de CG13617 entre ordenacions cromosòmiques és menor i el RNA antisense ja no es transcriu. Per a esbrinar la possible funció d’aquest gen hem dut a terme un exhaustiu anàlisi de seqüències nucleotídiques i proteiques en els 12 genomes de Drosophila disponibles i també en altres organismes. La proteïna CG13617 conté un dit de zinc tipus C2H2 molt conservat, tres regions que poden formar coiled coils, dues seqüències PEST i senyals de localització i exportació nuclear. També presenta similitud amb la proteïna humana DZIP1 i amb Iguana, un component de la via de senyalització Hedgehog al peix zebra, fet que indica que el seu paper dins la cèl·lula podria estar relacionat amb el transport de factors de transcripció cap a dins i cap a fora del nucli. Aquests resultats suggereixen que el gen CG13617 podria estar implicat en la regulació de la replicació del DNA i que l’efecte de posició en els portadors de la inversió 2j podria contribuir a explicar les diferències fenotípiques observades entre els individus 2st i 2j, així com el valor adaptatiu d’aquesta inversió. / Chromosomal inversions have been known for a long time to be maintained by natural selection in Drosophila populations. However, the molecular mechanisms underlying their adaptive value remain uncertain. In D. buzzatii natural populations, inversion 2j forms a balanced polymorphism with the 2st arrangement, in which 2j individuals have a larger size and a longer developmental time compared to 2st carriers. In this work we tested the hypothesis that a position effect of one of the inversion breakpoints could be the cause of these phenotypic changes by analyzing the expression of a gene adjacent to the proximal breakpoint, CG13617, in D. buzzatii lines with and without inversion 2j. We have found that in 2j embryos an antisense RNA originated in a copy of a Galileo family transposon inserted at the breakpoint causes a 5-fold decrease of the expression level of CG13617. In order to investigate the functional consequences of the reduction in CG13617 expression, we have used RNA interference to reproduce this silencing in D. melanogaster. Microarray and real-time RT-PCR experiments comparing first instar larvae with and without CG13617 expression revealed that 41 genes show reduced expression levels when CG13617 is silenced, while none is up-regulated. Interestingly, genes involved in DNA replication and cell cycle are significantly enriched among those affected by CG13617 silencing. Nine out of ten of these genes analyzed in D. buzzatii also show a reduced expression level in 2j embryos, but not in first instar larvae, a stage where the CG13617 expression difference between chromosomal arrangements is lower and the antisense RNA is no longer transcribed. To gain insight into the potential function of this gene we have carried out a comprehensive nucleotide and protein sequence analysis in the 12 available Drosophila genomes and also in other organisms. CG13617 protein contains a conserved C2H2 zinc finger, three coiled coil regions, two PEST sequences, and putative nuclear localization and export signals, and shows similarity to human DZIP1 and zebrafish Iguana (a component of the Hedgehog signaling pathway) proteins, which indicates that its cellular role could be related to the transport of transcription factors in and out of the nucleus. These results suggest that gene CG13617 could be involved in the regulation of DNA replication and that the position effect in 2j carriers might contribute to explain the phenotypic differences observed between 2st and 2j individuals as well as the adaptive value of the inversion.
|
10 |
Mètode Bayesià per a l’anàlisi d’Haplotips en estudis d’Associació Genètica. Aplicació a dades d’Esquizofrènia i CàncerIniesta Benedicto, Raquel 23 November 2010 (has links)
Els avenços que a les darreres dècades han protagonitzat les tècniques de genotipatge i de seqüenciació, unit al desenvolupament de tècniques estadístiques especialitzades i sofisticades, han permès elaborar noves vies de recerca per comprendre l’etiologia de malalties complexes l’origen de les quals, en molts casos, és multifactorial. Així com s’han establert factors ambientals que poden modular el risc de patir certes malalties, també s’han detectat variants genètiques que hi poden estar involucrades. Patologies com la diabetis, el càncer, l’esquizofrènia o l’asma es veuen influenciades per factors genètics en interacció amb factors ambientals. Al capdavant d’aquestes investigacions es troben els mapes de polimorfismes. El polimorfisme més comú al genoma humà és la variació en una sola base de la seqüència genòmica, l’anomenat ”Single Nucleotide Polimorphismï conegut per les seves inicials ”SNP”. Degut a la seva abundància, els SNPs són molt adients per generar mapes genètics i han esdevingut els marcadors més utilitzats en estudis d’associació genètica. Si bé des de fa dècades l’estudi del genoma humà s’ha centrat principalment en analitzar les variacions en la seqüència genòmica, des d’inicis de l’any 2000 sabem per diversos estudis que aquestes variacions tendeixen a donar-se en bloc. D’altra banda, també s’ha demostrat que les recombinacions genètiques que es donen al llarg del genoma no es produeixen de manera uniforme. Per aquest motiu, el genoma presenta zones que es transmeten en bloc, de progenitors a descendents, i que poden incloure blocs de variacions. Aquestes zones de baixa recombinació que es segreguen en bloc són els anomenats haplotips. Els haplotips poden facilitar el descobriment de gens relacionats amb malalties que pateixen els éssers humans. L’inter`Les en l’assignació d’haplotips i l’anàlisi de l’associació entre haplotips i malaltia en mostres d’individus no relacionats ha crescut incommensurablement als darrers anys degut a l’èmfasi que projectes com HapMap han situat sobre l’anàlisi d’haplotips. Ara bé, la deter-minació dels haplotips donada una mostra de genotips per un conjunt d’individus no sempre és immediata, havent de recórrer a tècniques específiques per tal de separar els cromosomes. Les tècniques de tipus molecular són les que aporten menys error però desafortunadament són cares i això dificulta el seu ús, sobretot en estudis poblacionals que tracten amb mostres grans. Per superar aquesta limitació, les investigacions han tendit a utilitzar la inferència estadística com a via més usual a l’hora de determinar els haplotips. La inferència sobre les freqüències haplotípiques és una bona solució per reconstruir la mostra haplotípica, però cal tenir present els efectes que el fet de treballar amb estimacions comportarà sobre tots els càlculs que es realitzin amb la mostra. En aquest sentit, resulta interessant dedicar esfor¸cos per tal d’intentar minimitzar la propagació d’aquests errors en les anàlisis d’associació genètica amb haplotips.
Tot i que existeix diversitat de programes per fer anàlisis haplotípiques aplicables a mostres d’individus no relacionats, molts d’ells presenten limitacions que esdevenen una bona mo-tivació per intentar cercar d’altres alternatives teòriques i computacionals per tractar més eficientment la problemàtica dels haplotips. En aquesta tesi doctoral es presenta el desenvolupament i la implementació informàtica d’un mètode per estimar haplotips i els efectes associats a diversos tipus de fenotips. El marc teòric amb que s’ha treballat és la inferència Bayesiana combinada amb tècniques de Markov Chain Monte Carlo que optimitzin les qües-tions computacionals. L’eina resultat és el paquet BayHap, publicada com a paquet a l’entorn estadístic R. El programa s’ha validat sobre escenaris de dades simulats i sobre dades reals. L’aplicació mostra millores en l’estimació d’efectes associats a haplotips amb baixa freqüència i alhora ofereix la possibilitat de dur a terme l’anàlisi d’haplotips sota un punt de vista bayesià amb les avantatges que aquest fet ofereix. / Nowadays, haplotypic information has become vitally important to clarify the genetic
basis of the etiology of some common diseases. Comparing DNA of healthy and diseased
individuals let us to describe changes in the genomic sequence that could modify the risk of
su ering from the disease. Association studies are the framework where this class of analysis
are carried out.
The DNA variations more often analyzed due to its high frequency along the genome are the
Single Nucleotide Polimorphisms. One \SNP" is the change in only one nucleotide between
individuals at the same position of their genomes. Is well known that there are zones in
the genomic sequence with a low rate of recombinations, that are inherited as a block by
the o spring. These zones are called haplotypes, and everyone carries two of them. On
the other hand, in the last decade researchers have stated that mutations as SNPs are also
transmitted in blocks, situated in haplotypic zones. For all of this, the knowledge of haplo-
types corresponding to a sample of genotypes observed for some SNPs of a set of unrelated
individuals could be very helpful to better understand the genetic association with a phe-
notype of interest. Initiatives as the international HapMap project have strongly motivated
the scienti c community to use haplotypes in association analysis. Unfortunately, in the
absence of family data, obtaining haplotypic information is not straightforward. Since every
cell of the human organism contains 22 pairs of homologous chromosomes, plus the sexual
chromosome, for each chromosomical location at the autosomal chromosomes there are two
bases, one for each homologous chromosome at the same position of the DNA sequence.
Given that current lab techniques usually only report genotypic data and do not provide the
chromosome for each base, individuals with two or more heterozygous sites have uncertain
haplotypes because there is more than one possible haplotype pair compatible with their
genotype. To overcome this limitation, research has tend to use statistical inference as the
most common way to determine haplotype information. Although statistical inference of
haplotypes frequencies is a good solution to reconstruct the haplotypes sample researchers
have to take into account the error propagation in posterior analysis. This is an encouraging
situation to apply e orts in order to minimize unwanted e ects.
Even though there are some programs to do haplotypic analysis over unrelated individuals,
most of them have unresolved questions as could be the estimation of association between
disease and low frequency haplotypes. In this work we develop and implement a method
to infer haplotypes and association with many types of phenotypes. The theoretical frame-
work in which we based our algorithm is the bayesian inference and Markov Chain Monte
Carlo techniques. The resulting application is an R package called BayHap available from
de repository of packages of this free statistical environment. The program was validated
through computational simulations and also applied over real data. The application shows
better performance than other algorithms in case of low frequencies haplotypes. In addition,
the package o ers the chance of make analysis through a bayesian point of view, with all
the strength this fact can suppose.
|
Page generated in 0.0362 seconds