Return to search

Elucidating mechanisms of gene regulation. Integration of high-throughput sequencing data for studying the epigenome

The recent advent of High-Throughput Sequencing (HTS) methods has triggered a
revolution in gene regulation studies. Demand has never been higher to process
the immense amount of emerging data to gain insight into the regulatory
mechanisms of the cell.
We address this issue by describing methods to analyze, integrate and interpret
HTS data from different sources. In particular, we developed and benchmarked
Pyicos, a powerful toolkit that offers flexibility, versatility and efficient memory
usage. We applied it to data from ChIP-Seq on progesterone receptor in breast
cancer cells to gain insight into regulatory mechanisms of hormones. Moreover,
we embedded Pyicos into a pipeline to integrate HTS data from different sources.
In order to do so, we used data sets from ENCODE to systematically calculate
signal changes between two cell lines. We thus created a model that accurately
predicts the regulatory outcome of gene expression, based on epigenetic changes
in a gene locus. Finally, we provide the processed data in a Biomart database to
the scientific community. / La llegada reciente de nuevos métodos de High-Throughput Sequencing (HTS) ha
provocado una revolución en el estudio de la regulación génica. La necesidad de
procesar la inmensa cantidad de datos generados, con el objectivo de estudiar los
mecanismos regulatorios en la celula, nunca ha sido mayor.
En esta tesis abordamos este tema presentando métodos para analizar, integrar e
interpretar datos HTS de diferentes fuentes. En particular, hemos desarollado
Pyicos, un potente conjunto de herramientas que ofrece flexibilidad, versatilidad y
un uso eficiente de la memoria. Lo hemos aplicado a datos de ChIP-Seq del
receptor de progesterona en células de cáncer de mama con el fin de investigar
los mecanismos de la regulación por hormonas. Además, hemos incorporado
Pyicos en una pipeline para integrar los datos HTS de diferentes fuentes. Hemos
usado los conjuntos de datos de ENCODE para calcular de forma sistemática los
cambios de señal entre dos líneas celulares. De esta manera hemos logrado crear
un modelo que predice con bastante precisión los cambios de la expresión génica,
basándose en los cambios epigenéticos en el locus de un gen. Por último, hemos
puesto los datos procesados a disposición de la comunidad científica en una base
de datos Biomart.

Identiferoai:union.ndltd.org:TDX_UPF/oai:www.tdx.cat:10803/81355
Date27 April 2012
CreatorsAlthammer, Sonja Daniela
ContributorsEyras Jiménez, Eduardo, Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut
PublisherUniversitat Pompeu Fabra
Source SetsUniversitat Pompeu Fabra
LanguageEnglish
Detected LanguageSpanish
Typeinfo:eu-repo/semantics/doctoralThesis, info:eu-repo/semantics/publishedVersion
Format150 p., application/pdf
SourceTDX (Tesis Doctorals en Xarxa)
Rightsinfo:eu-repo/semantics/openAccess, ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

Page generated in 0.002 seconds