Return to search

Analysis of multiple protein sequence alignments and phylogenetic trees in the context of phylogenomics studies

Phylogenomics is a biological discipline which can be understood as the intersection
of the fields of genomics and evolution. Its main focuses are the
analyses of genomes through the evolutionary lens and the understanding of
how different organisms relate to each other. Moreover, phylogenomics allows
to make accurate functional annotations of newly sequenced genomes.
This discipline has grown in response to the deluge of data coming from different
genome projects. To achieve their objectives, phylogenomics heavily
depends on the accuracy of different methods to generate precise phylogenetic
trees. Phylogenetic trees are the basic tool of this field and serve to
represent how sequences or species relate to each other through common
ancestry. During my thesis, I have centered my efforts in improving an automated
pipeline to generate accurate phylogenetic trees and its posterior
publication through a public database. Among the efforts to improve the
pipeline, I have specially focused on the problem of multiple sequence alignment
post-processing, which has been shown to be central to the reliability
of subsequent analyses. Subsequently I have applied this pipeline, and a
battery of other phylogenomics tools, to the study of the phylogenetic position
of Microsporidia, a group of fast-evolving intracellular parasites. Due
to their special genomic features, Microsporidia evolution constitutes one of
the classical examples of challenging problems for phylogenomics. Finally,
I have also used the pipeline as a part of a newly designed method for selecting
robust combinations of phylogenetic gene markers. I have used this
method for selecting optimal gene sets to assess the phylogenetic relationships
within fungi and cyanobacteria, showing that the potential of these
genes as phylogenetic markers goes well beyond the species used for their
selection. / Filogenómica es una disciplina biológica que puede ser entendida como la
intersección entre los campos de la genómica y la evolución. Su área de
estudio es el análisis evolutivo de los genomas y como se relacionan las
distintas especies entre sí. Además, la filogenómica tiene como objetivo
anotar funcionalmente, con gran precisi ón, genomas recién secuenciados.
De hecho, esta disciplina ha crecido rápidamente en los úultimos años
como respuesta a la avalancha de datos provenientes de distintos proyectos
genómicos. Para alcanzar sus objetivos, la filogenómica depende, en gran
medida, de los distintos métodos usados para generar árboles filogenéticos.
Los árboles filogenéticos son las herramientas básicas de la filogenómica y
sirven para representar como secuencias y especies se relacionan entre sí por
ascendencia. Durante el desarrollo de mi tesis, he centrado mis esfuerzos en
mejorar una pipeline (conjunto de programas ejecutados de forma controlada)
automática que permite generar árboles filogenéticos con gran precisión, y
como ofrecer estos datos a la comunidad científica a través de una base
de datos. Entre los esfuerzos realizados para mejorar la pipeline, me he
centrado especialmente en el post-procesamiento previo a cualquier análisis
de alineamientos múltiples de secuencias, ya que la calidad del alineamiento
determina la de los estudios posteriores. En un contexto más biológico, he
usado esta pipeline junto con otras herramientas filogenómicas en el estudio
de la posición filogenética de Microsporidia. Dadas sus características
genómicas especiales, la evolución de Microsporidia constituye uno de los
problemas clásicos y difíciles de resolver en filogenómica. Finalmente,
he usado también la pipeline como parte de un nuevo método para
seleccionar combinaciones óptimas de genes con potencial como marcadores
filogenéticos. De hecho, he usado este método para identificar conjuntos
de marcadores filogenéticos que permiten reconstruir con alto grado de
precisión las relaciones evolutivas en Cyanobacterias y en Hongos. Lo más
interesante de este método es que eval úa la fiabilidad de los marcadores en
especies no usadas para su selección.

Identiferoai:union.ndltd.org:TDX_UPF/oai:www.tdx.cat:10803/97289
Date16 November 2012
CreatorsCapella Gutiérrez, Salvador Jesús, 1985-
ContributorsGabaldón Estevan, Juan Antonio, 1973-, Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut
PublisherUniversitat Pompeu Fabra
Source SetsUniversitat Pompeu Fabra
LanguageEnglish
Detected LanguageSpanish
Typeinfo:eu-repo/semantics/doctoralThesis, info:eu-repo/semantics/publishedVersion
Format156 p., application/pdf
SourceTDX (Tesis Doctorals en Xarxa)
RightsADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs., info:eu-repo/semantics/openAccess

Page generated in 0.0026 seconds