Return to search

Influence of alignment uncertainty on homology and phylogenetic modeling

Most evolutionary analyses are based upon pre-estimated multiple sequence
alignment models. From a computational point of view, it is too complex to estimate a
correct alignment, as it is to derive a correct tree from that alignment. Several works
have recently reported on the influence of alignment on downstream analysis, and on
the uncertainty inherent to their estimation. Chapter 1 develops the notion of
alignment uncertainty as either inherent to the data (internal) or resulting from
methodological biases (external). Chapter 2 presents two contributions of mine for the
improvement of MSA methods through the use of homology extension (TM-Coffee)
and thanks to an improved word-matching algorithm (SymAlign). In Chapter 3, I
show how alignment uncertainty can be used to improve the trustworthiness of
phylogenetic analysis. Chapter 4 shows how a similar improvement can be obtained
through a simple adaptation of the T-Coffee transitive score, thus allowing
downstream analysis to take into account internal alignment uncertainty. The final
chapter contained a discussion of our current results and possible future work. / La mayoría de los análisis evolutivos están basados en modelos establecidos de alineamiento de secuencia múltiple. Desde un punto de vista computacional, es igual de complejo la estimación de un alineamiento correcto, como la obtención de un árbol correcto a partir del alineamiento. Recientemente varios trabajos han informado sobre la influencia del alineamiento en los análisis posteriores, y en la incertidumbre inherente a su estimación. El Capítulo 1 desarrolla el concepto de incertidumbre de alineación, tanto inherente a los datos (internos), como resultante de los sesgos metodológicos (externo). El Capítulo 2 presenta dos contribuciones mías para la mejora de los métodos de MSA a través del uso de la extensión de homología (TM‐Coffee) y gracias a un algoritmo de coincidencia de palabra mejorado (SymAlign). En el capítulo 3, se muestra cómo la incertidumbre de alineación puede ser utilizada para mejorar la confiabilidad del análisis filogenético. El capítulo 4 nos muestra como se puede obtener una mejora similar por medio de una simple adaptación de la puntuación transitiva del T-- Coffee, lo cual permite un análisis posterior para tener en cuenta la incertidumbre de alineación interna. El último capítulo contiene un análisis de los resultados actuales y los posibles futuros trabajos.

Identiferoai:union.ndltd.org:TDX_UPF/oai:www.tdx.cat:10803/129301
Date25 July 2013
CreatorsChang, Jia-Ming, 1978-
ContributorsNotredame, Cedric, Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut
PublisherUniversitat Pompeu Fabra
Source SetsUniversitat Pompeu Fabra
LanguageEnglish
Detected LanguageSpanish
Typeinfo:eu-repo/semantics/doctoralThesis, info:eu-repo/semantics/publishedVersion
Format91 p., application/pdf
SourceTDX (Tesis Doctorals en Xarxa)
Rightsinfo:eu-repo/semantics/openAccess, ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

Page generated in 0.0048 seconds