Submitted by Israel Vieira Neto (israel.vieiraneto@ufpe.br) on 2015-03-05T19:23:54Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
DISSERTAÇÃO Rodrigo Gomes de Souza.pdf: 3171313 bytes, checksum: 9deb17b1d601430bdbd445f77529b69e (MD5) / Made available in DSpace on 2015-03-05T19:23:54Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
DISSERTAÇÃO Rodrigo Gomes de Souza.pdf: 3171313 bytes, checksum: 9deb17b1d601430bdbd445f77529b69e (MD5)
Previous issue date: 2014-03 / Este trabalho propõe uma abordagem baseada no método dialético de otimização para resolver o
problema do alinhamento múltiplo de sequências (MSA). Nesta abordagem, problemas de múltiplo
alinhamento de sequências são vistos como problemas de otimização, onde os candidatos à solução
são modelados como vetores cujas componentes representam as posições das lacunas ao longo das
sequências. Além disso, os candidatos a solução são avaliados através de uma função objetivo que é
sugerida como uma composição de funções para pontuação de correspondências, funções para
penalização e pontuação por aspectos desejados e não-desejados. Com o objetivo de testar
computacionalmente esta proposta, foram criados um conjunto sintético de dados, composto de 50
grupos de 4 sequências e um modelo equivalente baseado em algoritmos genéticos. A representação
de candidatos à solução baseada em posições trouxe um problema com relação à quantidade de
lacunas que deveria ser utilizada no alinhamento de cada um dos 50 grupos de sequências. Como
solução, a ferramenta ClustalW foi aplicada, em cada grupo de sequências, para produzir um
alinhamento múltiplo, o qual foi utilizado para fornecer informações sobre a quantidade de lacunas
utilizada. Os alinhamentos realizados pelo ClustalW também foram avaliados pela função objetivo
proposta, para a produção de resultados comparáveis. Os experimentos foram definidos sob três
abordagens quanto ao número de lacunas utilizado. Na primeira abordagem, para o alinhamento de
cada grupo de sequências foi utilizada uma quantidade fixa de lacunas e equivalente à metade do
comprimento das sequências, enquanto que na segunda abordagem, foi utilizada um número de
lacunas igual ao usado pelo ClustalW. Na terceira abordagem, o número de lacunas usado por cada
candidato à solução existente da população inicial foi definido com um valor escolhido
aleatoriamente entre os valores que correspondem a 5% e 50% do comprimento. A cada abordagem,
os experimentos foram refeitos utilizando-se uma variação na qual o alinhamento produzido pelo
Clustal era inserido foi população inicial, em um processo conhecido como semeadura. Todos os
experimentos foram primeiramente realizados utilizando o modelo alternativo, baseado em
algoritmos genéticos, a fim de validar representação e função objetivo sugeridas, e, foram refeitos
em seguida utilizando o método baseado em otimização dialética. Os resultados obtidos por ambos
modelos foram comparados com os resultados obtidos pelos alinhamentos produzidos pelo
ClustalW através do teste não-paramétrico de Wilcoxon para amostras pareadas. Em comparação
com o algoritmo ClustalW, o modelo baseado no método dialético de otimização provou ser capaz
de produzir alinhamentos de altos scores como também de realizar melhorias significativas nos
alinhamentos encontrados pelo ClustalW.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/10946 |
Date | 03 1900 |
Creators | SOUZA, Rodrigo Gomes de |
Contributors | SANTOS, Wellington Pinheiro dos, YARA, Ricardo |
Publisher | Universidade Federal de Pernambuco |
Source Sets | IBICT Brazilian ETDs |
Language | Breton |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE |
Rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess |
Page generated in 0.0035 seconds