Spelling suggestions: "subject:"ctructural annotation"" "subject:"1structural annotation""
1 |
Modélisation informatique de structures dynamiques de segments textuels pour l'analyse de corpus / Data-processing modeling of dynamic structures of textual segments for the analysis of corpusDaoust, François 10 January 2011 (has links)
L'objectif de la thèse est de proposer un modèle informatique pour représenter, construire et exploiterdes structures textuelles. Le modèle proposé s'appuie sur une représentation du texte sous la forme d'unplan lexique/occurrences augmenté de systèmes d'annotations lexicales et contextuelles, modèle dontune implantation a été réalisée dans le logiciel SATO dont on présente les fonctionnalités etl'organisation interne. La présentation d'un certain nombre de travaux rendent compte dudéveloppement et de l'utilisation du logiciel dans divers contextes.La prise en charge formelle des structures textuelles et discursives trouve un allié dans le langage debalisage XML et dans les propositions de la Text Encoding Initiative (TEI). Formellement, lesstructures construites sur les segments textuels correspondent à des graphes. Dans le contexte d'uneanalyse textuelle en élaboration, ces graphes sont multiples et partiellement déployés. La résolution deces graphes, au sens du rattachement des noeuds à des segments textuels ou à des noeuds d'autresgraphes, est un processus dynamique qui peut être soutenu par divers mécanismes informatiques. Desexemples tirés de la linguistique textuelle servent à illustrer les principes de l'annotation structurelle.Des considérations prospectives sur une implantation informatique d'un système de gestion del'annotation structurelle sont aussi exposées. / The objective of the thesis is to propose a data-processing model to represent, build and exploit textualstructures. The suggested model relies on a «type/token» form of text representation extended bysystems of lexical and contextual annotations. This model's establishment was carried out in the SATOsoftware -- of which the functionalities and the internal organization are presented. Reference to anumber of works give an account of the development and use of the software in various contexts.The formal assumption of the textual and discursive structures find an ally in the beaconing XMLlanguage and the proposals of the Text Encoding Initiative (TEI). Formally, the structures built on thetextual segments correspond to graphs. In a development driven textual analysis context, these graphsare multiple and partially deployed. Their resolution, within the fastening of the nodes to textualsegments or that of other graphs, is a dynamic process which can be sustained by various dataprocessingmechanisms. Examples drawn from textual linguistics are used to illustrate the principles ofstructural annotation. Prospective considerations for the data-processing establishment of amanagement system of the structural annotation are also exposed.
|
2 |
An approach to improved microbial eukaryotic genome annotationSarrasin, Matthew 12 1900 (has links)
No description available.
|
3 |
Development of Biotechnological Tools for the Genetic Improvement of Pepino (Solanum Muricatum) and Tree Tomato (S.betaceum)Pacheco Toabanda, Juan Enrique 07 November 2022 (has links)
Tesis por compendio / [ES] El pepino dulce (Solanum muricatum) y el tomate de árbol (S. betaceum) pertenecen al grupo de cultivos de la familia Solanaceae. Estos dos cultivos son originarios de América del Sur y actualmente se cultivan en varios países con climas tropicales, subtropicales y mediterráneos. Han sido infrautilizados durante mucho tiempo y han cobrado relevancia solo en los últimos años debido a su alta calidad nutricional. El pepino dulce exhibe niveles significativos de potasio, vitamina C y carotenoides y se informa que presenta propiedades antioxidantes, antidiabéticas, antiinflamatorias y antitumorales. Sus frutos se pueden consumir tanto como postre o en ensaladas. El tomate de árbol también destaca por su alto contenido en compuestos bioactivos como carotenoides, antocianinas, flavonoides y vitaminas. Varios productos como jugos, mermeladas, salsas y productos farmacéuticos son elaborados a partir de sus frutos.
Debido a que estos cultivos se han introducido en nuevas regiones, donde pueden estar expuestos a estreses bióticos y abióticos que pueden amenazar su producción, y dado que el pepino dulce se ve especialmente afectado por la escasez de agua, fue necesario realizar un estudio para determinar la respuesta de siete cultivares de pepino dulce a parámetros fisiológicos y bioquímicos al estrés por sequía. Este trabajo puede ayudar a desarrollar programas de selección y mejoramiento que permitan generar nuevas variedades más tolerantes a la sequía.
Por otro lado, en los países de clima mediterráneo, el pepino dulce se cultiva como cultivo protegido, aplicando las mismas técnicas agrícolas que otras solanáceas como el tomate y el pimiento. Estos sistemas agrícolas también brindan condiciones óptimas para el desarrollo de enfermedades como Fusarium oxysporum f. sp. lycopersici (FOL), Verticillium dahliae (VE), virus del mosaico del pepino (PepMV) y virus del mosaico del tomate (ToMV), que potencialmente podrían causar grandes daños a los cultivos de pepino dulce. Por tal motivo, se realizó un estudio para evaluar la respuesta de una colección de pepino dulce y sus parientes silvestres contra estas cuatro enfermedades, y encontrar fuentes de resistencia/tolerancia a estos patógenos.
Aunque el tomate de árbol es un cultivo frutal importante debido a su valor nutricional y efectos beneficiosos para la salud, actualmente no hay información genómica y transcriptómica disponible públicamente. Por lo tanto, fue fundamental secuenciar el transcriptoma de dos cultivares de tomate de árbol con frutos morados (A21) y frutos anaranjados (A23). Estos dos cultivares han sido ampliamente utilizados y cultivados comercialmente en países de la región andina como Ecuador y Colombia. La obtención del primer transcriptoma de tomate de árbol ha permitido realizar un estudio comparativo entre el tomate de árbol y sus especies cercanas, tomate y patata, identificar genes implicados en la ruta de biosíntesis de carotenoides y desarrollar marcadores de polimorfismo de nucleótido único (SNP).
En general, esta Tesis Doctoral aporta información relevante sobre la respuesta del pepino a diversos estreses ambientales, que puede ser utilizada para el desarrollo de nuevas variedades de pepino resistentes a múltiples estreses. Mientras que en tomate de árbol, el
desarrollo de herramientas genómicas acelerará los programas de mejoramiento. / [CA] El cogombre dolç (Solanum muricatum) i tomata d'arbre (S. betaceum) pertanyen al grup de cultius de la família Solanaceae. Aquests dos cultius són originaris d'Amèrica del Sud i actualment es cultiven en diversos països amb climes tropicals, subtropicals i mediterranis. Han sigut infrautilitzats durant molt de temps i han cobrat rellevància només en els últims anys a causa de la seua alta qualitat nutricional. El cogombre dolç exhibeix nivells significatius de potassi, vitamina C i carotenoides i s'informa que presenta propietats antioxidants, antidiabètiques, antiinflamatòries i antitumorals. Els seus fruits es poden consumir tant com postres o en ensalades. La tomaca d'arbre també destaca pel seu alt contingut en compostos bioactivos com carotenoides, antocianinas, flavonoides i vitamines. Dels seus fruits s'elaboren diversos productes com a sucs, melmelades, salses i productes farmacèutics.
Pel fet que aquests cultius s'han introduït en noves regions on poden estar exposats a estressos biòtics i abiòtics que poden amenaçar la seua producció, atés que el cogombre es veu especialment afectat per l'escassetat d'aigua, va ser necessari realitzar un estudi per a determinar la resposta de set cultivars de cogombre dolç a paràmetres fisiològics i bioquímicos a l'estrés per sequera. Aquest treball pot ajudar a desenvolupar programes de selecció i millorament que permeten generar noves varietats més tolerants a la sequera. D'altra banda, als països de clima mediterrani, el cogombre dolç es cultiva com a cultiu protegit, aplicant les mateixes tècniques agrícoles que unes altres solanáceas com la tomaca i el pimentó. Aquests sistemes agrícoles també brinden condicions òptimes per al desenvolupament de malalties com Fusarium oxysporum f. sp. lycopersici (FOL), Verticillium dahliae (VE), virus del mosaic del cogombre (PepMV) i virus del mosaic de la tomaca (ToMV), que potencialment podrien causar grans danys als cultius de cogombre dolç. Per tal motiu, es va realitzar un estudi per a avaluar la resposta d'una col·lecció de cogombre dolç i els seus parents silvestres contra aquestes quatre malalties, i trobar fonts de resistència/tolerància a aquests patògens.
Encara que la tomaca d'arbre és un cultiu fruiter important a causa del seu valor nutricional i efectes beneficiosos per a la salut, actualment no hi ha informació genòmica i transcriptómica disponible públicament. Per tant, va ser fonamental seqüenciar el transcriptoma de dues cultivars de tomaca d'arbre amb fruits morats (A21) i fruits ataronjats (A23). Aquestes dues cultivars han sigut àmpliament utilitzats i cultivats comercialment en països de la regió andina com l'Equador i Colòmbia. L'obtenció del primer transcriptoma de tomaca d'arbre ha permés realitzar un estudi comparatiu entre la tomaca d'arbre i les seues espècies pròximes, tomaca i creïlla, identificar gens implicats en la ruta de biosíntesi de carotenoides i desenvolupar marcadors de polimorfisme de nucleòtid únic (SNP).
En general, aquesta Tesi Doctoral aporta informació rellevant sobre la resposta del cogombre a diversos estressos ambientals, que pot ser utilitzada per al desenvolupament de noves varietats de cogombre resistents a múltiples estressos. Mentre que en tomaca d'arbre, el desenvolupament d'eines genòmiques accelerarà els programes de millorament. / [EN] Pepino (Solanum muricatum) and tree tomato (S. betaceum) belong to the group of crops of the Solanaceae family. These two crops are native to South America and currently are grown in various countries with tropical, subtropical and Mediterranean climates. They have been underutilized for a long time and have become relevant only in recent years due to their high nutritional quality. Pepino exhibit significant levels of potassium, vitamin C and carotenoids and it is reported to present antioxidant, antidiabetic, anti-inflammatory and antitumor properties. Its fruits can be consumed both as a dessert or in salads. Tree tomato also highlights high content of bioactive compounds such as carotenoids, anthocyanins, flavonoids and vitamins. Severals products such as juices, jams, sauces and pharmaceutical products are made from its fruits.
Due to these crops have been introduced into new regions, where they may be exposed to biotic and abiotic stresses that can threaten their production, and since pepino is specially affected by water scarcity, a study was needed to determine the response of seven pepino cultivars
to physiological and biochemical parameters to drought stress. This work can help develop selection and improvement programs that allow the generation of new varieties that are more tolerant to drought.
On the other hand, in countries with a Mediterranean climate, pepino is grown as a protected crop, applying the same agricultural techniques as other solanaceous plants such as tomato and pepper. These agricultural systems also provide optimal conditions for the development of diseases such as Fusarium oxysporum f. sp. lycopersici (FOL), Verticillium dahliae (VE), pepino mosaic virus (PepMV) and tomato mosaic virus (ToMV), which could potentially cause great damage to pepino crops. For this reason, a study was performed to evaluate the response of a collection of pepino and their wild relatives against these four diseases, and find sources of resistance/tolerance to those pathogens.
Although tree tomato is an important fruit crop due to its nutritional value and beneficial health effects, there is currently no publicly available genomic and transcriptomic information. Therefore, it was essential to sequence the transcriptome of two tree tomato cultivars with purple fruits (A21) and orange fruits (A23). These two cultivars have been widely used and cultivated commercially in countries of the Andean region such as Ecuador and Colombia. Obtaining the first tree tomato transcriptome has made it possible to perform a comparative study between tree tomato and its close species, tomato and potato, identify genes involved in the carotenoid biosynthesis pathway, and develop single nucleotide polymorphism (SNP) markers.
In general, this Doctoral Thesis provides relevant information on the response of pepino to various environmental stresses, which can be used for the development of new varieties of pepino resistant to multiple stresses. While in tree tomato, the development of genomic tools will accelerating up breeding programs. / Pacheco Toabanda, JE. (2022). Development of Biotechnological Tools for the Genetic Improvement of Pepino (Solanum Muricatum) and Tree Tomato (S.betaceum) [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/189205 / Compendio
|
4 |
Function prediction of transcription start site associated RNAs (TSSaRNAs) in Halobacterium salinarum NRC-1 / Predição de função para TSSaRNAs (transcritos associados a sitios de início de transcrição) em Halobacterium salinarum NRC-1Adam, Yagoub Ali Ibrahim 07 February 2019 (has links)
The Transcription Start Site Associated non-coding RNAs (TSSaRNAs) have been predicted across the three domain of life. However, still, there are no reliable annotation efforts to identify their biological functions and their underline molecular machinery. Therefore, this project addresses the question of what are the potential functions of TSSaRNAs regarding their roles in addressing the cellular functions. To answer this question, we aimed to accurately identify TSSaRNAs in the model organism Halobacterium salinarum NRC-1 (an Archean microorganism) that incubated at the standard growth condition. Consequently, we aimed to investigate TSSaRNAs structural stability in the term of the thermodynamic energies. Moreover, we attempted to functionally annotate TSSaRNAs based on Rfam functional classification of non-coding RNAs. Based on the statistical approach we developed an algorithm to predict TSSaRNA using next-generation RNA sequencing data (RNA-Seq). To perform structural annotation of TSSaRNAs, we investigated the structural stability of TSSaRNAs by modeling the secondary structures by minimizing the thermodynamic free energy. We simulated TSSaRNAs tertiary structures based on the secondary structures constrain using the Rosetta-Common RNA tool. The structures of the minimum free energy supposed to be biophysically stable structures. To investigate the higher order structures of TSSaRNAs, we studied the hybridization between TSSaRNAs and their cognate genes as part of RNA based regulation system. Also, based on our hypothesis that TSSaRNAs may bind to protein to trigger their function, we have investigated the interaction between TSSaRNAs and Lsm protein which known as a chaperone protein that mediates RNA function and involved in RNA processing. Our pipeline to perform the functional annotation of TSSaRNAs aimed to classify TSSaRNAs into their corresponding Rfam families based on two steps: either through querying TSSaRNAs sequences against the co-variance models of Rfam families or by querying the Rfam sequences against the co-variance models of the consensus secondary structures in TSSaRNAs. The results showed that the prediction algorithm has succeeded to identify a total of 224 TSSaRNAs that expressed in the same strand of the mRNAs and 58 TSSaRNAs that expressed as antisense of the mRNAs. The identified TSSaRNAs molecules showed a median length of 25 nucleotides. Regarding the structural annotation of TSSaRNAs, the results showed that most of TSSaRNAs possessed thermodynamically stable secondary structures and their tertiary structures were capable of forming more complex structures through binding with other biomolecules. About the formation of higher-order structures, we have observed that most of TSSaRNAs (92.2%) were capable of hybridizing into their cognate genes also 55 TSSaRNAs indicated putative interactions with Lsm protein. Furthermore, the computation docking experiments demonstrated the TSSaRNAs-Lsm complexes associated with favorable binding energy of a median of -542900 kcal mole -¹. Regarding the functional annotation of TSSaRNAs, the results showed that the majority of TSSaRNAs (42.05%) considered as potential cis-acting regulators such as cis-regulatory element and sRNAs, but still, there are potential trans-acting regulators to regulate distant molecules such as CRISPR and antisense RNA. Moreover, the results indicated that TSSaRNAs could trigger more complex function as a catalytic function such as Riboswitch or to play a role in the defense against a virus such as CRISPR. As a conclusion; based on the results of this study we could state that TSSaRNAs have several potential functions opening the experimental validation perspective. / Os RNA não codificantes associados ao sítio de início da transcrição - em inglês, transcription start site associated non-coding RNAs (TSSaRNA) - foram observados nos três domínios da vida. No entanto, sem esforço confiável de anotação para identificar suas funções biológicas e seus mecanismos moleculares. Portanto, esse projeto levanta a questão de quais são as funções em potencial dos TSSaRNAs a respeito de seus papeis nas funções celulares. Para responder esta questão, nós objetivamos em identificar de forma eficaz os TSSaRNAs no organismo modelo Halobacterium salinarum NRC-1 (um microrganismo do domínio Arqueia) encubado em uma condição de crescimento padrão. Consequentemente, nós investigamos a estabilidade estrutural dos TSSaRNAs em relação a energias termodinâmicas. Ainda, fizemos a anotação funcional dos TSSaRNAs baseado na classificação funcional Rfam dos RNAs não-codificantes. Baseada em uma abordagem estatística nós desenvolvemos um algoritmo para predizer TSSaRNA usando dados de sequenciamento de RNA de nova geração (RNA-Seq). Para investigar a estabilidade estrutural dos TSSaRNAs nós modelamos as estruturas secundárias minimizando a energia livre termodinâmica para alcançar a estrutura mais estável biofisicamente. Nós simulamos estruturas terciárias de TSSaRNAs baseado nas restrições das estruturas secundárias usando a ferramenta Rosetta-Common RNA. As estruturas de energia livre mínima seriam supostamente estruturas estáveis biofisicamente. Para investigar as estruturas de ordem superior (quaternária) dos TSSaRNAs, nós estudamos a hibridização entre os TSSaRNAs e seus genes cognatos como parte de um possível sistema de regulação baseado em RNA. Ainda, baseada na hipótese que os TSSaRNAs podem ligar à proteína para habilitar sua função, nós investigamos a interação entre TSSaRNAs e proteína Lsm que é conhecida por ser uma proteína chaperone que media função do RNA e está envolvida no processamento do RNA. Nosso pipeline para executar a anotação funcional dos TSSaRNAs objetivou classificar as TSSaRNAs em suas correspondentes classes Rfam baseado em dois passos: por meio de consulta das sequências TSSaRNA em relação a modelos de covariância de famílias Rfam ou por consulta de sequências Rfam em relação a modelos de covariância das estruturas de secundárias de consenso das estruturas secundárias nos TSSaRNAs. Os resultados mostraram que o algoritmo de detecção teve sucesso em identificar um total de 224 TSSaRNAs que expressaram na mesma direção dos mRNAs e 58 TSSaRNAs que expressaram no sentido oposto (antisenso) dos mRNAs. As moléculas TSSaRNAs identificadas mostraram um comprimento mediano de 25 nucleotídeos. A respeito da anotação estrutural dos TSSaRNAs, os resultados mostraram que a maioria dos TSSaRNAs possuíam estruturas secundárias estáveis termodinamicamente e suas estruturas terciárias foram capazes de formar estruturas mais complexas por meio de vínculos com outras biomoléculas. Quanto à formação de estruturas de maior de estruturas de alta ordem nos observamos que a maioria dos TSSaRNAs (92.2%) são capazes, pelo menos em princípio, de hibridizar em seus genes cognatos e, também, 55 TSSaRNAs evidenciaram interagir com a proteína Lsm. Além disso, os experimentos computacionais de docking demonstratam os complexos TSSaRNAs-Lsm associados com energia de ligação favorável com uma média de - 542900 kcal mole -¹. Quanto à anotação funcional dos TSSaRNAs, os resultados mostraram que a maioria dos TSSaRNAs (42.05%) podem ser consideradas potenciais reguladores atuando em cis tais como elemento cis-regulamentar e sRNAs, mas ainda há pontenciais reguladores atuando em trans para regular moléculas em loci distantes, tais como CRISPR e RNA antisense. Além disso, os resultados mostraram que TSSaRNAs podem potencialmente ativar funções mais complexas como uma função catalítica, tal como Riboswitch ou executar um papel de defesa contra vírus, tal como CRISPR. Como conclusão; baseado nos resultados desse estudo, nós podemos afirmar que TSSaRNAs possuem várias funções em potencial abrindo a perspecitiva de validação experimental.
|
Page generated in 0.1222 seconds