Return to search

Computational and Mathematical Methods for Data Analysis in Biology and Finance / Méthodes mathématiques et computationnelles pour l'analyse de données en biologie et en finance

Les mathématiques sont comprises en tant qu’ensemble d’idées abstraites, dans le sens où le monde réel – ou plutôt réalité – n’a pas à intervenir. Pourtant, certains faits mathématiques observables dans des données expérimentales ou simulées peuvent être contre-intuitifs. La thèse est divisée en deux parties : premièrement, on étudie mathématiquement les matrices du genre celles dont nous avons discutées en biologie et finance. En particulier, nous mettons en évidence le fait contre-intuitif suivant : pour ces matrices, le vecteur propre associé à la plus haute valeur propre est très proche de la somme de chacune des lignes de la matrice, colonne par colonne. Nous discutons aussi d’applications en théorie des graphes avec bon nombre de simulations numériques. Dans un second temps, nous attaquons le problème des contacts géniques : à partir d’une carte de contact génique, un vrai défi actuel est de retrouver la structure tridimensionnelle de l’ADN. Nous proposons diverses méthodes d’analyse matricielle de données, dont une met en évidence l’existence, dans le noyau, de zones disjointes où les interactions sont de différents types. Ces zones sont des compartiments nucléaires. Avec d’autres données biologiques, nous mettons en évidence la fonction biologique de chacun de ces compartiments. Les outils d’analyses sont ceux utilisés en finance pour analyser des matrices d’auto-corrélation, ou même des séries temporelles. / Mathematics are understood as a set of abstract ideas, in the measure of the real world – or reality – has no way to intervene. However, some observable mathematical facts in experimental or simulated data can be counter-intuitive. The PhD is divided into two parts: first, we mathematically study the matrices of the same type of the ones in biology and finance. In particular, we show the following counter-intuitive fact: for these matrices, the eigenvector associated with the highest eigenvalue is close to the sum of each row, column by column. We also discuss some applications to graph theory with many numerical simulations and data analysis.On the other hand, we will face the genetic contact problem: from a contact map, a real current challenge is to find the DNA 3D-structure. We propose several matrix analysis methods, which one show disjoinct areas in the nucleus where the DNA interactions are different. These areas are nuclear compartments. With other biological features, we characterize the biological function of each of the compartments. The analysis tools are the ones already used in finance to analyze the autocorrelation matrices, or even time series.

Identiferoai:union.ndltd.org:theses.fr/2015PA066177
Date17 September 2015
CreatorsRiposo, Julien
ContributorsParis 6, Mozziconacci, Julien, Bianca, Carlo
Source SetsDépôt national des thèses électroniques françaises
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation, Text

Page generated in 0.002 seconds