1 |
Essays in functional econometrics and financial marketsTsafack-Teufack, Idriss 07 1900 (has links)
Dans cette thèse, j’exploite le cadre d’analyse de données fonctionnelles et développe
l’analyse d’inférence et de prédiction, avec une application à des sujets sur les marchés
financiers. Cette thèse est organisée en trois chapitres.
Le premier chapitre est un article co-écrit avec Marine Carrasco. Dans ce chapitre,
nous considérons un modèle de régression linéaire fonctionnelle avec une variable
prédictive fonctionnelle et une réponse scalaire. Nous effectuons une comparaison
théorique des techniques d’analyse des composantes principales fonctionnelles (FPCA)
et des moindres carrés partiels fonctionnels (FPLS). Nous déterminons la vitesse de
convergence de l’erreur quadratique moyen d’estimation (MSE) pour ces méthodes.
Aussi, nous montrons cette vitesse est sharp. Nous découvrons également que le biais
de régularisation de la méthode FPLS est plus petit que celui de FPCA, tandis que
son erreur d’estimation a tendance à être plus grande que celle de FPCA. De plus,
nous montrons que le FPLS surpasse le FPCA en termes de prédiction avec moins de
composantes.
Le deuxième chapitre considère un modèle autorégressif entièrement fonctionnel
(FAR) pour prèvoir toute la courbe de rendement du S&P 500 a la prochaine journée.
Je mène une analyse comparative de quatre techniques de Big Data, dont la méthode de
Tikhonov fonctionnelle (FT), la technique de Landweber-Fridman fonctionnelle (FLF), la
coupure spectrale fonctionnelle (FSC) et les moindres carrés partiels fonctionnels (FPLS).
La vitesse de convergence, la distribution asymptotique et une stratégie de test statistique
pour sélectionner le nombre de retard sont fournis. Les simulations et les données réelles
montrent que les méthode FPLS performe mieux les autres en terme d’estimation du
paramètre tandis que toutes ces méthodes affichent des performances similaires en termes
de prédiction.
Le troisième chapitre propose d’estimer la densité de neutralité au risque (RND) dans
le contexte de la tarification des options, à l’aide d’un modèle fonctionnel. L’avantage de
cette approche est qu’elle exploite la théorie d’absence d’arbitrage et qu’il est possible
d’éviter toute sorte de paramétrisation. L’estimation conduit à un problème d’inversibilité
et la technique fonctionnelle de Landweber-Fridman (FLF) est utilisée pour le surmonter. / In this thesis, I exploit the functional data analysis framework and develop inference,
prediction and forecasting analysis, with an application to topics in the financial market.
This thesis is organized in three chapters.
The first chapter is a paper co-authored with Marine Carrasco. In this chapter,
we consider a functional linear regression model with a functional predictor variable
and a scalar response. We develop a theoretical comparison of the Functional Principal
Component Analysis (FPCA) and Functional Partial Least Squares (FPLS) techniques.
We derive the convergence rate of the Mean Squared Error (MSE) for these methods. We
show that this rate of convergence is sharp. We also find that the regularization bias of
the FPLS method is smaller than the one of FPCA, while its estimation error tends to
be larger than that of FPCA. Additionally, we show that FPLS outperforms FPCA in
terms of prediction accuracy with a fewer number of components.
The second chapter considers a fully functional autoregressive model (FAR) to forecast
the next day’s return curve of the S&P 500. In contrast to the standard AR(1) model
where each observation is a scalar, in this research each daily return curve is a collection
of 390 points and is considered as one observation. I conduct a comparative analysis
of four big data techniques including Functional Tikhonov method (FT), Functional
Landweber-Fridman technique (FLF), Functional spectral-cut off (FSC), and Functional
Partial Least Squares (FPLS). The convergence rate, asymptotic distribution, and a
test-based strategy to select the lag number are provided. Simulations and real data
show that FPLS method tends to outperform the other in terms of estimation accuracy
while all the considered methods display almost the same predictive performance.
The third chapter proposes to estimate the risk neutral density (RND) for options
pricing with a functional linear model. The benefit of this approach is that it exploits
directly the fundamental arbitrage-free equation and it is possible to avoid any additional
density parametrization. The estimation problem leads to an inverse problem and the
functional Landweber-Fridman (FLF) technique is used to overcome this issue.
|
2 |
Contributions à l'analyse de données fonctionnelles multivariées, application à l'étude de la locomotion du cheval de sport / Contributions to the analysis of multivariate functional data, application to the study of the sport horse's locomotionSchmutz, Amandine 15 November 2019 (has links)
Avec l'essor des objets connectés pour fournir un suivi systématique, objectif et fiable aux sportifs et à leur entraineur, de plus en plus de paramètres sont collectés pour un même individu. Une alternative aux méthodes d'évaluation en laboratoire est l'utilisation de capteurs inertiels qui permettent de suivre la performance sans l'entraver, sans limite d'espace et sans procédure d'initialisation fastidieuse. Les données collectées par ces capteurs peuvent être vues comme des données fonctionnelles multivariées : se sont des entités quantitatives évoluant au cours du temps de façon simultanée pour un même individu statistique. Cette thèse a pour objectif de chercher des paramètres d'analyse de la locomotion du cheval athlète à l'aide d'un capteur positionné dans la selle. Cet objet connecté (centrale inertielle, IMU) pour le secteur équestre permet de collecter l'accélération et la vitesse angulaire au cours du temps, dans les trois directions de l'espace et selon une fréquence d'échantillonnage de 100 Hz. Une base de données a ainsi été constituée rassemblant 3221 foulées de galop, collectées en ligne droite et en courbe et issues de 58 chevaux de sauts d'obstacles de niveaux et d'âges variés. Nous avons restreint notre travail à la prédiction de trois paramètres : la vitesse par foulée, la longueur de foulée et la qualité de saut. Pour répondre aux deux premiers objectifs nous avons développé une méthode de clustering fonctionnelle multivariée permettant de diviser notre base de données en sous-groupes plus homogènes du point de vue des signaux collectés. Cette méthode permet de caractériser chaque groupe par son profil moyen, facilitant leur compréhension et leur interprétation. Mais, contre toute attente, ce modèle de clustering n'a pas permis d'améliorer les résultats de prédiction de vitesse, les SVM restant le modèle ayant le pourcentage d'erreur inférieur à 0.6 m/s le plus faible. Il en est de même pour la longueur de foulée où une précision de 20 cm est atteinte grâce aux Support Vector Machine (SVM). Ces résultats peuvent s'expliquer par le fait que notre base de données est composée uniquement de 58 chevaux, ce qui est un nombre d'individus très faible pour du clustering. Nous avons ensuite étendu cette méthode au co-clustering de courbes fonctionnelles multivariées afin de faciliter la fouille des données collectées pour un même cheval au cours du temps. Cette méthode pourrait permettre de détecter et prévenir d'éventuels troubles locomoteurs, principale source d'arrêt du cheval de saut d'obstacle. Pour finir, nous avons investigué les liens entre qualité du saut et les signaux collectés par l'IMU. Nos premiers résultats montrent que les signaux collectés par la selle seuls ne suffisent pas à différencier finement la qualité du saut d'obstacle. Un apport d'information supplémentaire sera nécessaire, à l'aide d'autres capteurs complémentaires par exemple ou encore en étoffant la base de données de façon à avoir un panel de chevaux et de profils de sauts plus variés / With the growth of smart devices market to provide athletes and trainers a systematic, objective and reliable follow-up, more and more parameters are monitored for a same individual. An alternative to laboratory evaluation methods is the use of inertial sensors which allow following the performance without hindering it, without space limits and without tedious initialization procedures. Data collected by those sensors can be classified as multivariate functional data: some quantitative entities evolving along time and collected simultaneously for a same individual. The aim of this thesis is to find parameters for analysing the athlete horse locomotion thanks to a sensor put in the saddle. This connected device (inertial sensor, IMU) for equestrian sports allows the collection of acceleration and angular velocity along time in the three space directions and with a sampling frequency of 100 Hz. The database used for model development is made of 3221 canter strides from 58 ridden jumping horses of different age and level of competition. Two different protocols are used to collect data: one for straight path and one for curved path. We restricted our work to the prediction of three parameters: the speed per stride, the stride length and the jump quality. To meet the first to objectives, we developed a multivariate functional clustering method that allow the division of the database into smaller more homogeneous sub-groups from the collected signals point of view. This method allows the characterization of each group by it average profile, which ease the data understanding and interpretation. But surprisingly, this clustering model did not improve the results of speed prediction, Support Vector Machine (SVM) is the model with the lowest percentage of error above 0.6 m/s. The same applied for the stride length where an accuracy of 20 cm is reached thanks to SVM model. Those results can be explained by the fact that our database is build from 58 horses only, which is a quite low number of individuals for a clustering method. Then we extend this method to the co-clustering of multivariate functional data in order to ease the datamining of horses’ follow-up databases. This method might allow the detection and prevention of locomotor disturbances, main source of interruption of jumping horses. Lastly, we looked for correlation between jumping quality and signals collected by the IMU. First results show that signals collected by the saddle alone are not sufficient to differentiate finely the jumping quality. Additional information will be needed, for example using complementary sensors or by expanding the database to have a more diverse range of horses and jump profiles
|
Page generated in 0.1236 seconds