Spelling suggestions: "subject:"test d’ajustamento"" "subject:"est d’ajustamento""
1 |
Sur les tests lisses d'ajustement dans le context des series chronologiquesTagne Tatsinkou, Joseph Francois 12 1900 (has links)
La plupart des modèles en statistique classique repose sur une hypothèse sur
la distribution des données ou sur une distribution sous-jacente aux données. La
validité de cette hypothèse permet de faire de l’inférence, de construire des intervalles
de confiance ou encore de tester la fiabilité du modèle. La problématique
des tests d’ajustement vise à s’assurer de la conformité ou de la cohérence de
l’hypothèse avec les données disponibles. Dans la présente thèse, nous proposons
des tests d’ajustement à la loi normale dans le cadre des séries chronologiques
univariées et vectorielles. Nous nous sommes limités à une classe de séries chronologiques
linéaires, à savoir les modèles autorégressifs à moyenne mobile (ARMA
ou VARMA dans le cas vectoriel).
Dans un premier temps, au cas univarié, nous proposons une généralisation du
travail de Ducharme et Lafaye de Micheaux (2004) dans le cas où la moyenne est
inconnue et estimée. Nous avons estimé les paramètres par une méthode rarement
utilisée dans la littérature et pourtant asymptotiquement efficace. En effet, nous
avons rigoureusement montré que l’estimateur proposé par Brockwell et Davis
(1991, section 10.8) converge presque sûrement vers la vraie valeur inconnue du
paramètre. De plus, nous fournissons une preuve rigoureuse de l’inversibilité de
la matrice des variances et des covariances de la statistique de test à partir de
certaines propriétés d’algèbre linéaire. Le résultat s’applique aussi au cas où la
moyenne est supposée connue et égale à zéro. Enfin, nous proposons une méthode
de sélection de la dimension de la famille d’alternatives de type AIC, et nous
étudions les propriétés asymptotiques de cette méthode. L’outil proposé ici est
basé sur une famille spécifique de polynômes orthogonaux, à savoir les polynômes
de Legendre.
Dans un second temps, dans le cas vectoriel, nous proposons un test d’ajustement
pour les modèles autorégressifs à moyenne mobile avec une paramétrisation
structurée. La paramétrisation structurée permet de réduire le nombre élevé de paramètres dans ces modèles ou encore de tenir compte de certaines contraintes
particulières. Ce projet inclut le cas standard d’absence de paramétrisation. Le
test que nous proposons s’applique à une famille quelconque de fonctions orthogonales.
Nous illustrons cela dans le cas particulier des polynômes de Legendre
et d’Hermite. Dans le cas particulier des polynômes d’Hermite, nous montrons
que le test obtenu est invariant aux transformations affines et qu’il est en fait
une généralisation de nombreux tests existants dans la littérature. Ce projet peut
être vu comme une généralisation du premier dans trois directions, notamment le
passage de l’univarié au multivarié ; le choix d’une famille quelconque de fonctions
orthogonales ; et enfin la possibilité de spécifier des relations ou des contraintes
dans la formulation VARMA.
Nous avons procédé dans chacun des projets à une étude de simulation afin
d’évaluer le niveau et la puissance des tests proposés ainsi que de les comparer
aux tests existants. De plus des applications aux données réelles sont fournies.
Nous avons appliqué les tests à la prévision de la température moyenne annuelle
du globe terrestre (univarié), ainsi qu’aux données relatives au marché du travail
canadien (bivarié).
Ces travaux ont été exposés à plusieurs congrès (voir par exemple Tagne,
Duchesne et Lafaye de Micheaux (2013a, 2013b, 2014) pour plus de détails). Un
article basé sur le premier projet est également soumis dans une revue avec comité
de lecture (Voir Duchesne, Lafaye de Micheaux et Tagne (2016)). / Several phenomena from natural and social sciences rely on distribution’s assumption
among which the normal distribution is the most popular. The validity
of that assumption is useful to setting up forecast intervals or for checking model
adequacy of the underlying model. The goodness-of-fit procedures are tools to
assess the adequacy of the data’s underlying assumptions. Autoregressive and moving
average time series models are often used to find the mathematical behavior
of these phenomena from natural and social sciences, and especially in the finance
area. These models are based on some assumptions including normality distribution
for the innovations. Normality assumption may be helpful for some testing
procedures. Furthermore, stronger conclusions can be drawn from the adjusted
model if the white noise can be assumed Gaussian. In this work, goodness-of-fit
tests for checking normality for the innovations from autoregressive moving average
time series models are proposed for both univariate and multivariate cases
(ARMA and VARMA models).
In our first project, a smooth test of normality for ARMA time series models
with unknown mean based on a least square type estimator is proposed.
We derive the asymptotic null distribution of the test statistic. The result here
is an extension of the paper of Ducharme et Lafaye de Micheaux (2004), where
they supposed the mean known and equal to zero. We use the least square type
estimator proposed by Brockwell et Davis (1991, section 10.8) and we provide a
rigorous proof that it is almost surely convergent. We show that the covariance
matrix of the test is nonsingular regardless if the mean is known. We have also
studied a data driven approach for the choice of the dimension of the family and
we gave a finite sample approximation of the null distribution. Finally, the finite
and asymptotic sample properties of the proposed test statistic are studied via a
small simulation study.
In the second project, goodness-of-fit tests for checking multivariate normality
for the innovations from vector autoregressive moving average time series
models are proposed. Since these time series models may rely on a large number
of parameters, structured parameterization of the functional form is allowed. The
methodology also relies on the smooth test paradigm and on families of orthonormal
functions with respect to the multivariate normal density. It is shown that
the smooth tests converge to convenient chi-square distributions asymptotically.
An important special case makes use of Hermite polynomials, and in that situation
we demonstrate that the tests are invariant under linear transformations.
We observed that the test is not invariant under linear transformations with Legendre
polynomials. A consistent data driven method is discussed to choose the
family order from the data. In a simulation study, exact levels are studied and
the empirical powers of the smooth tests are compared to those of other methods.
Finally, an application to real data is provided, specifically on Canadian labour
market data and annual global temperature.
These works were exposed at several meeting (see for example Tagne, Duchesne
and Lafaye de Micheaux (2013a, 2013b, 2014) for more details). A paper
based on the first project is submitted in a refereed journal (see Duchesne, Lafaye
de Micheaux et Tagne (2016)).
|
2 |
Les modèles de régression dynamique et leurs applications en analyse de survie et fiabilité / Dynamic regression models and their applications in survival and reliability analysisTran, Xuan Quang 26 September 2014 (has links)
Cette thèse a été conçu pour explorer les modèles dynamiques de régression, d’évaluer les inférences statistiques pour l’analyse des données de survie et de fiabilité. Ces modèles de régression dynamiques que nous avons considérés, y compris le modèle des hasards proportionnels paramétriques et celui de la vie accélérée avec les variables qui peut-être dépendent du temps. Nous avons discuté des problèmes suivants dans cette thèse.Nous avons présenté tout d’abord une statistique de test du chi-deux généraliséeY2nquiest adaptative pour les données de survie et fiabilité en présence de trois cas, complètes,censurées à droite et censurées à droite avec les covariables. Nous avons présenté en détailla forme pratique deY2nstatistique en analyse des données de survie. Ensuite, nous avons considéré deux modèles paramétriques très flexibles, d’évaluer les significations statistiques pour ces modèles proposées en utilisantY2nstatistique. Ces modèles incluent du modèle de vie accélérés (AFT) et celui de hasards proportionnels (PH) basés sur la distribution de Hypertabastic. Ces deux modèles sont proposés pour étudier la distribution de l’analyse de la duré de survie en comparaison avec d’autre modèles paramétriques. Nous avons validé ces modèles paramétriques en utilisantY2n. Les études de simulation ont été conçus.Dans le dernier chapitre, nous avons proposé les applications de ces modèles paramétriques à trois données de bio-médicale. Le premier a été fait les données étendues des temps de rémission des patients de leucémie aiguë qui ont été proposées par Freireich et al. sur la comparaison de deux groupes de traitement avec des informations supplémentaires sur les log du blanc du nombre de globules. Elle a montré que le modèle Hypertabastic AFT est un modèle précis pour ces données. Le second a été fait sur l’étude de tumeur cérébrale avec les patients de gliome malin, ont été proposées par Sauerbrei & Schumacher. Elle a montré que le meilleur modèle est Hypertabastic PH à l’ajout de cinq variables de signification. La troisième demande a été faite sur les données de Semenova & Bitukov, à concernant les patients de myélome multiple. Nous n’avons pas proposé un modèle exactement pour ces données. En raison de cela était les intersections de temps de survie.Par conséquent, nous vous conseillons d’utiliser un autre modèle dynamique que le modèle de la Simple Cross-Effect à installer ces données. / This thesis was designed to explore the dynamic regression models, assessing the sta-tistical inference for the survival and reliability data analysis. These dynamic regressionmodels that we have been considered including the parametric proportional hazards andaccelerated failure time models contain the possibly time-dependent covariates. We dis-cussed the following problems in this thesis.At first, we presented a generalized chi-squared test statisticsY2nthat is a convenient tofit the survival and reliability data analysis in presence of three cases: complete, censoredand censored with covariates. We described in detail the theory and the mechanism to usedofY2ntest statistic in the survival and reliability data analysis. Next, we considered theflexible parametric models, evaluating the statistical significance of them by usingY2nandlog-likelihood test statistics. These parametric models include the accelerated failure time(AFT) and a proportional hazards (PH) models based on the Hypertabastic distribution.These two models are proposed to investigate the distribution of the survival and reliabilitydata in comparison with some other parametric models. The simulation studies were de-signed, to demonstrate the asymptotically normally distributed of the maximum likelihood estimators of Hypertabastic’s parameter, to validate of the asymptotically property of Y2n test statistic for Hypertabastic distribution when the right censoring probability equal 0% and 20%.n the last chapter, we applied those two parametric models above to three scenes ofthe real-life data. The first one was done the data set given by Freireich et al. on thecomparison of two treatment groups with additional information about log white blood cellcount, to test the ability of a therapy to prolong the remission times of the acute leukemiapatients. It showed that Hypertabastic AFT model is an accurate model for this dataset.The second one was done on the brain tumour study with malignant glioma patients, givenby Sauerbrei & Schumacher. It showed that the best model is Hypertabastic PH onadding five significance covariates. The third application was done on the data set given by Semenova & Bitukov on the survival times of the multiple myeloma patients. We did not propose an exactly model for this dataset. Because of that was an existing oneintersection of survival times. We, therefore, suggest fitting other dynamic model as SimpleCross-Effect model for this dataset.
|
Page generated in 0.0649 seconds