Global ETD Search

1	Test d'hipòtesis com a selecció de models. Una aproximació geomètrica Cubedo Culleré, Marta 27 September 2002 (has links) L'objectiu general d'aquest treball és posar de relleu alguns problemes relacionats amb la teoria dels tests d'hipòtesis i aportar nous elements que donin uns criteris per a la selecció de models estadístics. Per això usarem principalment, com a mitjà, tècniques geomètriques en el context de l'estadística, i així proposarem noves metodologies, alternatives o complementàries a les tècniques clàssiques, basades en les propietats geomètriques dels models estadístics. En tot aquest treball es tractarà, de forma unificada, el problema de l'especificació del model i els tests d'hipòtesis. Per aclarir una mica més aquesta idea podem dir que es tractaran els tests d'hipòtesis des de la perspectiva de la selecció de models, en el sentit que acceptar una hipòtesi consistirà, essencialment, en acceptar que un model descriurà els trets més rellevants de una part de la realitat millor, segons uns criteris prèviament explicitats, que un altre més complex. Per tant els tests d'hipòtesis i la selecció de models es tractaran a través d'unes mateixes eines metodològiques.De fet, dintre del context dels tests d'hipòtesis, es donen una sèrie de paradoxes que moltes vegades passen desapercebudes, o bé són acceptades, pels estadístics, i no estadístics, que els utilitzen, però que deixen entreveure unes certes mancances a nivell conceptual. Recordem, que en la formulació clàssica dels tests d'hipòtesis, moltes vegades s'accepta una hipòtesi la qual sabem, estrictament parlant, que és falsa. Però prendre aquests tipus de decisions pot ser raonable per diverses raons: doncs un model més senzill ens pot permetre sintetitzar o simplificar una realitat complexa, facilitant, a més, la predicció de nous resultats amb un cert grau de fiabilitat. El que no sembla doncs massa raonable és que aquestes decisions entre hipòtesis es prenguin en base a les seves probabilitats, o probabilitats condicionades, d'error, donat que sabem, en sentit estricte, que són falses.Des d'aquest punt de vista, i tal com es desenvolupa en la secció 2 del capítol 1, la qüestió bàsica de la inferència estadística no hauria de ser: Quina és la probabilitat que una afirmació donada sigui certa?, doncs sabem que cap afirmació és estrictament certa, en el sentit que els models utilitzats en aquest context són només aproximacions de la realitat. Més aviat, la qüestió bàsica hauria de ser: quant allunyada està una determinada afirmació de la realitat?, suposant, és clar, que s'ha definit una distància per mesurar-ho. Dit en altres paraules, una estructura formal per a determinats tipus de raonaments inductius s'hauria de fonamentar més en una mesura de proximitat a la realitat, que no pas en una probabilitat. De fet, la probabilitat és una molt bona eina per quantificar la propensió a ocórrer dels esdeveniments observables, doncs parlem en termes de si un esdeveniment ocorre o no, i no pas en termes de si aquest esdeveniment és vertader o fals. En aquest sentit la probabilitat és una eina bàsica per construir models teòrics de fenòmens observables, però en inferència estadística, segons el que hem comentat anteriorment, sembla més adient utilitzar una distància.En aquest treball s'ha intentat donar una metodologia alternativa basada en distàncies sobre els models estadístics paramètrics. Com és ben sabut, aquests models, sota certes condicions generals de regularitat, tenen estructura de varietat Riemanniana, de manera que apareix com a distància natural la distància Riemanniana, la qual podem utilitzar com a eina per quantificar l'error estadístic.En el capítol 2 es proposen quatre mètodes, tot i que, de fet, podríem parlar d'un únic mètode en el sentit que tots ells comparteixen una mateixa filosofia de fons que s'implementa, a efectes pràctics, segons les diferents preferències a l'hora de treballar en estadística: freqüentista o Bayesiana, utilitzant probabilitats o bé moments.Cal tenir en compte també que tots ells es basaran en l'acceptació d'un estimador convenient pel model general, com per exemple l'estimador màxim-versemblant, del vertader valor del paràmetre. Així doncs, i seguint la línia que hem comentat a l'inici d'aquest paràgraf, els quatre mètodes sorgeixen de les combinacions de dues regles i dos procediments. Les regles es defineixen per comparar els errors fets en realitzar les estimacions sota l'espai general de paràmetres i sota el subespai definit per la hipòtesi nul.la, en una regla es comparen probabilitats i en l'altra moments, rebent els noms de regla-"p" i regla-"m", respectivament. Els dos procediments es defineixen per obtenir una estimació en la mesura de l'error sota el subespai de paràmetres definit per la hipòtesi nul.la, utilitzant una aproximació freqüentista en un cas, i una Bayesiana en l'altre. Aquest dos procediments rebran el nom de procediment-"f" i procediment-"b" respectivament. En aquest segon capítol es tractarà també, la relació entre hipòtesis simples i comportes i les distribucions asimptòtiques d'algunes de les distàncies que apareixen en els mètodes anteriorment descrits.Des del tercer capítol fins al sisé, es veuran diferents aplicacions dels mètodes a diferents models estadístics coneguts, com és el cas del model normal "n"-variant amb "Sigma" coneguda, el model Poisson, el model Gamma i el model lineal normal. Notem, però, que en el capítol 4 es donarà una aproximació asimptòtica per a un model estadístic paramètric regular "n"-dimensional general, això es farà utilitzant un dels mètodes abans proposats.Finalment s'estudiarà el comportament dels mètodes proposats quan no es compleix una de les suposicions bàsiques plantejades en aquest nou desenvolupament metodològic: quan no podem suposar que la probabilitat a priori corresponent a la hipòtesi nul.la, o submodel, és zero. Veurem com en aquest cas encara es donen resultats raonables, la qual cosa mostra la robustesa d'aquests nous mètodes. / In many cases when scientists use hypothesis tests they are fully aware that the statistical model itself, and a fortiori the null hypothesis, is only a partial description of reality, and, from a logical point of view, it is not strictly true. But there are several reasons why a (strictly speaking false) model might be developed: it allows us to synthesize data variability, while maintaining a reasonable fit with observed data, and also it facilitates prediction of new phenomena with a certain degree of accuracy. Quite simply, modelling makes reality more readily understandable.From this point of view, the basic question of statistical inference is not: What is the probability that a given statement is true?, since it is known that any assertion is not strictly true, rather the basic question is: How far does this statement lie from a true statement?, provided a distance to measure this were previously supplied. In other words, a formal structure for a certain class of inductive reasoning should be based more on a measure of closeness to the approximate truth than on probability.In the present work, we consider hypothesis testing problems in the context of parametric statistical models when the dimension corresponding to the null hypothesis is strictly smaller than the dimension of the whole model. We aim to solve problems of this kind by adopting methods which supply us with precise explanation as to why sometimes we choose the simplest model (null hypothesis) although it is not truthful.We develop an alternative methodology, based on point estimation tools, and we use distances over the parametric statistical models to supply a quantitative scalar measure of the errors corresponding to the estimations. This methodology is applied to various situations and compared with classical techniques. Tècniques geomètriques (Matemàtica) Models estadístics Tests d'hipòtesis Estadística Ciències Experimentals i Matemàtiques 51
2	Aspectos geométricos de las poblaciones y los individuos estadísticos Miñarro Alonso, Antonio 17 April 1991 (has links) Comenzarnos realizando una aproximación al concepto de modelo estadístico desde el punto de vista geométrico, centrándonos principalmente en consideraciones sobre la introducción de distancias, y en particular estudiando la métrica informacional y sus propiedades. Dada una variedad paramétrica correspondiente a un modelo estadístico, hemos efectuado un estudio del espacio tangente y del espacio tangente dual en un punto a la variedad, introduciendo representaciones adecuadas de los mismos. Tales representaciones han permitido identificar a los elementos del espacio muestral con campos tensoriales covariantes de primer orden en la variedad, mientras que las variables aleatorias pueden ser identificados con campos tensoriales contravariantes también de primer orden. Hemos introducido dos definiciones de distancias, en sentido estricto pseudodistancias, entre valores muestrales basadas ambas en distancias en el espacio tangente dual entre formas lineales asociadas. La primera, a la que denominamos distancia inmediata, es definida a partir de la distancia euclídea en el espacio tangente dual. Se han obtenido expresiones explícitas para la distancia cuando los individuos estadísticos son muestras correspondientes a las distribuciones Poisson, Weibull, Gamma, Exponencial, Binomial, Binomial Negativa, Multinomial, Multinomial negativa, Wald, Logística, Normal univariante y Normal multivariante. Se han estudiarlo ciertas propiedades relacionadas con la distancia inmediata, entre las que destacamos su invarianza frente a cambios de la medida de referencia y transformaciones por estadísticas suficientes, y su no decrecimiento al aumentar el número de parámetros de las variedades. La distancia estructural es definida a partir de la distancia sobre el conjunto imagen del espacio muestral. Se demuestra que coincide con la distancia inmediata si el conjunto imagen es un conjunto convexo y también que dicho conjunto no es convexo si la dimensión del espacio muestral es uno y el número de parámetros de la variedad mayor o igual a dos. Se ha obtenido la expresión explícita para la distancia estructural entre muestras de tamaño uno correspondientes a una distribución normal univariante. Se han estudiado las aplicaciones de las distancias entre individuos a técnicas clásicas de inferencia estadística, definiendo nuevos procedimientos de estimación de parámetros y contraste de hipótesis desde el punto de vista geométrico. Se comprueba cómo utilizando la distancia inmediata se recuperan gran parte de los resultados clásicos, en particular las ecuaciones de verosimilitud y el contraste de hipótesis mediante el test de los multiplicadores de Lagrange. Hemos comprobado también como utilizando en estimación de parámetros la distancia estructural en un ejemplo en que éste difiere de la inmediata, se obtienen resultados que difieren respecto a la máxima verosimilitud clásica y que podemos considerar más acordes con resultados intuitivos al dejar indeterminada la estimación de la varianza trabajando con muestras de tamaño uno de una distribución Normal univariante. Se ha introducido una clase de funciones de densidad de probabilidad que pueden ser caracterizadas en una variedad paramétrica de dimensión finita. Se comprueba que las variedades resultantes son de curvatura constante y positiva. Se han obtenido las expresiones para las geodésicas y la distancia de Rao entre dos distribuciones. Hemos efectuado un estudio probabilístico en varios ejemplos y finalmente consideramos la aplicación de tales familias a la estimación no paramétrica de funciones de densidad gracias a su capacidad de adaptación. Se ha abordado el problema de la estimación de parámetros en las familias anteriormente citadas. Comprobamos los inconvenientes de la estimación máximo verosímil y para subsanarlos hemos propuesto un algoritmo tipo “stepwise” que toma en cuenta la significación de los incrementos de la verosimilitud al modificar el número de parámetros de las familias. Utilizamos diversas simulaciones para comprobar la bondad del algoritmo, obteniendo resultados satisfactorios tanto al trabajar con distribuciones clásicos como con las nuevas familias. Se han comparado los resultados con otros métodos clásicos de estimación no paramétrica, en particular con el método de los Kernel. También se ha estudiado el método de minimizar la esperanza del cuadrado de la distancia estructural entre individuos (MESD). Para poder llevar a cabo tal estudio se ha desarrollado una aproximación a la distinción Riemanniana y se han utilizado técnicas de minimización numérica de funciones de varias variables con restricciones. Se han obtenido algunos ejemplos que muestran un mejor comportamiento de la estimación MESD frente a la MLE. Finalmente se han considerado dos ejemplos prácticos consistentes en la estimación de una función de densidad bimodal a partir de unos datos en forma de histograma y en la clasificación de diversos patrones electroforéticos asimilándolos a funciones de densidad. En limbos ejemplos los resultados parecen validar completamente la metodología empleada. / We have studied the concept of statistical model from a geometric point of view considering particularly the information metric and the problem of introducing distances. Given a parametric manifold representing a statistical model and given a point of the manifold, we have defined two different distances between elements of sample space (statistical individuals) by means of a suitable representation of statistical individuals as linear forms of the dual tangent space to the manifold in the given point. Some properties have been studied and the explicit expressions for some examples have been obtained. Several techniques of statistical inference: parameter estimation, hypothesis tests, discrimination; have been studied in the light of the distances between elements of sample spaces. Some classical results have been recovered, in particular Iikelihood equations and Lagrange multipliers test. We have introduced a class of probability density functions that may be represented in finite dimensional manifolds. Geometrical properties of such manifolds have been studied and the Rao distance between two distributions has been obtained. We have considered several examples. We have also studied the problem of parameter estimation in the functions defined previously; we have developed a stepwise algorithm for nonparametric density estimation in order to some problems arising with classical maximum likelihood estimation when we handle a large number of parameters. We also present some examples applied lo biological data. Models estadístics Modelos estadísticos Statistical models Geometria diferencial Geometría diferencial Differential Geometry Ciències Experimentals i Matemàtiques 311
3	Integración de los modelos de simulación en el diseño de los ensayos clínicos Abbas, Ismail 26 April 2004 (has links) Los ensayos clínicos son a menudo muy costosos y pueden tener una duración considerable. Un error en el diseño de un ensayo clínico puede implicar la imposibilidad de verificar la hipótesis que se pretendía probar por falta de significación estadística de los resultados, lo que supondrá una pérdida de recursos y un retraso en el proceso de introducción del nuevo producto farmacéutico en el mercado.En esta tesis se plantea el diseño de un ensayo clínico de medicamentos como un problema económico de optimización. El criterio de optimización concreto puede variar según la perspectiva y el marco de decisión. Desde una perspectiva empresarial de maximización del beneficio, el ensayo clínico puede verse como una inversión con unos costes relativamente predecibles y unos beneficios futuros mucho más inciertos. Objetivos e hipótesis de la tesis El objetivo principal de este trabajo es el análisis y desarrollo de modelos de simulación para la optimización del diseño de los ensayos clínicos. Con este fin se desarrollan diferentes estructuras de modelos estocásticos asistidos por ordenador que permiten representar adecuadamente el ensayo clínico y simular los resultados con diseños e hipótesis alternativas antes de su realización. Con ello se pretende determinar el diseño que optimiza el coste y el tiempo de desarrollo de un ensayo clínico, analizando los resultados hipotéticos antes de su realización real.La hipótesis que se pretende probar es que el desarrollo y la aplicación de los modelos de simulación propuestos permiten alcanzar de forma más eficiente los objetivos de los ensayos clínicos, es decir, obtener con una determinada probabilidad de éxito los resultados buscados -lo que en el caso de nuevos productos es una condición necesaria para su comercialización- en un periodo de tiempo y con un coste óptimos. Metodología El modelo conceptual general para la optimización de un ensayo clínico que proponemos en esta tesis consiste en dos sub-modelos: un sub-modelo de reclutamiento de pacientes y de asignación del tratamiento y un sub-modelo de seguimiento que describe la evolución de la variable o variables de proceso del ensayo clínico y las variables finales de respuesta. La validación del modelo conceptual es interdisciplinaria y es necesaria para comprobar que los objetivos y las hipótesis se corresponden con los establecidos en el protocolo. Resultados de la investigación Los resultados de esta tesis se han aplicado a un ensayo clínico de lipodistrofia en el tratamiento con antiretrovirales (ARV). Por ello, se ha construido, validado y seleccionado un modelo estadístico cuyos resultados se ajustan lo mejor posible a los resultados del ensayo clínico de lipodistrofia. Posteriormente, se aplica este modelo para la optimización del diseño de un ensayo clínico futuro. Comentarios e investigaciones futuras La revisión realizada de la literatura ha permitido constatar que la mayoría de los enfoques que se aplican en la actualidad al diseño de ensayos clínicos, incluyendo los que utilizan modelos de simulación, no tienen en cuenta todos los aspectos relevantes para la optimización del diseño conjuntamente. Lo que propone precisamente esta tesis como principal aportación es integrar todos estos aspectos en un modelo general de simulación para la optimización del diseño de un ensayo clínico según criterios y supuestos explícitos. Este enfoque permite desarrollar el modelo general de optimización en el que se plantee el diseño óptimo en términos de maximización del beneficio neto esperado. Según el promotor, los beneficios serían: o bien el beneficio económico, o bien los beneficios en salud, que podrían, eventualmente, expresarse en unidades monetarias mediante el método de la disponibilidad a pagar u otros enfoques habituales en evaluación económica. / Clinical trials are frequently very expensive and can last quite long. An error in the design of a clinical trial can imply the impossibility of confirming the hypothesis because of the fact results are lacking in statistical significance. This will mean to incur losses in resources and a delay in the introduction of the new pharmaceutical product into the market.In this thesis the clinical trial design is conceived as an economic optimisation problem. The concrete optimisation criterion might depend on the approach and the decision context. From the market point of view that seeks maximising benefits, clinical trials can be seen as an investment with relatively predictable costs but a much more uncertain future benefits. Objectives and hypothesis of this thesis The main objective of this work is analysing and developing simulation models for the optimisation of clinical trial design. We have thus developed different computer-assisted stochastic models structures which allow conveniently to represent the clinical trial and simulate the results with alternative designs and hypothesis before carrying it out. The ultimate goal is determining which design optimises cost and clinical trial duration, by analysing hypothetical results before they are actually put into practice.The hypothesis wanted to be proved is that the development and application of the proposed simulation models allow more efficiently achieve the objectives formulated in a clinical trial, i.e. to obtain the sought results with a given success probability -what, as far as new pharmaceutical products is concerned, is a necessary condition before their commercialisation- with optimal cost and time span. Methods The general conceptual model to optimise a clinical trial we proposes in this thesis consists in two sub-models: a recruitment of patients and treatment assignment sub-model and a follow-up sub-model, which describes the evolution of the clinical trial process and end-point variable or variables. The validation of the conceptual model is interdisciplinary and it is necessary to verify that the objectives and the hypothesis to correspond closely to those established in the protocol. Research results The results of this thesis have been applied to a clinical trial of lipodystrophy in the antrretroviral treatment (ARV). It has been build up, validated and selected a statistic model which results adjust as good as possible to the results of clinical trial of lipodystrophy. Afterwards, this same model is applied for the design optimisation of a future clinical trial. Discussion and future research The review of literature has allowed us to realise that most of the approaches applied nowadays to the design of clinical trials, including those that use simulation models, do not take into account the relevant aspects for the optimisation of the design altogether. What this thesis suggests precisely as main contribution is integrating all these aspects in a general simulation model for the design optimisation of a clinical trial according to explicit criteria and assumptions. This approach allows developing a general model of optimisation where the optimal design is seen in terms of maximisation of the expected net benefit. According to the sponsor, the benefits would be: the economic benefit, or the benefits to health, which could, eventually, be expressed in monetary units based on the willingness to pay method or other usual economic evaluation methods. models d'enfermetats optimizació econòmica economia de salut assaig clínic models d'estats discrets calibració i validació models estadístics salut pública simulació 00 004 311 33

1

Page generated in 0.0803 seconds