Global ETD Search

11	Estudi de les inèrcies estructurals en anàlisis de correspondències. Aportacions per a una millora de les anàlisis Daunis i Estadella, Josep 11 February 2005 (has links) La memòria d'aquesta tesi doctoral s'estructura en un primer capítol on es descriuen els objectius de la tesi i l'organització del treball de recerca. Després, el Capítol 2: Anàlisis factorials de dades es destina a presentar les eines utilitzades en les anàlisis factorials de dades. S'introdueix una anàlisi de tipus general, l'anàlisi canònica per a la comparació de dos grups de variables, i llavors es generalitza per a mes de dos grups. Presentem les anàlisis de correspondències, simples i múltiples, com un cas particular de les anàlisis canòniques, però també des d'una perspectiva més clàssica. Es proporcionen tècniques de representació gràfica - representacions simètriques i Biplots - i el concepte d'inèrcia.En el Capítol 3: Models loglineals i models gràfics es desenvolupen els models loglineals i els models gràfics, el concepte d'independència condicional i el seu ús. Es desenvolupen, a continuació, la formulació dels models loglineals, les restriccions que els caracteritzen -suma zero o còrner zero- i les relacions de transició. Es realitza un estudi de la influència dels paràmetres en la generació de models, sobretot de la importància del termes de les interaccions sobre els termes independents i els efectes principals. En aquest capítol s'introdueix la deviància, com a raó de versemblança entre dos models, la seva expressió i relació amb l'estadístic χ2 i altres indicadors de divergència de models.El Capítol 4: Estudi de les inèrcies en anàlisis de correspondències s'inicia amb la relació entre la inèrcia, el coeficient de contingència i la deviància. A continuació, s'estudien les descomposicions de la inèrcia com a contribucions dels individus, modalitats o variables i s'apliquen a l'estudi de matrius quadrades. En referència a les anàlisis de correspondències múltiples de la taula de Burt, es fa la descomposició de les inèrcies per blocs i s'estudia la problemàtica dels blocs diagonals. S'estudien metodologies de tractament i es fa una proposta de metodologia per al tractament de matrius quadrades no simètriques basada en una doble descomposició, per una part en l'anàlisi de la simetria-no simetria i per l'altra utilitzant la reconstitució factorial de la part simètrica, basada en un algorisme k-EM, on k és l'ordre de reconstitució. La reconstitució k-EM pot ser aplicada a les taules diagonals de Burt i ens porta a una anàlisi equivalent al Joint Correspondence Analysis.En el Capítol 5: ACM respecte un model i ACM condicional es dedica a presentar les ACM sobre un model i l'ACM condicional, on una variable qualitativa externa juga el paper de partició. L'aportació es basa en realitzar l'estudi de la inèrcia i la seva descomposició, en dues parts lligades a la variable condicionadora externa: la inèrcia inter i la inèrcia intra. Es troba la formulació de la distribució i mitjançant aquesta, s'interpreta la importància o no del condicionament. Així doncs, usant l'ACM condicional i els models loglineals estudiem el comportament de la inèrcia en relació al model. El Capítol 6: ACM multicondicional considera les problemàtiques que genera la implementació de l'ACM multicondicional, ja que no es pot generalitzar trivialment del cas simple. Mitjançant l'estudi de les inèrcies condicionals i els models loglineals es desenvolupa una proposta d'anàlisi multicondicional. Aquests resultats són comparats amb els que s'obtenen en un procés de modelització loglineal. S'aplica la proposta a un exemple en el Capítol 7.El treball de recerca finalitza amb unes conclusions on es resumeixen les principals aportacions i s'indiquen quines podrien ser algunes línies de recerca futures en aquest camp i s'annexen les macros programades. / The research work memory is structured in a first chapter with the description of the objectives of the doctoral thesis and the research work organization. Then, the Chapter 2 Descriptive factorial analysis is exclusively dedicated to present the tools used in factorial analysis. A general analysis, the canonical analysis, to compare two groups of variables is introduced, and then it is generalized to more than two questions. We present correspondence analysis, simple and multiple, as a particular case of canonical analysis, but we present both methods also from a more classical point of view. We also introduce graphical techniques -symmetric displays and Biplots- and the inertia concept.Chapter 3 Loglinear and graphical models introduces briefly loglinear models and graphical models, the conditional independence concept and its use. Next, we develop the loglinear model formula and the constraints that characterize the model -zero sum or zero corner treatment- and the transition relations. We make a study of the influence of the parameters over the model generation, especially about the significance of interaction terms over principal and independent terms. In this chapter we introduce the deviance, as a likelihood ratio between two models, its expression and its relation with the χ2 statistic and other model divergence indicators. In Chapter 4 Study of the inertias in correspondence analysis we start with the relation among inertias, the contingence coefficient and deviance. Next, we study the inertia decomposition as the contribution of each individual, category or variable. It's applied to study the case of square matrices. With reference to the multiple correspondence analysis of the Burt table, we decompose inertia by blocks and we investigate the influence of the blocks of the diagonal. A summary of several treatment methodologies is done. We propose a new methodology to treat squared skew-symmetric matrices, based on a double decomposition, on the one hand, in the symmetry-skew-symmetry analysis and on the other using the factorial reconstitution of the symmetric part, based on a k-EM algorithm, where k is the reconstitution order. The k-EM reconstitution methodology can be applied to the diagonal tables of a Burt table, which leads a result equivalent to Joint Correspondence Analysis.In Chapter 5 - MCA with respect to a model and conditional MCA- firstly we start presenting MCA with respect to a model. Secondly we discuss conditional MCA, where an external variable plays a partitioning role. The contribution is based on studying the inertia and its decomposition in two parts linked to the external conditioning variables, the inter and intra inertia. Next, we find their distribution function and, by means of this, we can test the significance of the conditioning variable. Therefore, using the conditional MCA and loglinear models introduced before, we study the inertia behaviour with relation to the model and with different relation levels between the variables.The Chapter 6 -Multiconditional MCA- consideres problems generated by the implementation of multiple conditional analysis, since it is not possible to generalize this definition to the simple conditional case. By means of the study of conditional inertias and loglinear models, we develop our proposal for a multiconditional analysis. These results are compared with the results obtained in a loglinear modelling process. We apply our proposal to a data example in Chapter 7. The dissertation ends with a chapter of conclusions which sums up our principal contributions and suggests some future research lines in this field of investigation and with the macros programmed and used. ACS ACM correspondencies inèrcies anàlisi factorial 1209. Estadística 31 311 51 519.1
12	Homogeneïtat d'estil en El Tirant Lo Blanc Riba Civil, Alexandre 20 September 2002 (has links) En la tesi s'aborda el problema de l'homogeneïtat d'estil en el Tirant lo Blanc mitjançant l'ús de l'estilometria. Les hipòtesis al voltant de l'autoria del Tirant lo Blanc van des de l'autoria única de Joanot Martorell a la intervenció d'un segon autor, be a l'última part de la novel·la o be al llarg de tota ella, passant per altres teories més heterodoxes. A la primera part de la tesi es fa un breu repàs dels problemes que aborda l'estilometria i d'algunes eines estadístiques útils a l'hora de fer un estudi quantitatiu de l'estil literari, es resumeix la qüestió de l'autoria del Tirant lo Blanc, i es descriu la base de dades que s'ha construït per la quantificació de l'estil en el Tirant. Per atacar el problema, hem començat adaptant tècniques d'anàlisi descriptiva de dades, com els gràfics de control i l'anàlisi de correspondències. Per explotar la base de dades, proposem un mètode pràctic per estimar un o més d'un punt de canvi en seqüències de normals, de binomials i de multinomials. El mètode es basa en l'ajust de models i troba els estimadors màxim versemblants del(s) punt(s) de canvi. També hem utilitzat un mètode cluster basat en l'ajust de models per a dades politòmiques, per a agrupar les files d'una taula de contingència. Vam començar l'estudi fent un estudi comparatiu de 12 maneres diferents de mesurar la riquesa i diversitat de vocabulari. Pel que fa a les unitats lexicomètriques la llargada de paraula i l'ús de paraules freqüents i lliures del context ens han sigut molt útils per a l'estimació del punt de canvi i l'atribució d'estil als capítols. L'ús de lletres, tot i ser menys útil, serveix per a reforçar l'evidència del que trobem amb les unitats abans esmentades. La llargada de frase i la de capítol no ens ha sigut útils per a determinar una frontera d'estil en el Tirant.Per tot el que hem anat trobant estem convençuts que hi ha un canvi sobtat en l'estil entre els capítols 371 i 382, que difícilment pot ser atribuïble a l'argument. També hem trobat que després del punt de canvi conviuen capítols amb els dos estils, el que probablement reforça la teoria de que un segon autor va afegir capítols sobre un original pràcticament acabat. De totes maneres, no ens pertoca a nosaltres descobrir que el canvi d'estil no pugui ser degut a altres raons. / En la tesis se aborda el problema de la homogeneidad de estilo en el Tirant lo Blanc mediante el uso de la estilometría. Las hipótesis sobre la autoría del Tirant lo Blanc van desde la autoría única de Joanot Martorell a la intervención de un segundo autor, bien en la última parte de la novela o bien a lo largo de toda ella, pasando por otras teorías más heterodoxas. En la primera parte de la tesis se hace un breve repaso de los problemas que aborda la estilometría i de algunas herramienta estadísticas útiles para el estudio cuantitativo del estilo literario, se resume la cuestión de la autoría del Tirant lo Blanc, y se describe la base de datos que s ha construido para la ciantificación del estilo en el Tirant. Para atacar el problema, hemos empezado adaptando técnicas de análisis descriptivo de datos, como los gráficos de control y el análisis de correspondencias. Para explotar la base de datos, proponemos un método práctico para estimar uno o más de un punto de cambio en secuencias de normales, de binomiales y de multinomiales. El método se basa en el ajuste de modelos y halla los estimadores máximo verosímiles del (de los) punto(s) de cambio. También hemo utilizado un método cluster basado en el ajuste de modelos para a datos politómicos, para agrupar las filas de una tabla de contingencia. Empezamos el estudio realizando un estudio comparativo de 12 formas diferentes de medir la riqueza y diversidad de vocabulario. Las unidades lexicométricas como la longitud de palabra y el uso de palabras frecuentes y libres del contexto nos han sido muy útiles para la estimación del punto de cambio y la atribución de estilo a los capítulos. El uso de letras, a pesar de ser menos útil, sirve para reforzar la evidencia de lo que hallamos con las unidades antes citadas. La longitud de frase y la de capítulo no nos han sido útiles para a determinar una frontera de estilo en el Tirant.Por todos los resultados que hemos ido obteniendo, estamos convencidos que hay un cambio repentino en el estilo entre los capítulos 371 y 382, que difícilmente puede ser atribuible al argumento. También hemos observado que después del punto de cambio conviven capítulos con los dos estilos, lo que probablemente refuerza la teoría de que un segundo autor añadió capítulos sobre un original prácticamente acabado. De todas maneras, no es nuestra misión descubrir que el cambio de estilo no pueda ser debido a otras razones. / This Ph.D. Thesis tackles the problem of the homogeneity of style in Tirant lo Blanc, using the statistical analysis of stylistic features that are measurable but rarely consciously controlled by the author. The goal is to determine whether the style in the book is homogeneous and, if it is not, to find stylistic boundaries. Tirant lo Blanc is the main work in Catalan literature, a chivalry book hailed to be 'the best book of its kind in the world' by Cervantes in Don Quixote, and is considered to be the first modern novel in Europe. There has been an intense and long lasting debate around its authorship originating from conflicting information given in its first edition; while the dedicatory letter states that Joanot Martorell takes sole responsibility for writing the book, the colophon states that the last quarter of the book was written by Martí Joan de Galba, after the death of Martorell. Neither of the two candidate authors left any text comparable to the one under study, and therefore one can not use discriminant analysis to help classify the chapters in the book by author. The majority opinion among medievalists leans towards the single-authorship hypothesis, even though there is a rather strong dissenting minority. In the first part of the thesis we summarize some useful statistical techniques for the quantitative analysis of literary style, we describe the problems that stylometry deals with and we give the state-of-the-art of the authorship attribution problem in Tirant lo Blanc. The data base built by the quantification of style is described as well. The analysis is started by the use of graphical, Statistical Process Control and Correspondence Analysis techniques. In order to obtain maximum likelihood estimates of one or more than one change points in either normal, binomial or multinomial sequences, we propose a practical method based on the fitting of Generalized Linear Models. A cluster method for the rows of a contingency table, based on the fitting of models, is proposed too. We analyze the evolution of the diversity of the vocabulary used in the book through twelve different diversity indices. Following the lead of the extensive stylometry literature, we use word length, and the use of function words to estimate the change point and the attribution of style to the 489 chapters of the book. The use of letters, in spite of being less useful, reinforces the evidences found with the units previously cited. The sentence length and the chapter length weren't useful to determine a style boundary in Tirant The statistical analysis consistently detects a change in style somewhere between chapters 371 and 382, even though a few chapters at the end have a style similar to the ones before that boundary. It is important to remark that even though the statistical analysis supports the existence of two authors, it is not up to us to exclude the possibility that the stylistic boundary found could be explained otherwise. categorical data estilometria index de diversitat generalized linear models change-point analysis llargada de paraules 1209. Estadística 311 60 80 82
13	Diseño de una nariz electrónica para la determinación no destructiva del grado de la maduración de la fruta Brezmes Llecha, Jesús 11 December 2001 (has links) La monitorización del grado de maduración es un tema de gran relevancia en la industria frutícola. En esta tesis doctoral se ha estudiado la viabilidad de utilizar una nariz electrónica como instrumento para monitorizar el proceso de maduración de la fruta de forma no destructiva. Los sistemas de olfato electrónico son instrumentos basados en una matriz de sensores químicos semiconductores cuyas sensibilidades están parcialmente solapadas. Los algoritmos de procesado de señal constituyen una parte fundamental de estos equipos. En este trabajo se ha seguido una metodología de aproximación sucesiva. Se diseñó un primer prototipo para comprobar la viabilidad de la idea y luego se diseñó un segundo instrumento para realizar tareas más productivas. Una parte fundamental del trabajo ha sido la modificación, evaluación e integración de diferentes algoritmos de procesado de señales. Entre ellos se han estudiado diferentes tipos de redes neuronales (redes feed-forward con entrenamiento back-propagation, redes Fuzzy Art y Fuzzy Artmap), algoritmos paramétricos como el PLS (Partial Least Squares) o algoritmos no supervisados como el PCA (Principal Component Analysis).Los prototipos se probaron con diferentes variedades de fruta climatérica. En concreto, manzanas, peras, melocotones y nectarinas fueron las variedades escogidas para el estudio. Para evaluar objetivamente las prestaciones de los equipos se compararon sus resultados con los indicadores que habitualmente se utilizan en los estudios de calidad que se realizan sobre diferentes variedades de fruta. Entre ellos destacamos la firmeza, la acidez, el contenido en sólidos solubles, la producción de etileno y el perfil aromático de las muestras. Además de clasificar la fruta según diferentes estados de maduración, los prototipos revelaron la existencia de buenas correlaciones entre las señales de los sensores y algunos de los indicadores medidos en las muestras de fruta analizadas. El segundo prototipo fue capaz de predecir varios indicadores de calidad a partir de la medida no destructivas de la producción aromática de las muestras utilizadas. Además, predijo con mucha exactitud la fecha óptima de recolecta de las variedades de melocotón y nectarinas estudiadas, variedades que presentan dificultades al intentar determinar con exactitud el momento óptimo de su recolecta. Los resultados obtenidos en esta tesis permiten concluir que, aunque existen algunos aspectos que deben ser mejorados antes de poder comercializar una nariz electrónica que monitorice el estado de maduración de la fruta, es viable el diseño de un instrumento de estas características para ser operado en condiciones de laboratorio. / The monitorization of the ripening state is becoming a very important issue in the fruit industry. In this doctoral thesis, a viability study has been carried out to see whether an electronic nose could be used as an instrument to assess fruit ripeness in a non-destructive manner. Electronic noses are systems based on an array of gas sensors with overlapped sensitivities. The signal processing algorithms embedded onto these instruments play a very important role since they process the multidimensional information generated at the sensor array to obtain the desired output.In this thesis, a successive approximation to the problem has been carried out. A first prototype was designed to check the viability of the idea. Afterwards, a second instrument was designed to test specific applications. A great amount of the work done dealt with the modification, evaluation and integration of many signal processing algorithms. Among them, different kinds of neural networks (feed-forward with back-propagation training, Fuzzy Art and Fuzzy Artmap), parametric algorithms (such as PLS, partial least squares) and unsupervised projections such as PCA (principal component analysis) were evaluated.The prototypes were tested with different cultivars, all of them climacteric; apples, pears, peaches and nectarines were chosen for the study. In order to do an objective evaluation, the results of the second prototype were compared with the ones obtained with techniques regularly used to assess fruit quality and ripeness. In this way, firmness, acidity, soluble solid contents, ethylene and aromatic production values were correlated with sensor signals from the prototype.Besides classifying fruit regarding to its ripeness state, the second prototype proved there were good correlations between sensor signals and some quality indicators measured on the samples chosen for the study. In fact, the prototype was able to predict some of the quality indicators just using the sensor signals from the non-destructive measurement of the fruit samples chosen. Moreover, it was able to predict with accuracy the optimal harvest date for peaches and nectarines, cultivars whose harvest date is difficult to determine by traditional techniques.The overall results obtained in this study lead to the conclusion that, although there are some problems that have to be addressed before an electronic nose for fruit ripeness assessment may become commercially available, the design of such as system to be operated under laboratory conditions is viable. nas electrònic maduració olfacte electrònic 631
14	Modelo bioeconómico para la evaluación del impacto de la genética y otras variables sobre la cadena cárnica vacuna en Uruguay Soares de Lima Lapetina, Juan Manuel 17 July 2009 (has links) Se ha desarrollado un modelo bioecononómico dinámico, con el objetivo de disponer de una herramienta adaptada a las condiciones de Uruguay con la cual evaluar el efecto de la genética y alternativas de producción, reproducción y manejo sobre la productividad y el retorno económico de los establecimientos ganaderos y de la cadena cárnica uruguaya en su conjunto. Se destaca la importancia de la edad de las novillas al primer servicio y la tasa de preñez de hembras jóvenes. Se verifican complejas interacciones entre la tasa reproductiva y variables como la política de descarte de hembras del rebaño y los precios de venta. El cebo constituye una altenativa de mayor retorno económico que la cría, con una alta sensibilidad al aporte de insumos. Desde el punto de vista de la genética, la tasa reproductiva, el rendimiento de res y la tasa de crecimiento de machos constituyen las variables de mayor peso económico. En sectores de ganadería extensiva fundamentalmente, aún se visualizan alternativas de bajo coste y alto retorno económico. El modelo posibilita la consideración simultánea de numerosas variables, pudiendo ser utilizado como apoyo a la investigación y extensión en ganadería a nivel de establecimientos o en la evaluación de políticas de diversa índole a nivel regional o nacional. / Soares De Lima Lapetina, JM. (2009). Modelo bioeconómico para la evaluación del impacto de la genética y otras variables sobre la cadena cárnica vacuna en Uruguay [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/6030 Modelo bioeconómico Ganadería Uruguay Genética Sistemas de producción Cría Cebo 310402 - Bovinos 120714 - Formulación de sistemas 1209 - Estadística 610702 - Teoría y sistemas
15	Statistical methods for time course microarray data Nueda Roldán, María José 02 September 2009 (has links) La tesis aborda el análisis estadístico de series simples y múltiples de experimentos de "Time Course Microarray" (TCM). El trabajo se centra en el desarrollo, aplicación y evaluación de métodos estadísticos específicos que consideran la problemática de este tipo de datos, tanto desde el punto de vista de selección de genes como del análisis funcional. Las técnicas desarrolladas se comparan con otros métodos del estado del arte actual evaluando las diferentes metodologías en términos de eficiencia y significado biológico de los resultados. En la tesis se incluye la descripción del funcionamiento de la tecnología de "microarrays" así como una revisión crítica de los métodos estadísticos aplicados a este tipo de datos mostrando los inconvenientes que surgen al aplicar métodos generales a series temporales de "microarrays" y justificando la necesidad de desarrollar nuevas técnicas para el análisis de TCM. La primera técnica desarrollada es maSigPro ("microarray Significant Profile") que usa análisis de regresión lineal para modelar la expresión génica y lleva a cabo una estrategia en dos pasos para seleccionar los genes diferencialmente expresados. La aplicación de la técnica multivariantes ASCA (ANOVA "Simultaneous Component Analysis") a datos de TCM da como resultado el método ASCA-genes que combina la exploración multivariante de datos con un procedimiento de selección para identificación de genes con cambios relevantes. El método ASCA es también usado para crear una estrategia de filtrado de datos de gran utilidad para eliminar el alto nivel de ruido estructural de los datos de microarrays. Por último, se desarrollan métodos estadísticos para una evaluación directa e integrada de las alteraciones que pueden sufrir las funciones génicas en TCM. Para este propósito, se ha adaptado las técnicas maSigPro, ASCA y PCA incorporándoles información funcional obteniendo las metodologías maSigFun, PCA-maSigFun y ASCA-functional. / Nueda Roldán, MJ. (2009). Statistical methods for time course microarray data [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/6061 Time-course microarray Masigpro Asca Anova Pca ESTADISTICA E INVESTIGACION OPERATIVA 1209 - Estadística 120903 - Análisis de datos 120909 - Análisis multivariante 240401 - Bioestadística
16	Consecutive patterns and statistics on restricted permutations Elizalde Torrent, Sergi 16 July 2004 (has links) El tema d'aquesta tesi és l'enumeració de permutacions amb subseqüències prohibides respecte a certs estadístics, i l'enumeració de permutacions que eviten subseqüències generalitzades.Després d'introduir algunes definicions sobre subseqüències i estadístics en permutacions i camins de Dyck, comencem estudiant la distribució dels estadístics -nombre de punts fixos' i -nombre d'excedències' en permutacions que eviten una subseqüència de longitud 3. Un dels resultats principals és que la distribució conjunta d'aquest parell de paràmetres és la mateixa en permutacions que eviten 321 que en permutacions que eviten 132. Això generalitza un teorema recent de Robertson, Saracino i Zeilberger. Demostrem aquest resultat donant una bijecció que preserva els dos estadístics en qüestió i un altre paràmetre. La idea clau consisteix en introduir una nova classe d'estadístics en camins de Dyck, basada en el que anomenem túnel.A continuació considerem el mateix parell d'estadístics en permutacions que eviten simultàniament dues o més subseqüències de longitud 3. Resolem tots els casos donant les funcions generadores corresponents. Alguns casos són generalitzats a subseqüències de longitud arbitrària. També descrivim la distribució d'aquests paràmetres en involucions que eviten qualsevol subconjunt de subseqüències de longitud 3. La tècnica principal consisteix en fer servir bijeccions entre permutacions amb subseqüències prohibides i certs tipus de camins de Dyck, de manera que els estadístics en permutacions que considerem corresponen a estadístics en camins de Dyck que són més fàcils d'enumerar.Tot seguit presentem una nova família de bijeccions del conjunt de camins de Dyck a sí mateix, que envien estadístics que apareixen en l'estudi de permutacions amb subseqüències prohibides a estadístics clàssics en camins de Dyck, la distribució dels quals s'obté fàcilment. En particular, això ens dóna una prova bijectiva senzilla de l'equidistribució de punts fixos en les permutacions que eviten 321 i en les que eviten 132. A continuació donem noves interpretacions dels nombres de Catalan i dels nombres de Fine. Considerem una classe de permutacions definida en termes d'aparellaments de 2n punts en una circumferència sense creuaments. N'estudiem l'estructura i algunes propietats, i donem la distribució de diversos estadístics en aquests permutacions.En la següent part de la tesi introduïm una noció diferent de subseqüències prohibides, amb el requeriment que els elements que formen la subseqüència han d'aparèixer en posicions consecutives a la permutació. Més en general, estudiem la distribució del nombre d'ocurrències de subparaules (subseqüències consecutives) en permutacions. Resolem el problema en diversos casos segons la forma de la subparaula, obtenint-ne les funcions generadores exponencials bivariades corresponents com a solucions de certes equacions diferencials lineals. El mètode està basat en la representació de permutacions com a arbres binaris creixents i en mètodes simbòlics.La part final tracta de subseqüències generalitzades, que extenen tant la noció de subseqüències clàssiques com la de subparaules. Per algunes subseqüències obtenim nous resultats enumeratius. Finalment estudiem el comportament assimptòtic del nombre de permutacions de mida n que eviten una subseqüència generalitzada fixa quan n tendeix a infinit. També donem fites inferiors i superiors en el nombre de permutacions que eviten certes subseqüències. consecutive patterns tunnel statistics dyck paths pattern avoidance permutations bijection generalized patterns restricted permutation 519.1
17	Regression models with an interval-censored covariate Langohr, Klaus 16 June 2004 (has links) El análisis de supervivencia trata de la evaluación estadística de variables que miden el tiempo transcurrido hasta un evento de interés. Una particularidad que ha de considerar el análisis de supervivencia son datos censurados. Éstos aparecen cuando el tiempo de interés no puede ser observado exactamente y la información al respecto es parcial. Se distinguen diferentes tipos de censura: un tiempo censurado por la derecha está presente si el tiempo de supervivencia es sabido mayor a un tiempo observado; censura por izquierda está dada si la supervivencia es menor que un tiempo observado. En el caso de censura en un intervalo, el tiempo está en un intervalo de tiempo observado, y el caso de doble censura aparece cuando, también, el origen del tiempo de supervivencia está censurado.La primera parte del Capítulo 1 contiene un resumen de la metodología estadística para datos censurados en un intervalo, incluyendo tanto métodos paramétricos como no-paramétricos. En la Sección 1.2 abordamos el tema de censura noinformativa que se supone cumplida para todos los métodos presentados. Dada la importancia de métodos de optimización en los demás capítulos, la Sección 1.3 trata de la teoría de optimización. Esto incluye varios algoritmos de optimización y la presentación de herramientas de optimización. Se ha utilizado el lenguaje de programación matemática AMPL para resolver los problemas de maximización que han surgido. Una de las características más importantes de AMPL es la posibilidad de enviar problemas de optimización al servidor 'NEOS: Server for Optimization' en Internet para que sean solucionados por ese servidor.En el Capítulo 2, se presentan los conjuntos de datos que han sido analizados. El primer estudio es sobre la supervivencia de pacientes de tuberculosis co-infectados por el VIH en Barcelona, mientras el siguiente, también del área de VIH/SIDA, trata de usuarios de drogas intra-venosas de Badalona y alrededores que fueron admitidos a la unidad de desintoxicación del Hospital Trias i Pujol. Un área completamente diferente son los estudios sobre la vida útil de alimentos. Se presenta la aplicación de la metodología para datos censurados en un intervalo en esta área. El Capítulo 3 trata del marco teórico de un modelo de vida acelerada con una covariante censurada en un intervalo. Puntos importantes a tratar son el desarrollo de la función de verosimilitud y el procedimiento de estimación de parámetros con métodos del área de optimización. Su uso puede ser una herramienta importante en la estadística. Estos métodos se aplican también a otros modelos con una covariante censurada en un intervalo como se demuestra en el Capítulo 4.Otros métodos que se podrían aplicar son descritos en el Capítulo 5. Se trata sobre todo de métodos basados en técnicas de imputación para datos censurados en un intervalo. Consisten en dos pasos: primero, se imputa el valor desconocido de la covariante, después, se pueden estimar los parámetros con procedimientos estadísticos estándares disponibles en cualquier paquete de software estadístico.El método de maximización simultánea ha sido implementado por el autor con el código de AMPL y ha sido aplicado al conjunto de datos de Badalona. Presentamos los resultados de diferentes modelos y sus respectivas interpretaciones en el Capítulo 6. Se ha llevado a cabo un estudio de simulación cuyos resultados se dan en el Capítulo 7. Ha sido el objetivo comparar la maximización simultánea con dos procedimientos basados en la imputación para el modelo de vida acelerada. Finalmente, en el último capítulo se resumen los resultados y se abordan diferentes aspectos que aún permanecen sin ser resueltos o podrían ser aproximados de manera diferente. / Survival analysis deals with the evaluation of variables which measure the elapsed time until an event of interest. One particularity survival analysis has to account for are censored data, which arise whenever the time of interest cannot be measured exactly, but partial information is available. Four types of censoring are distinguished: right-censoring occurs when the unobserved survival time is bigger, left-censoring when it is less than an observed time, and in case of interval-censoring, the survival time is observed within a time interval. We speak of doubly-censored data if also the time origin is censored.In Chapter 1 of the thesis, we first give a survey on statistical methods for interval-censored data, including both parametric and nonparametric approaches. In the second part of Chapter 1, we address the important issue of noninformative censoring, which is assumed in all the methods presented. Given the importance of optimization procedures in the further chapters of the thesis, the final section of Chapter 1 is about optimization theory. This includes some optimization algorithms, as well as the presentation of optimization tools, which have played an important role in the elaboration of this work. We have used the mathematical programming language AMPL to solve the maximization problems arisen. One of its main features is that optimization problems written in the AMPL code can be sent to the internet facility 'NEOS: Server for Optimization' and be solved by its available solvers.In Chapter 2, we present the three data sets analyzed for the elaboration of this dissertation. Two correspond to studies on HIV/AIDS: one is on the survival of Tuberculosis patients co-infected with HIV in Barcelona, the other on injecting drug users from Badalona and surroundings, most of whom became infected with HIV as a result of their drug addiction. The complex censoring patterns in the variables of interest of the latter study have motivated the development of estimation procedures for regression models with interval-censored covariates. The third data set comes from a study on the shelf life of yogurt. We present a new approach to estimate the shelf lives of food products taking advantage of the existing methodology for interval-censored data.Chapter 3 deals with the theoretical background of an accelerated failure time model with an interval-censored covariate, putting emphasize on the development of the likelihood functions and the estimation procedure by means of optimization techniques and tools. Their use in statistics can be an attractive alternative to established methods such as the EM algorithm. In Chapter 4 we present further regression models such as linear and logistic regression with the same type of covariate, for the parameter estimation of which the same techniques are applied as in Chapter 3. Other possible estimation procedures are described in Chapter 5. These comprise mainly imputation methods, which consist of two steps: first, the observed intervals of the covariate are replaced by an imputed value, for example, the interval midpoint, then, standard procedures are applied to estimate the parameters.The application of the proposed estimation procedure for the accelerated failure time model with an interval-censored covariate to the data set on injecting drug users is addressed in Chapter 6. Different distributions and covariates are considered and the corresponding results are presented and discussed. To compare the estimation procedure with the imputation based methods of Chapter 5, a simulation study is carried out, whose design and results are the contents of Chapter 7. Finally, in the closing Chapter 8, the main results are summarized and several aspects which remain unsolved or might be approximated in another way are addressed. parameter estimation optimization techniques optimization tools epidemiology HIV/AIDS regression models interval-censored data maximum likelihood estimation 1209. Estadística 311 51 60 61
18	A markov chain monte carlo method for inverse stochastic modeling and uncertainty assessment Fu, Jianlin 07 May 2008 (has links) Unlike the traditional two-stage methods, a conditional and inverse-conditional simulation approach may directly generate independent, identically distributed realizations to honor both static data and state data in one step. The Markov chain Monte Carlo (McMC) method was proved a powerful tool to perform such type of stochastic simulation. One of the main advantages of the McMC over the traditional sensitivity-based optimization methods to inverse problems is its power, flexibility and well-posedness in incorporating observation data from different sources. In this work, an improved version of the McMC method is presented to perform the stochastic simulation of reservoirs and aquifers in the framework of multi-Gaussian geostatistics. First, a blocking scheme is proposed to overcome the limitations of the classic single-component Metropolis-Hastings-type McMC. One of the main characteristics of the blocking McMC (BMcMC) scheme is that, depending on the inconsistence between the prior model and the reality, it can preserve the prior spatial structure and statistics as users specified. At the same time, it improves the mixing of the Markov chain and hence enhances the computational efficiency of the McMC. Furthermore, the exploration ability and the mixing speed of McMC are efficiently improved by coupling the multiscale proposals, i.e., the coupled multiscale McMC method. In order to make the BMcMC method capable of dealing with the high-dimensional cases, a multi-scale scheme is introduced to accelerate the computation of the likelihood which greatly improves the computational efficiency of the McMC due to the fact that most of the computational efforts are spent on the forward simulations. To this end, a flexible-grid full-tensor finite-difference simulator, which is widely compatible with the outputs from various upscaling subroutines, is developed to solve the flow equations and a constant-displacement random-walk particle-tracking method, which enhances the com / Fu, J. (2008). A markov chain monte carlo method for inverse stochastic modeling and uncertainty assessment [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/1969 Mcmc Geostatistics Inverse problem Model calibration Spatial structure History matching Reservoir simulation Conditional simulation INGENIERIA HIDRAULICA 1209 - Estadística 2508 - Hidrología 330515 - Ingeniería hidráulica 250605 - Hidrogeología
19	Errores en la búsqueda de condiciones robustas. Metodologías para evitarlos. Pozueta Fernández, Maria Lourdes 10 December 2001 (has links) El problema de encontrar condiciones robustas al efecto de factores no controlados es un tema que interesa enormemente a las empresas ya que es una característica que demanda el mercado. Existen básicamente dos métodos para estudiar el problema: El que se basa en el método propuesto por G. Taguchi a comienzos de los 80's con el que se aproxima la variabilidad a partir de matrices producto y se seleccionan las condiciones robustas minimizando la respuesta, o el que parte de una matriz más económica que permite estimar un modelo para la respuesta Y en función de los factores de control y ruido, y estudia las condiciones robustas a partir de las interacciones entre los factores ruido y los factores de control. Aunque en un principio cabrían esperar resultados muy similares analizando un mismo problema por las dos vías hemos encontrado ejemplos donde las conclusiones son muy dispares y por ello nos hemos planteado este trabajo de investigación para encontrar las causas de estas diferencias.El trabajo de investigación lo hemos iniciado estudiando la naturaleza de las superficies asociadas a la variabilidad provocada por factores ruido realizando el estudio de forma secuencial aumentando el número de factores ruido. Hemos demostrado que independientemente de que la métrica seleccionada sea s2(Y), s(Y) o lo(s(Y)) las superficies difícilmente podrán ser aproximadas por polinomios de primer orden en los factores de control llegando a la conclusión de que algunas de las estrategias habituales que los experimentadores utilizan en la práctica difícilmente llevan a un buen conocimiento de esta superficie. Por ejemplo no es adecuado colocar un diseño 2k-p de Resolución III en los factores de control en una matriz producto siendo recomendables diseños de Resolución IV con puntos centrales.A continuación se han supuesto dos fuentes de variación en la respuesta debidas a ruido, fuentes desconocidas para el experimentador, y se ha estudiado la sensibilidad de los dos métodos para recoger estas oportunidades de reducción de la variabilidad demostrándose que el modelo para métricas resumen está más preparado para recoger todas las fuentes de variación que el modelo a partir de métricas no-resumen, el cual es muy sensible a la estimación del modelo de Y.Por último se ha investigado sobre los errores más comunes a la hora de seleccionar las condiciones robustas a partir de gráficos. diseño robusto Taguchi diseño de experimentos matriz producto variabilidad diseño de parámetros robust design robust conditions Taguchi Design of experiments condiciones robustas product array inner array outer array variability parameter design 1209. Estadística 311 51 62 65

Search results