• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 63
  • 6
  • 4
  • 1
  • Tagged with
  • 74
  • 21
  • 14
  • 12
  • 11
  • 7
  • 7
  • 7
  • 7
  • 7
  • 6
  • 5
  • 4
  • 4
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
71

Management of Genetic Diversity in Conservation Programs Using Genomic Coancestry

Morales González, Elisabet 20 July 2023 (has links)
Tesis por compendio / [ES] Un objetivo fundamental en los programas de conservación es mantener la diversidad genética y la estrategia de gestión más eficiente para lograrlo es aplicar el método de Contribuciones Óptimas. Este método optimiza las contribuciones de los candidatos a reproductores minimizando el parentesco global ponderada, lo que conduce a niveles más altos de diversidad genética, medida como heterocigosis esperada, y a un control efectivo del aumento de consanguinidad. El parámetro fundamental de este método es la matriz de parentesco. Esta matriz se ha obtenido tradicionalmente a partir del pedigrí, pero la disponibilidad actual de genotipos para un gran número de polimorfismos de un solo nucleótido (SNP) nos permite estimarla con una mayor precisión. Sin embargo, se han propuesto muchas medidas de parentesco genómico y se desconoce qué medida es la más apropiada para minimizar la pérdida de diversidad genética. Por lo tanto, el objetivo general de esta tesis fue investigar la eficiencia de diferentes matrices genómicas de parentesco en la gestión de poblaciones en programas de conservación, cuando se aplica el método de Contribuciones Óptimas. Las matrices comparadas fueron aquellas basadas en: i) la proporción de alelos compartidos por dos individuos (CSIM); ii) las desviaciones del número observado de alelos compartidos por dos individuos respecto del número esperado (CL&H); iii) la matriz de relaciones genómicas obtenida a través el método 1 de VanRaden (CVR1); iv) la matriz de relaciones genómicas obtenida a través el método 2 de VanRaden (CVR2); v) la matriz de relaciones genómicas obtenida a través el método de Yang (CYAN); y vi) segmentos idénticos por descendencia (CSEG). Los resultados para una sola generación, usando miles de SNP genotipados en individuos de una población cultivada de rodaballo, mostraron grandes diferencias en la magnitud de los seis coeficientes de parentesco. Las correlaciones entre los diferentes coeficientes variaron mucho, siendo las más bajas aquellas entre CSIM, CL&H o CSEG y CVR2 o CYAN. La gestión que utiliza matrices basadas en la proporción de alelos o segmentos compartidos (CSIM, CL&H y CSEG) retuvieron una mayor diversidad que aquella que utiliza matrices de relaciones genómicas (CVR1, CVR2 y CYAN). Como era de esperar, maximizar la heterocigosis llevó los alelos hacia frecuencias intermedias. Sin embargo, alejar las frecuencias alélicas de las frecuencias iniciales puede ser indeseable, ya que se pueden perder adaptaciones particulares al medio. Se utilizaron simulaciones estocásticas para investigar la eficiencia de CL&H y CVR2 en el manejo de poblaciones no divididas a lo largo de 50 generaciones y ambas matrices se compararon tanto en términos de la diversidad genética como en términos de los cambios asociados en las frecuencias alélicas. EL uso de CL&H en el método de Contribuciones Óptimas llevó a una mayor diversidad genética pero también en un mayor cambio de frecuencias alélicas que el uso de CVR2. Las diferencias entre estrategias fueron menores cuando sólo se usaron SNP con una frecuencia del alelo menos común (MAF) por encima de un umbral particular (MAF > 0.05 y MAF > 0.25) para calcular CL&H y CVR2 así como cuando se aplicó el método de Contribuciones Óptimas en poblaciones con censo más pequeños (se pasó de N = 100 a N = 20). La evaluación de CL&H y CVR2 se extendió a poblaciones subdivididas, también a través de simulaciones por ordenador. En poblaciones subdivididas, la diversidad genética se distribuye en dos componentes: dentro y entre subpoblaciones. Cuando se otorga un mayor peso al componente dentro de subpoblaciones, es posible restringir los niveles de consanguinidad. Bajo este escenario, la utilización de CL&H resultó ser la mejor opción para gestionar este tipo de poblaciones, ya que mantuvo una mayor diversidad global, condujo a una menor consanguinidad y a cambios en las frecuencias similares a los observados cuando se utilizó CVR2. / [CA] Un objectiu fonamental en els programes de conservació és mantindré la diversitat genètica i l'estratègia de gestió més eficient per aconseguir-ho és aplicar el mètode de contribucions òptimes. Aquest mètode optimitza les contribucions dels candidats a reproductors minimitzant el parentiu global ponderat, cosa que condueix a nivells més alts de diversitat genètica, mesurada com a heterozigosi esperada, i a un control efectiu de l'augment de consanguinitat. El paràmetre fonamental d'aquest mètode és la matriu de parentiu. Aquesta matriu s'ha obtingut tradicionalment a partir del pedigrí, però la disponibilitat actual de genotips per a un gran nombre de polimorfismes d'un sol nucleòtid (SNP) ens permet estimar-la amb més precisió. Tot i això, s'han proposat moltes mesures de parentiu genòmic i es desconeix quina mesura és la més apropiada per minimitzar la pèrdua de diversitat genètica. Per tant, l'objectiu general d'aquesta tesi va ser investigar l'eficiència de diferents matrius genòmiques de parentiu en la gestió de poblacions en programes de conservació, quan s'aplica el mètode de Contribucions Òptimes. Les matrius comparades van ser aquelles basades en: i) la proporció d'al·lels compartits per dos individus (CSIM); ii) les desviacions del nombre observat d'al·lels compartits per dos individus respecte del nombre esperat (CL&H); iii) la matriu de relacions genòmiques obtinguda a través del mètode 1 de VanRaden (CVR1); iv) la matriu de relacions genòmiques obtinguda a través del mètode 2 de VanRaden (CVR2); v) la matriu de relacions genòmiques obtinguda a través del mètode de Yang (CYAN); i vi) segments idèntics per descendència (CSEG). Els resultats per a una sola generació, usant milers d'SNP genotipats en individus d'una població cultivada de turbot, van mostrar grans diferències en la magnitud dels sis coeficients de parentiu. Les correlacions entre els coeficients van variar molt, sent les més baixes aquelles entre CSIM, CL&H o CSEG i CVR2 o CYAN. La gestió que utilitza matrius basades en la proporció d'al·lels o segments compartits (CSIM, CL&H i CSEG) van retindré una diversitat més gran que aquella que utilitza matrius de relacions genòmiques (CVR1, CVR2 i CYAN). Com calia esperar, la màxima heterozigosi va portar els al·lels cap a freqüències intermèdies. No obstant això, allunyar les freqüències al·lèliques de les freqüències inicials pot ser indesitjable, ja que es poden perdre adaptacions particulars al medi. Es van fer servir simulacions estocàstiques per investigar l'eficiència de CL&H i CVR2 en el maneig de poblacions no dividides al llarg de 50 generacions i les dues matrius es van comparar tant en termes de la diversitat genètica com en termes dels canvis associats a les freqüències al·lèliques. L'ús de CL&H en el mètode de Contribucions Òptimes va resultar en una major diversitat genètica però també en un canvi més gran de freqüències al·lèliques que l'ús de CVR2. Les diferències entre estratègies van ser menors quan només es van fer servir SNP amb una freqüència de l'al·lel menys comú (MAF) per sobre d'un llindar particular (MAF > 0.05 i MAF > 0.25) per calcular CL&H i CVR2 així com quan es va aplicar el mètode de Contribucions Òptimes en poblacions amb cens més petit (es va passar de N = 100 a N = 20). L'avaluació de CL&H i CVR2 es va estendre a poblacions subdividides, també a través de simulacions per ordinador. En poblacions subdividides, la diversitat genètica es distribueix en dos components: dins i entre subpoblacions. Quan s'atorga un pes més gran al component dins de subpoblacions, és possible restringir els nivells de consanguinitat. Sota aquest escenari, la utilització de CL&H va resultar ser la millor opció per gestionar aquest tipus de poblacions, ja que va mantindré una diversitat global més gran, va conduir a una menor consanguinitat i a canvis en les freqüències similars als observats quan es va utilitzar CVR2. / [EN] A main objective in conservation programs is to maintain genetic diversity, and the most efficient management strategy to achieve it is to apply the Optimal Contributions method. This method optimizes the contributions of breeding candidates by minimizing the global weighted coancestry. This leads to the highest levels of genetic diversity, when measured as expected heterozygosity, and to an effective control of the increase of inbreeding. The fundamental parameter of the method is the coancestry matrix which, traditionally, has been obtained from pedigree data. The current availability of genome-wide information allows us to estimate coancestries with higher precision. However, many different genomic coancestry measures have been proposed and it is unknown which measure is more efficient to minimize the loss of genetic diversity. Thus, the general aim of this thesis was to investigate the efficiency of different genomic coancestry matrices in the management of conserved populations when the Optimal Contributions method is applied to maximize genetic diversity. The matrices compared were those based on: i) the proportion of shared alleles (CSIM); ii) deviations of the observed number of alleles shared by two individuals from the expected number (CL&H); iii) the realized relationship matrix obtained by VanRaden's method 1 (CVR1); iv) the realized relationship matrix obtained by VanRaden's method 2 (CVR2); v) the realized relationship matrix obtained by Yang¿s method (CYAN); and vi) identical by descent segments (CSEG). Results for a single generation using thousands of SNP genotyped in individuals from a farm turbot population, showed large differences in the magnitude of the six coancestry coefficients. Moreover, pairwise correlations were those between coefficients greatly varied (especially for self-coancestry). The lowest correlations between CSIM, CL&H or CSEG and CVR2 or CYAN. Management with matrices based on the proportion of shared alleles or on segments (CSIM, CL&H and CSEG) retained higher variability than those based on realized genomic relationship matrices (CVR1, CVR2 and CYAN). As expected, maximizing heterozygosity pushed alleles toward intermediate frequencies. However, moving allele frequencies away from initial frequencies may be undesirable as particular adaptations to the environment can be lost. Stochastic simulations were used to investigate the efficiency of CL&H and CVR2 in the management of an undivided population across 50 generations and both matrices were compared not only in terms of the genetic diversity maintained but also in terms of the associated changes in allele frequencies across generations. The use of CL&H in the Optimal Contribution method resulted in a higher genetic diversity but also in a higher change of allele frequencies than the use of CVR2. The differences between strategies were reduced when only SNPs with a minimum allele frequency (MAF) above a particular threshold (MAF > 0.05 and MAF > 0.25) were used to compute CL&H and CVR2 as well as when the Optimal Contributions method was applied in populations of smaller sizes (N = 20 vs N = 100). The evaluation of CL&H and CVR2 was extended to subdivided populations, also via computer simulations. When populations are subdivided into different breeding groups, it is possible to give different weights to the within- and between-subpopulation components of genetic diversity. When a higher weight is given to the within-subpopulation component, the levels of inbreeding can be restricted. In this scenario, the use of CL&H was the best option for managing subdivided populations as it maintained more global diversity, led to less inbreeding and to changes in frequencies similar to those observed when using CVR2 when a large weight was given to the within-subpopulation term. / Esta tesis doctoral se realizó en el Instituto de Investigación y Tecnología Agraria y Alimentaria (INIA-CSIC) de Madrid. El trabajo expuesto en el capítulo 2 se realizó en parte en el Instituto Roslin, de la Universidad de Edimburgo durante una estancia predoctoral. Los trabajos expuestos en la tesis han sido financiados con una beca predoctoral FPI (BES-2017-081070) y a través de proyectos del Plan Estatal de I+D+i del Ministerio de Ciencia e Innovación (proyectos CGL2016-75904-C2-2-P y PID2020- 114426GB-C22) y de la Unión Europea (‘European Union‘s Seventh Framework Program, KBBE.2013.1.2-10, under Grant Agreement No. 613611, FISHBOOST project’ y ‘European Commission Horizon 2020, Framework Programme through Grant Agreement No. 727315, MedAID project’). / Morales González, E. (2023). Management of Genetic Diversity in Conservation Programs Using Genomic Coancestry [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/195231 / Compendio
72

Environmental Effects of Agricultural Expansion in the Upper Amazon : A study of river basin geochemistry and hydrochemistry, and farmers' perceptions

Lindell, Lina January 2011 (has links)
In this thesis natural science is combined with environmental psychology in order to determine how deforestation and subsequent agricultural expansion in the Peruvian highland jungle has affected the natural environment and rural livelihoods. This region is part of one of the most biodiverse areas on Earth and is also exposed to high pressure from deforestation that threatens the ecosystems as well as the well-being of local populations. The problem stretches beyond the upper Amazon since the region constitutes headwaters to theAmazon Riverand is part of the most important forest ecosystem of the world. This study evaluates the relative controls of human induced land-cover change and natural factors on the chemical status of soils, stream waters, and sediments, mainly through a spatial sampling design. The field work was located to two adjacent river basins underlain by sedimentary rocks. Streams of 48 independent sub-basins, the two main rivers, 80 upland soil sites (weakly developed soils on sandstone and siltstone) and four vertical profiles of floodplain sediments were sampled and analysed for major and trace elements, including nutrients and potentially toxic metals. Further, perceptions of environmental changes were investigated through a combination of quantitative and qualitative interview data collected from 51 smallholder farmers. Soils of primary forests were found to be chemically similar to those of regenerated forests and agricultural land-covers (pastures and coffee plantations), and differences in chemical concentrations between streams draining areas to varying degrees covered by forest were assigned to natural variability. In addition, the chemical composition of alluvial deposits was similar in the two drainage basins despite a substantial difference in exploitation degree (30 % versus 70 % cleared from forest). Thus, no evidence was found of long-term changes in the geochemistry of the Subandean river basins as a result of the conversion of primary forest to agricultural land-uses. The farmers, however, perceived an overall increase in environmental degradation as well as a change towards drier and warmer climatic conditions. The climate change was reported to be the main factor responsible for a negative trend in life quality (rural livelihoods). The results may be used in the work of identifying priorities and key factors necessary for environmental and socioeconomic sustainability in the upper Amazon. / En esta tesis se combina la ciencia natural con la psicología ambiental con el fin de determinar como la ampliación de la frontera agrícola ha afectado el medio ambiente y los medios de vida en la selva alta del Perú. Esta región forma parte de una de las zonas con mayor biodiversidad en el planeta y a su vez está expuesta a una alta presión de la deforestación que amenaza a los ecosistemas, así como el bienestar de la población en esta zona. Así mismo, este problema se hace sentir mas allá de la selva alta ya que esta zona forma parte de las cabeceras del río Amazonas y pertenece al ecosistema forestal más importante del mundo. Este estudio evalúa los efectos de la agricultura de tala y quema, en comparación con los factores naturales, sobre las propiedades químicas de los suelos, las quebradas, y los sedimentos, principalmente a través de un diseño de muestreo espacial. El trabajo de campo se realizó en dos cuencas fluviales adyacentes que están compuestas por rocas sedimentarias. Quebradas de 48 sub-cuencas independientes, dos ríos principales, 80 localidades de suelo (poco desarrollados sobre areniscas y limolitas) y cuatro perfiles verticales de sedimentos fluviales fueron muestreados y analizados para los elementos mayores y menores, incluyendo nutrientes y metales potencialmente tóxicos. También se han investigado las percepciones sobre los cambios ambientales usando una combinación de datos cuantitativos y cualitativos, recopilados a través de entrevistas a 51 agricultores. Según los resultados no hubo diferencias significativas entre la química de suelos de bosques primarios y tierras agrícolas (pastos, plantaciones de café y de bosques secundarios). En cuanto a las quebradas, las diferencias en las concentraciones de sustancias químicas entre sub-cuencas afectadas por la deforestación en diferentes grados fueron asignados a una variabilidad natural. Además, la composición química de los depósitos aluviales fue similar en las dos cuencas a pesar de una diferencia sustancial en el grado de explotación (30 % en comparación con 70 % deforestado). Por lo tanto, no se encontró evidencia de cambios persistentes en la geoquímica de las cuencas Subandinas como resultado de la conversión de bosques a tierras agrícolas. Sin embargo los agricultores percibieron una tendencia general de aumento de la degradación del medio ambiente, así como un cambio en el clima a condiciones más secas y cálidas, lo cual fue reportado como el principal factor responsable de un cambio negativo en la calidad de vida. Estos resultados pueden ser utilizados en el trabajo de identificación de prioridades y factores claves para la sostenibilidad ambiental y socioeconómica en la selva alta.
73

Probabilistic methods for multi-source and temporal biomedical data quality assessment

Sáez Silvestre, Carlos 05 April 2016 (has links)
[EN] Nowadays, biomedical research and decision making depend to a great extent on the data stored in information systems. As a consequence, a lack of data quality (DQ) may lead to suboptimal decisions, or hinder the derived research processes and outcomes. This thesis aims to the research and development of methods for assessing two DQ problems of special importance in Big Data and large-scale repositories, based on multi-institutional, cross-border infrastructures, and acquired during long periods of time: the variability of data probability distributions (PDFs) among different data sources-multi-source variability-and the variability of data PDFs over time-temporal variability. Variability in PDFs may be caused by differences in data acquisition methods, protocols or health care policies; systematic or random errors during data input and management; demographic differences in populations; or even falsified data. To date, these issues have received little attention as DQ problems nor count with adequate assessment methods. The developed methods aim to measure, detect and characterize variability dealing with multi-type, multivariate, multi-modal data, and not affected by large sample sizes. To this end, we defined an Information Theory and Geometry probabilistic framework based on the inference of non-parametric statistical manifolds from the normalized distances of PDFs among data sources and over time. Based on this, a number of contributions have been generated. For the multi-source variability assessment we have designed two metrics: the Global Probabilistic Deviation, which measures the degree of global variability among the PDFs of multiple sources-equivalent to the standard deviation among PDFs; and the Source Probabilistic Outlyingness, which measures the dissimilarity of the PDF of a single data source to a global latent average. They are based on the construction of a simplex geometrical figure (the maximum-dimensional statistical manifold) using the distances among sources, and complemented by the Multi-Source Variability plot, an exploratory visualization of that simplex which permits detecting grouping patterns among sources. The temporal variability method provides two main tools: the Information Geometric Temporal plot, an exploratory visualization of the temporal evolution of PDFs based on the projection of the statistical manifold from temporal batches; and the PDF Statistical Process Control, a monitoring and automatic change detection algorithm for PDFs. The methods have been applied to repositories in real case studies, including the Public Health Mortality and Cancer Registries of the Region of Valencia, Spain; the UCI Heart Disease; the United States NHDS; and Spanish Breast Cancer and an In-Vitro Fertilization datasets. The methods permitted discovering several findings such as partitions of the repositories in probabilistically separated temporal subgroups, punctual temporal anomalies due to anomalous data, and outlying and clustered data sources due to differences in populations or in practices. A software toolbox including the methods and the automated generation of DQ reports was developed. Finally, we defined the theoretical basis of a biomedical DQ evaluation framework, which have been used in the construction of quality assured infant feeding repositories, in the contextualization of data for their reuse in Clinical Decision Support Systems using an HL7-CDA wrapper; and in an on-line service for the DQ evaluation and rating of biomedical data repositories. The results of this thesis have been published in eight scientific contributions, including top-ranked journals and conferences. One of the journal publications was selected by the IMIA as one of the best of Health Information Systems in 2013. Additionally, the results have contributed to several research projects, and have leaded the way to the industrialization of the developed methods and approaches for the audit and control of biomedical DQ. / [ES] Actualmente, la investigación biomédica y toma de decisiones dependen en gran medida de los datos almacenados en los sistemas de información. En consecuencia, una falta de calidad de datos (CD) puede dar lugar a decisiones sub-óptimas o dificultar los procesos y resultados de las investigaciones derivadas. Esta tesis tiene como propósito la investigación y desarrollo de métodos para evaluar dos problemas especialmente importantes en repositorios de datos masivos (Big Data), basados en infraestructuras multi-céntricas, adquiridos durante largos periodos de tiempo: la variabilidad de las distribuciones de probabilidad (DPs) de los datos entre diferentes fuentes o sitios-variabilidad multi-fuente-y la variabilidad de las distribuciones de probabilidad de los datos a lo largo del tiempo-variabilidad temporal. La variabilidad en DPs puede estar causada por diferencias en los métodos de adquisición, protocolos o políticas de atención; errores sistemáticos o aleatorios en la entrada o gestión de datos; diferencias demográficas en poblaciones; o incluso por datos falsificados. Esta tesis aporta métodos para detectar, medir y caracterizar dicha variabilidad, tratando con datos multi-tipo, multivariantes y multi-modales, y sin ser afectados por tamaños muestrales grandes. Para ello, hemos definido un marco de Teoría y Geometría de la Información basado en la inferencia de variedades de Riemann no-paramétricas a partir de distancias normalizadas entre las PDs de varias fuentes de datos o a lo largo del tiempo. En consecuencia, se han aportado las siguientes contribuciones: Para evaluar la variabilidad multi-fuente se han definido dos métricas: la Global Probabilistic Deviation, la cual mide la variabilidad global entre las PDs de varias fuentes-equivalente a la desviación estándar entre PDs; y la Source Probabilistic Outlyingness, la cual mide la disimilaridad entre la DP de una fuente y un promedio global latente. Éstas se basan en un simplex construido mediante las distancias entre las PDs de las fuentes. En base a éste, se ha definido el Multi-Source Variability plot, visualización que permite detectar patrones de agrupamiento entre fuentes. El método de variabilidad temporal proporciona dos herramientas: el Information Geometric Temporal plot, visualización exploratoria de la evolución temporal de las PDs basada en la la variedad estadística de los lotes temporales; y el Control de Procesos Estadístico de PDs, algoritmo para la monitorización y detección automática de cambios en PDs. Los métodos han sido aplicados a casos de estudio reales, incluyendo: los Registros de Salud Pública de Mortalidad y Cáncer de la Comunidad Valenciana; los repositorios de enfermedades del corazón de UCI y NHDS de los Estados Unidos; y repositorios españoles de Cáncer de Mama y Fecundación In-Vitro. Los métodos detectaron hallazgos como particiones de repositorios en subgrupos probabilísticos temporales, anomalías temporales puntuales, y fuentes de datos agrupadas por diferencias en poblaciones y en prácticas. Se han desarrollado herramientas software incluyendo los métodos y la generación automática de informes. Finalmente, se ha definido la base teórica de un marco de CD biomédicos, el cual ha sido utilizado en la construcción de repositorios de calidad para la alimentación del lactante, en la contextualización de datos para el reuso en Sistemas de Ayuda a la Decisión Médica usando un wrapper HL7-CDA, y en un servicio on-line para la evaluación y clasificación de la CD de repositorios biomédicos. Los resultados de esta tesis han sido publicados en ocho contribuciones científicas (revistas indexadas y artículos en congresos), una de ellas seleccionada por la IMIA como una de las mejores publicaciones en Sistemas de Información de Salud en 2013. Los resultados han contribuido en varios proyectos de investigación, y facilitado los primeros pasos hacia la industrialización de las tecnologías / [CA] Actualment, la investigació biomèdica i presa de decisions depenen en gran mesura de les dades emmagatzemades en els sistemes d'informació. En conseqüència, una manca en la qualitat de les dades (QD) pot donar lloc a decisions sub-òptimes o dificultar els processos i resultats de les investigacions derivades. Aquesta tesi té com a propòsit la investigació i desenvolupament de mètodes per avaluar dos problemes especialment importants en repositoris de dades massius (Big Data) basats en infraestructures multi-institucionals o transfrontereres, adquirits durant llargs períodes de temps: la variabilitat de les distribucions de probabilitat (DPs) de les dades entre diferents fonts o llocs-variabilitat multi-font-i la variabilitat de les distribucions de probabilitat de les dades al llarg del temps-variabilitat temporal. La variabilitat en DPs pot estar causada per diferències en els mètodes d'adquisició, protocols o polítiques d'atenció; errors sistemàtics o aleatoris durant l'entrada o gestió de dades; diferències demogràfiques en les poblacions; o fins i tot per dades falsificades. Aquesta tesi aporta mètodes per detectar, mesurar i caracteritzar aquesta variabilitat, tractant amb dades multi-tipus, multivariants i multi-modals, i no sent afectats per mides mostrals grans. Per a això, hem definit un marc de Teoria i Geometria de la Informació basat en la inferència de varietats de Riemann no-paramètriques a partir de distàncies normalitzades entre les DPs de diverses fonts de dades o al llarg del temps. En conseqüència s'han aportat les següents contribucions: Per avaluar la variabilitat multi-font s'han definit dos mètriques: la Global Probabilistic Deviation, la qual mesura la variabilitat global entre les DPs de les diferents fonts-equivalent a la desviació estàndard entre DPs; i la Source Probabilistic Outlyingness, la qual mesura la dissimilaritat entre la DP d'una font de dades donada i una mitjana global latent. Aquestes estan basades en la construcció d'un simplex mitjançant les distàncies en les DPs entre fonts. Basat en aquest, s'ha definit el Multi-Source Variability plot, una visualització que permet detectar patrons d'agrupament entre fonts. El mètode de variabilitat temporal proporciona dues eines: l'Information Geometric Temporal plot, visualització exploratòria de l'evolució temporal de les distribucions de dades basada en la varietat estadística dels lots temporals; i el Statistical Process Control de DPs, algoritme per al monitoratge i detecció automàtica de canvis en les DPs de dades. Els mètodes han estat aplicats en repositoris de casos d'estudi reals, incloent: els Registres de Salut Pública de Mortalitat i Càncer de la Comunitat Valenciana; els repositoris de malalties del cor de UCI i NHDS dels Estats Units; i repositoris espanyols de Càncer de Mama i Fecundació In-Vitro. Els mètodes han detectat troballes com particions dels repositoris en subgrups probabilístics temporals, anomalies temporals puntuals, i fonts de dades anòmales i agrupades a causa de diferències en poblacions i en les pràctiques. S'han desenvolupat eines programari incloent els mètodes i la generació automàtica d'informes. Finalment, s'ha definit la base teòrica d'un marc de QD biomèdiques, el qual ha estat utilitzat en la construcció de repositoris de qualitat per l'alimentació del lactant, la contextualització de dades per a la reutilització en Sistemes d'Ajuda a la Decisió Mèdica usant un wrapper HL7-CDA, i en un servei on-line per a l'avaluació i classificació de la QD de repositoris biomèdics. Els resultats d'aquesta tesi han estat publicats en vuit contribucions científiques (revistes indexades i en articles en congressos), una de elles seleccionada per la IMIA com una de les millors publicacions en Sistemes d'Informació de Salut en 2013. Els resultats han contribuït en diversos projectes d'investigació, i han facilitat la industrialització de les tecnologies d / Sáez Silvestre, C. (2016). Probabilistic methods for multi-source and temporal biomedical data quality assessment [Tesis doctoral]. Editorial Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/62188 / TESIS / Premiado
74

Effets des incertitudes et de la variabilité spatiale des propriétés des sols et des structures sur le dimensionnement des semelles filantes et des conduites enterrées / Effects of uncertainties and spatial variation of soil and structure properties on geotechnical design : cases of continuous spread footings and buried pipes

Imanzadeh, Saber 15 February 2013 (has links)
Le sol présente une variabilité spatiale des propriétés physiques et mécaniques dont les effets sur des structures légères avec semelles filantes et sur les conduites enterrées ne sont pas bien pris en compte dans leur dimensionnement. Cette variabilité naturelle peut être très importante dans le cas de ces ouvrages car elle induit des tassements différentiels, dont les conséquences peuvent être dommageables : fissures dans les murs, les poutres ou encore des fuites dans les réseaux d’assainissement. La variabilité naturelle du sol et l'incertitude liée à la connaissance imparfaite des propriétés du sol et/ou du béton ou de l'acier de la structure sont les principales sources d'incertitude dans le choix des paramètres de calcul pour le dimensionnement de ces structures. Dans cette thèse, une approche analytique avec les méthodes probabilistes (FOSM et SOSM) et le modèle de Winkler, puis numérique avec le couplage de la méthode des éléments finis avec des approches géostatistiques ont été successivement menées pour modéliser le comportement des semelles filantes et des conduites enterrés lorsque les incertitudes sur les propriétés mécaniques du sol et de la structure sont prises en compte dans leur dimensionnement. Il apparait ainsi, l’importance du comportement longitudinal de ces ouvrages et du poids des incertitudes dans leur dimensionnement. / Soil exhibits spatial heterogeneities resulting from the history of its deposition and aggregation processes that occur in different physical and chemical environments. This inherent or natural variability can be very important in the case of the superficial geotechnical works inducing differential settlements, whose consequences on structural response can be harmful: local failures, cracking in beams or walls, leakage in sewers. Natural variability of soil and uncertainty related to imperfect knowledge in soil properties and/or of concrete or steel of the structure, are the major source of uncertainty in the choice of the design parameters. In this thesis the probabilistic methods in geotechnical engineering, the analytical Winkler model and the coupling of the finite element method with geostatistical approaches were successively used to model the behavior of shallow foundations and buried pipe networks when soil and structure uncertainties are considered in their design.

Page generated in 0.0373 seconds