• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 41
  • 28
  • 6
  • 5
  • 3
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 106
  • 106
  • 24
  • 22
  • 21
  • 18
  • 17
  • 17
  • 17
  • 14
  • 12
  • 12
  • 12
  • 10
  • 10
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
71

Desenvolvimento de método para inferência de características físicas da água associadas às variações espectrais. Caso de Estudo: Reservatório de Itupararanga/SP /

Pereira, Adriana Castreghini de Freitas. January 2008 (has links)
Resumo: Na sociedade atual, discussões relacionadas à água potável tem ocupado um espaço importante, principalmente no meio científico, onde, através de pesquisas voltadas à disponibilidade e qualidade das águas é possível preparar diagnósticos e apontar soluções para planejadores e tomadores de decisões. Nesse contexto, o objetivo geral do trabalho foi desenvolver um método para inferência de variáveis limnológicas que indicam a qualidade da água e estejam associadas à sua característica espectral, em um reservatório de uso múltiplo e avaliar sua correlação com dados espectrais tomados "in situ" e extraídos de imagens orbitais de satélites de alta resolução espacial. Para tanto, uma imagem multiespectral do satélite Ikonos II foi adquirida, quase simultaneamente a coleta de dados limnológicos e espectrais "in situ", em pontos amostrados adequadamente no corpo d'água, e posicionados com GPS. Devido à heterogeneidade das condições do tempo no levantamento de campo, uma nova abordagem amostral foi necessária, que se deu pela divisão da amostra em quatro conjuntos, quais foram: conjunto 1 (céu aberto e vento fraco), conjunto 2 (céu aberto e vento de médio a forte), conjunto 3 (céu nublado e vento fraco) e conjunto 4 (céu nublado e vento de médio a forte)... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: In current society, drinkable water has been the subject of innumerable debates, mainly in scientific groups, in which, through researches focused on the availability and water quality, it is possible to prepare diagnoses and point out solutions to planners and decision makers. In this context, the general aim of the research was to develop a method for the inference of physical limnological variables that indicate the quality of the water and that are associated to its spectral characteristic, in a multiple use reservoir and evaluate its correlation to spectral data collected "in situ" and extracted from orbital images of high definition space sattelites. In order to achieve that, a multispectral image of the satellite Ikonos II was acquired, almost simultaneously to the gathering of limnological and spectral data "in situ", in points sampled adequately in the water surveyed, and positioned by means of GPS. Due to the heterogeneous weather conditions when taking the ground samples, a new sampling approach was necessary, and it occurred with the division of the sample in four settings, which were: setting 1 (clear sky and mildly windy), setting 2 (clear sky and windy), setting 3 (overcast sky and mildly windy) and setting 4 (overcast sky and windy)... (Complete abstract click electronic access below) / Orientador: Maria de Lourdes Bueno Trindade Galo / Coorientador: Edivaldo Domingues Velin / Banca: Cláudio Clemente Faria Barbosa / Banca: Waterloo Pereira Filho / Banca: Renata Ribeiro de Araújo / Banca: Vilma Mayumi Tachibana / Doutor
72

Meta-análise de parâmetros genéticos de características de crescimento em bovinos de corte sob enfoques clássico e Bayesiano. / Meta-analysis of genetic parameters of growth traits on beef cattle under classic and bayesian approach.

Juliana Di Giorgio Giannotti 03 September 2004 (has links)
O crescente volume de publicações científicas gerado pelo desenvolvimento das pesquisas e as conclusões, algumas vezes destoantes, obtidas em diferentes trabalhos versando sobre um mesmo tema, são as duas principais motivações de pesquisadores em compilar informações publicadas. Em vista disso, procedimentos estatísticos, dentre os quais destaca-se a meta-análise, vêm sendo desenvolvidos para obtenção de uma resposta única e confiável para um conjunto de resultados publicados.No melhoramento genético animal há um grande número de trabalhos contendo estimativas de herdabilidade de características de crescimento em bovinos de corte. Através de pesquisa bibliográfica foram encontrados, em 186 artigos publicados, 869 estimativas de herdabilidade de efeito direto, 186 estimativas de herdabilidade de efeito materno e 123 estimativas do coeficiente de correlação genética entre os efeitos direto e materno, das características de crescimento peso ao nascimento, peso a desmama, peso aos 365 dias e peso aos 550 dias em bovinos de corte de origem indiana. De posse deste conjunto de dados, foram realizadas meta-análises, dentro de cada uma das quatro características de crescimento, cujo objetivo principal foi obter uma resposta combinada, para estes parâmetros genéticos, sob enfoques clássico e bayesiano. No enfoque clássico conduziram-se as meta-análises utilizando modelos fixo e aleatório, em que dois estimadores, o de máxima verossimilhança restrita e o proposto por DerSimonian & Laird, foram empregados para estimar a variância entre os estudos. Também foi realizada meta-análise de acordo com a técnica de agrupamento de Ward. Sob o enfoque bayesiano, as meta-análises foram conduzidas utilizando-se um modelo hierárquico e, a variância entre os estudos, foi obtida via simulação através do modelo proposto. As estimativas combinadas de herdabilidade de efeito direto variaram de 0,18 a 0,33, nos diferentes grupos formados a partir da análise de agrupamento, sendo sempre menores àquelas obtidas para peso à desmama e sempre maiores àquelas obtidas para peso aos 550 dias. As estimativas combinadas de herdabilidade de efeito materno foram 0,09 para peso ao nascimento, 0,13 para peso à desmama, 0,12 para peso aos 365 dias e 0,05 para peso aos 550 dias. As estimativas combinadas para correlação entre os efeitos diretos e maternos foram de –0,16 para peso ao nascimento, à desmama e aos 550 dias e -0,20 para peso aos 365 dias. Os três métodos utilizados para estimar a variância entre os estudos, o da máxima verossimilhança restrita, o proposto por DerSimonian & Laird e o Bayesiano, conduziram a valores distintos para esta variância, sendo sempre maiores os valores obtidos através do método Bayesiano e sempre menores os obtidos por DerSimonian & Laird. Porém, os valores das estimativas combinadas para herdabilidades de efeito direto, obtidas através destes três estimadores, muito próximos, para as quatro características. Devido ao fato de comparar e combinar resultados de estudos distintos, permitindo inferir sobre um conjunto de resultados publicados, recomenda-se a meta-análise, como procedimento estatístico, para obtenção de valores combinados das estimativas de herdabilidade de efeito direto, materno e suas correlações, nas características de crescimento em bovinos de corte. / The increasing volume of research publications as a consequence of scientific development and eventually with divergent conclusions obtained in different studies about the same subject are the two main motivations for compiling the information of these works. Statistical procedures, particularly the meta-analysis, were developed in order to obtain a unique and realistic answer from a set of published results. In the field of animal breeding there is a large amount of research work on heritability estimates for growth traits in beef cattle. A total of 186 articles was found in literature, reporting 869 direct heritability estimates, 186 maternal heritability estimates and 123 direct-maternal genetic correlation for birth weight, weaning weight, weight at 365 and at 550 days of age in zebu beef cattle. Based on this data set, meta-analysis, under Classic and Bayesian approaches, were performed in order to obtain a pooled estimate of those genetic parameters for each trait. Regarding the Classic approach, the meta-analysis were performed using a random effect model, where two estimators, the Restricted Maximum Likelihood and the one proposed by DerSimonian & Laird were used to evaluate the variance between studies. Also, it was performed a meta-analysis using the method of cluster analysis of Ward to group the estimates. Under the Bayesian approach, the meta-analysis was performed using a hierarchical model and the variances between the studies, were obtained by simulation using the proposed model. The pooled estimates for direct heritabilities ranged from 0.18 to 0.33 for the different groups composed by the cluster analysis. The lower values were obtained for weaning weight and higher values were obtained for weight at 550 days of age. The pooled estimates for maternal heritabilities were 0.09 for birth weight, 0.13 for weaning weight, 0.12 for weight at 365 days of age and 0.05 for weight at 550 days of age. The pooled estimates for direct-maternal genetic correlations were -0.16 for birth weight, weaning weight and weight at 550 days of age and -0.20 for weight at 365 days of age. The three methods, Restricted Maximum likelihood, the estimator proposed by DerSimonian & Laird and the Bayesian, used to estimate the variance between studies lead to different values, the greater ones obtained by Bayesian method and the lower by DerSimonian & Laird. In general, pooled estimates values for direct heritabilities, obtained by those three estimators, were very close. Meta-analysis is recommended as a statistical procedure to compare and combine results from different studies in order to obtain pooled values of direct and maternal heritabilities and direct-maternal genetic correlations of growth traits of beef cattle.
73

Obtenção dos níveis de significância para os testes de Kruskal-Wallis, Friedman e comparações múltiplas não-paramétricas. / Obtaining significance levels for Kruskal-Wallis, Friedman and nonparametric multiple comparisons tests.

Antonio Carlos Fonseca Pontes 29 June 2000 (has links)
Uma das principais dificuldades encontradas pelos pesquisadores na utilização da Estatística Experimental Não-Paramétrica é a obtenção de resultados confiáveis. Os testes mais utilizados para os delineamentos com um fator de classificação simples inteiramente casualizados e blocos casualizados são o de Kruskal-Wallis e o de Friedman, respectivamente. As tabelas disponíveis para estes testes são pouco abrangentes, fazendo com que o pesquisador seja obrigado a recorrer a aproximações. Estas aproximações diferem dependendo do autor a ser consultado, podendo levar a resultados contraditórios. Além disso, tais tabelas não consideram empates, mesmo no caso de pequenas amostras. No caso de comparações múltiplas isto é mais evidente ainda, em especial quando ocorrem empates ou ainda, nos delineamentos inteiramente casualizados onde se tem número diferente de repetições entre tratamentos. Nota-se ainda que os softwares mais utilizados em geral recorrem a aproximações para fornecer os níveis de significância, além de não apresentarem resultados para as comparações múltiplas. Assim, o objetivo deste trabalho é apresentar um programa, em linguagem C, que realiza os testes de Kruskal-Wallis, de Friedman e de comparações múltiplas entre todos os tratamentos (bilateral) e entre os tratamentos e o controle (uni e bilateral) considerando todas as configurações sistemáticas de postos ou com 1.000.000 de configurações aleatórias, dependendo do número total de permutações possíveis. Dois níveis de significância são apresentados: o DW ou MaxDif , baseado na comparação com a diferença máxima dentro de cada configuração e o Geral, baseado na comparação com todas as diferenças em cada configuração. Os valores do nível de significância Geral assemelham-se aos fornecidos pela aproximação normal. Os resultados obtidos através da utilização do programa mostram, ainda, que os testes utilizando as permutações aleatórias podem ser bons substitutos nos casos em que o número de permutações sistemáticas é muito grande, já que os níveis de probabilidade são bastante próximos. / One of the most difficulties for the researchers in using Nonparametric Methods is to obtain reliable results. Kruskal-Wallis and Friedman tests are the most used for one-way layout and for randomized blocks, respectively. Tables available for these tests are not too wild, so the research must use approximate values. These approximations are different, depending on the author and the results can be not similar. Furthermore, these tables do not taking account tied observations, even in the case of small sample. For multiple comparisons, this is more evident, specially when tied observations occur or the number of replications is different. Many softwares like SAS, STATISTICA, S-Plus, MINITAB, etc., use approximation in order to get the significance levels and they do not present results for multiple comparisons. Thus, the aim of this work is to present a routine in C language that runs Kruskal-Wallis, Friedman and multiple comparisons among all treatments (bi-tailed) and between treatment and control (uni and bi-tailed), considering all the systematic configurations of the ranks or with more than 1,000,000 random ones, depending on the total of possible permutations. Two levels of significance are presented: DW or MaxDif, based on the comparison of the maximum difference within each configuration and the Geral, based on the comparison of all differences for each configuration. The Geral values of the significance level are very similar for the normal approximation. The obtaining results through this routine show that, the tests using random permutations can be nice substitutes for the case of the number of systematic permutations is too large, once the levels of probability are very near.
74

Abordagem Bayesiana na análise genética de populações utilizando dados de marcadores moleculares. / Bayesian approach to the genetic analysis of populations using molecular markers data.

Alexandre Siqueira Guedes Coelho 27 August 2002 (has links)
Dentre os diversos aspectos geralmente observados na caracterização genética de populações naturais, a avaliação do grau de estruturação da variabilidade genética entre e dentro dos indivíduos e a obtenção de estimativas de parâmetros genéticos indicadores do sistema reprodutivo da espécie assumem grande importância. Os parâmetros de maior interesse neste caso são o índice de fixação intrapopulacional (f) e a taxa de fecundação cruzada (t). Pelo uso de simulações computacionais, este trabalho demonstra o caráter dinâmico do índice de fixação intrapopulacional em diferentes locos ao longo das gerações em decorrência do caráter finito da população e de variação nas taxas médias de fecundação cruzada entre gerações. Sugere-se que este caráter dinâmico representa uma explicação para a elevada variação, comumente reportada na literatura, das estimativas de f obtidas com locos diferentes avaliados em uma mesma população. Utilizando a abordagem Bayesiana, um modelo hierárquico de análise é proposto para a estimação de f, incorporando as informações obtidas de múltiplos locos não ligados, levando-se em conta a condicionalidade do processo de estimação ao polimorfismo dos locos utilizados. O modelo proposto incorpora o caráter dinâmico de f para diferentes locos e permite a estimação do número efetivo de indivíduos reprodutivamente ativos em uma população. Propõe-se ainda um modelo Bayesiano para a estimação da taxa de fecundação cruzada com base na informação de múltiplos locos, admitindo-se a possibilidade de ocorrência de apomixia. Os modelos propostos são avaliados por simulação e exemplos de aplicação a dados reais de marcadores moleculares codominantes são discutidos. Os resultados obtidos demonstram a aplicabilidade das metodologias propostas e o elevado potencial de aplicação da estatística Bayesiana em estudos de genética de populações. / Among the various aspects generally considered in the genetic characterization of natural populations of plant species, the evaluation of the degree of genetic structure within and among individuals and the estimation of parameters related to the species mating system are of great importance. In general, considerable effort is focused on the estimation of the intrapopulation fixation index (f) and the outcrossing rate (t). Using computer simulated data, the dynamic nature of f for different loci along generations is illustrated. The dynamic nature of f is shown to result from the finite condition of populations and from the variation in the mean values of the outcrossing rates among generations. It is suggested that this dynamic behavior explains the inconsistency, commonly reported in the literature, of f estimates obtained for different loci in a given population. Using a Bayesian approach, we propose a hierarchical model for the estimation of f, incorporating information obtained from different unlinked loci and considering the conditionality of the estimation process to genetic polymorphism. The proposed model incorporates the dynamic nature of f values for different loci and allows the estimation of the effective number of reproductively active individuals in a given population. Using a similar approach, a Bayesian model is also proposed for estimating the outcrossing rate using multiple loci information and incorporating the possibility of apomixis. The models proposed are evaluated by computer simulations and examples using real data from codominant molecular markers are presented. Results obtained illustrate the applicability of the proposed methods and reveal the great potential of use of Bayesian statistics in population genetic studies.
75

Um modelo para avaliação dos efeitos do impacto ambiental no valor imobiliário e sua aplicação com o estudo de caso da usina e compostagem de lixo da Vila Leopoldina. / A model for the evaluation of environmental impact effects on real estate values and its application to a case study of the Vila Leopoldina garbage composting plant.

Robinson Antonio Vieira Borba 29 October 1992 (has links)
Um modelo de avaliação da propriedade imobiliária referenciado à qualidade ambiental pode ser um instrumento para os estudos de impactos ambientais, relacionando seus efeitos aos valores das propriedades, tendo por preocupação contribuir para o aprimoramento dos Estudos de Impacto Ambiental, e aperfeiçoamento dos Relatórios de Impacto Ambiental, dispositivos legais exigidos pela legislação ambiental brasileira. A metodologia foi desenvolvida a partir de uma abordagem analítica de trabalhos que, tendo por temática central o estudo do valor da propriedade, procuraram, através de um modelo matemático, relacioná-lo à qualidade ambiental da moradia. Parte-se da hipótese de que se uma moradia tem mais atributos desejáveis entre eles a qualidade ambiental do que outra esta avaliação será refletida em um preço mais alto no mercado. A partir do perfil metodológico encontrado neste painel de trabalhos, propõe-se um modelo para avaliação do impacto ambiental nos valores das propriedades imobiliárias e,finalmente, com dados imobiliários extraídos do mercado residencial, testa -se este modelo em um caso concreto na estruturação urbana da cidade de são Paulo: a Usina de Compostagem de Lixo da vila Leopoldina, com os efeitos de seu impacto ambiental nos valores das propriedades residenciais vizinhas. Concluiu-se que a partir do significativo prejuízo, calculado para 33 elementos da pesquisa, ocasionado pelo incômodo registrado como \"um mau cheiro\" pela população da região, pode-se afirmar que na totalidade do espaço físico desta região a magnitude da depreciação recomendaria um deslocamento da usina com efetivo ganho não apenas para a comunidade, como também para a municipalidade, com um previsível salto na tributação do imposto territorial e urbano proporcionado pela revalorização dos valores imobiliários. / A model for the evaluation of real estate regarding the environmental quality can be a tool for the environmental impact studies, relating its effects to the estate values, aiming at contributing to the improvement of the Environmental Impact Studies and the perfection of the Environmental Impact Reports, legal devices required by the Brazilian environmental legislation. The methodology was developed after an analytical approach to papers which, having the study of the estate value as central theme, have tried, through a mathematical model, to relate it to the environmental quality of housing. Starting from the hypothesis that if one housing happens to have more desirable attributes among them the environmental quality -than another, this evaluation will be reflected in a higher price in the market. From the methodological profile found in this collection of papers, a model for the evaluation of the environmental impact on the prices of the real estate is proposed and finally, with real estate data extracted from the housing market, this model is tested on a concrete case in the urban structuring o f S o Paulo city: the Vila Leopoldina Garbage Composting Plant, with the effects of its environmental impact on the prices of neighboring residential estates. It was concluded that judging from the significant loss calculated for 33 elements of the research, caused by the disturbance reported as \"a bad smell\" by the neighboring population, it can be stated that on the whole of the physical space in this area, the magnitude of the depreciation would recommend the removal of the plant with effective profit not only for the community, but also for the municipality, with a foreseeable increase of the urban and territorial taxes yielded by the restoration of the real estate prices.
76

Melhoramento do resíduo de Wald em modelos lineares generalizados / Improvement of Wald residual in generalized linear models

Mariana Ragassi Urbano 18 December 2008 (has links)
A teoria dos modelos lineares generalizados é muito utilizada na estatística, para a modelagem de observações provenientes da distribuição Normal, mas, principalmente, na modelagem de observações cuja distribuição pertença à família exponencial de distribuições. Alguns exemplos são as distribuições binomial, gama, normal inversa, dentre outras. Ajustado um modelo, para vericar a adequação do ajuste, são aplicadas técnicas de diagnósticos e feita uma análise de resíduos. As propriedades dos resíduos para modelos lineares generalizados não são muito conhecidas e resultados assintóticos são o único recurso. Este trabalho teve como objetivo estudar as propriedades assintóticas do resíduo de Wald, e realizar correções para que sua distribuição se aproxime de uma distribuição normal padrão. Uma aplicação das correções para o resíduo de Wald foi feita para cinco conjuntos de dados. Em dois conjuntos, a variável resposta apresentava-se na forma de contagem, e para a modelagem utilizou-se a distribuição de Poisson. Dois outros conjuntos são provenientes de delineamentos experimentais inteiramente casualizados, com variável resposta contínua e para a modelagem utilizou-se a distribuição normal, e para o último conjunto, o interesse era modelar a proporção, e utilizou-se a distribuição binomial. Um estudo de simulação foi conduzido, utilizando-se o método de Monte Carlo, e concluiu-se, que com as correções realizadas no resíduo de Wald, houve uma melhora signicativa em sua distribuição, sendo que a versão melhorada do resíduo tem distribuição que aproxima mais de uma distribuição normal padrão. / The theory of generalized linear models is very used in statistics, not only for modeling data normally distributed, but in the modeling of data whose distribution belongs to the exponential family of distributions. Some examples are binomial, gamma and inverse Gaussian distribution, among others. After tting a model in order to check the adequacy of tting, diagnostic techniques are used. The properties of residuals in generalized linear models are not well known, and asymptotic results are the only recourse. This work aims to study the asymptotic properties of Wald residual, and to obtain corrections to make the distribution of the modied residuals closer to standard normal. An application of the corrections for Wald residuals was done to ve datasets. In two datasets the response variables were counts, and to model, was used the Poisson distribution. Other two datasets are provided from a completely randomized design with a continuous response, and to model, was used the normal distribution, and, in the last dataset the interest was to model the proportion and the binomial distribution was used. A Monte Carlo simulation, was performed showing that the distribution of the corrected Wald residuals, is more close to the standard normal distribution.
77

Cell assemblies in neuronal recordings : identification and study through the inference of functional network models and statistical physics techniques / Assemblages de cellules dans enregistrements neuronaux : identification et étude par l’inférence de modèles de réseaux fonctionnels et techniques de physique statistique

Tavoni, Gaia 30 October 2015 (has links)
Cette thèse illustre une recherche sur les assemblées de cellules, groupes de neurones étroitement liés et co-activés, considérés comme les unités de la mémoire. Après une revue des majeures avancées expérimentales et théoriques dans ce domaine, et des techniques de physique statistique et d'inférence pour l'étude de neurones en interaction, on présente une nouvelle méthode pour dévoiler les assemblées decellules à partir des données neuronales et on montre son application à des enregistrements multi-électrodes dans le cortex préfrontal de rats pendant l'exécution d'une tâche et les époques de sommeil précédant et suivant. La méthode est basée sur l'inférence d'un réseau d'Ising d’interactions effectives entre les neurones et sur la simulation du modèle inféré en présence d'une entrée globale uniforme: quand l'entrée augmente, on découvre des configurations d'activité élevée (assemblées de cellules), qui s'activent dans les données à des échelles de temps de dizaines de ms en présence de stimuli transitoires. Les assemblées sont robustes par rapport au bruit. La comparaison des réseaux d'interactions et des résultats des simulations à travers les trois phases expérimentales révèle des règles empiriques pour la modification des assemblées de cellules. Le modèle inféré est également exploité pour estimer la réactivation (replay) des assemblées pendant le sommeil, important pour la consolidation de la mémoire. Inférence et échantillonnage d'un modèle linéaire généralisé montrent qu'il n'y a pas un ordre d'activation spécifique des neurones. On discute enfin une application de statistique descriptive à l'étude de la plasticité synaptique in vitro dans un cadre optogénétique. / This thesis illustrates a research on cell assemblies, groups of closely connected, synchronously activating neurons, which are thought to be the units of memory. After a review of the main experimental and theoretical advances in this field, and of the techniques of statistical physics and inference for the study of interacting neurons, a new method to unveil cell assemblies from neuronal data is illustrated and applied to multi-electrode recordings in the prefrontal cortex of rats during performance of a task and during the preceding and following sleep epochs. The method is based on the inference of an Ising network of effective interactions between the neurons and on the simulation of the inferred model in the presence of a global uniform drive: as the drive increases, configurations of high activity (cell assemblies) are unveiled, which activate in the data on time scales of tens of ms, in the presence of transient stimuli. The assemblies are robust with respect to noise. Comparisonof the interaction networks and of the results of the simulations across the three experimental phases reveals empirical rules for the modification of cell assemblies. The inferred model is also exploited to estimate the reactivation (replay) of the cell assemblies during sleep, important for memory consolidation. Inference and sampling of a generalized linear model show that there is not a specific order of activation of the neurons in the groups. It is finally discussed an application of descriptive statistics to the study of synaptic plasticity of neurons in vitro in an optogenetic framework.
78

Étiologies moléculaires des insuffisances surrénales primaires congénitales : développements statistiques pour la validation du séquençage parallèle massif / Genetics of congenital primary adrenal insufficiency and statistical developments for massive parallel sequencing validation

Boulez, Florence 30 March 2018 (has links)
L'insuffisance surrénale primaire (ISP) se caractérise par un déficit en hormones stéroïdiennes lié à un trouble du cortex surrénal qui expose au risque d'insuffisance aiguë et de menace vitale. Actuellement, 80% des formes pédiatriques d'ISP sont d'origine génétique et 5% restent sans étiologie génétique identifiée. Les récentes découvertes de mutations de gènes du stress oxydant ouvrent le champ des recherches d'anomalies génétiques non spécifiques de la glande surrénale. Le séquençage parallèle massif (MPS) autorise aujourd'hui la réalisation de millions de séquences et l'étude simultanée de plusieurs gènes de plusieurs patients ce qui permet d'accélérer le diagnostic. C'est aussi la technique de choix pour la recherche de nouveaux gènes. Cependant, parmi les défis de cette nouvelle technologie, il est possible de citer la gestion de la très grande quantité de données qu'elle génère et le besoin d'une validation rigoureuse préalable à son utilisation à des fins diagnostiques.Le premier objectif du présent travail était d'établir un diagnostic génétique dans une cohorte de patients atteints d'ISP et de rechercher de nouveaux gènes. L'étude des génotypes et des phénotypes permet de comprendre les mécanismes physiopathologiques pour les engager dans le traitement et le conseil génétique.Le second objectif était le développement de méthodes bio-informatiques et d'inférence statistique pour faciliter le transfert du séquençage classique (Sanger) vers la technique MPS. Ce développement comprend l'analyse graphique de la qualité du séquençage, l'ajustement de modèles log-linéaires pour comparer les propriétés de différents « pipelines », et l'ajustement de modèles additifs généralisés pour estimer les contributions des sources d'erreurs de séquençage. Les analyses statistiques ont considéré chaque paire de bases comme unité statistique et chaque patient comme étude indépendante, ce qui confère à l'analyse simultanée de tous les patients le caractère d'une méta-analyse / Primary adrenal insufficiency (PAI) is characterized by an impaired production of steroid hormones due to an adrenal cortex defect. This condition exposes to the risk of acute insufficiency which may be life-threatening. Today, 80% of pediatric forms of PAI have a genetic origin but 5% have no clear genetic support. Recently discovered mutations in genes relative to the oxidative stress have opened the way to research works on genes unrelated to the adrenal gland. Massive Parallel Sequencing (MPS) is now able to perform millions of sequences and study simultaneously several genes in several patients, which accelerates the diagnosis. Above all, MPS is the preferred technique for new gene discoveries. However, among the challenges of this new technology one may cite the management of the huge amount of data MPS generates and the need for a strict validation process before the use of MPS for diagnosis purposes.The first objective of the present work was to establish a genetic diagnosis in a cohort of patients with PAI and search for new genes. Study the genotypes and phenotypes allows a better understanding of the physiopathological mechanisms of PAI and offering appropriate care for the patients and counseling for families. The second objective was the development of bioinformatic and statistical inference methods to help shifting from the classical Sanger sequencing to MPS. This shift involves a graphical analysis of the quality of sequencing, an adjustment of log-linear models to allow comparing the properties of different pipelines, an adjustment of the generalized additive models to allow estimating the contributions of various sources of sequencing errors. The statistical methods have considered each DNA base-pair as a statistical unit and each patient as a separate study which confers the simultaneous study of all patients the status of a meta-analysis
79

Investigating Systematics In The Cosmological Data And Possible Departures From Cosmological Principle

Gupta, Shashikant 08 1900 (has links) (PDF)
This thesis contributes to the field of dark energy and observational cosmology. We have investigated possible direction dependent systematic signal and non-Gaussian features in the supernovae (SNe) Type Ia data. To detect these effects we propose a new method of analysis. Although We have used this technique on SNe Ia data, it is quite general and can be applied to other data sets as well. SNe Ia are the most precise known distance indicators at the cosmological distances. Their constant peak luminosity(after correction) makesthem standard candles and hence one can measure the distances in the universe using SNe Ia. This distance measurement can determine various cosmological parameters such as the Hubble constant, various components of matter density and dark energy from, the SNe Ia observations. Recent SNe Ia observations have shown that the expansion of the universe is currently accelerating. This recent acceleration is explained by invoking a component in the universe having negative pressure and is termed as dark energy. It can be described by a homogeneous and isotropic fluid with the equation of state P = wρ, where w is allowed to be negative. A constant(Λ) in the Einstein equation(known as cosmological constant) can explain the acceleration, in the fluid model it can be modeled with w = -1. Other models of dark energy with w = -1 can also explain the acceleration, however the precise nature of this mysterious component remains unknown. Although there exist a wide range of dark energy models, cosmological constant provides the simplest explanation to the acceleration of the expansion of the Universe. The equation of state parameter w has been investigated by recent surveys but the results are still consistent with a wide range of dark energy models. In order to discriminate among various cosmological models we need an even more precise measurement of distance and error bars in the SNe Ia data. From the central limit theorem we expect Gaussian errors in any experiment that is free from systematic noise. However in astronomy we do not have a control over the observed phenomena and thus can not control the systematic errors (due to some physical processes in the Universe) in the observed data. The only possible way to deal with such data is by using appropriate statistical techniques. Among these systematic features the direction dependent features are more dangerous ones since they may indicate a preferred direction in the Universe. To address the issue of direction dependent features we have developed a new technique(Δ statistic henceforth) which is based on the extreme value theory. We have applied this technique to the available high-z SNe Ia data from Riess et al.(2004)and Riess et al.(2007). In addition we have applied it to the HST data from HST key project for H0 measurement. Below we summarize the material presented in the thesis. Chapter wise summary of the thesis In the first chapter we present an introductory discussion of the various basic cosmological notions eg. Cosmological Principle (CP), observational evidence in support of CP and departures from it, distance measures and large scale structure. The observed departures from the CP could be present due to the systematic errors and/or non-Gaussian error bars in the data. We discuss the errors involved in the measurement process Basics of statistical techniques : In the next two chapters we discuss basics of the statistical techniques used in this thesis and extreme value theory. Extreme value theory describes how to calculate the distribution of extreme events. The simplest of the distributions of the extremes is known as the Gumbel distribution. We discuss features of the Gumbel distribution since it is used extensively in our analysis. Δ statistic and features in the SNe data : In the fourth chapter we derive Δ statistic and apply it to the SNe Ia data sets. An outline of the Δ statistic is as follows : a) We define a plane which cuts the sky into hemispheres. This plane will divide the data into two subsets, one in each hemisphere. b) Now we calculate the χ2 in each hemisphere for an FRW universe assuming a flat geometry. c) The difference of χ2 in the two hemisphere is calculated and maximized by rotating the plane. This maximum should follow the Gumbel distribution. Since it is difficult to calculate the analytic form of Gumbel distribution we calculate it numerically assuming Gaussian error bars. This gives the theoretical distribution for the above calculated maximum of difference of χ2 . The results indicate that GD04 shows systematic effects as well non-Gaussian features while the set GD07 is better in terms of systematic effects and non-Gaussian features. Non-Gaussian features in the H0 data : HST key project measures the value of Hubble constant at the level of 10% accuracy, which requires precise measurement of the distances. It uses various methods to measure distance for instance SNe Ia, Tully-Fisher relation, surface-brightness fluctuations etc. In the fifth chapter we apply Δ statistic to the HST Key Project data in order to check the presence of non-Gaussian and direction dependent features. Our results show that although this data set seems to be free of direction dependent features, it is inconsistent with the Gaussian errors. Analytic Marginalization : The quantities of real interest in cosmology are ΩM and ΩΛ, Hubble constant could in principle be treated as a nuisance parameter. It would be useful to marginalize over the nuisance parameter. Although it can be done numerically using Bayesian method, Δ statistic does not allow it. In chapter six we propose a method to marginalize over H0 analytically. The χ2 in this case is a complicated function of errors in the data. We compare this analytic method with the Bayesian marginalization method and results show that the two methods are quite consistent. We apply the Δ statistic to the SNe data after the analytic marginalization. Results do not change much indicating the insensitivity of the direction de-pendent features to the Hubble constant. A variation to the Δ statistic: As has been discussed earlier that, it is difficult to calculate the theoretical distribution of Δ in general. However if the parent distribution follows certain conditions it is possible to derive the analytic form for the Gumbel distribution for Δ. In the seventh chapter we derive a variation to the Δ statistic in a way that allows us to calculate the analytic distribution. The results in this case are different from those presented earlier, but they confirm the same direction dependence and non-Gaussian features in the data.
80

Modelos de regressão beta retangular heteroscedásticos aumentados em zeros e uns / Zero-one augmented heteroscedastic rectangular beta regression models

Silva, Ana Roberta dos Santos, 1989- 26 August 2018 (has links)
Orientador: Caio Lucidius Naberezny Azevedo / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-26T19:30:15Z (GMT). No. of bitstreams: 1 Silva_AnaRobertadosSantos_M.pdf: 4052475 bytes, checksum: 08fb6f3f7b4ed838df4eea2dbcf06a29 (MD5) Previous issue date: 2015 / Resumo: Neste trabalho desenvolvemos a distribuição beta retangular aumentada em zero e um, bem como um correspondente modelo de regressão beta retangular aumentado em zero e um para analisar dados limitados-aumentados (representados por variáveis aleatórias mistas com suporte limitado), que apresentam valores discrepantes. Desenvolvemos ferramentas de inferência sob as abordagens bayesiana e frequentista. No que diz respeito à inferência bayesiana, devido à impossibilidade de obtenção analítica das posteriores de interesse, utilizou-se algoritmos MCMC. Com relação à estimação frequentista, utilizamos o algoritmo EM. Desenvolvemos técnicas de análise de resíduos, utilizando o resíduo quantil aleatorizado, tanto sob o enfoque frequentista quanto bayesiano. Desenvolvemos, também, medidas de influência, somente sob o enfoque bayesiano, utilizando a medida de Kullback Leibler. Além disso, adaptamos métodos de checagem preditiva à posteriori existentes na literatura, ao nosso modelo, utilizando medidas de discrepância apropriadas. Para a comparação de modelos, utilizamos os critérios usuais na literatura, como AIC, BIC e DIC. Realizamos diversos estudos de simulação, considerando algumas situações de interesse prático, com o intuito de comparar as estimativas bayesianas com as frequentistas, bem como avaliar o comportamento das ferramentas de diagnóstico desenvolvidas. Um conjunto de dados da área psicométrica foi analisado para ilustrar o potencial do ferramental desenvolvido / Abstract: In this work we developed the zero-one augmented rectangular beta distribution, as well as a correspondent zero-one augmented rectangular beta regression model to analyze limited-augmented data (represented by mixed random variables with limited support), which present outliers. We develop inference tools under the Bayesian and frequentist approaches. Regarding to the Bayesian inference, due the impossibility of obtaining analytically the posterior distributions of interest, we used MCMC algorithms. Concerning the frequentist estimation, we use the EM algorithm. We develop techniques of residual analysis, by using the randomized quantile residuals, under both frequentist and Bayesian approaches. We also developed influence measures, only under the Bayesian approach, by using the measure of Kullback Leibler. In addition, we adapt methods of posterior predictive checking available in the literature, to our model, using appropriate discrepancy measures. For model selection, we use the criteria commonly employed in the literature, such as AIC, BIC and DIC. We performed several simulation studies, considering some situations of practical interest, in order to compare the Bayesian and frequentist estimates, as well as to evaluate the behavior of the developed diagnostic tools. A psychometric real data set was analyzed to illustrate the performance of the developed tools / Mestrado / Estatistica / Mestra em Estatística

Page generated in 0.1005 seconds