Spelling suggestions: "subject:"modelos multivariadas"" "subject:"modelos multivariado""
1 |
Análisis del Retorno Esperado de Acciones Chilenas: Descomposición de VarianzaValdivieso Contreras, Ercos January 2009 (has links)
No description available.
|
2 |
[en] STATE SPACE MODELS: MULTIVARIATE FORMULATION APPLIED TO LOAD FORECASTING / [pt] MODELOS EM ESPAÇO DE ESTADO: FORMULAÇÃO MULTIVARIADA APLICADA À PREVISÃO DE CARGA ELÉTRICAMARCELO RUBENS DOS SANTOS DO AMARAL 19 July 2006 (has links)
[pt] Os métodos de análise de séries temporais têm se revelado
uma importante ferramenta de apoio à tomada de decisões,
com importância crescente em um mundo cada vez mais
globalizado. Esse fato pode ser ilustrado, entre muitos
outros, através de um convênio firmado entre o CEPEL, o
Núcleo de Estatística Computacional da PUC/RJ e a
Eletrobrás, para se avaliar a utilidade dessas ferramentas
nas etapas do planejamento do setor elétrico brasileiro. A
metodologia em Espaço de Estado proporcionou o surgimento
de duas importantes classes de modelos de previsão e
análise de séries temporais completamente alternativas (os
modelos estruturais e os modelos de inovações em espaço de
estado), e, por isso, podem por vezes, causar dúvidas
quando se fala em métodos de previsão em espaço de estado
sem se especificar sobre qual das duas se está falando.
Foi escolhido uma técnica específica e facilmente
executável em softwares comerciais para cada classe de
modelos: O desenvolvimento clássico de Harvey implementado
no software STAMP, representando os modelos estruturais; e
o desenvolvimento de Goodrich implementado no software
FMP, representando os modelos de inovações. Essas técnicas
estão tratadas de uma forma aprofundada, para proporcionar
um melhor entendimento teórico das diferenças existentes
entre ambas. Com o intuito de se avaliar a performance
frente às outras técnicas existentes, são comparados os
resultados das previsões entre as metodologias a partir de
um sistema de comparação baseado nas estatísticas MAPE
(Mean Absolute Percentage Error), RMSE (Root Mean Squared
Error) e U-Theil. Para tanto são vistos sucintamente as
técnicas: Alisamento Exponencial (Holt-Winters), Box &
Jenkins e Redes Neurais. Todas as técnicas foram aplicadas
aos dados de consumo de energia elétrica das 32 empresas
concessionárias do setor no Brasil, além de comparadas com
as previsões realizadas por essas concessionárias. A
novidade deste trabalho para o projeto em andamento está
na aplicação multivariada possível através da metodologia
de Goodrich. / [en] The analysis of time series is, nowadays one of the most
important tools in the decision making process, due mainly
to the globalization of the world.
As an illustration of that we can mention the recent
contract signed between NEC/PUC-Rio and CEPEL/Eletrobrás,
where time series techniques are to be used in the
planning process of the brazilian sector.
The state-space approach forms the basis of two
important forecasting models to time series analysis the
structural model and the state space innovation model.
Because of that one finds it difficult to have a clear cut
definition of either one of them.
These two models formulation were implemented in comercial
softwares: the structural model of A. Harvey in STAMP and
the state space innovation of R. Goodrich in FMP.
In order to check the perfomance of these state space
approaches vis-à-vis the traditional forecasting
techniques, it was used the following statistics: MAPE
(Mean Absolute Percentage Error), RMSE (Root Mean Squared
Error) and U-Theil. The traditional approaches used in the
comparison were: Holt-Winters, Box & Jenkins and
Backpropagation Neural Network. All the methods, included
the state space ones were applied to the demand series of
32 electrical utilities which form the brazilian
electrical distribution system. If was also attempted the
multivariate state-space formulation of R. Goodrich which
is included in FMP software.
|
3 |
Molecular diagnosis of autism spectrum disorder through whole exome sequencing / Diagnóstico molecular do transtorno do espectro autista através do sequenciamento completo de exomaAlmeida, Tatiana Ferreira de 05 November 2018 (has links)
Autism spectrum disorder (ASD) is a neurodevelopment disorder characterized by impairment in communication skills, behavior and social interactions that affects around 1-2% worldwide. To date the etiology of ASD has not yet been fully understood, but in the last 18 years many advances have been made to understand the genetic component related to the development of the clinical phenotype. With the advent of genomic scan analysis such as chromosome analysis by microarray and whole exome sequencing (WHE) many advances have been made to understand the pathophysiology of the disease. About 10-15% of the cases can be explained by large losses or gains (deletions or duplications greater than 1000 base pairs) of the genetic material, which generally involve the disruption of one or more genes. Next generation sequencing methodologies were fundamental in the description of point mutations and small insertions and deletions associated with ASD. The WES has allowed many discoveries to be made about new candidate genes and mechanisms for the development of the disease. It is now claimed that de novo (non-inherited) and likely gene disruptive mutations, such as loss-of-function and non-synonymous changes with high prediction of damage by computational tools, in genes related to neurodevelopment are a major contributor to the disease mechanism. However, these mutations, in addition to not explaining the majority of cases, are rarely recurrent in the population, which makes it difficult to establish a definitive molecular diagnosis for most patients. WES is already a practice in clinical genetics laboratories and demonstrates high effectiveness for diseases that follow a Mendelian pattern of inheritance, and have an established genetic cause. In clinical practice WES is requested for cases of ASD, despite having different modes of inheritance and having more than 1,000 genes associated with the disease. Due to these characteristics the analysis of WES for ASD is a major challenge for the clinical laboratory. This study proposes the construction of a computerized WES analysis routine that can test different candidate genes for their sensitivity and specificity for the detection of affected individuals. The proposed approach consists in the counting of variants separated by their possible protein damage and population frequency for each individual from affected and control groups, this study analyzed 168 WES, being 49 with ASD and 119 controls. After counting formulation, these values are subjected to a sequence of statistical tests, seeking a significant difference in the amount of mutations of all the variants alone, loss-of-function or damaging missense mutations, and the application of models of multivariate analysis such as: logistic regression, decision tree, neural network, vector support machine and principal component analysis for the elaboration of more complex models for disease development. A total of 21 lists of genes were tested, of which 19 presented at least one significant result, and the analysis of variants alone was the one that obtained the largest number of significant events. From apparently protective variants (higher number in the control group), such as the missense variants in RAS/MAPK pathway as variants of stopgain with population frequency above 0.05 in chromatin genes in greater number in individuals with ASD. None of the multivariate analysis models had significant discrimination results between the two groups. Due to the small sample size, the results of this study should be interpreted with limitations, and it is necessary to replicate these scenarios in other databases. However, these findings suggest that different types and frequencies of variants may have distinct contributions to disease development depending on the genes analyzed, rather than complex relationships between variants of the same gene list / O transtorno do espectro autista (TEA) é um distúrbio do neurodesenvolvimento caracterizado por uma incapacidade de comunicação comportamento e interações sociais que afeta em torno de 1-2% da população mundial. Até o momento a etiologia do TEA ainda não é totalmente compreendida, mas nos últimos 18 anos muitos avanços foram feitos para entender o componente genético relacionado ao desenvolvimento do quadro clínico. Com o advento das análises de varredura genômica como a análise cromossômica por microarray e o sequenciamento completo de exoma (SCE) muitos avanços foram feitos para a compreensão da fisiopatologia da doença. Em torno de 10-15% dos casos podem ser explicados por grandes perdas ou ganhos (deleções ou duplicações superiores a 1000 pares de bases) do material genético, que geralmente envolvem a disrupção de um ou mais genes. As metodologias de sequenciamento de nova geração foram fundamentais para a descrição das mutações de ponto e pequenas inserções e deleções associadas ao TEA. O SCE permitiu que muitas descobertas fossem feitas sobre novos genes candidatos e mecanismos para o desenvolvimento da doença. Atualmente afirma-se que as alterações de novo (não herdadas) e de maior probabilidade de ruptura gênica, como as mutações de perda-de-função e as alterações não-sinônimas com alta predição de dano por ferramentas computacionais, em genes de susceptibilidade a doenças do neurodesenvolvimento sejam um grande contribuidor para o mecanismo da doença. Entretanto essas mutações, além de não explicar a totalidade dos casos raramente são recorrentes na população, o que dificulta o estabelecimento de um diagnóstico molecular definitivo para a maioria dos pacientes. O SCE já é uma prática nos laboratórios clínicos de genética e demonstra uma alta efetividade para as doenças que seguem um padrão de herança mendeliano, e têm uma causa genética estabelecida. Na prática clínica o SCE é solicitado para os casos de TEA, apesar de ter diferentes modos de herança e terem mais de 1,000 genes associados à doença. Devido a estas características o SCE para os casos de TEA são um grande desafio para o laboratório clínico. Este estudo propõem a construção de uma rotina computacional de análise do SCE que possa testar diferentes genes candidatos quanto à sua sensibilidade e especificidade para a detecção dos indivíduos afetados. A abordagem proposta é a contagem de variantes separadas por seu possível dano à proteína e frequência populacional para cada indivíduo de grupos afetado e controle em 168 indivíduos com SCE, sendo 49 com TEA e 119 controles. Após a formulação da contagem esses valores são submetidos a uma sequência de testes estatísticos, buscando diferença significativa em quantidade de mutações de todas as variantes isoladamente, das mutações de perda-de-função, ou não-sinônimas danosas como um conjunto e a aplicação de modelos de análise multivariada como: regressão logística, árvore de decisão, rede neural, máquinas de suporte de vetor e análise de componente principal para a elaboração de modelos mais complexos para o desenvolvimento na doença. Ao todo foram testadas 21 listas de genes, destas, 19 apresentaram ao menos um resultado significativo, sendo a análise de variantes isoladamente a que obteve maior número de eventos significativos. Desde variantes aparentemente protetoras (maior número no grupo controle), como as variantes não-sinônimas em via de RAS/MAPK quanto variantes de perda de códon de parada com frequência populacional acima de 0.05 em genes de cromatina em maior número nos indivíduos com TEA. Nenhum dos modelos de análise multivariada obteve resultados significativos na discriminação entre os dois grupos. Devido ao pequeno número amostral os resultados deste estudo devem ser interpretados com limitações, sendo necessária a replicação deste cenário em outros bancos de dados. Entretanto, estes achados sugerem que diferentes tipos e frequências de variantes podem ter contribuições distintas para o desenvolvimento da doença a depender dos genes analisados, mais de que relações complexas entre as variantes de uma mesma lista de genes
|
4 |
Practical considerations for genotype imputation and multi-trait multi-environment genomic prediction in a tropical maize breeding program / Considerações práticas para a imputação de genótipos e predição genômica aplicada a múltiplos caracteres e ambientes em um programa de melhoramento de milho tropicalOliveira, Amanda Avelar de 17 June 2019 (has links)
The availability of molecular markers covering the entire genome, such as single nucleotide polymorphism (SNP) markers, allied to the computational resources for processing large amounts of data, enabled the development of an approach for marker assisted selection for quantitative traits, known as genomic selection. In the last decade, genomic selection has been successfully implemented in a wide variety of animal and plant species, showing its benefits over traditional marker assisted selection and selection based only on pedigree information. However, some practical challenges may still limit the wide implementation of this method in a plant breeding program. For example, we cite the cost of high-density genotyping of a large number of individuals and the application of more complex models that take into account multiple traits and environments. Thus, this study aimed to i) investigate SNP calling and imputation strategies that allow cost-effective high-density genotyping, as well as ii) evaluating the application of multivariate genomic selection models to data from multiple traits and environments. This work was divided into two chapters. In the first chapter, we compared the accuracy of four imputation methods: NPUTE, Beagle, KNNI and FILLIN, using genotyping-by-sequencing (GBS) data from 1060 maize inbred lines, which were genotyped using different depths of coverage. In addition, two SNP calling and imputation strategies were evaluated. Our results indicated that combining SNP-calling and imputation strategies can enhance cost-effective genotyping, resulting in higher imputation accuracies. In the second chapter, multivariate genomic selection models, for multiple traits and environments, were compared with their univariate versions. We used data from 415 hybrids evaluated in the second season in four years (2006-2009) for grain yield, number of ears and grain moisture. Hybrid genotypes were inferred in silico based on their parental inbred lines using SNP markers obtained via GBS. However, genotypic information was available only for 257 hybrids, motivating the use of the H matrix, which combines genetic information based on pedigree and molecular markers. Our results demonstrated that the use of multi-trait multi-environment models can improve predictive abilities, especially to predict the performance of hybrids that have not yet been evaluated in any environment. / A disponibilidade de marcadores moleculares cobrindo todo o genoma, como os polimorfismos de nucleotídeos individuais (single nucleotide polymorphism - SNP), aliada aos recursos computacionais para o processamento de grande volume de dados, tornou possível o desenvolvimento de uma abordagem de melhoramento assistido para caracteres de herança quantitativa, conhecida como seleção genômica. Na última década a seleção genômica tem sido implementada com sucesso em uma enorme variedade de espécies animais e vegetais, comprovando suas vantagens sobre a seleção assistida por marcadores tradicional e a seleção baseada apenas em informações de parentesco. No entanto, alguns desafios práticos ainda podem limitar a implementação deste método em um programa de melhoramento de plantas. Como exemplos, citam-se o custo da genotipagem de alta densidade de um grande número de indivíduos e a aplicação de modelos mais complexos, que consideram múltiplos caracteres e ambientes. Dessa forma, este estudo teve como objetivos: i) investigar estratégias de identificação de SNPs e imputação que possibilitem uma genotipagem de alta densidade economicamente viável; e ii) avaliar a aplicação de modelos multivariados de seleção genômica para múltiplos caracteres e ambientes. Este trabalho foi divido em dois capítulos. No primeiro capítulo, comparou-se a acurácia de quatro métodos de imputação: NPUTE, Beagle, KNNI e FILLIN, usando dados de genotipagem por sequenciamento (genotyping-by-sequencing - GBS) de 1.060 linhagens de milho, que foram genotipadas usando diferentes profundidades de cobertura. Além disso, duas estratégias de identificação de SNPs e imputação foram avaliadas. Os resultados indicaram que a combinação de estratégias de detecção de polimorfismos e imputação pode possibilitar uma genotipagem economicamente viável, resultando em maiores acurácias de imputação. No segundo capítulo, modelos multivariados de seleção genômica, para múltiplos caracteres e ambientes, foram comparados com suas versões univariadas. Dados de 415 híbridos avaliados na segunda safra em quatro anos (2006-2009) para os caracteres produtividade de grãos, número de espigas e umidade foram utilizados. Os genótipos dos híbridos foram inferidos in silico com base nos genótipos das linhagens parentais usando marcadores SNPs obtidos via GBS. No entanto, informações genotípicas estavam disponíveis para apenas 257 híbridos, de modo que foi necessário fazer uso da matriz H, a qual combina informações de parentesco genético baseadas em pedigree e marcadores. Os resultados obtidos demonstraram que o uso de modelos de seleção genômica para múltiplos caracteres e ambientes pode aumentar a capacidade preditiva, especialmente para predizer a performance de híbridos nunca avaliados em qualquer ambiente.
|
5 |
Seguro contra risco de downside de uma carteira: uma proposta híbrida frequentista-Bayesiana com uso de derivativosPérgola, Gabriel Campos 23 January 2013 (has links)
Submitted by Gabriel Campos Pérgola (gabrielpergola@gmail.com) on 2013-02-04T12:56:43Z
No. of bitstreams: 1
DissertationGabrielPergola2013.pdf: 521205 bytes, checksum: 85369078a82b0d5cc02f8248961e9214 (MD5) / Rejected by Suzinei Teles Garcia Garcia (suzinei.garcia@fgv.br), reason: Prezado Gabriel,
Não recebemos os arquivo em PDF.
Att.
Suzi 3799-7876 on 2013-02-05T18:53:00Z (GMT) / Submitted by Gabriel Campos Pérgola (gabrielpergola@gmail.com) on 2013-02-05T19:00:17Z
No. of bitstreams: 2
DissertationGabrielPergola2013.pdf: 521205 bytes, checksum: 85369078a82b0d5cc02f8248961e9214 (MD5)
DissertationGabrielPergola2013.pdf: 521205 bytes, checksum: 85369078a82b0d5cc02f8248961e9214 (MD5) / Approved for entry into archive by Suzinei Teles Garcia Garcia (suzinei.garcia@fgv.br) on 2013-02-05T19:07:12Z (GMT) No. of bitstreams: 2
DissertationGabrielPergola2013.pdf: 521205 bytes, checksum: 85369078a82b0d5cc02f8248961e9214 (MD5)
DissertationGabrielPergola2013.pdf: 521205 bytes, checksum: 85369078a82b0d5cc02f8248961e9214 (MD5) / Made available in DSpace on 2013-02-05T19:09:04Z (GMT). No. of bitstreams: 2
DissertationGabrielPergola2013.pdf: 521205 bytes, checksum: 85369078a82b0d5cc02f8248961e9214 (MD5)
DissertationGabrielPergola2013.pdf: 521205 bytes, checksum: 85369078a82b0d5cc02f8248961e9214 (MD5)
Previous issue date: 23-01-13 / Portfolio insurance allows a manager to limit downside risk while allowing participation in upside markets. The purpose of this dissertation is to introduce a framework to portfolio insurance optimization from a hybrid frequentist-Bayesian approach. We obtain the joint distribution of regular returns from a frequentist statistical method, once the outliers have been identified and removed from the data sample. The joint distribution of extreme returns, in its turn, is modelled by a Bayesian network, whose topology reflects the events that can significantly impact the portfolio performance. Once we link the regular and extreme distributions of returns, we simulate future scenarios for the portfolio value. The insurance subportfolio is then optimized by the Differential Evolution algorithm. We show the framework in a step by step example for a long portfolio including stocks participating in the Bovespa Index (Ibovespa), using market data from 2008 to 2012. / Seguros de carteiras proporcionam aos gestores limitar o risco de downside sem renunciar a movimentos de upside. Nesta dissertação, propomos um arcabouço de otimização de seguro de carteira a partir de um modelo híbrido frequentista-Bayesiano com uso de derivativos. Obtemos a distribuição conjunta de retornos regulares através de uma abordagem estatística frequentista, uma vez removidos os outliers da amostra. A distribuição conjunta dos retornos extremos, por sua vez, é modelada através de Redes Bayesianas, cuja topologia contempla os eventos que o gestor considera crítico ao desempenho da carteira. Unindo as distribuições de retornos regulares e extremos, simulamos cenários futuros para a carteira. O seguro é, então, otimizado através do algoritmo Evolução Diferencial. Mostramos uma aplicação passo a passo para uma carteira comprada em ações do Ibovespa, utilizando dados de mercado entre 2008 e 2012.
|
Page generated in 0.0728 seconds