• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 38
  • 1
  • Tagged with
  • 39
  • 39
  • 12
  • 12
  • 12
  • 9
  • 9
  • 8
  • 6
  • 6
  • 6
  • 6
  • 6
  • 6
  • 6
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Desenvolvimento de modelos dinâmicos para a formação de clusters aplicados em dados biológicos / Developing dynamical systems for data clustering applied to biological data

Antonio Paulo Galdeano Damiance Junior 16 October 2006 (has links)
Com o advento da tecnologia de microarray, uma grande quantidade de dados de expressão gênica encontra-se disponível. Após a extração das taxas de expressão dos genes, técnicas de formação de clusters são utilizadas para a análise dos dados. Diante da diversidade do conhecimento que pode ser extraído dos dados de expressão gênica, existe a necessidade de diferentes técnicas de formação de clusters. O modelo dinâmico desenvolvido em (Zhao et. al. 2003a) apresenta diversas características interessantes para o problema de formação de clusters, entre as quais podemos citar: a não necessidade de fornecer o número de cluster, a propriedade de multi-escala, serem altamente paralelos e, principalmente, permitirem a inserção de regras e mecanismos mais complexos para a formação dos clusters. Todavia, este modelo apresenta dificuldades em determinar clusters de formato e tamanho arbitrários, além de não realizar a clusterização hierárquica, sendo estas duas características desejáveis para uma técnica de clusterização. Neste trabalho, foram desenvolvidas três técnicas para superar as limitações do modelo dinâmico proposto em (Zhao et. al. 2003a). O Modelo1, o qual é uma simplificação do modelo dinâmico original, porém mais eficiente. O Modelo2, que a partir da inserção de um novo conjunto de elementos no modelo dinâmico, permite a formação de clusters de formato e tamanho arbitrário. E um algoritmo para a clusterização hierárquica que utiliza o Modelo1 como bloco de construção. Os modelos desenvolvidos foram aplicados em dados biológicos, segmentando imagens de microarray e auxiliando na análise do conjunto expressão de genes de St. Jude Leukemia. / With the advent of microarray technology, a large amount of gene expression data is now available. Clustering is the computational technique usually employed to analyze and explore the data produced by microarrays. Due to the variety of information that can be extracted from the expression data, many clustering techniques with different approaches are needed. In the work proposed by (Zhao et. al. 2003a), the dynamical model for data clustering has several interesting features to the clustering task: the number of clusters does not need to be known, the multi-scale property, high parallelism, and it is flexible to use more complex rules while clustering the data. However, two desirable features for clustering techniques are not present: the ability to detect different clusters sizes and shapes, and a hierarchical representation of the clusters. This project presents three techniques, overcoming the restrictions of the dynamical model proposed by (Zhao et. al. 2003a). The first technique, called Model1, is more effective than the original model and was obtained simplifying it. The second technique, called Model2, is capable of detecting different clusters sizes and shapes. The third technique consists in a hierarchical algorithm that uses Model1 as a building block. The techniques here developed were used with biological data. Microarray image segmentation was performed and the St. Jude Leukemia gene expression data was analyzed and explored.
32

Inferência bayesiana em modelos de dinâmica de populações biológicas com termo de perturbação assimétrico / Bayesian inference in biological population dynamic models with skewed and heavy tailed perturbation terms

Silva, Carlos Patricio Montenegro 20 January 2016 (has links)
Neste trabalho de tese, estudamos o modelo de crescimento logístico de populações biológicas utilizando a abordagem de espaço de estados. Os estados não observados são as biomassas anuais, a equação de observação é linear e a equação de estado é não linear. As distribuições de probabilidade utilizadas para os termos de erro de observação aditivos são: Normal, t-student, Skew-normal e Skew-t. As distribuições Log-normal, Log-t, Log-skew-normal e Log-skew-t são consideradas para os erros de observação multiplicativos. A inferência nos modelos é realizada considerando-se métodos Bayesianos e as distribuições a posterior de interesse são aproximadas utilizando-se algoritmos MCMC e a aproximação de Laplace. Apresentamos duas aplicações, a primeira referente a pesca de camarão marinho na costa do Chile, na qual a variável observável é o rendimento médio anual de pesca (captura por unidade de esforço média). Na segunda é considerada a pesca de lagostim vermelho na costa de Chile, na qual além do rendimento médio anual da pesca, observa-se as estimativas anuais de biomassa vulnerável, obtidas através de estudos de área varrida. Para o primeiro conjunto de dados, os modelos com erros de observação multiplicativos têm melhor performance, particularmente os modelos Log-skew-normal e Log-skew-t. Considerando estes resultados, no segundo caso utilizamos somente erros multiplicativos e a distribuição a posteriori preditiva mostra que cada variável observável parece ter sua própria família de distribuição de probabilidades. Além disso, os resultados também revelam uma crescente complexidade do modelo ao incorporar a classe mais geral de distribuições assimétricas. / We study the logistic population growth model using a state-space approach. The non observable states are the annual biomass of the population with a linear observation equation and a non-linear state equation. The probability distribution used for the additives observation error terms are Normal, Student-t, Skew-normal and Skew-t, and Log-normal, Log-t, Log-skew-normal and Log-skew-t for multiplicative observation errors terms. The inference about the parameters of the models is performed using Bayesian methods, with MCMC algorithms and Laplace approximations. We present two applications to real data sets. The first in marine shrimp population off the coast of Chile, where observable variable is the average annual fishing yield. The second application is for the population of the red squat lobster off Chile, where in addition to the average annual fishing yield, a second observable variable was included. In the first case, the multiplicative observational errors models presented the best results. Particularly the Log-skew-normal and Log-skew-t models has the better performances. Considering these results, in the second application we use only multiplicative observation errors models.
33

Inferência bayesiana em modelos de dinâmica de populações biológicas com termo de perturbação assimétrico / Bayesian inference in biological population dynamic models with skewed and heavy tailed perturbation terms

Carlos Patricio Montenegro Silva 20 January 2016 (has links)
Neste trabalho de tese, estudamos o modelo de crescimento logístico de populações biológicas utilizando a abordagem de espaço de estados. Os estados não observados são as biomassas anuais, a equação de observação é linear e a equação de estado é não linear. As distribuições de probabilidade utilizadas para os termos de erro de observação aditivos são: Normal, t-student, Skew-normal e Skew-t. As distribuições Log-normal, Log-t, Log-skew-normal e Log-skew-t são consideradas para os erros de observação multiplicativos. A inferência nos modelos é realizada considerando-se métodos Bayesianos e as distribuições a posterior de interesse são aproximadas utilizando-se algoritmos MCMC e a aproximação de Laplace. Apresentamos duas aplicações, a primeira referente a pesca de camarão marinho na costa do Chile, na qual a variável observável é o rendimento médio anual de pesca (captura por unidade de esforço média). Na segunda é considerada a pesca de lagostim vermelho na costa de Chile, na qual além do rendimento médio anual da pesca, observa-se as estimativas anuais de biomassa vulnerável, obtidas através de estudos de área varrida. Para o primeiro conjunto de dados, os modelos com erros de observação multiplicativos têm melhor performance, particularmente os modelos Log-skew-normal e Log-skew-t. Considerando estes resultados, no segundo caso utilizamos somente erros multiplicativos e a distribuição a posteriori preditiva mostra que cada variável observável parece ter sua própria família de distribuição de probabilidades. Além disso, os resultados também revelam uma crescente complexidade do modelo ao incorporar a classe mais geral de distribuições assimétricas. / We study the logistic population growth model using a state-space approach. The non observable states are the annual biomass of the population with a linear observation equation and a non-linear state equation. The probability distribution used for the additives observation error terms are Normal, Student-t, Skew-normal and Skew-t, and Log-normal, Log-t, Log-skew-normal and Log-skew-t for multiplicative observation errors terms. The inference about the parameters of the models is performed using Bayesian methods, with MCMC algorithms and Laplace approximations. We present two applications to real data sets. The first in marine shrimp population off the coast of Chile, where observable variable is the average annual fishing yield. The second application is for the population of the red squat lobster off Chile, where in addition to the average annual fishing yield, a second observable variable was included. In the first case, the multiplicative observational errors models presented the best results. Particularly the Log-skew-normal and Log-skew-t models has the better performances. Considering these results, in the second application we use only multiplicative observation errors models.
34

Métodos de adequação e diagnóstico em modelos de sobrevivência dinâmicos / Methods of diagnostic and goodness-of-fit in dynamic survival models

Raminelli, Jaqueline Aparecida 29 January 2016 (has links)
A análise de dados de sobrevivência tem sido tradicionalmente baseada no modelo de regressão de Cox (COX, 1972). No entanto, a suposição de taxas de falha proporcionais assumida para esse modelo pode não ser atendida em diversas situações práticas. Essa restrição do modelo de Cox tem gerado interesse em abordagens alternativas, dentre elas os modelos dinâmicos que permitem efeito das covariáveis variando no tempo. Neste trabalho, foram revisados os principais modelos de sobrevivência dinâmicos com estrutura aditiva e multiplicativa nos contextos não paramétrico e semiparamétrico. Métodos gráficos baseados em resíduos foram apresentados com a finalidade de avaliar a qualidade de ajuste desses modelos. Uma versão tempo-dependente da área sob a curva ROC, denotada por AUC(t), foi proposta com a finalidade de avaliar e comparar a qualidade de predição entre modelos de sobrevivência com estruturas aditiva e multiplicativa. O desempenho da AUC(t) foi avaliado por meio de um estudo de simulação. Dados de três estudos descritos na literatura foram também analisados para ilustrar ou complementar os cenários que foram considerados no estudo de simulação. De modo geral, os resultados obtidos indicaram que os métodos gráficos apresentados para avaliar a adequação dos modelos em conjunto com a AUC(t) se constituem em um conjunto de ferramentas estatísticas úteis para o próposito de avaliar modelos de sobrevivência dinâmicos nos contextos não paramétrico e semiparamétrico. Além disso, a aplicação desse conjunto de ferramentas em alguns conjuntos de dados evidenciou que se, por um lado, os modelos dinâmicos são atrativos por permitirem covariáveis tempo-dependentes, por outro lado podem não ser apropriados para todos os conjuntos de dados, tendo em vista que estimação pode apresentar restrições para alguns deles. / Analysis of survival data has been traditionally based on the Cox regression model (COX, 1972). However, the proportionality of the hazards required by this model may not be attended for many practical situations. This restriction of the Cox model has generated interest in alternative approaches, among them dynamic models that allow covariates with time-varying effect. In this work, the main dynamic survival models with additive and multiplicative structures were revised under the nonparametric and semiparametric settings. Graphical methods based on residuals were presented in order to evaluate the goodness-of-fit of these models. A time-dependent version of the area under the ROC curve, denoted by AUC(t), was proposed to evaluate and compare the predictive accuracy of additive and multiplicative survival models. The performance of the AUC(t) was evaluated by means of a simulation study. Data from three studies described in the literature were also analyzed to illustrate or complement the scenarios that were considered in the simulation study. Overall, the results indicate that the graphical methods presented to assess the goodness-of-fit of the models together with the AUC(t) provide a useful set of statistics tools for the purpose of evaluating dynamic survival models in the nonparametric and semiparametric settings. Moreover, applying this set of tools in some data sets showed that on the one hand dynamic models are attractive because they allow time-dependent covariates, but on the other hand they may not be appropriate for all data sets since estimation may present restrictions for some of them.
35

Previsão da arrecadação de receitas federais: aplicações de modelos de séries temporais para o estado de São Paulo / Federal revenue collection forecast: application of time series models at the state of Sao Paulo

Campos, Celso Vilela Chaves 26 March 2009 (has links)
O objetivo principal do presente trabalho é oferecer métodos alternativos de previsão da arrecadação tributária federal, baseados em metodologias de séries temporais, inclusive com a utilização de variáveis explicativas, que reflitam a influência do cenário macroeconômico na arrecadação tributária, com o intuito de melhorar a acurácia da previsão da arrecadação. Para tanto, foram aplicadas as metodologias de modelos dinâmicos univariados, multivariados, quais sejam, Função de Transferência, Auto-regressão Vetorial (VAR), VAR com correção de erro (VEC), Equações Simultâneas, e de modelos Estruturais. O trabalho tem abrangência regional e limita-se à análise de três séries mensais da arrecadação, relativas ao Imposto de Importação, Imposto Sobre a Renda das Pessoas Jurídicas e Contribuição para o Financiamento da Seguridade Social - Cofins, no âmbito da jurisdição do estado de São Paulo, no período de 2000 a 2007. Os resultados das previsões dos modelos acima citados são comparados entre si, com a modelagem ARIMA e com o método dos indicadores, atualmente utilizado pela Secretaria da Receita Federal do Brasil (RFB) para previsão anual da arrecadação tributária, por meio da raiz do erro médio quadrático de previsão (RMSE). A redução média do RMSE foi de 42% em relação ao erro cometido pelo método dos indicadores e de 35% em relação à modelagem ARIMA, além da drástica redução do erro anual de previsão. A utilização de metodologias de séries temporais para a previsão da arrecadação de receitas federais mostrou ser uma alternativa viável ao método dos indicadores, contribuindo para previsões mais precisas, tornando-se ferramenta segura de apoio para a tomada de decisões dos gestores. / The main objective of this work is to offer alternative methods for federal tax revenue forecasting, based on methodologies of time series, inclusively with the use of explanatory variables, which reflect the influence of the macroeconomic scenario in the tax collection, for the purpose of improving the accuracy of revenues forecasting. Therefore, there were applied the methodologies of univariate dynamic models, multivariate, namely, Transfer Function, Vector Autoregression (VAR), VAR with error correction (VEC), Simultaneous Equations, and Structural Models. The work has a regional scope and it is limited to the analysis of three series of monthly tax collection of the Import Duty, the Income Tax Law over Legal Entities Revenue and the Contribution for the Social Security Financing Cofins, under the jurisdiction of the state of São Paulo in the period from 2000 to 2007. The results of the forecasts from the models above were compared with each other, with the ARIMA moulding and with the indicators method, currently used by the Secretaria da Receita Federal do Brasil (RFB) to annual foresee of the tax collection, through the root mean square error of approximation (RMSE). The average reduction of RMSE was 42% compared to the error committed by the method of indicators and 35% of the ARIMA model, besides the drastic reduction in the annual forecast error. The use of time-series methodologies to forecast the collection of federal revenues has proved to be a viable alternative to the method of indicators, contributing for more accurate predictions, becoming a safe support tool for the managers decision making process.
36

Métodos de adequação e diagnóstico em modelos de sobrevivência dinâmicos / Methods of diagnostic and goodness-of-fit in dynamic survival models

Jaqueline Aparecida Raminelli 29 January 2016 (has links)
A análise de dados de sobrevivência tem sido tradicionalmente baseada no modelo de regressão de Cox (COX, 1972). No entanto, a suposição de taxas de falha proporcionais assumida para esse modelo pode não ser atendida em diversas situações práticas. Essa restrição do modelo de Cox tem gerado interesse em abordagens alternativas, dentre elas os modelos dinâmicos que permitem efeito das covariáveis variando no tempo. Neste trabalho, foram revisados os principais modelos de sobrevivência dinâmicos com estrutura aditiva e multiplicativa nos contextos não paramétrico e semiparamétrico. Métodos gráficos baseados em resíduos foram apresentados com a finalidade de avaliar a qualidade de ajuste desses modelos. Uma versão tempo-dependente da área sob a curva ROC, denotada por AUC(t), foi proposta com a finalidade de avaliar e comparar a qualidade de predição entre modelos de sobrevivência com estruturas aditiva e multiplicativa. O desempenho da AUC(t) foi avaliado por meio de um estudo de simulação. Dados de três estudos descritos na literatura foram também analisados para ilustrar ou complementar os cenários que foram considerados no estudo de simulação. De modo geral, os resultados obtidos indicaram que os métodos gráficos apresentados para avaliar a adequação dos modelos em conjunto com a AUC(t) se constituem em um conjunto de ferramentas estatísticas úteis para o próposito de avaliar modelos de sobrevivência dinâmicos nos contextos não paramétrico e semiparamétrico. Além disso, a aplicação desse conjunto de ferramentas em alguns conjuntos de dados evidenciou que se, por um lado, os modelos dinâmicos são atrativos por permitirem covariáveis tempo-dependentes, por outro lado podem não ser apropriados para todos os conjuntos de dados, tendo em vista que estimação pode apresentar restrições para alguns deles. / Analysis of survival data has been traditionally based on the Cox regression model (COX, 1972). However, the proportionality of the hazards required by this model may not be attended for many practical situations. This restriction of the Cox model has generated interest in alternative approaches, among them dynamic models that allow covariates with time-varying effect. In this work, the main dynamic survival models with additive and multiplicative structures were revised under the nonparametric and semiparametric settings. Graphical methods based on residuals were presented in order to evaluate the goodness-of-fit of these models. A time-dependent version of the area under the ROC curve, denoted by AUC(t), was proposed to evaluate and compare the predictive accuracy of additive and multiplicative survival models. The performance of the AUC(t) was evaluated by means of a simulation study. Data from three studies described in the literature were also analyzed to illustrate or complement the scenarios that were considered in the simulation study. Overall, the results indicate that the graphical methods presented to assess the goodness-of-fit of the models together with the AUC(t) provide a useful set of statistics tools for the purpose of evaluating dynamic survival models in the nonparametric and semiparametric settings. Moreover, applying this set of tools in some data sets showed that on the one hand dynamic models are attractive because they allow time-dependent covariates, but on the other hand they may not be appropriate for all data sets since estimation may present restrictions for some of them.
37

Previsão da arrecadação de receitas federais: aplicações de modelos de séries temporais para o estado de São Paulo / Federal revenue collection forecast: application of time series models at the state of Sao Paulo

Celso Vilela Chaves Campos 26 March 2009 (has links)
O objetivo principal do presente trabalho é oferecer métodos alternativos de previsão da arrecadação tributária federal, baseados em metodologias de séries temporais, inclusive com a utilização de variáveis explicativas, que reflitam a influência do cenário macroeconômico na arrecadação tributária, com o intuito de melhorar a acurácia da previsão da arrecadação. Para tanto, foram aplicadas as metodologias de modelos dinâmicos univariados, multivariados, quais sejam, Função de Transferência, Auto-regressão Vetorial (VAR), VAR com correção de erro (VEC), Equações Simultâneas, e de modelos Estruturais. O trabalho tem abrangência regional e limita-se à análise de três séries mensais da arrecadação, relativas ao Imposto de Importação, Imposto Sobre a Renda das Pessoas Jurídicas e Contribuição para o Financiamento da Seguridade Social - Cofins, no âmbito da jurisdição do estado de São Paulo, no período de 2000 a 2007. Os resultados das previsões dos modelos acima citados são comparados entre si, com a modelagem ARIMA e com o método dos indicadores, atualmente utilizado pela Secretaria da Receita Federal do Brasil (RFB) para previsão anual da arrecadação tributária, por meio da raiz do erro médio quadrático de previsão (RMSE). A redução média do RMSE foi de 42% em relação ao erro cometido pelo método dos indicadores e de 35% em relação à modelagem ARIMA, além da drástica redução do erro anual de previsão. A utilização de metodologias de séries temporais para a previsão da arrecadação de receitas federais mostrou ser uma alternativa viável ao método dos indicadores, contribuindo para previsões mais precisas, tornando-se ferramenta segura de apoio para a tomada de decisões dos gestores. / The main objective of this work is to offer alternative methods for federal tax revenue forecasting, based on methodologies of time series, inclusively with the use of explanatory variables, which reflect the influence of the macroeconomic scenario in the tax collection, for the purpose of improving the accuracy of revenues forecasting. Therefore, there were applied the methodologies of univariate dynamic models, multivariate, namely, Transfer Function, Vector Autoregression (VAR), VAR with error correction (VEC), Simultaneous Equations, and Structural Models. The work has a regional scope and it is limited to the analysis of three series of monthly tax collection of the Import Duty, the Income Tax Law over Legal Entities Revenue and the Contribution for the Social Security Financing Cofins, under the jurisdiction of the state of São Paulo in the period from 2000 to 2007. The results of the forecasts from the models above were compared with each other, with the ARIMA moulding and with the indicators method, currently used by the Secretaria da Receita Federal do Brasil (RFB) to annual foresee of the tax collection, through the root mean square error of approximation (RMSE). The average reduction of RMSE was 42% compared to the error committed by the method of indicators and 35% of the ARIMA model, besides the drastic reduction in the annual forecast error. The use of time-series methodologies to forecast the collection of federal revenues has proved to be a viable alternative to the method of indicators, contributing for more accurate predictions, becoming a safe support tool for the managers decision making process.
38

Modelos de regressão estáticos e dinâmicos para taxas ou proporções: uma abordagem bayesiana / Regression of static and dynamic models for proportions or rates: a Bayesian approach

Correia, Leandro Tavares 01 June 2015 (has links)
Este trabalho apresenta um estudo de dados com resposta em intervalos limitados, mais especificamente no intervalo [0,1], como no caso de taxas e proporções. Em diversos casos práticos esta estrutura de dados apresenta uma quantidade não negligenciável de valores extremos (0 e 1) e que modelos usuais não são adequados para sua análise. Para esta situação propomos, por meio de um enfoque Bayesiano, modelos de regressão beta inflacionado de zeros e uns (BIZU) e modelos de regressão Tobit duplamente censurado adaptados nesse intervalo. Técnicas de diagnóstico e qualidade do ajuste também são discutidas. Apresentamos a análise desta estrutura de dados no contexto de série de tempo por meio da abordagem Bayesiana de modelos dinâmicos. Estudos de comportamento e previsão de séries de tempo foram explorados utilizando técnicas de Monte Carlo sequencial, conhecidas como filtro de partículas. Particularidades e competitividade entre as duas classes de modelos também foram discutidas. / This paper presents a study focused on observations in a limited interval , more specifically in [0,1] , such as rate and proportion data. In many practical cases this data structure has a considerable amount of extreme values (0 and 1) and usual classical models are not suitable for this type of data set. We propose two class of regression models to deal with this context: beta inflated of zeros and ones (BIZU) models and Tobit doubly censored models adapted in this interval. Fit quality and diagnostic techniques are also discussed. Time series of proportions are also developed through Bayesian dynamic models. Forecasting and behavioral analysis were explored using sequential Monte Carlo techniques, known as particle filters. Particularities and competitiveness between the two classes of models were also discussed as well.
39

Modelos de regressão estáticos e dinâmicos para taxas ou proporções: uma abordagem bayesiana / Regression of static and dynamic models for proportions or rates: a Bayesian approach

Leandro Tavares Correia 01 June 2015 (has links)
Este trabalho apresenta um estudo de dados com resposta em intervalos limitados, mais especificamente no intervalo [0,1], como no caso de taxas e proporções. Em diversos casos práticos esta estrutura de dados apresenta uma quantidade não negligenciável de valores extremos (0 e 1) e que modelos usuais não são adequados para sua análise. Para esta situação propomos, por meio de um enfoque Bayesiano, modelos de regressão beta inflacionado de zeros e uns (BIZU) e modelos de regressão Tobit duplamente censurado adaptados nesse intervalo. Técnicas de diagnóstico e qualidade do ajuste também são discutidas. Apresentamos a análise desta estrutura de dados no contexto de série de tempo por meio da abordagem Bayesiana de modelos dinâmicos. Estudos de comportamento e previsão de séries de tempo foram explorados utilizando técnicas de Monte Carlo sequencial, conhecidas como filtro de partículas. Particularidades e competitividade entre as duas classes de modelos também foram discutidas. / This paper presents a study focused on observations in a limited interval , more specifically in [0,1] , such as rate and proportion data. In many practical cases this data structure has a considerable amount of extreme values (0 and 1) and usual classical models are not suitable for this type of data set. We propose two class of regression models to deal with this context: beta inflated of zeros and ones (BIZU) models and Tobit doubly censored models adapted in this interval. Fit quality and diagnostic techniques are also discussed. Time series of proportions are also developed through Bayesian dynamic models. Forecasting and behavioral analysis were explored using sequential Monte Carlo techniques, known as particle filters. Particularities and competitiveness between the two classes of models were also discussed as well.

Page generated in 0.261 seconds