Spelling suggestions: "subject:"análise dde regressão e dde correlação"" "subject:"análise dde regressão e dee correlação""
1 |
As distribuições Kumaraswamy-log-logística e Kumaraswamy-logística / Distributions Kumaraswamy-log-logistic and Kumaraswamy-logisticSantana, Tiago Viana Flor de 18 October 2010 (has links)
Neste trabalho apresenta-se duas novas distribuições de probabilidade obtidas de dois métodos de generalização da distribuição log-logística com dois parâmetros (LL(?,?)). O primeiro método descrito em Marshall e Olkin (1997) transforma a nova distribuição, agora com três parâmetros e denominada distribuição log-logística modificada (LLM (v,?,?)), mais flexível porém, não muda a forma geral da função de taxa de falha e o novo parâmetro v, não influência no cálculo da assimetria e curtose. O segundo método utiliza a classe de distribuições Kumaraswamy proposta por Cordeiro e Castro (2010), para construir a nova distribuição de probabilidade, denominada distribuição Kumaraswamy log-logística (Kw-LL(a,b,?,?)), a qual considera dois novos parâmetros a e b obtendo ganho nas formas da função de taxa de falha, que agora além de modelar dados onde a função de taxa de falha tem forma decrescente e unimodal, modela forma crescente e forma de U. Também foi proposto as distribuições logística modificada (LM (v,µ,?)) e Kumaraswamy logística (Kw-L (a,b, µ,?)$) para a variável Y=log(T), em que T ~ LLM (v,?,?) no caso da distribuição logística modificada e T ~ Kw-LL(a,b,?,?) no caso da distribuição Kw-L. Com reparametrização ? = exp(µ) e ? = 1/?. Da mesma forma que a distribuição LLM, não há ganho quanto a forma da função de taxa de falha da distribuição logística modificada e o parâmetro v não contribuiu para o cálculo da assimetria e curtose desta distribuição. O modelo de regressão locação e escala foi proposto para ambas as distribuições. Por fim, utilizou-se dois conjuntos de dados, para exemplificar o ganho das novas distribuições Kw-LL e Kw-L em relação as distribuições log-logística e logística. O primeiro conjunto refere-se a dados de tempo até a soro-reversão de 143 crianças expostas ao HIV por via vertical, nascidas no Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto no período de 1995 a 2001, onde as mães não foram tratadas. O segundo conjunto de dados refere-se ao tempo até a falha de um tipo de isolante elétrico fluido submetivo a sete níveis de voltagem constante. / In this work, are presented two new probability distributions, obtained from two generalization methods of the log-logistic distribution, with two parameters (LL (?, ?)). The first method described in Marshall e Olkin (1997) turns the new distribution, now with three parameters, called modified log-logistic distribution (LLM(v, ?, ?)). This distribution is more flexible, but, does not change the general shape of the failure rate function, as well as the new parameter v, does not influence the calculus of skewness and kurtosis. The second method, uses the class of distributions Kumaraswamy proposed by Cordeiro and Castro (2010). To build the new probability distribution, called Kumaraswamy log-logistic distribution (Kw-LL(a,b,?,?)), which considers two new parameters a and b gaining in the forms of failure rate function, that now, even modeling data where the failure rate function has decreasing and unimodal shape, models the increasing form and the U-shaped. Also, were proposed the distributions modified logistic (LM (v,µ,?)) and Kumaraswamy logistics (Kw-L (a,b,µ,?)) for the variable Y=log(T), where T ~ LLM(v,?,?) in the case of the modified logistic distribution and T ~ Kw-LL (a,b,?,?) in the case of Kw-L distribution, with reparametrization ? =exp(µ) and ? = 1/?. As in the distribution LLM, there is no gain for the shape of the failure rate function of modified logistic distribution and the parameter v does not contribute to the calculation of skewness and kurtosis of the distribution. The location and scale regression models were proposed for both distributions. As illustration, were used two datasets to exemplify the gain of the new distributions Kw-LL and Kw-L compared with the log-logistic and logistic distributions. The first dataset refers to the data of time until soro-reversion of 143 children exposed to HIV through vertical, born in the Hospital of the Medical School of Ribeirão Preto during the period 1995 to 2001, where mothers were not treated. The second dataset refers to the time until the failure of a type of electrical insulating fluid subjected to seven constant voltage levels
|
2 |
Modelos de regressão log-gama generalizado com fração de cura / The generalized log-gama mixture model with covariatesRizzato, Fernanda Bührer 08 February 2007 (has links)
Neste trabalho considera-se uma reparametrização no modelo log-gama generalizado para a inclusão de dados com sobreviventes de longa duração. Os modelos tentam estimar separadamente os efeitos das covariáveis na aceleração ou desaceleração no tempo e na fração de sobreviventes que é a proporção da população para o qual o evento não ocorre. A função logística é usada para o modelo de regressão com fração de cura. Os parâmetros do modelo, serão estimados através do método de máxima verossimilhança. Alguns métodos de influência, como a influência local e a influência local total de um indivíduo, serão introduzidos, calculados, analisados e discutidos. Finalmente, um conjunto de dados médicos será analisado sob o modelo log-gama generalizado com fração de cura. Uma análise de resíduos será executada para verificar a qualidade de ajuste do modelo. / In this work the generalized log-gama model is modified for possibility that long-term survivors are present in the data . The models attempt to estimate separately the effects of covariates on the accelaration/decelaration of the timing of a given event and surviving fraction; that is, the proportion of the population for which the event never occurs. The logistic function is used for the regression model of the surviving fraction. Inference for the model parameters is considered via maximum likelihood. Some influence methods, such as the local influence, total local influence of an individual are derived, analyzed and discussed. Finally, a data set from the medical area is analyzed under log-gama generalized mixture model. A residual analysis is performed in order to select an appropriate model.
|
3 |
Análise Bayesiana de ensaios fatoriais 2k usando os princípios dos efeitos esparsos, da hierarquia e da hereditariedade / Bayesian analysis of 2k factorial designs using the sparse eects, hierarchy and heredity principlesBiz, Guilherme 29 January 2010 (has links)
No Planejamento de experimentos para o ajuste de modelos polinomiais envolvendo k fatores principais e respectivas interações, e bastante comum a utilização dos fatoriais 2k, 3k ou frações dos mesmos. Para as analises dos resultados desses experimentos, freqüentemente se considera o princípio da hereditariedade, ou seja, uma vez constatada uma interação significativa entre fatores, os fatores que aparecem nesta interação e respectivas interações devem também estar presentes no modelo. Neste trabalho, esse princípio e incorporado diretamente a priori, para um método de seleção de variáveis Bayesiana, seguindo as idéias propostas por Chipman, Hamada e Wu (1997), porem com uma alteração dos valores sugeridos pelos autores para os hiperparâmetros. Essa alteração, proposta neste trabalho, promove uma melhoria considerável na metodologia original. A metodologia e então ilustrada por meio da analise dos resultados de um experimento fatorial para a elaboração de biofilmes de amido originado da ervilha. / In experimental planning for adjustment of polynomials models involving k main factors and their interactions, it is frequent to adopt the 2k, 3k designs or its fractions. Furthermore, it is not unusual, when analysing the results of such experiments, to consider the heredity principle. In other words, once detected a signicant interaction between factors, the factors that appear in this interaction and respective interactions should also be present in the model. In this work, this principle is incorporated directly in the prior, following the ideas proposed by Chipman, Hamada and Wu (1997), but changing some of the hyperparameters. What improves considerably the original methodology. Finally the methodology is illustrated by the analysis of the results of an experiment for the elaboration of pea starch biolms.
|
4 |
Análise de influência local no modelo de regressão logística / Analysis of local influence with the logistic regression modelSouza, Édila Cristina de 09 February 2006 (has links)
Uma etapa importante após a formulação e ajuste de um modelo de regressão é a análise de diagnóstico. A regressão logística tem se constituído num dos principais métodos de modelagem estatística de dados; mesmo quando a resposta de interesse não é originalmente do tipo binário, alguns pesquisadores tem dicotomizado a resposta de modo que a probabilidade de sucesso pode ser modelado através da regressão logística. Neste trabalho consideramos um estudo de diagnóstico no modelo da regressão logística, utilizando as medidas proposta por Pregibon (1981) e a técnica de influência local Cook (1986). Investigamos a aplicação da técnica de influência local sob diferentes esquemas de perturbação. Como ilustração, apresentamos a aplicação dos resultados desenvolvidos em dois conjuntos de dados reais. / An important stage after the formularization and adjustment of a regression model is the diagnosis analysis. Logistic regression is one of the main methods for modeling data and even when the response of interest is is not originally of the binary type, some researchers have dichotomized the response in a way that the success probability can be modeled through logistic regression. In this work we consider a study of diagnosis methods with logistic regression, using the measures proposed by Pregibon (1981) and the local influence technique of Cook (1986). We investigate the application of the local influence technique of under different types of disturbance. As as illustration, we show the application of the developed results obtained with real data sets.
|
5 |
Análise Bayesiana de ensaios fatoriais 2k usando os princípios dos efeitos esparsos, da hierarquia e da hereditariedade / Bayesian analysis of 2k factorial designs using the sparse eects, hierarchy and heredity principlesGuilherme Biz 29 January 2010 (has links)
No Planejamento de experimentos para o ajuste de modelos polinomiais envolvendo k fatores principais e respectivas interações, e bastante comum a utilização dos fatoriais 2k, 3k ou frações dos mesmos. Para as analises dos resultados desses experimentos, freqüentemente se considera o princípio da hereditariedade, ou seja, uma vez constatada uma interação significativa entre fatores, os fatores que aparecem nesta interação e respectivas interações devem também estar presentes no modelo. Neste trabalho, esse princípio e incorporado diretamente a priori, para um método de seleção de variáveis Bayesiana, seguindo as idéias propostas por Chipman, Hamada e Wu (1997), porem com uma alteração dos valores sugeridos pelos autores para os hiperparâmetros. Essa alteração, proposta neste trabalho, promove uma melhoria considerável na metodologia original. A metodologia e então ilustrada por meio da analise dos resultados de um experimento fatorial para a elaboração de biofilmes de amido originado da ervilha. / In experimental planning for adjustment of polynomials models involving k main factors and their interactions, it is frequent to adopt the 2k, 3k designs or its fractions. Furthermore, it is not unusual, when analysing the results of such experiments, to consider the heredity principle. In other words, once detected a signicant interaction between factors, the factors that appear in this interaction and respective interactions should also be present in the model. In this work, this principle is incorporated directly in the prior, following the ideas proposed by Chipman, Hamada and Wu (1997), but changing some of the hyperparameters. What improves considerably the original methodology. Finally the methodology is illustrated by the analysis of the results of an experiment for the elaboration of pea starch biolms.
|
6 |
As distribuições Kumaraswamy-log-logística e Kumaraswamy-logística / Distributions Kumaraswamy-log-logistic and Kumaraswamy-logisticTiago Viana Flor de Santana 18 October 2010 (has links)
Neste trabalho apresenta-se duas novas distribuições de probabilidade obtidas de dois métodos de generalização da distribuição log-logística com dois parâmetros (LL(?,?)). O primeiro método descrito em Marshall e Olkin (1997) transforma a nova distribuição, agora com três parâmetros e denominada distribuição log-logística modificada (LLM (v,?,?)), mais flexível porém, não muda a forma geral da função de taxa de falha e o novo parâmetro v, não influência no cálculo da assimetria e curtose. O segundo método utiliza a classe de distribuições Kumaraswamy proposta por Cordeiro e Castro (2010), para construir a nova distribuição de probabilidade, denominada distribuição Kumaraswamy log-logística (Kw-LL(a,b,?,?)), a qual considera dois novos parâmetros a e b obtendo ganho nas formas da função de taxa de falha, que agora além de modelar dados onde a função de taxa de falha tem forma decrescente e unimodal, modela forma crescente e forma de U. Também foi proposto as distribuições logística modificada (LM (v,µ,?)) e Kumaraswamy logística (Kw-L (a,b, µ,?)$) para a variável Y=log(T), em que T ~ LLM (v,?,?) no caso da distribuição logística modificada e T ~ Kw-LL(a,b,?,?) no caso da distribuição Kw-L. Com reparametrização ? = exp(µ) e ? = 1/?. Da mesma forma que a distribuição LLM, não há ganho quanto a forma da função de taxa de falha da distribuição logística modificada e o parâmetro v não contribuiu para o cálculo da assimetria e curtose desta distribuição. O modelo de regressão locação e escala foi proposto para ambas as distribuições. Por fim, utilizou-se dois conjuntos de dados, para exemplificar o ganho das novas distribuições Kw-LL e Kw-L em relação as distribuições log-logística e logística. O primeiro conjunto refere-se a dados de tempo até a soro-reversão de 143 crianças expostas ao HIV por via vertical, nascidas no Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto no período de 1995 a 2001, onde as mães não foram tratadas. O segundo conjunto de dados refere-se ao tempo até a falha de um tipo de isolante elétrico fluido submetivo a sete níveis de voltagem constante. / In this work, are presented two new probability distributions, obtained from two generalization methods of the log-logistic distribution, with two parameters (LL (?, ?)). The first method described in Marshall e Olkin (1997) turns the new distribution, now with three parameters, called modified log-logistic distribution (LLM(v, ?, ?)). This distribution is more flexible, but, does not change the general shape of the failure rate function, as well as the new parameter v, does not influence the calculus of skewness and kurtosis. The second method, uses the class of distributions Kumaraswamy proposed by Cordeiro and Castro (2010). To build the new probability distribution, called Kumaraswamy log-logistic distribution (Kw-LL(a,b,?,?)), which considers two new parameters a and b gaining in the forms of failure rate function, that now, even modeling data where the failure rate function has decreasing and unimodal shape, models the increasing form and the U-shaped. Also, were proposed the distributions modified logistic (LM (v,µ,?)) and Kumaraswamy logistics (Kw-L (a,b,µ,?)) for the variable Y=log(T), where T ~ LLM(v,?,?) in the case of the modified logistic distribution and T ~ Kw-LL (a,b,?,?) in the case of Kw-L distribution, with reparametrization ? =exp(µ) and ? = 1/?. As in the distribution LLM, there is no gain for the shape of the failure rate function of modified logistic distribution and the parameter v does not contribute to the calculation of skewness and kurtosis of the distribution. The location and scale regression models were proposed for both distributions. As illustration, were used two datasets to exemplify the gain of the new distributions Kw-LL and Kw-L compared with the log-logistic and logistic distributions. The first dataset refers to the data of time until soro-reversion of 143 children exposed to HIV through vertical, born in the Hospital of the Medical School of Ribeirão Preto during the period 1995 to 2001, where mothers were not treated. The second dataset refers to the time until the failure of a type of electrical insulating fluid subjected to seven constant voltage levels
|
7 |
Análise das desigualdades de acessibilidade ao trabalho e renda em São Paulo. / Analysis of the inequalities in accessibility to work and income in São Paulo.Graça, Nuno Rezende de Alencastro 26 November 2018 (has links)
Este estudo tem como objetivo avaliar as relações espaciais entre acessibilidade a empregos e desigualdades de renda na cidade de São Paulo. A acessibilidade e sua relação com as desigualdades sociais têm sido cada vez mais discutidas em pesquisas recentes e, embora alguns estudos tenham abordado questões de desigualdade de acessibilidade, pouco se discutiu sobre a influência dos dados de tempo de viagem nas medidas de acessibilidade e nos subsequentes resultados de modelagem. Para avaliar a distribuição espacial por modo, este trabalho explora três fontes de dados diferentes, a saber, uma rede em SIG desenvolvida usando dados AVL, uma matriz O/D de um modelo de transporte de quatro etapas e o tempo de viagem do API do Google Maps. Evidências de auto correlação espacial entre acessibilidade e distribuição de renda foram encontradas pela aplicação do índice de Moran nos resíduos de regressão global com base em todos os testes de fontes de dados, cujos valores variaram de 0,51 até 0,8 para ambos os modos de transporte público e individual. Um modelo GWR foi calculado, e os parâmetros resultantes indicaram uma relação positiva entre acessibilidade e renda, com valores R2 variando de 50% a 78%, dependendo da fonte de dados e do modo de transporte. Para efeitos de comparação, foi produzida uma análise comparativa das classes de valores de acessibilidade e renda para avaliar os resultados da regressão por áreas distintas da cidade. Uma conclusão geral é que a relação entre baixa acessibilidade e baixa renda é marcante e mais significativa do que a existente entre alta acessibilidade e alta renda. / This study aims to evaluate the spatial relationships between accessibility to jobs and income inequalities in the city of São Paulo. Accessibility and its relationship with social inequalities have been increasingly discussed in recent researches, and although some studies have been tackling accessibility inequalities issues, not much have been discussed regarding the influence of travel time data on accessibility measures and subsequent modeling results. In order to evaluate spatial distribution by mode, this work explores three different data sources, namely a GIS network developed using AVL data, an OD matrix from a four-stage transportation model and Google´s Map API travel time. Evidences of spatial autocorrelation between accessibility and income distribution were found by the application of Moran index on global regression residuals based on all data sources tests, which values varied from 0,51 until 0,8 for both transit and private mode. A GWR model was computed, and the resulting parameters indicated a positive relation between accessibility and income, with R2 varying from 50% to 78% depending on the data source and transport mode. For comparison effects, it was produced a comparative analysis of the classes of values of accessibility and income to evaluate the results of the regression by distinct areas of the city. An overall conclusion is that the relation between low accessibility and low income is marked and more significant than the relation between high accessibility and high income.
|
8 |
Análise de influência local no modelo de regressão logística / Analysis of local influence with the logistic regression modelÉdila Cristina de Souza 09 February 2006 (has links)
Uma etapa importante após a formulação e ajuste de um modelo de regressão é a análise de diagnóstico. A regressão logística tem se constituído num dos principais métodos de modelagem estatística de dados; mesmo quando a resposta de interesse não é originalmente do tipo binário, alguns pesquisadores tem dicotomizado a resposta de modo que a probabilidade de sucesso pode ser modelado através da regressão logística. Neste trabalho consideramos um estudo de diagnóstico no modelo da regressão logística, utilizando as medidas proposta por Pregibon (1981) e a técnica de influência local Cook (1986). Investigamos a aplicação da técnica de influência local sob diferentes esquemas de perturbação. Como ilustração, apresentamos a aplicação dos resultados desenvolvidos em dois conjuntos de dados reais. / An important stage after the formularization and adjustment of a regression model is the diagnosis analysis. Logistic regression is one of the main methods for modeling data and even when the response of interest is is not originally of the binary type, some researchers have dichotomized the response in a way that the success probability can be modeled through logistic regression. In this work we consider a study of diagnosis methods with logistic regression, using the measures proposed by Pregibon (1981) and the local influence technique of Cook (1986). We investigate the application of the local influence technique of under different types of disturbance. As as illustration, we show the application of the developed results obtained with real data sets.
|
9 |
Modelos de regressão log-gama generalizado com fração de cura / The generalized log-gama mixture model with covariatesFernanda Bührer Rizzato 08 February 2007 (has links)
Neste trabalho considera-se uma reparametrização no modelo log-gama generalizado para a inclusão de dados com sobreviventes de longa duração. Os modelos tentam estimar separadamente os efeitos das covariáveis na aceleração ou desaceleração no tempo e na fração de sobreviventes que é a proporção da população para o qual o evento não ocorre. A função logística é usada para o modelo de regressão com fração de cura. Os parâmetros do modelo, serão estimados através do método de máxima verossimilhança. Alguns métodos de influência, como a influência local e a influência local total de um indivíduo, serão introduzidos, calculados, analisados e discutidos. Finalmente, um conjunto de dados médicos será analisado sob o modelo log-gama generalizado com fração de cura. Uma análise de resíduos será executada para verificar a qualidade de ajuste do modelo. / In this work the generalized log-gama model is modified for possibility that long-term survivors are present in the data . The models attempt to estimate separately the effects of covariates on the accelaration/decelaration of the timing of a given event and surviving fraction; that is, the proportion of the population for which the event never occurs. The logistic function is used for the regression model of the surviving fraction. Inference for the model parameters is considered via maximum likelihood. Some influence methods, such as the local influence, total local influence of an individual are derived, analyzed and discussed. Finally, a data set from the medical area is analyzed under log-gama generalized mixture model. A residual analysis is performed in order to select an appropriate model.
|
10 |
Uma revisão da análise de experimentos unifatoriais com tratamentos de natureza quantitativa: comparações múltiplas ou análise de regressão? / A review of the analysis of unifactorial experiments with quantitative treatments: Multiple Comparisons or Regression Analysis?Rodrigues, Josiane 21 June 2011 (has links)
O presente trabalho teve por objetivo fazer uma reflexão acerca do uso de testes de comparações múltiplas e da análise de regressão no estudo de experimentos unifatoriais cujos tratamentos são níveis de um fator quantitativo, para comparar os resultados e informações que são trazidas por cada uma dessas análises, verificando suas eventuais vantagens e limitações. De acordo com os objetivos propostos pelo presente trabalho, foi feita, depois de realizada a revisão bibliográfica sobre a análise de regressão e alguns dos testes de comparação de médias, um levantamento acerca de artigos cujo objetivo principal era o de fazer uma investigação de trabalhos publicados em jornais, revistas ou periódicos nos quais se utilizou algum procedimento de comparação de médias verificando assim a adequação desses testes às análises estatísticas realizadas. Essa revisão demonstrou que um número significativo de pesquisadores utiliza de procedimentos de comparações múltiplas em análises estatísticas de experimentos unifatoriais nos quais os tratamentos envolvidos são níveis de um fator quantitativo, o que é considerado por alguns como um procedimento inadequado. Assim sendo, foram analisados também dados de experimentos unifatoriais com tratamentos dessa ordem, que foram submetidos a uma análise de regressão e também a um procedimento de comparação múltipla das médias, com o objetivo de verificar quais as vantagens e limitações de cada um desses procedimentos na análise do experimento em questão. Nessa comparação ficou claro que o uso de procedimentos de comparações múltiplas na análise de experimentos unifatoriais envolvendo tratamentos quantitativos pode resultar na redução de informações e também da eficiência dos resultados, quando procedimentos mais apropriados, nesse caso, a análise de regressão, estão disponíveis para analisar dados dessa natureza. / The present work had like purpose to make a reflection about the use of multiple comparison tests and of the regression analysis on learning of unifactorial experiments whose treatments are levels of a quantitative factor, to compare the results and information are brought for each one of the analysis, verifying the eventual advantages and limitations of them. According to the purposes of the present work, was realized, later the bibliographical revision about regression analysis and some of the mean comparison tests was done, a survey about articles whose principal aim was to make a raising of works published at newspapers, magazines or periodicals where was used some mean comparison procedure verifying the adaptation of these tests to the statistical analysis realized. This revision demonstrated that a revealing number of searchers use multiple comparison procedures at analysis of unifactorial experiments whose treatments involved are levels of a quantitative factor, what is considered for some searchers like an inadequate procedure. Of this way, the data of unifactorial experiments, whose treatments were levels of a quantitative factor, were analyzed too, that were submitted to a regression analysis and to a multiple comparison procedure, with the aim of verifying the advantages and limitations of each one of these procedures at the analysis of the experiment. At this comparison, was clear that the use of multiple comparison procedures at analysis of experiments involving quantitative experiments can result in loss of information and reduced efficiency of the results, when more appropriate procedures, in this case, the regression analysis, are available to analyze this kind of data.
|
Page generated in 0.1233 seconds