Global ETD Search

751	Contribuições sobre o envelope simulado na análise de diagnóstico em modelos de regressão / Contributions on the simulated envelope for diagnostic analysis in regression models Fernandes, Victor Vinicius 30 April 2019 (has links) O envelope simulado é um método da análise de diagnóstico, utilizado para avaliar a veracidade da hipótese referente a distribuição de probabilidade assumida para a variável resposta em um modelo de regressão. Neste trabalho, descrevemos alguns procedimentos para a sua obtenção e, posteriormente, propomos um método para a rejeição do modelo a partir do envelope. No intuito de comparar nosso procedimento com as demais propostas, realizamos um estudo de simulação de Monte Carlo em duas classes de modelos de regressão. Os resultados apontam que o método proposto apresenta boa performance, uma vez que o mesmo fornece taxas estáveis de rejeição do modelo sob a distribuição correta. Já para as demais metodologias, além de possuírem um custo computacional maior, a taxa de rejeição do modelo correto cresce conforme aumenta-se o tamanho amostral. Complementando os resultados, realizamos também a comparação do gráfico de probabilidade normal e meio normal com envelope através de simulações de Monte Carlo. Os estudos sugeriram que, de maneira geral, o gráfico normal demonstrou melhor desempenho, principalmente com a utilização do procedimento proposto. Por fim, aplicamos a dados reais, provenientes da Pesquisa Nacional de Saúde (PNS) de 2013, nosso método de rejeição do modelo e as demais propostas. Constatou-se que para estes dados, nosso método sugeriu uma decisão contrária a fornecida pelos outros procedimentos. / The simulated envelope is a diagnostic analysis method used to evaluate the hypothesis about the probability distribution assumed for the response variable in a regression model. In this work, we describe some procedures to obtain the simulated envelope and, later, we propose a method to decide if we should reject a model using the envelope. In order to compare our procedure with other proposals, we performed a Monte Carlo simulation study in two classes of regression models. The results indicate that the proposed method presents good performance, since it provides stable rejection rates of the model under the correct distribution. About other methodologies, besides having a higher computational cost, the rejection rate under the correct model increases as the sample size rises. In addition, we also compare the full normal plot and the half normal plot with envelope using Monte Carlo simulations studies. The results suggest that, in general, the full normal plot performs better, especially with the proposed procedure. Finally, we apply our decision method and the other proposals to real data from the National Health Survey (Brazil) of 2013. To these data, our method suggested a different decision from that one provided by the other procedures. Análise de diagnóstico Diagnostic analysis Gráfico de probabilidade normal Modelos de regressão Monte Carlo simulation Normal probability plot Regression models Residual Resíduo Simulação de Monte Carlo
752	Análise de diagnóstico em modelos de regressão ZAGA e ZAIG / Diagnostic analysis in ZAGA and ZAIG regression models Rodrigues, Juliana Scudilio 10 March 2016 (has links) Resíduos desempenham um papel importante na verificação do ajuste do modelo e na idenfiticação de observações discrepantes e/ou influentes. Neste trabalho, estudamos duas classes de resíduos para os modelos de regressão gama inflacionados no zero (ZAGA) e gaussiana inversa inflacionados no zero (ZAIG). Essas classes de resíduos são uma função de um resíduo para o componente contínuo do modelo e da estimativa de máxima verossimilhança da probabilidade da observação assumir o valor zero. Estudos de simulação de Monte Carlo foram realizados para examinar as propriedades dessas classes de resíduos em ambos os modelos de regressão (ZAGA e ZAIG). Os resultados mostraram que um resíduo de uma dessas classes tem algumas propriedades semelhantes à da distribuição normal padrão nos modelos estudados. Além desse objetivo principal, descrevemos os modelos de regressão ZAGA e ZAIG, estudamos propriedades de alguns resíduos em modelos lineares generalizados com resposta gama e gaussiana inversa e discutimos outros aspectos de análise de diagnóstico nos modelos ZAGA e ZAIG. Para finalizar, foi feita uma aplicação com dados reais de fundos de investimentos, em que ajustamos o modelo ZAIG, para exemplificar os tópicos discutidos e mostrar a importância desses modelos e as vantagens de um dos resíduos estudados na análise de dados reais. / Residuals play an important role in checking model adequacy and in the identification of outliers and influential observations. In this paper, we studied two class of residuals for the zero adjusted gamma regression model (ZAGA) and the zero adjusted inverse Gaussian regression model (ZAIG). These classes of residuals are function of a residual for the continuous component of the model and the maximum likelihood estimate of the probability of the observation assuming the zero value. Monte Carlo simulation studies are performed to examine the properties of this class of residuals in both models (ZAGA and ZAIG). Results showed that a residual of one of these class has some similar properties to the standard normal distribution in the studied models. We also described ZAGA and ZAIG regression models, studied properties of some residuals in generalized linear models with response gamma and inverse Gaussian and discussed other aspects of diagnostic analysis in ZAGA and ZAIG models. To finsih,we presented a real data set application from invesment funds of Brazil. We fitted the ZAIG model to illustrate the topics discussed and showed the importance of these models and the advantages of one of the studied residuals in the analysis of real dataset. Análise de diagnóstico Diagnostic analysis Fundo de investimento Inflated regression models Investiment funds Modelo ZAGA Modelo ZAIG Modelos de regressão inacionado no zero Quantile residual Resíduo quantílico ZAGA models ZAIG models
753	Condições de regularidade para o modelo de regressão com parametrização geral / Regularity conditions for the regression model with general parameterization Loose, Laís Helen 24 May 2019 (has links) Este trabalho objetiva apresentar um estudo detalhado e sistemático de algumas condições de regularidade para inferências baseadas em máxima verossimilhança no modelo de regressão elíptico multivariado com parametrização geral proposto em Lemonte e Patriota (2011). O modelo em estudo tem vários modelos importantes como casos particulares, entre eles temos os modelos lineares e não lineares homocedásticos e heterocedásticos, modelos mistos, modelos heterocedásticos com erros nas variáveis e na equação, modelos multiníveis, entre outros. As condições de regularidade estudadas estão associadas à identificabilidade do modelo, à existência, à unicidade, à consistência e à normalidade assintótica dos estimadores de máxima verossimilhança (EMV) e à distribuição assintótica das estatísticas de testes. Para isso, são enunciadas as condições suficientes e formalizados os teoremas que garantem a existência, unicidade, consistência e normalidade assintótica dos EMV e a distribuição assintótica das estatísticas de teste usuais. Além disso, os resultados de cada teorema são comentados e as demonstrações são apresentadas com detalhes. Inicialmente, considerou-se o modelo sob a suposição de normalidade dos erros, para, na sequência, ser possível generalizar os resultados para o caso elíptico. A fim de exemplificar os resultados obtidos, foram verificadas, analiticamente, a validade de algumas condições e os resultados de alguns teoremas em casos particulares do modelo geral. Ademais, foi desenvolvido um estudo de simulação em que uma das condições é violada adotando o modelo heterocedástico com erros nas variáveis e na equação. Por meio de simulações de Monte Carlo foram avaliados os impactos sobre a consistência e normalidade assintótica dos EMV. / This work aims to present a detailed and systematic study of some regularity conditions for inferences based on maximum likelihood in the multivariate elliptic regression model with general parameterization proposed in Lemonte and Patriota (2011). The model under study has several important models as particular cases, among them we have the linear and non-linear homocedastic and heterocedastic models, mixed models, heterocedastic models with errors in the variables and in the equation, multilevel models, among others. The regularity conditions studied are associated with the identifiability of the model, existence, uniqueness, consistency and asymptotic normality of the maximum likelihood estimators (MLE) and the asymptotic distribution of some test statistics. Sufficient conditions are stated to guarantee the existence, unicity, consistency and asymptotic normality of the MLE and the asymptotic distribution of the usual test statistics. In addition, the results of each theorem are commented and the proof are presented in detail. Initially, the model was considered under the assumption of normality of the errors, and then the results were generalized for the elliptical case. In order to exemplify the attained results, some particular cases of the general model are analyzed analytically, the validity of some conditions and the results of some theorems are verified. In addition, a simulation study is developed with one of the conditions violated under the heterocedastic model with errors in the variables and in the equation. By means of Monte Carlo simulations, the impacts of this violation on the consistency and the asymptotic normality of the MLE are evaluated. Asymptotic properties of estimators Asymptotic theory Distribuições elípticas Elliptical distribution Estimador de máxima verossimilhança Maximum likelihood estimator Modelos de regressão Regression models Teoria assintótica
754	Estimativa do torque de instalação de fundações por estacas helicoidais por meio de resultados de ensaio SPT / Estimation of the installation torque of helical piles using SPT data Silva, Bruno Oliveira da 10 October 2018 (has links) As linhas de transmissão no Brasil são geralmente muito extensas, uma vez que os grandes centros de consumo de energia ficam distantes das usinas hidrelétricas. Por essa razão, a construção e manutenção de linhas de transmissão é de grande importância e, em uma grande porcentagem destas linhas, as estacas helicoidais são usadas como fundações. No entanto, a previsão da profundidade final de instalação destas estacas ainda é um grande desafio para os projetistas, fornecedores de estacas helicoidais e construtoras. A profundidade final destas fundações é controlada pelo torque de instalação; portanto, se o torque necessário para instalar uma estaca pudesse ser calculado com acurácia, com base em suas dimensões, e nos resultados de ensaios de investigação de solo in situ (SPT), a previsão de comprimentos de estaca para estimativas de custos, a definição de equipamentos adequados para instalação e a estimativa da quantidade de seções de estacas a serem transportadas para uma determinada linha de transmissão seriam mais acuradas. Além disso, a capacidade de carga de estacas helicoidais pode ser estimada usando os resultados do torque final de instalação. Sendo assim, para atender à necessidade de se determinar o torque de instalação de fundações helicoidais ainda na fase de projeto, um método simplificado foi desenvolvido e validado com os resultados de 752 estacas helicoidais multi-hélices instaladas em solos predominantemente arenosos, de uma linha de transmissão brasileira. O modelo desenvolvido baseia-se nos resultados de ensaios SPT e considera o efeito de instalação das estacas no solo penetrado. Nesta dissertação é apresentada uma descrição detalhada do método proposto e uma comparação entre os resultados medidos em campo e calculados pelo método. Os resultados da comparação mostram que o método proposto pode estimar com sucesso o torque de instalação de estacas helicoidais. / The transmission lines in Brazil are usually very extensive, since the centers of power consumption are often far from the most hydroelectric plants. For this reason, the construction and maintenance of transmission lines is frequent in this country, and in a large percentage of transmission lines, helical piles are used as guy wire anchors and foundations for transmission towers. However, the estimates of the final embedded depth of numerous helical piles to be used in several towers of the transmission lines is still a challenge for the designers, pile suppliers and contractors. The final depth of helical foundations is controlled by the installation torque; therefore, if the torque necessary to install a helical pile could be accurately calculated based on the pile dimensions and results of in-situ soil tests (SPT), the prediction of pile lengths for costs estimations, the definition of suitable equipment for pile installation, and the estimate of the quantity of helical piles sections to be transported for a particular transmission line would be more precise. Additionally, the uplift capacity of helical piles can be estimated using the results of final installation torque. In order to address the existed need of determining the installation torque of helical foundations during the design phase, a simplified method was developed and validated with the results of 753 multi-helix piles installed in predominantly sandy soils of a Brazilian transmission line. The model proposed is based on the results of SPT tests, and considers the installation effect of helical piles on the soil penetrated. This text presents a detailed description of such method and a comparison between measured and predicted results. The comparison shows that the method proposed can successfully estimate the installation torque of helical piles. Estacas helicoidais Helical piles Installation torque Multivariate linear regression Regressão linear multivariada Sandy soils Solos arenosos SPT SPT N-value Torque de instalação
755	Teoria de conjuntos fuzzy e regressão logística na tomada de decisão para realização de cintilografia das paratiróides / Fuzzy sets theory and logistic regression in decision making for parathyroid scintigraphy investigation Sousa, Clóvis Arlindo de 15 June 2007 (has links) Introdução - Grande parte das cintilografias das paratiróides realizadas antes da primeira cirurgia (paratiroidectomia) resulta negativa, podendo sugerir uma inadequação na solicitação do exame. Objetivo - Desenvolver e comparar dois modelos matemáticos baseados em teoria de conjuntos fuzzy e regressão logística para tomada de decisão na realização de cintilografia das paratiróides, a partir de valores séricos de Cálcio (Ca) e Paratormônio (PTH). Métodos - Da base de registros de cintilografia de paratiróides realizadas no Centro de Medicina Diagnóstica Fleury, em São Paulo, foram identificados 194 pacientes (grupo desenvolvimento) que no período de janeiro de 2000 a dezembro de 2004 tinham Ca e PTH séricos medidos. Foram desenvolvidos dois modelos matemáticos, um deles baseado em regressão logística e o outro em teoria de conjuntos fuzzy, com a finalidade de definir uma medida de indicação para a realização do exame cintilográfico. O desempenho dos modelos foi comparado utilizando curvas ROC pelo teste de Hanley e McNeil. Utilizou-se o grupo teste de 139 pacientes registrados de 2005 a 2006 para avaliar os modelos e verificar sua acurácia. Resultados - No grupo desenvolvimento, a área sob a curva ROC do modelo de regressão logística foi de 0,86 (IC 95%: 0,81-0,91) e do modelo fuzzy foi 0,89 (IC 95%: 0,84-0,93), avaliadas como estatisticamente distintas (p=0,026). O modelo fuzzy se destacou como particularmente útil porque, ao contrário do modelo logístico, mostrou capacidade de utilizar informações de PTH em intervalo em que os valores de Ca mostraram-se pouco discriminantes. No grupo teste, a área para o modelo logístico foi de 0,89 (IC 95%: 0,83-0,95) e para o modelo fuzzy foi de 0,91 (IC 95%: 0,85-0,96) (p=0,128). Conclusões - O modelo fuzzy apresentou desempenho igual ou superior ao modelo de regressão logística. O modelo matemático baseado em teoria de conjuntos fuzzy, no contexto deste estudo, obteve desempenho mais adequado do que o modelo baseado em regressão logística como método para decisão da realização de cintilografia das paratiróides. Por pertinente, destaque-se que, resultado de um exercício metodológico, inferências sobre o comportamento do objeto podem ser impróprias, dada a não representatividade populacional dos dados. / Introduction - A great number of parathyroid scintigraphies performed before the first surgery (parathyroidectomy) results negative suggesting an inadequate use of this test. Objective - The aim of this study was to develop and compare two mathematical models based on logistic regression analysis and fuzzy sets theory to select patients to be submitted to parathyroid scintigraphy based on serum calcium and parathormone values. Methods - From the data registrered on parathyroid scintigrafy database from Fleury - Medical Diagnostic Center, São Paulo, within the period between January 2000 to December 2004, 194 patients with available serum calcium and parathormone were identified. Two mathematical models based on logistic regression analysis and fuzzy sets theory were developed to recognize patients for parathyroid scintigraphy on the basis of laboratorial exams. The logistic regression model was developed using SPSS and the fuzzy model using MatLab. The performances of the models were compared using ROC curves with the test of Hanley e McNeil. The accuracies of both models were also analyzed and compared using a new database (test database) of 139 parathyroid scintigraphies performed between 2005 and 2006. Results - The performances of the models were statistically different (p=0.026). The area under the ROC curves were 0.86 (CI 95%: 0.81-0.91) for the logistic regression model and 0.89 (CI 95%: 0.84-0.93) for the fuzzy model. As an advantage over the logistic model, the latter has shown the ability to draw decision from parathormone information within a not discriminating interval of calcium values. In the test database the ROC area for the logistic regression model the ROC curve area was 0.89 (CI 95%: 0.83-0.95) and for the fuzzy model was 0.91 (CI 95%: 0.85-0.96) (p=0.128). Conclusions - The mathematical model based on fuzzy sets theory fared better than the logistic model in decision making for scintigraphy indication. Nevertheless, one should take heed that inferences should be kept to what concerns model comparison and not the parathyroid scintigraphy itself, once the data analysed was not representative of any population. Cálcio Calcium Cintilografia Fuzzy logic Lógica fuzzy Logistic models Mathematical models Modelos matemáticos Parathormone Parathyroid Paratiróides Paratormônio Radionuclide imaging Regressão logística
756	Contribuições em inferência e modelagem de valores extremos / Contributions to extreme value inference and modeling. Pinheiro, Eliane Cantinho 04 December 2013 (has links) A teoria do valor extremo é aplicada em áreas de pesquisa tais como hidrologia, estudos de poluição, engenharia de materiais, controle de tráfego e economia. A distribuição valor extremo ou Gumbel é amplamente utilizada na modelagem de valores extremos de fenômenos da natureza e no contexto de análise de sobrevivência para modelar o logaritmo do tempo de vida. A modelagem de valores extremos de fenômenos da natureza tais como velocidade de vento, nível da água de rio ou mar, altura de onda ou umidade é importante em estatística ambiental pois o conhecimento de valores extremos de tais eventos é crucial na prevenção de catátrofes. Ultimamente esta teoria é de particular interesse pois fenômenos extremos da natureza têm sido mais comuns e intensos. A maioria dos artigos sobre teoria do valor extremo para modelagem de dados considera amostras de tamanho moderado ou grande. A distribuição Gumbel é frequentemente incluída nas análises mas a qualidade do ajuste pode ser pobre em função de presença de ouliers. Investigamos modelagem estatística de eventos extremos com base na teoria de valores extremos. Consideramos um modelo de regressão valor extremo introduzido por Barreto-Souza & Vasconcellos (2011). Os autores trataram da questão de corrigir o viés do estimador de máxima verossimilhança para pequenas amostras. Nosso primeiro objetivo é deduzir ajustes para testes de hipótese nesta classe de modelos. Derivamos a estatística da razão de verossimilhanças ajustada de Skovgaard (2001) e cinco ajustes da estatística da razão de verossimilhanças sinalizada, que foram propostos por Barndorff-Nielsen (1986, 1991), DiCiccio & Martin (1993), Skovgaard (1996), Severini (1999) e Fraser et al. (1999). As estatísticas ajustadas são aproximadamente distribuídas como uma distribuição $\\chi^2$ e normal padrão com alto grau de acurácia. Os termos dos ajustes têm formas compactas simples que podem ser facilmente implementadas em softwares disponíveis. Comparamos a performance do teste da razão de verossimilhanças, do teste da razão de verossimilanças sinalizada e dos testes ajustados obtidos neste trabalho em amostras pequenas. Ilustramos uma aplicação dos testes usuais e suas versões modificadas em conjuntos de dados reais. As distribuições das estatísticas ajustadas são mais próximas das respectivas distribuições limites comparadas com as distribuições das estatísticas usuais quando o tamanho da amostra é relativamente pequeno. Os resultados de simulação indicaram que as estatísticas ajustadas são recomendadas para inferência em modelo de regressão valor extremo quando o tamanho da amostra é moderado ou pequeno. Parcimônia é importante quando os dados são escassos, mas flexibilidade também é crucial pois um ajuste pobre pode levar a uma conclusão completamente errada. Uma revisão da literatura foi feita para listar as distribuições que são generalizações da distribuição Gumbel. Nosso segundo objetivo é avaliar a parcimônia e flexibilidade destas distribuições. Com este propósito, comparamos tais distribuições através de momentos, coeficientes de assimetria e de curtose e índice da cauda. As famílias mais amplas obtidas pela inclusão de parâmetros adicionais, que têm a distribuição Gumbel como caso particular, apresentam assimetria e curtose flexíveis enquanto a distribuição Gumbel apresenta tais características constantes. Dentre estas distribuições, a distribuição valor extremo generalizada é a única com índice da cauda que pode ser qualquer número real positivo enquanto os índices da cauda das outras distribuições são zero. Observamos que algumas generalizações da distribuição Gumbel estudadas na literatura são não identificáveis. Portanto, para estes modelos a interpretação e estimação de parâmetros individuais não é factível. Selecionamos as distribuições identificáveis e as ajustamos a um conjunto de dados simulado e a um conjunto de dados reais de velocidade de vento. Como esperado, tais distribuições se ajustaram bastante bem ao conjunto de dados simulados de uma distribuição Gumbel. A distribuição valor extremo generalizada e a mistura de duas distribuições Gumbel produziram melhores ajustes aos dados do que as outras distribuições na presença não desprezível de observações discrepantes que não podem ser acomodadas pela distribuição Gumbel e, portanto, sugerimos que tais distribuições devem ser utilizadas neste contexto. / The extreme value theory is applied in research fields such as hydrology, pollution studies, materials engineering, traffic management, economics and finance. The Gumbel distribution is widely used in statistical modeling of extreme values of a natural process such as rainfall and wind. Also, the Gumbel distribution is important in the context of survival analysis for modeling lifetime in logarithmic scale. The statistical modeling of extreme values of a natural process such as wind or humidity is important in environmental statistics; for example, understanding extreme wind speed is crucial in catastrophe/disaster protection. Lately this is of particular interest as extreme natural phenomena/episodes are more common and intense. The majority of papers on extreme value theory for modeling extreme data is supported by moderate or large sample sizes. The Gumbel distribution is often considered but the resulting fit may be poor in the presence of ouliers since its skewness and kurtosis are constant. We deal with statistical modeling of extreme events data based on extreme value theory. We consider a general extreme-value regression model family introduced by Barreto-Souza & Vasconcellos (2011). The authors addressed the issue of correcting the bias of the maximum likelihood estimators in small samples. Here, our first goal is to derive hypothesis test adjustments in this class of models. We derive Skovgaard\'s adjusted likelihood ratio statistics Skovgaard (2001) and five adjusted signed likelihood ratio statistics, which have been proposed by Barndorff-Nielsen (1986, 1991), DiCiccio & Martin (1993), Skovgaard (1996), Severini (1999) and Fraser et al. (1999). The adjusted statistics are approximately distributed as $\\chi^2$ and standard normal with high accuracy. The adjustment terms have simple compact forms which may be easily implemented by readily available software. We compare the finite sample performance of the likelihood ratio test, the signed likelihood ratio test and the adjusted tests obtained in this work. We illustrate the application of the usual tests and their modified versions in real datasets. The adjusted statistics are closer to the respective limiting distribution compared to the usual ones when the sample size is relatively small. Simulation results indicate that the adjusted statistics can be recommended for inference in extreme value regression model with small or moderate sample size. Parsimony is important when data are scarce, but flexibility is also crucial since a poor fit may lead to a completely wrong conclusion. A literature review was conducted to list distributions which nest the Gumbel distribution. Our second goal is to evaluate their parsimony and flexibility. For this purpose, we compare such distributions regarding moments, skewness, kurtosis and tail index. The larger families obtained by introducing additional parameters, which have Gumbel embedded in, present flexible skewness and kurtosis while the Gumbel distribution skewness and kurtosis are constant. Among these distributions the generalized extreme value is the only one with tail index that can be any positive real number while the tail indeces of the other distributions investigated here are zero. We notice that some generalizations of the Gumbel distribution studied in the literature are not indetifiable. Hence, for these models meaningful interpretation and estimation of individual parameters are not feasible. We select the identifiable distributions and fit them to a simulated dataset and to real wind speed data. As expected, such distributions fit the Gumbel simulated data quite well. The generalized extreme value distribution and the two-component extreme value distribution fit the data better than the others in the non-negligible presence of outliers that cannot be accommodated by the Gumbel distribution, and therefore we suggest them to be applied in this context. Ajustes para pequenas amostras Extreme-value regression Generalized Gumbel distributions Hypothesis tests Modelos não lineares Nonlinear models Regressão valor extremo Small-sample adjustments Testes de hipóteses
757	Fadiga no doente com câncer colo-retal: fatores de risco e preditivos / Fatigue in colo-rectal cancer patients: risk and predictive factors Mota, Dalete Delalibera Corrêa de Faria 31 January 2008 (has links) INTRODUÇÃO: Não existem estudos preditivos sobre fadiga em doentes com câncer colo-retal, embora fadiga seja descrita como freqüente na população oncológica. OBJETIVO: Identificar os fatores de risco e preditivos independentes de fadiga em doentes com câncer colo-retal. MÉTODO: Estudo preditivo que envolveu amostra não-probabilística de 157 pacientes adultos ambulatoriais com tumor primário de cólon ou reto (idade média 60±11,7 anos; 54% homens; média de anos de escolaridade 10,7±5,4 anos; estádio IV 44,8%), atendidos em quatro serviços de oncologia do município de São Paulo, Brasil (julho/2006 a julho/2007). Os pacientes preencheram a Ficha de Identificação, a Escala de Fadiga de Piper-Revisada (0-10; ponto de corte: >4; ?=0,94), o Inventário de Depressão de Beck (0-63; ponto de corte: >13; ?=0,83), a Escala de Karnofky (0%-100%; ponto de corte: <80), a Escala de Prejuízo do Sono (0-10; ponto de corte: >5) e a Escala de Dor (0-10; ponto de corte: >6). Os pontos de corte foram estabelecidos pela análise da curva ROC (Receiver Operating Characteristic), com exceção do ponto de corte de fadiga, que foi estabelecido após análise da distribuição dos escores em percentis e do critério proposto pela National Comprehensive Cancer Network. RESULTADOS: Fadiga foi referida por 26,8% dos doentes. Os fatores de risco para fadiga foram os seguintes: serviço de saúde público, dor, prejuízo do sono, depressão e capacidade funcional prejudicada (p<0,05). A análise de regressão logística identificou três fatores preditivos: depressão, capacidade funcional e prejuízo do sono. A depressão aumentou em 4 vezes a chance de ocorrer fadiga (OR: 4,2; IC95% 1,68-10,39), a capacidade funcional aumentou em 3 vezes (OR: 3,2; IC95% 1,37-7,51) e o prejuízo do sono também em 3 vezes (OR: 3,2; IC95% 1,30-8,09). Quando os três fatores preditivos estiveram presentes, a probabilidade de ocorrer fadiga foi de 80%, o que indicou boa capacidade de predição. Quando os três fatores preditivos estiveram ausentes, a probabilidade de ocorrer fadiga foi de 8%. A especificidade e sensibilidade do modelo foram de 81,9% e 58,6%, respectivamente, indicando baixa chance de falsos positivos e alta chance de falsos negativos. CONCLUSÕES: Depressão, capacidade funcional e prejuízo do sono foram preditores de fadiga. O estudo disponibiliza tabela de probabilidade de predição de fadiga e propõe que, por meio da avaliação da depressão, da capacidade funcional e do prejuízo do sono, é possível conhecer a probabilidade do paciente ter fadiga, o que é inédito nessa população e de grande utilidade na clínica / INTRODUCTION: There are no studies that identify the predictive factors of fatigue among colo-rectal cancer patients, although fatigue is described as a frequent problem in the oncology setting. AIM: Identify risk factors and independent predictors of fatigue in colo-rectal cancer patients. METHOD: Predictive study that involved non-probabilistic sample of 157 adult outpatients with primary colon or rectal (mean age 60±11.7 years; 54% male; educational level 10.7±5.4 years; cancer stage IV 44.8%), recruited from 4 oncology clinics in Sao Paulo, Brazil (July/2006 to July/2007). Patients filled out an Identification Profile, Piper Fatigue Scale-revised (0-10; cut-score: >4, ?=0,94), Beck Depression Inventory (0-63; cut-score: >13, ?=0,83), Karnofsky Scale (0%-100%; cut-score: <80%), Sleep disturbance scale (0-10; cut-score: >5), and Pain scale (0-10; cut-score: >6). The cut scores were established by ROC (Receiver Operating Characteristic) curves, except for fatigue cut-score, which was established after an analysis of the distribution of the scores in percentiles and of the criteria proposed by National Comprehensive Cancer Network. RESULTS: Fatigue was identified by 26.8% of the patients. The risk factors for fatigue were: public oncology service, pain, sleep disturbance, poor performance status, and depression (p<0.05). Logistic regression identified three predictors: depression, sleep disturbance, and performance status. Depression increased the chance for fatigue to occur by four times (OR: 4.2; 95%CI 1.68-10.39), performance status increased by three times (OR: 3.2; 95%CI 1.37-7.51), and sleep disturbance also increased the chance by three times (OR: 3.2; 95%CI 1.30-8.09). When the three factors were present in concomitance, the probability that patients had fatigue was 80%, which was considered a good predictive capacity. When none of the factors were present, the probability that patients had fatigue was 8%. The specificity and sensibility of this model were 81.9% and 58.6%, respectively, indicating that there is low chance of false positive and high chance of false negatives. CONCLUSIONS: Depression, performance status, and sleep disturbance were predictive factors of fatigue. The study presents a prediction table and proposes that by assessing depression, performance status and sleep disturbance, it is possible to know the probability that a patient will have fatigue. This finding is original and applicable in clinical practice Análise de regressão Colorectal neoplasms Cuidados paliativos Fadiga Fatigue Fatores de risco Logistic models Modelos logísticos Neoplasias colorretais Odds ratio Palliative care Razão de chances Regression analysis Risk factors Sintomas Symptoms
758	Análise de sensibilidade e resíduos em modelos de regressão com respostas bivariadas por meio de cópulas / Bivariate response regression models with copulas: Sensitivity and residual analysis Gomes, Eduardo Monteiro de Castro 01 February 2008 (has links) Neste trabalho são apresentados modelos de regressão com respostas bivariadas obtidos através de funções cópulas. O objetivo de utilizar estes modelos bivariados é modelar a correlação entre eventos e captar nos modelos de regressão a influência da associação entre as variáveis resposta na presença de censura nos dados. Os parâmetros dos modelos, são estimados por meio dos métodos de máxima verossimilhança e jackknife. Alguns métodos de análise de sensibilidade como influência global, local e local total de um indivíduo, são introduzidos e calculados considerando diferentes esquemas de perturbação. Uma análise de resíduos foi proposta para verificar a qualidade do ajuste dos modelos utilizados e também foi proposta novas medidas de resíduos para respostas bivariadas. Métodos de simulação de Monte Carlo foram conduzidos para estudar a distribuição empírica dos resíduos marginais e bivariados propostos. Finalmente, os resultados são aplicados à dois conjuntos de dados dsponíveis na literatura. / In this work bivariate response regression models are presented with the use of copulas. The objective of this approach is to model the correlation between events and capture the influence of this correlation in the regression parameters. The models are used in the context of survival analysis and are ¯tted to two data sets available in the literature. Inferences are obtained using maximum likelihood and Jackknife methods. Sensitivity techniques such as local and global in°uence are proposed and calculated. A residual analysis is proposed to check the adequacy of the models and simulation methods are used to asses the empirical distribution of the marginal univariate and bivariate residual measures proposed. Análise de regressão e correlação Análise de sobrevivência Archimedean copulas Censored data Dados censurados Métodos Monte Carlo Monte Carlo simulation. Regression models Resi- dual analysis Sensitivity analysis Simulação (estatística).
759	Uma revisão da análise de experimentos unifatoriais com tratamentos de natureza quantitativa: comparações múltiplas ou análise de regressão? / A review of the analysis of unifactorial experiments with quantitative treatments: Multiple Comparisons or Regression Analysis? Rodrigues, Josiane 21 June 2011 (has links) O presente trabalho teve por objetivo fazer uma reflexão acerca do uso de testes de comparações múltiplas e da análise de regressão no estudo de experimentos unifatoriais cujos tratamentos são níveis de um fator quantitativo, para comparar os resultados e informações que são trazidas por cada uma dessas análises, verificando suas eventuais vantagens e limitações. De acordo com os objetivos propostos pelo presente trabalho, foi feita, depois de realizada a revisão bibliográfica sobre a análise de regressão e alguns dos testes de comparação de médias, um levantamento acerca de artigos cujo objetivo principal era o de fazer uma investigação de trabalhos publicados em jornais, revistas ou periódicos nos quais se utilizou algum procedimento de comparação de médias verificando assim a adequação desses testes às análises estatísticas realizadas. Essa revisão demonstrou que um número significativo de pesquisadores utiliza de procedimentos de comparações múltiplas em análises estatísticas de experimentos unifatoriais nos quais os tratamentos envolvidos são níveis de um fator quantitativo, o que é considerado por alguns como um procedimento inadequado. Assim sendo, foram analisados também dados de experimentos unifatoriais com tratamentos dessa ordem, que foram submetidos a uma análise de regressão e também a um procedimento de comparação múltipla das médias, com o objetivo de verificar quais as vantagens e limitações de cada um desses procedimentos na análise do experimento em questão. Nessa comparação ficou claro que o uso de procedimentos de comparações múltiplas na análise de experimentos unifatoriais envolvendo tratamentos quantitativos pode resultar na redução de informações e também da eficiência dos resultados, quando procedimentos mais apropriados, nesse caso, a análise de regressão, estão disponíveis para analisar dados dessa natureza. / The present work had like purpose to make a reflection about the use of multiple comparison tests and of the regression analysis on learning of unifactorial experiments whose treatments are levels of a quantitative factor, to compare the results and information are brought for each one of the analysis, verifying the eventual advantages and limitations of them. According to the purposes of the present work, was realized, later the bibliographical revision about regression analysis and some of the mean comparison tests was done, a survey about articles whose principal aim was to make a raising of works published at newspapers, magazines or periodicals where was used some mean comparison procedure verifying the adaptation of these tests to the statistical analysis realized. This revision demonstrated that a revealing number of searchers use multiple comparison procedures at analysis of unifactorial experiments whose treatments involved are levels of a quantitative factor, what is considered for some searchers like an inadequate procedure. Of this way, the data of unifactorial experiments, whose treatments were levels of a quantitative factor, were analyzed too, that were submitted to a regression analysis and to a multiple comparison procedure, with the aim of verifying the advantages and limitations of each one of these procedures at the analysis of the experiment. At this comparison, was clear that the use of multiple comparison procedures at analysis of experiments involving quantitative experiments can result in loss of information and reduced efficiency of the results, when more appropriate procedures, in this case, the regression analysis, are available to analyze this kind of data. Análise de regressão e de correlação Análise de variância Análise estatística de dados Comparações múltiplas Delineamento experimental. Interpretation of experimental results. Multiple comparison tests Quantitative treatments Regression Analysis Unifactorial experiments
760	Fatores abióticos condicionantes da distribuição de espécies arbóreas em quatro formações florestais do Estado de São Paulo / Abiotic factors determining spatial distribution of tree species in four forest formations of the State of São Paulo Magalhães, Simone Rodrigues de 15 March 2016 (has links) No estudo das comunidades florestais, estabelecer a importância relativa dos fatores que definem a composição e a distribuição das espécies é um desafio. Em termos de gradientes ambientais o estudo das respostas das espécies arbóreas são essenciais para a compreensão dos processos ecológicos e decisões de conservação. Neste sentido, para contribuir com a elucidação dos processos ecológicos nas principais formações florestais do Estado de São Paulo (Floresta Ombrófila Densa de Terras Baixas, Floresta Ombrófila Densa Submontana, Floresta Estacional Semidecidual e Savana Florestada) este trabalho objetivou responder as seguintes questões: (I) a composição florística e a abundância das espécies arbóreas, em cada unidade fitogeográfica, variam conforme o gradiente edáfico e topográfico?; (II) características do solo e topografia podem influenciar na previsibilidade de ocorrência de espécies arbóreas de ampla distribuição em diferentes tipos vegetacionais? (III) existe relação entre o padrão de distribuição espacial de espécies arbóreas e os parâmetros do solo e topografia? O trabalho foi realizado em parcelas alocadas em unidades de conservação (UC) que apresentaram trechos representativos, em termos de conservação e tamanho, das quatro principais formações florestais presentes no Estado de São Paulo. Em cada UC foram contabilizados os indivíduos arbóreos (CAP ≥ 15 cm), topografia, dados de textura e atributos químicos dos solos em uma parcela de 10,24 ha, subdividida em 256 subparcelas. Análises de correspodência canônica foram aplicadas para estabelecer a correspondência entre a abundância das espécies e o gradiente ambiental (solo e topografia). O método TWINSPAN modificado foi aplicado ao diagrama de ordenação da CCA para avaliar a influência das variáveis ambientais (solo e topografia) na composição de espécies. Árvores de regressão \"ampliadas\" (BRT) foram ajustadas para a predição da ocorrência das espécies segundo as variáveis de solo e topografia. O índice de Getis-Ord (G) foi utilizado para determinar a autocorrelação espacial das variáveis ambientais utilizadas nos modelos de predição da ocorrência das espécies. Nas unidades fitogeográficas analisadas, a correspondência entre o gradiente ambiental (solo e topografia) e a abundância das espécies foi significativa, especialmente na Savana Florestada onde observou-se a maior relação. O solo e a topografia também se relacionaram com a semelhança na composição florística das subparcelas, com exceção da Floresta Estacional Semicidual (EEC). As principais variáveis de solo e topografia relacionadas a flora em cada UC foram: (1) Na Floresta Ombrófila Densa de Terras Baixas (PEIC) - teor de alumínio na camada profunda (Al (80-100 cm)) que pode refletir os teor de Al na superfície, acidez do solo (pH(H2O) (5-25 cm)) e altitude, que delimitou as áreas alagadas; (2) Na Floresta Ombrófila Densa Submontana (PECB) - altitude, fator que, devido ao relevo acidentado, influencia a temperatura e incidência de sol no sub-bosque; (3) Na Savana Florestada (EEA) - fertilidade, tolerância ao alumínio e acidez do solo. Nos modelos de predição BRT, as variáveis químicas dos solos foram mais importantes do que a textura, devido à pequena variação deste atributo no solo nas áreas amostradas. Dentre as variáveis químicas dos solos, a capacidade de troca catiônica foi utilizada para prever a ocorrência das espécies nas quatro formações florestais, sendo particularmente importante na camada mais profunda do solo da Floresta Ombrófila Densa de Terras Baixas (PEIC). Quanto à topografia, a altitude foi inserida na maioria dos modelos e apresentou diferentes influências sobre as áreas de estudo. De modo geral, para presença das espécies de ampla distribuição observou-se uma mesma tendência quando à associação com os atributos dos solos, porém com amplitudes dos descritores edáficos que variaram de acordo com a área de estudo. A ocorrência de Guapira opposita e Syagrus romanzoffiana, cujo padrão variou conforme a escala, foi explicada por variáveis com padrões espaciais agregados que somaram entre 30% e 50% de importância relativa no modelo BRT. A presença de A. anthelmia, cujo padrão também apresentou certo nível de agregação, foi associada apenas a uma variável com padrão agregado, a altitude (21%), que pode ter exercido grande influência na distribuição da espécie ao delimitar áreas alagadas. T. guianensis se associou a variáveis ambientais preditoras com padrão espacial agregado que somaram cerca de 70% de importância relativa, o que deve ter sido suficiente para estabelecer o padrão agregado em todas as escalas. No entanto, a influência dos fatores ambientais no padrão de distribuição da espécie não depende apenas do ótimo ambiental da espécie, mas um resultado da interação espécie-ambiente. Concluiu-se que: (I) características edáficas e topográficas explicaram uma pequena parcela da composição florística, em cada unidade fitogeográfica, embora a ocorrência de algumas espécies tenha se associado ao gradiente edáfico e topográfico; (II) a partir de características dos solos e da topografia foi possível prever a presença de espécies arbóreas, que apresentaram particularidades em relação a sua associação com o solo de cada fitofisionomia; (III) a partir de associações descritivas o solo e a topografia influenciam o padrão de distribuição espacial das espécies, na proporção em que contribuem para a presença das mesmas. / In the study of forest communities, establish the relative importance of the factors that define the composition and distribution of species is a challenge. In terms of environmental gradients study the responses of tree species are essential to the understanding of ecological processes and conservation decisions. In this regard, to contribute to the elucidation of ecological processes in the main forest formations of São Paulo (Dense Ombrophylous Forest of Lowlands, Submontane Dense Ombrophylous Forest, Semideciduous Forest and Savanna Woodland) this study aimed to answer the following questions: (I) floristic composition and tree species abundance in each phytogeographic unit change according to edaphic and topographic gradient?; (II) soil characteristics and topography can influence the occurrence of predictability of tree species widely distributed in different types of vegetation? (III) there is a relationship between spatial distribution pattern of tree species and the soil parameters and topography? The work was carried out in allocated plots in protected areas (PA) with the four main forest formations in terms of conservation and size of Sao Paulo. In each PA was sampled individual trees, topography, texture data and chemical properties of the soil on a plot of 10.24 ha, subdivided into 256 subplots. Canonical corresponding analyzes (CCA) were applied to establish the correspondence between the abundance of species and environmental gradient (soil and topography). The modified TWINSPAN method was applied to CCA ordination diagram to evaluate the influence of environmental variables (soil and topography) on species composition. Boosteed Regression Trees (BRT) were adjusted for predicting the occurrence of the species according to soil variables and topography. The Getis Ord-index (G) was used to determine the spatial autocorrelation of environmental variables used in the BRT models. In analyzed phytogeographic units, correspondence between the environmental gradient (soil and topography) and abundance of species was significant, especially in Savanna Woodland. The soil and topography also correlated with the floristic composition similarity of the subplots, with the exception of Semicidual Seasonal Forest (EEC). The main soil and topography variables related to floristic in each PA were: (1) Dense Ombrophylous Forest of Lowlands (PEIC) - aluminium content in the deep layer (Al (80-100 cm)) which may reflect the Al content at the surface, soil acidity (pH (H2O) (5-25 cm)) and altitude, which outlined the flooded areas; (2) Submontane Dense Ombrophylous Forest (PECB) - elevation, due to the rugged terrain influences the temperature and light incidence in the understory; (3) Savanna Woodland (EEA) - fertility, tolerance to aluminum and soil acidity. In BRT prediction models, the chemical soil variables were more important than the texture due to small variation of this soil attribute in the sampled area. Among the soil chemical variables, cation exchange capacity was used to predict the species occurrence in four forest formations and particularly important in the soil deepest layer on the Dense Ombrophylous Forest of Lowlands (PEIC). In relation to topography, elevation was included in most models and had different influences on the study areas. Overall, the species widely distributed showed the same trend as the association with the attributes of the soil, but with amplitudes of edaphic descriptors that change according to the study area. The occurrence of the Guapira opposita and Syagrus romanzoffiana, whose pattern change according to the scale, was explained by variables with aggregated spatial patterns that amounted to between 30% and 50% relative importance in the BRT model. The presence of A. anthelmia, which defaults also presented certain level of aggregation, was associated only with one aggregate variable, elevation (21%), which may have exerted great influence on the species distribution to delimit wetlands. T. guianensis was related with the predictive environmental variables of aggregate spatial pattern which totaled to about 70% relative importance, what must have been enough to establish the aggregate pattern at all scales. However, the influence of environmental factors (soil and topography) on the species distribution pattern depends not only on the environmental optimum of the species, but a result of species-environment interaction. We concluded that: (I) soil and topographical characteristics explain a small portion of the floristic composition in each phytogeographic unit, although the occurrence of some species have been associated to the soil and topographic gradient; (II) from soil characteristics and topography it was possible to predict the presence of tree species, which showed particular in relation to its association with the soil of each vegetation type; (III) from descriptive associations soil and topography influence the spatial distribution pattern of the species, to the extent that contribute to the presence of the same. Análise de correspondência canônica Árvores de regressão ampliadas Boosted regression trees Edaphic variables Florestas Tropicais Habitat Padrão de distribuição espacial Solo Spatial distribution pattern Topografia Topography

Search results