951 |
Técnicas de Data Mining na aquisição de clientes para financiamento de Crédito Direto ao Consumidor - CDC / Data Mining Techniques to acquire new customers for financing of Consumer CreditAdriana Maria Marques da Silva 27 September 2012 (has links)
O trabalho busca dissertar sobre as técnicas de data mining mais difundidas: regressão logística, árvore de decisão e rede neural, além de avaliar se tais técnicas oferecem ganhos financeiros para instituições privadas que contam com processos ativos de conquista de clientes. Uma empresa do setor financeiro será utilizada como objeto de estudo, especificamente nos seus processos de aquisição de novos clientes para adesão do Crédito Direto ao Consumidor (CDC). Serão mostrados os resultados da aplicação nas três técnicas mencionadas, para que seja possível verificar se o emprego de modelos estatísticos discriminam os clientes potenciais mais propensos dos menos propensos à adesão do CDC e, então, verificar se tal ação impulsiona na obtenção de ganhos financeiros. Esses ganhos poderão vir mediante redução dos custos de marketing abordando-se somente os clientes com maiores probabilidades de responderem positivamente à campanha. O trabalho apresentará o funcionamento de cada técnica teoricamente, e conforme os resultados indicam, data mining é uma grande oportunidade para ganhos financeiros em uma empresa. / The paper intends to discourse about most widespread data mining techniques: logistic regression, decision tree and neural network, and assess whether these techniques provide financial gains for private institutions that have active processes for business development. A company of the financial sector is used as object of study, specifically in the processes of acquiring new customers for adhesion to consumer credit (in Brazil CDC). This research will show the results of the three above mentioned techniques, to check whether the statistical models point out relevant differences between prospects´ intentions to adhere to consumer credit. In the meantime, the techniques are checked whether they leverage financial gain. These gains are expected to came from better focused and directed marketing efforts. The paper presents the operation of each technique theoretically, and as the results indicate, data mining is a great opportunity for a company boost profits.
|
952 |
Análise de sensibilidade e resíduos em modelos de regressão com respostas bivariadas por meio de cópulas / Bivariate response regression models with copulas: Sensitivity and residual analysisEduardo Monteiro de Castro Gomes 01 February 2008 (has links)
Neste trabalho são apresentados modelos de regressão com respostas bivariadas obtidos através de funções cópulas. O objetivo de utilizar estes modelos bivariados é modelar a correlação entre eventos e captar nos modelos de regressão a influência da associação entre as variáveis resposta na presença de censura nos dados. Os parâmetros dos modelos, são estimados por meio dos métodos de máxima verossimilhança e jackknife. Alguns métodos de análise de sensibilidade como influência global, local e local total de um indivíduo, são introduzidos e calculados considerando diferentes esquemas de perturbação. Uma análise de resíduos foi proposta para verificar a qualidade do ajuste dos modelos utilizados e também foi proposta novas medidas de resíduos para respostas bivariadas. Métodos de simulação de Monte Carlo foram conduzidos para estudar a distribuição empírica dos resíduos marginais e bivariados propostos. Finalmente, os resultados são aplicados à dois conjuntos de dados dsponíveis na literatura. / In this work bivariate response regression models are presented with the use of copulas. The objective of this approach is to model the correlation between events and capture the influence of this correlation in the regression parameters. The models are used in the context of survival analysis and are ¯tted to two data sets available in the literature. Inferences are obtained using maximum likelihood and Jackknife methods. Sensitivity techniques such as local and global in°uence are proposed and calculated. A residual analysis is proposed to check the adequacy of the models and simulation methods are used to asses the empirical distribution of the marginal univariate and bivariate residual measures proposed.
|
953 |
Uma revisão da análise de experimentos unifatoriais com tratamentos de natureza quantitativa: comparações múltiplas ou análise de regressão? / A review of the analysis of unifactorial experiments with quantitative treatments: Multiple Comparisons or Regression Analysis?Josiane Rodrigues 21 June 2011 (has links)
O presente trabalho teve por objetivo fazer uma reflexão acerca do uso de testes de comparações múltiplas e da análise de regressão no estudo de experimentos unifatoriais cujos tratamentos são níveis de um fator quantitativo, para comparar os resultados e informações que são trazidas por cada uma dessas análises, verificando suas eventuais vantagens e limitações. De acordo com os objetivos propostos pelo presente trabalho, foi feita, depois de realizada a revisão bibliográfica sobre a análise de regressão e alguns dos testes de comparação de médias, um levantamento acerca de artigos cujo objetivo principal era o de fazer uma investigação de trabalhos publicados em jornais, revistas ou periódicos nos quais se utilizou algum procedimento de comparação de médias verificando assim a adequação desses testes às análises estatísticas realizadas. Essa revisão demonstrou que um número significativo de pesquisadores utiliza de procedimentos de comparações múltiplas em análises estatísticas de experimentos unifatoriais nos quais os tratamentos envolvidos são níveis de um fator quantitativo, o que é considerado por alguns como um procedimento inadequado. Assim sendo, foram analisados também dados de experimentos unifatoriais com tratamentos dessa ordem, que foram submetidos a uma análise de regressão e também a um procedimento de comparação múltipla das médias, com o objetivo de verificar quais as vantagens e limitações de cada um desses procedimentos na análise do experimento em questão. Nessa comparação ficou claro que o uso de procedimentos de comparações múltiplas na análise de experimentos unifatoriais envolvendo tratamentos quantitativos pode resultar na redução de informações e também da eficiência dos resultados, quando procedimentos mais apropriados, nesse caso, a análise de regressão, estão disponíveis para analisar dados dessa natureza. / The present work had like purpose to make a reflection about the use of multiple comparison tests and of the regression analysis on learning of unifactorial experiments whose treatments are levels of a quantitative factor, to compare the results and information are brought for each one of the analysis, verifying the eventual advantages and limitations of them. According to the purposes of the present work, was realized, later the bibliographical revision about regression analysis and some of the mean comparison tests was done, a survey about articles whose principal aim was to make a raising of works published at newspapers, magazines or periodicals where was used some mean comparison procedure verifying the adaptation of these tests to the statistical analysis realized. This revision demonstrated that a revealing number of searchers use multiple comparison procedures at analysis of unifactorial experiments whose treatments involved are levels of a quantitative factor, what is considered for some searchers like an inadequate procedure. Of this way, the data of unifactorial experiments, whose treatments were levels of a quantitative factor, were analyzed too, that were submitted to a regression analysis and to a multiple comparison procedure, with the aim of verifying the advantages and limitations of each one of these procedures at the analysis of the experiment. At this comparison, was clear that the use of multiple comparison procedures at analysis of experiments involving quantitative experiments can result in loss of information and reduced efficiency of the results, when more appropriate procedures, in this case, the regression analysis, are available to analyze this kind of data.
|
954 |
Causalidade Granger em medidas de risco / Granger Causality with Risk MeasuresPatricia Nagami Murakami 02 May 2011 (has links)
Esse trabalho apresenta um estudo da causalidade de Granger em Risco bivariado aplicado a séries temporais financeiras. Os eventos de risco, no caso de séries financeiras, estão relacionados com a avaliação do Valor em Risco das posições em ativos. Para isso, os modelos CaViaR, que fazem parte do grupo de modelos de Regressão Quantílica, foram utilizado para identificação desses eventos. Foram expostos os conceitos principais envolvidos da modelagem, assim como as definições necessárias para entendê-las. Através da análise da causalide de Granger em risco entre duas séries, podemos investigar se uma delas é capaz de prever a ocorrência de um valor extremo da outra. Foi realizada a análise de causalidade de Granger usual somente para como comparativo. / Quantile Regression, Value at Risk, CAViaR Model, Granger Causality, Granger Causality in Risk
|
955 |
O mercado imobiliário residencial da região metropolitana de São Paulo: uma aplicação de modelos de comercialização hedônica de regressão e correlação canônica / The Real Estate Market of Metropolitan Region of Sao Paulo: an hedonic models application of multiple regression and canonical correlationLuiz Paulo Lopes Favero 29 September 2005 (has links)
Este trabalho destina-se a realizar um estudo sobre o mercado imobiliário de lançamentos residenciais da Região Metropolitana de São Paulo, tendo como base a utilização de modelos de comercialização hedônica. Para tanto, utiliza-se da Teoria dos Atributos proposta por Lancaster e dos modelos hedônicos e de equilíbrio de sub-mercados propostos por Rosen e Palmquist, a partir dos quais é possível analisar a importância relativa de pacotes de atributos, em função dos diferentes perfis sócio-demográficos determinados previamente por meio de análise fatorial elaborada com um grupo de 11 variáveis sócio-demográficas de cada Município da Região Metropolitana e de cada distrito do Município de São Paulo. Por meio de um levantamento realizado com especialistas, com compradores de imóveis residenciais e por meio de anúncios específicos, definiram-se as variáveis hedônicas explicativas e dependentes a serem incluídas nos modelos de regressão múltipla de Box-Cox e de correlação canônica, sob a ótica da demanda e da oferta, para cada perfil sócio-demográfico definido. O método proposto permite a determinação e a avaliação dos pacotes representativos de atributos para a composição das condições comerciais dos imóveis residenciais em lançamento na Região Metropolitana de São Paulo, propiciando a verificação da existência de eventuais descolamentos entre o comportamento da demanda e da oferta e possibilitando a comparação da importância relativa de cada variável entre os perfis sócio-demográficos. Portanto, a aplicação do método proposto neste trabalho pode propiciar a implementação de iniciativas privadas e políticas públicas voltadas ao estabelecimento de novas estratégias de lançamento imobiliário, designadas para cada tipo específico de empreendimento e de acordo com as preferências dos consumidores e das características de cada localidade. / This work intends to research about the residential launchings of the real estate market in the Metropolitan Region of Sao Paulo, using hedonic models. Its based on the approach to Theory of Attributes, proposed by Lancaster, and on the hedonic models and the sub-markets equilibrium approach proposed by Rosen and Palmquist, that make possible the analysis of the relative importance of the attributes bundles for each different social and demographic group previously defined by the factorial analysis statistical technique, that used 11 social and demographic variables related to each Municipality of the Metropolitan Region of Sao Paulo and each district of the City of Sao Paulo. Using a survey realized with specialists, residential launchings buyers and through specific advertisements, many explicative and dependent hedonic variables were defined and are to be included in the models of Box-Cox multiple regression and canonical correlation, under the perspective of demand and supply, for each social and demographic defined group. The proposed method allows the determination and the evaluation of the representative bundles of attributes to the composition of the residential launchings commercial conditions of the Metropolitan Region of Sao Paulo real estate market, making possible to verify the existence of eventual gaps between the demand and supply behaviors and allowing the comparison of the relative importance of each variable among the social and demographic groups. Thus, the method application can facilitate private and public implementations, allowing the establishment of new strategies designated to each specific kind of real estate, according to the consumers preferences and local characteristics.
|
956 |
Modelos não lineares resultantes da soma de regressões lineares ponderadas por funções distribuição acumulada / Nonlinear Models resulting from the sum of weighted linear regression of cumulative distribution functionsLucas Santana da Cunha 03 February 2016 (has links)
Os controladores eletrônicos de pulverização visam minimizar a variação das taxas de insumos aplicadas no campo. Eles fazem parte de um sistema de controle, e permitem a compensação da variação de velocidade de deslocamento do pulverizador durante a operação. Há vários tipos de controladores eletrônicos de pulverização disponíveis no mercado e uma das formas de selecionar qual o mais eficiente nas mesmas condições, ou seja, em um mesmo sistema de controle, é quantificar o tempo de resposta do sistema para cada controlador específico. O objetivo desse trabalho foi estimar os tempos de resposta para mudanças de velocidade de um sistema eletrônico de pulverização via modelos de regressão não lineares, estes, resultantes da soma de regressões lineares ponderadas por funções distribuição acumulada. Os dados foram obtidos no Laboratório de Tecnologia de Aplicação, localizado no Departamento de Engenharia de Biossistemas da Escola Superior de Agricultura \"Luiz de Queiroz\", Universidade de São Paulo, no município de Piracicaba, São Paulo, Brasil. Os modelos utilizados foram o logístico e de Gompertz, que resultam de uma soma ponderada de duas regressões lineares constantes com peso dado pela função distribuição acumulada logística e Gumbell, respectivamente. Reparametrizações foram propostas para inclusão do tempo de resposta do sistema de controle nos modelos, com o objetivo de melhorar a interpretação e inferência estatística dos mesmos. Foi proposto também um modelo de regressão não linear difásico que resulta da soma ponderada de regressões lineares constantes com peso dado pela função distribuição acumulada Cauchy seno hiperbólico exponencial. Um estudo de simulação foi feito, utilizando a metodologia de Monte Carlo, para avaliar as estimativas de máxima verossimilhança dos parâmetros do modelo. / The electronic controllers spray aimed at minimizing the variation of inputs rates applied in the field. They are part of a control system, and allow for compensation for variation spray travel speed during operation. There are several types of electronic spray controllers on the market and one way to select which more efficient under the same conditions, ie in the same system of control, is to quantify the system response time for each specific driver. The objective of this study was to estimate the response times for changes in speed of an electronic spraying system via nonlinear regression models, these resulting from the sum of weighted linear regressions for cumulative distribution functions. Data were obtained on the Application Technology Laboratory, located in the Department of Biosystems Engineering from College of Agriculture \"Luiz de Queiroz\", University of Sao Paulo, in Piracicaba, Sao Paulo, Brazil. The models used were the logistic and Gompertz, resulting from a weighted sum of two constant linear regressions with weight given by the cumulative distribution function logistics and Gumbell respectively. Reparametrization been proposed for inclusion in the control system response time models, in order to improve the statistical interpretation and inference of the same. It has also been proposed a non-linear regression model two-phase which is the weighted sum of constant linear regressions weight given by a cumulative distribution function exponential hyperbolic sine Cauchy in which a simulation study was conducted using the methodology of Monte Carlo to evaluating the maximum likelihood estimates of the model parameters.
|
957 |
Três ensaios sobre economia da saúdeNISHIMURA, Fábio Nobuo 12 June 2015 (has links)
Submitted by Haroudo Xavier Filho (haroudo.xavierfo@ufpe.br) on 2016-03-01T15:05:56Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
TESE ECONOMIA.pdf: 486990 bytes, checksum: 8b32919db583ebbdf0a85e29db45ea18 (MD5) / Made available in DSpace on 2016-03-01T15:05:56Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
TESE ECONOMIA.pdf: 486990 bytes, checksum: 8b32919db583ebbdf0a85e29db45ea18 (MD5)
Previous issue date: 2015-06-12 / CAPES / As mortes e as incapacidades motoras ocasionadas por causas evitáveis e não evitáveis, promovem na sociedade diversos impactos negativos em relação ao desenvolvimento econômico e social de diversos países. Essas adversidades criam barreiras ao desenvolvimento econômico e ao bem estar, pois impossibilita o avanço do capital humano devido a algum tipo de deficiência gerada na saúde das pessoas. Para minimizar essas adversidades, os governos executam ações e programas que se aplicados de forma eficiente reduzem essas condições problemáticas. Como forma de
verificar o efeito avaliou-se o resultado das ações e dos programas através de seu efeito médio do tratamento. Desta forma, o presente trabalho tem como objetivo analisar o efeito dos programas públicos sobre as saúde da população. Assim, ele está dividido em três capítulos, caraterizando os três ensaios. O primeiro ensaio analisa o efeito do “Programa de Arrendamento Residencial”, chamado PAR, sobre a mortalidade infantil. O segundo ensaio é o programa “Pacto pela Redução da Mortalidade Infantil” nas regiões Nordeste e Amazônia Legal, com o objetivo de identificar se ele consegue reduzir as mortes nas regiões brasileiras, com maiores taxa de óbitos em crianças até um
ano de idade. O terceiro ensaio avalia o impacto do programa “Aqui tem Farmácia Popular” sobre as mortes por hipertensão no Estado de Mato Grosso, com isso verificamos se ocorre uma redução das mortes por hipertensão em municípios onde existem farmácias credenciadas no programa. Para o primeiro artigo aplicamos um desenho de regressão descontínua e para os outros dois artigos,
utilizamos a estratégia de painel com modelo de efeito fixo (diferenças em diferenças). De forma
geral como resultado, os programas analisados conseguem atingir seus objetivos de redução das
mortes, considerando a particularidade de cada um. / The deaths and motor disabilities caused by preventable and not preventable causes, promote various negative impacts on society in relation to economic and social development of many countries. These adversities create barriers to economic development and well-being, because prevents the advancement of human capital due to a disability generated on people’s health. To minimize these adversities, governments perform actions and programs being implemented efficiently reduce these problematic conditions. In order to verify the effect evaluated the results of actions and programs through its average treatment effect. Thus, this study aims to analyze the effect of public programs on the health of the population. Thus, it is divided into three chapters, featuring
the three essays. The first essay analyzes the effect of “ Residential Leasing Program ”, called PAR, on infant mortality. The second essay is the “ Pact to Reduce Infant Mortality ” in the Northeast and Legal Amazon, in order to identify whether it can reduce deaths in the Brazilian regions, with the highest death rate in children under one year old . The third essay evaluates the impact of the program “ Here’s People’s Pharmacy ” about deaths from hypertension in the state of Mato Grosso, with that check if there is a reduction of deaths from hypertension in municipalities where there are pharmacies accredited to the program. For the first article we applied a regression discontinuity
design and the other two articles, we use the panel strategy with fixed effect model (difference in difference). Generally as a result, the analyzed programs can achieve their reduction targets of deaths, considering the peculiarity of each.
|
958 |
Um método de aprendizagem seqüencial com filtro de Kalman e Extreme Learning Machine para problemas de regressão e previsão de séries temporaisNÓBREGA, Jarley Palmeira 24 August 2015 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2016-03-15T12:52:14Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Tese_Jarley_Nobrega_CORRIGIDA.pdf: 12392055 bytes, checksum: 30d9ff36e7236d22ddc3a16dd942341f (MD5) / Made available in DSpace on 2016-03-15T12:52:14Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Tese_Jarley_Nobrega_CORRIGIDA.pdf: 12392055 bytes, checksum: 30d9ff36e7236d22ddc3a16dd942341f (MD5)
Previous issue date: 2015-08-24 / Em aplicações de aprendizagem de máquina, é comum encontrar situações onde o
conjunto de entrada não está totalmente disponível no início da fase de treinamento. Uma solução
conhecida para essa classe de problema é a realização do processo de aprendizagem através do
fornecimento sequencial das instâncias de treinamento. Entre as abordagens mais recentes para
esses métodos, encontram-se as baseadas em redes neurais do tipo Single Layer Feedforward
Network (SLFN), com destaque para as extensões da Extreme Learning Machine (ELM) para
aprendizagem sequencial.
A versão sequencial da ELM, chamada de Online Sequential Extreme Learning Machine
(OS-ELM), utiliza uma solução recursiva de mínimos quadrados para atualizar os pesos de
saída da rede através de uma matriz de covariância. Entretanto, a implementação da OS-ELM e
suas extensões sofrem com o problema de multicolinearidade entre os elementos da matriz de
covariância.
Essa tese introduz um novo método para aprendizagem sequencial com capacidade para
tratar os efeitos da multicolinearidade. Chamado de Kalman Learning Machine (KLM), o
método proposto utiliza o filtro de Kalman para a atualização sequencial dos pesos de saída
de uma SLFN baseada na OS-ELM. Esse trabalho também propõe uma abordagem para a
estimativa dos parâmetros do filtro, com o objetivo de diminuir a complexidade computacional
do treinamento. Além disso, uma extensão do método chamada de Extended Kalman Learning
Machine (EKLM) é apresentada, voltada para problemas onde a natureza do sistema em estudo
seja não linear.
O método proposto nessa tese foi comparado com alguns dos mais recentes e efetivos
métodos para o tratamento de multicolinearidade em problemas de aprendizagem sequencial. Os
experimentos executados mostraram que o método proposto apresenta um desempenho melhor
que a maioria dos métodos do estado da arte, quando medidos o de erro de previsão e o tempo
de treinamento. Um estudo de caso foi realizado, aplicando o método proposto a um problema
de previsão de séries temporais para o mercado financeiro. Os resultados confirmaram que o
KLM consegue simultaneamente reduzir o erro de previsão e o tempo de treinamento, quando
comparado com os demais métodos investigados nessa tese. / In machine learning applications, there are situations where the input dataset is not fully
available at the beginning of the training phase. A well known solution for this class of problem
is to perform the learning process through the sequential feed of training instances. Among most
recent approaches for sequential learning, we can highlight the methods based on Single Layer
Feedforward Network (SLFN) and the extensions of the Extreme Learning Machine (ELM)
approach for sequential learning.
The sequential version of the ELM algorithm, named Online Sequential Extreme Learning
Machine (OS-ELM), uses a recursive least squares solution for updating the output weights
through a covariance matrix. However, the implementation of OS-ELM and its extensions suffer
from the problem of multicollinearity for the hidden layer output matrix.
This thesis introduces a new method for sequential learning in which the effects of multicollinearity
is handled. The proposed Kalman Learning Machine (KLM) updates sequentially
the output weights of an OS-ELM based network by using the Kalman filter iterative procedure.
In this work, in order to reduce the computational complexity of the training process, a new
approach for estimating the filter parameters is presented. Moreover, an extension of the method,
named Extended Kalman Learning Machine (EKLM), is presented for problems where the
dynamics of the model are non linear.
The proposed method was evaluated by comparing the related state-of-the-art methods
for sequential learning based on the original OS-ELM. The results of the experiments show
that the proposed method can achieve the lowest forecast error when compared with most of
their counterparts. Moreover, the KLM algorithm achieved the lowest average training time
when all experiments were considered, as an evidence that the proposed method can reduce the
computational complexity for the sequential learning process. A case study was performed by
applying the proposed method for a problem of financial time series forecasting. The results
reported confirm that the KLM algorithm can decrease the forecast error and the average training
time simultaneously, when compared with other sequential learning algorithms.
|
959 |
Mapeamento digital da fertilidade do solo das regiões Norte, Noroeste e Serrana do Estado do Rio de JaneiroAndrade, Sandra Fernandes de 06 March 2018 (has links)
Submitted by Biblioteca de Pós-Graduação em Geoquímica BGQ (bgq@ndc.uff.br) on 2018-03-06T16:22:51Z
No. of bitstreams: 1
TESE_SANDRA_FERNANDES_ANDRADE.pdf: 6238564 bytes, checksum: c11933fcb48773bb165ea782a4942d4e (MD5) / Made available in DSpace on 2018-03-06T16:22:51Z (GMT). No. of bitstreams: 1
TESE_SANDRA_FERNANDES_ANDRADE.pdf: 6238564 bytes, checksum: c11933fcb48773bb165ea782a4942d4e (MD5) / Fundação de Amparo à Pesquisa do Estado do Rio de Janeiro / Universidade Federal Fluminense. Instituto de Química. Programa de Pós-Graduação em Geoquímica, Niterói, RJ / O Mapeamento Digital de Solo (DSM) está evoluindo muito nas últimas décadas, desde a fase de investigação até a produção de mapas em diversas escalas, abrangendo países, regiões e bacias hidrográficas. A predição de classes e propriedades de solos no mapeamento digital fundamenta-se nas relações existentes entre os fatores e processos de formação dos solos. O conhecimento dos atributos químicos dos solos é um fator de grande relevância, visando a utilização racional de corretivos e fertilizantes. O trabalho objetivou realizar a modelagem solo-paisagem de variáveis químicas de fertilidade do solo, a saber, pH em água, Pass(mg/kg), K+(cmolc/kg), C(g/kg), CTC(cmolc/kg), V% e Al(m)%, usando como preditoras as variáveis ambientais Plano de Curvatura, Perfil de Curvatura, Índice de Umidade, Aspecto, Declividade, Tipos de Solo, NDVI, Imagens Landsat 7 (bandas 2, 4 e 7) e Litologia. A área de estudo compreende as regiões mais produtivas do Estado do Rio de Janeiro: Norte, Noroeste e Serrana, entre as coordenadas 43°22´35´´; 40°57´27´´WG, e 20°45´47´´; 22°34´21´´S, com 22.043 km2. Os dados de solos foram extraídos de um banco de dados maior, cedido pela Embrapa Solos. A análise exploratória dos dois bancos de dados identificou valores extremos, que foram expurgados, para manter as características de fertilidade natural e a homogeneidade da amostra, preparando a análise por regressão linear múltipla (RLM). Os parâmetros estatísticos analisados para avaliação dos modelos de RLM foram: AIC, RMSE, Cp, R2 ajustado, F e a probabilidade de F. Aos resultados da RLM, foram adicionados os resultados de krigagem dos resíduos da regressão, uma técnica de DSM conhecida como R+K, que se mostrou um método adequado para o mapeamento digital de propriedades do solo, neste trabalho. Os solos analisados apresentam baixo pH e altos níveis de saturação por Al, bem como baixas concentrações de fósforo assimilável. Os valores de CTC e V(%) estão dentro do intervalo considerado bom para a fertilidade do solo, segundo dados da literatura. O carbono apresentou níveis considerados bons para a fertilidade do solo, principalmente, nas áreas de baixada da região Norte. Não foi possível realizar uma síntese de fertilidade do solo considerando simultaneamente todas as variáveis estudadas, pois elas não se distribuem espacialmente dentro dos critérios de boa fertilidade preconizados na literatura. Entretanto, foi possível a realização de dois mapas-sínteses, aproveitando a boa correlação entre CTC e K+ e entre pH e V%. O primeiro mapa-síntese, com as variáveis K+ e CTC, identificou, na região da baixada Norte fluminense uma faixa considerada boa para a fertilidade do solo. O segundo mapa-síntese, com as variáveis pH e V%, mostra que as regiões com boa fertilidade do solo coincidem com as regiões de médio e alto valores de V% e com valores também mais elevados de pH, o que ocorre, principalmente, na região Noroeste. As regiões que foram consideradas de baixa fertilidade coincidem com regiões de pH ácido, principalmente nas regiões Serrana e Norte. / Soil Digital Mapping (DSM) has been evolving over the past decades, from the investigation period to the production of maps in several scales, covering countries, regions and hydrographic basins. The prediction of classes and properties of the soils at the digital mapping is based on the existing relations between the factors and processes on the soil formation. The knowledge of the chemical qualities of the soil is a key point, aiming the rational use of correctives and fertilizers. This thesis had the objective of modeling the chemical variables of soil fertility, namely:pH in water, Pass(mg/kg), K+(cmolc/kg), C(g/kg), CEC(cmolc/kg), V% and Al(m)%, using as predictors the curvature plan and curvature profile, , aspect and declivity of the slopes, types of soil and its humidity level, NDVI, Landsat 7 images (2,4 and 7 bands) and litology. The area of study encompasses the most productive regions of Rio de Janeiro State: North, Northwest and Mountaineous, at 43°22´35´´; 40°57´27´´WG, e 20°45´47´´; 22°34´21´´S, covering 22,043 km2. Soil idata was taken from a wider database, provided by Embrapa Solos. The exploratory analyses of the two databases identified extreme values, that were discarded, to keep the characteristics of natural fertility and homogeneity of the sample, preparing the analyses by multiple linear regression (MLR). The statistic parameters analyzed by MLR models were: AIC, RMSE, Cp, adjusted R2, F and F probability. The results of the MLR were added to the results of the krigage of regression residue, a DSM technic known as R+K, that seemed to be an adequate method for digital mapping of soil properties, at this work. The analyzed soils showed low pH and high levels of Al saturation, as well as low concentrations of assimilative phosphorus. The CEC and V (%) values are on a good range to soil fertility, according to literature data. Carbon showed good levels for soil fertility, especially at the low terrains of the North region. It was not possible to achieve a synthesis of the soil fertility considering simultaneously all the studied varieties, since they are not homogeneous spatially. However, it was possible to make two synthesis-maps, using the good correlation between CEC and K+ and between pH and V%. The first synthesis-map, with the variegated K+ and CEC, identified, at the area of low lands of North of Rio de Janeiro State a lane considered good for soil fertility. The second synthesis-map, with the variegated pH and V%, shows that the areas with good soil fertility are the same of the areas of medium and high values of V% and with higher values of pH, which happens mainly at the Northwest. The areas that were considered with low fertility are the same with acid pH, specially the North and Mountaineous areas.
|
960 |
Regressão logística – uma estimativa Bayesiana aplicada na identificação de fatores de risco para HIV, em doadores de sangueQUEIROZ, Niedja Maristone Oliveira Barreto 26 March 2004 (has links)
Submitted by (ana.araujo@ufrpe.br) on 2016-08-09T12:57:36Z
No. of bitstreams: 1
Niedja Maristone Oliveira Barreto Queiroz.pdf: 2909360 bytes, checksum: 109caf21db04442310458a38ed638100 (MD5) / Made available in DSpace on 2016-08-09T12:57:36Z (GMT). No. of bitstreams: 1
Niedja Maristone Oliveira Barreto Queiroz.pdf: 2909360 bytes, checksum: 109caf21db04442310458a38ed638100 (MD5)
Previous issue date: 2004-03-26 / Logistic regression has application in several fields as epidemiology, medical research, banks, market research and social research. One of its advantages is that the interpretation of the measure is possible through the " Odds Ratios” (OR), that are functions of the parameters of the model. In this study the binary regression model was used, with the objective of estimating the relationship between two variables, taking into account the presence of other factors. For his purpose a Bayesian approach was used to estimate those risk measures, and these results were compared with the corresponding classical results obtained by application of a stepwise backward process, using the maximum likelihood as criterion for exclusion of the variable of the model, and the Wald test as analysis of each parameter of the final model, both at the level of significance of 0,05. An application was performed using real data from a transverse study of 106.203 blood donor candidates, found apt by the clinical screening process performed at the blood bank Recife of the HEMOPE foundation. Measures of HIV infection association “OR” were estimated in relation with certain socio-demographic conditions, sorological markers for other Sexually Transmissible Diseases as well as the donation type. For the classical analysis thestatistical package SPSS version 10 was used, and for the bayesian analysis the Winbugs 14. The results indicated that OR obtained using the two methods are rather similar, in spite of the fact that the classical approach used Maximum likelihood and the bayesian approach used the Markov Chain Monte Carlo(MCMC), which are quite different methods. It was concluded, that the factors independently associated to the HIV infection risk among donors of blood in the observed period, for the bayesian estimate, were: age 18 to 28 years (2,45) and 29 to 39 years (2,79); illiteracy (8,17), primary school (3,31) and secundary school (3,29); positive Anti-Hbc (1,95), positive syphilis (3,14), residence in the Metropolitan Area of Recife (2,41) and type of voluntary donation (11,94). / Regressão logística tem aplicação em diversos campos como epidemiologia, pesquisa médica, bancos, pesquisa de mercado e pesquisa social. Uma de suas vantagens é que a interpretação da medida é possível através das “Odds Ratios” (OR), que são funções dos parâmetros do modelo. Neste estudo foi usado o modelo de regressão binária, com o objetivo de estimar a relação entre duas variáveis tendo em conta a presença de outros fatores. Utilizou-se para isso uma abordagem bayesiana para estimar essas medidas de risco, fazendo uma comparação com os resultados da abordagem clássica proveniente de um processo stepwise backward, utilizando o critério da razão de verossimilhança como exclusão da variável do modelo e o teste de Wald como análise de cada parâmetro do modelo final, ambos no nível de significância de 0,05. Realizou-se uma aplicação com dados reais proveniente de um estudo transversal de 106.203 doadores de sangue de 1ª doação aptos na triagem clínica no Hemocentro Recife da Fundação HEMOPE. Estimou-se medidas de associação “OR”, da infecção por HIV, com relação a algumas condições sócio-demográficas, marcadores sorológicos para outras Doenças Sexualmente Transmissíveis (DST) e tipo de doação. Para as análises no método clássico foi utilizado o pacote estatístico SPSS versão 10 e no método bayesiano o Winbugs 14. Os resultados indicaram que as OR estimadas, utilizando os dois métodos, foram bastante próximas, apesar do clássico utilizar o método de estimação por Máxima Verossimilhança, e o bayesiano utilizar os métodos de Monte Carlo Cadeia de Markov (MCMC), que são métodos diferentes. Concluiu-se, que os fatores independentemente associados ao risco de infecção por HIV entre doadores de sangue no período foram, pela estimativa bayesiana: idade 18 a 28 anos (2,45) e 29 a 39 anos (2,79); escolaridade: analfabeto (8,17), ensino fundamental (3,31) e médio (3,29); Anti-Hbc positivo (1,95); sífilis positivo (3,14); residir na Região Metropolitana do Recife (RMR) (2,41) e tipo de doação voluntária (11,94).
|
Page generated in 0.0614 seconds