1121 |
Análise da qualidade do ar : um estudo de séries temporais para dados de contagemSilva, Kelly Cristina Ramos da 30 April 2013 (has links)
Made available in DSpace on 2016-06-02T20:06:08Z (GMT). No. of bitstreams: 1
5213.pdf: 2943691 bytes, checksum: 6d301fea12ee3950f36c4359dd4a627e (MD5)
Previous issue date: 2013-04-30 / Financiadora de Estudos e Projetos / The aim of this study was to investigate the monthly amount of unfavourable days to pollutant dispersion in the atmosphere on the metropolitan region of S ão Paulo (RMSP). It was considered two data sets derived from the air quality monitoring on the RMSP: (1) monthly observations of the times series of annual period and (2) monthly observations of the times series of period form May to September. It was used two classes of models: the Vector Autoregressive models (VAR) and Generalized Additive Models for Location, Scale and Shape (GAMLSS). The techniques presented in this dissertation was focus in: VAR class had emphasis on modelling stationary time series; and GAMLSS class had emphasis on models for count data, like Delaporte (DEL), Negative Binomial type I (NBI), Negative Binomial type II (NBII), Poisson (PO), inflated Poisson Zeros (ZIP), Inverse Poisson Gaussian (PIG) and Sichel (SI). The VAR was used only for the data set (1) obtaining a good prediction of the monthly amount of unfavourable days, although the adjustment had presented relatively large residues. The GAMLSS were used in both data sets, and the NBII model had good performance to data set (1), and ZIP model for data set (2). Also, it was made a simulation study to better understanding of the GAMLSS class for count data. The data were generated from three different Negative Binomial distributions. The results shows that the models NBI, NBII, and PIG adjusted well the data generated. The statistic techniques used in this dissertation was important to describe and understand the air quality problem. / O objetivo deste trabalho foi investigar a quantidade mensal de dias desfavoráveis à dispersão de poluentes na atmosfera da região metropolitana de São Paulo (RMSP). Foram considerados dois conjuntos de dados provenientes do monitoramento da qualidade do ar da RMSP: (1) um contendo observações mensais das séries temporais do período anual e (2) outro contendo observações mensais das séries temporais do período de maio a setembro. Foram utilizadas duas classes de modelos: os Modelos Vetoriais Autorregressivos (VAR) e os Modelos Aditivos Generalizados para Locação, Escala e Forma (GAMLSS), ressaltando que as técnicas apresentadas nessa dissertação da classe VAR têm ênfase na modelagem de séries temporais estacionárias e as da classe GAMLSS têm ênfase nos modelos para dados de contagem, sendo eles: Delaporte (DEL), Binomial Negativa tipo I (NBI), Binomial Negativa tipo II (NBII), Poisson (PO), Poisson Inflacionada de Zeros (ZIP), Poisson Inversa Gaussiana (PIG) e Sichel (SI). O modelo VAR foi utilizado apenas para o conjunto de dados (1), obtendo uma boa previsão da quantidade mensal de dias desfavoráveis, apesar do ajuste ter apresentado resíduos relativamente grandes. Os GAMLSS foram utilizados em ambos conjuntos de dados, sendo que os modelos NBII e ZIP melhor se ajustaram aos conjuntos de dados (1) e (2) respectivamente. Além disso, realizou-se um estudo de simulação para compreender melhor os GAMLSS investigados. Os dados foram gerados de três diferentes distribuições Binomiais Negativas. Os resultados obtidos mostraram que, tanto os modelos NBI e NBII como o modelo PIG, ajustaram bem os dados gerados. As técnicas estatísticas utilizadas nessa dissertação foram importantes para descrever e compreender o problema da qualidade do ar.
|
1122 |
Modelos mistos semiparamétricos parcialmente não linearesMachado, Robson José Mariano 28 March 2014 (has links)
Made available in DSpace on 2016-06-02T20:06:09Z (GMT). No. of bitstreams: 1
6004.pdf: 835734 bytes, checksum: b9cae4e00b44525ff06f6dfea7cfe687 (MD5)
Previous issue date: 2014-03-28 / Universidade Federal de Sao Carlos / Correlated data sets with nonlinear structure are common in many areas such as biostatistics, pharmacokinetics and longitudinal studies. Nonlinear mixed-effects models are useful tools to analyse those type of problems. In this dissertation, a generalization to this models is proposed, namely by semiparametric partially nonlinear mixed-effects model (MMSPNL), with a nonparametric function to model the mean of the response variable. It assumes that the mean of the interest variable is explained by a nonlinear function, which depends on fixed effects parameters and explanatory variables, and by a nonparametric function. Such nonparametic function is quite flexible, allowing a better adequacy to the functional form that underlies the data. The random effects are included linearly to the model, which simplify the expression of the response variable distribution and enables the model to take into account the within-group correlation structure. It is assumed that the random errors and the random effects jointly follow a multivariate normal distribution. Relate to the nonparametric function, it is deal with the P-splines smoothing technique. The methodology to obtain the parameters estimates is penalized maximum likelihood method. The random effects may be obtained by using the Empirical Bayes method. The goodness of the model and identification of potencial influent observation is verified with the local influence method and a residual analysis. The pharmacokinetic data set, in which the anti-asthmatic drug theophylline was administered to 12 subjects and serum concentrations were taken at 11 time points over the 25 hours (after being administered), was re-analysed with the proposed model, exemplifying its uses and properties. / Dados correlacionados com estrutura não linear são comuns em bioestatística, estudos farmacocinéticos e longitudinais. Modelos mistos não lineares são ferramentas úteis para se analisar esses tipos de problemas. Nesta dissertação, propõe-se uma generalização desses modelos, chamada de modelo misto semiparamétrico parcialmente não linear (MMSPNL), com uma função não paramétrica para se modelar a média da variável resposta. Assume-se que a média da variável de interesse é explicada por uma função não linear, que depende de parâmetros de efeitos fixos e variáveis explicativas, e por uma função não paramétrica. Tal função não paramétrica possui grande flexibilidade, permitindo uma melhor adequação à forma funcional que subjaz aos dados. Os efeitos aleatórios são incluídos linearmente ao modelo, o que simplifica a expressão da distribuição da variável resposta e permite considerar a estrutura de correlação intra grupo. É assumido que os erros aleatórios e efeitos aleatórios conjuntamente seguem uma distribuição normal multivariada. Em relação a função não paramétrica, utiliza-se a técnica de suavização com P-splines. A metodologia para se obterem as estimativas dos parâmetros é o método de máxima verossimilhança penalizada. Os efeitos aleatórios podem ser obtidos usando-se o método de Bayes empírico. A qualidade do modelo e a identificação de observações aberrantes é verificada pelo método de influência local e por análise de resíduos. O conjunto de dados farmacocinéticos, em que o antiasmático theophylline foi administrado a 12 sujeitos e concentrações séricas foram tomadas em 11 instantes de tempo durante as 25 horas (após ser administrado), foi reanalisado com o modelo proposto, exemplificando seu uso e propriedades.
|
1123 |
Previsão espaço-temporal de demanda incluindo alterações nos hábitos de consumidores residenciais /Mejia Alzate, Mario Andres January 2016 (has links)
Orientador: Antonio Padilha Feltrin / Resumo: Neste trabalho é apresentado um método que permite determinar o crescimento espaço-temporal da demanda de energia elétrica devido às mudanças nos hábitos de consumo no setor residencial. A proposta é baseada em uma regressão ponderada geograficamente que permite determinar a localização espacial dos setores com maior proporção de residências candidatas para comprar um novo eletrodoméstico, e uma regressão de distribuição logística que permite simular em cada setor, como vai ser o crescimento ao longo do tempo dessa proporção de residências candidatas para comprar o aparelho. Finalmente, o método determina o impacto nas curvas de carga dos transformadores de distribuição, considerando: o número de residências candidatas em cada setor, e informações do eletrodoméstico em estudo, tais como: curva de carga em p.u, potência nominal, fator de utilização, fator de coincidência e fator de potência. A região em estudo é dividida em pequenas subáreas, com o objetivo de melhorar a resolução espacial do prognóstico, e também considerar interrelações de proximidade entre as subáreas, para determinar como as decisões tomadas em um local influenciam nas preferências de seus vizinhos. O método proposto usa como dados de entrada variáveis socioeconômicas do censo da população que são de fácil acesso para as empresas do setor elétrico e que caracterizam a economia e as preferências da população da cidade em estudo. O método proposto foi aplicado em uma cidade de médio porte da República do Equ... (Resumo completo, clicar acesso eletrônico abaixo) / Mestre
|
1124 |
Modelação e análise da vida útil (metrológica) de medidores tipo indução de energia elétrica ativaSilva, Marcelo Rubia da [UNESP] 27 August 2010 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:22:31Z (GMT). No. of bitstreams: 0
Previous issue date: 2010-08-27Bitstream added on 2014-06-13T18:49:27Z : No. of bitstreams: 1
silva_mr_me_ilha.pdf: 2058535 bytes, checksum: 046bcb6196cc4909e675190cc0e21275 (MD5) / Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) / O estudo da confiabilidade operacional de equipamentos se tornou fundamental para as empresas possuírem o devido controle dos seus ativos, tanto pelo lado financeiro quanto em questões de segurança. O estudo da taxa de falha de equipamentos prevê quando as falhas irão ocorrer possibilitando estabelecer atitudes preventivas, porém, seu estudo deve ser realizado em condições de operação estabelecidas e fixas. Os medidores de energia elétrica, parte do ativo financeiro das concessionárias de energia, são equipamentos utilizados em diversas condições de operação, tanto nas condições do fluxo de energia, tais como presenças de harmônicos, subtensões, sobre-tensões e padrões de consumo distintos, quanto pelo local físico de instalação, tais como maresia, temperatura, umidade, etc. As falhas nos medidores eletromecânicos de energia elétrica são de difícil constatação uma vez que a maioria dos erros de medição, ocasionados principalmente por envelhecimento de componentes, não alteram a qualidade da energia fornecida e nem interrompem o seu fornecimento. Neste sentido, este trabalho propõe uma nova metodologia de determinação de falhas em medidores eletromecânicos de energia elétrica ativa. Faz-se uso de banco de dados de uma concessionária de energia elétrica e do processo de descoberta de conhecimento em bases de dados para selecionar as variáveis mais significativas na determinação de falhas em medidores eletromecânicos de energia elétrica ativa, incluindo no conjunto de falhas a operação com erros de medição acima do permitido pela legislação nacional (2010). Duas técnicas de mineração de dados foram utilizadas: regressão stepwise e árvores de decisão. As variáveis obtidas foram utilizadas na construção de um modelo de agrupamento de equipamentos associando a cada grupo uma probabilidade... / The operational reliability study of equipments has become primal in order to enterprises have the righteous control over their assets, both by financial side as by security reasons. The study for the hazard rate of equipments allows to foresee the failures for the equipments and to act preventively, but this study must be accomplished under established and fixed operation conditions. The energy meters, for their part, are equipments utilized in several operating conditions so on the utilization manner, like presence of harmonics, undervoltages and over-voltages and distinct consumption patterns, as on the installation location, like swel, temperature, humidity, etc. Failures in electromechanical Wh-meters are difficult to detect once that the majority of metering errors occurred mainly by aging of components do not change the quality of offered energy neither disrupt its supply. In this context, this work proposes a novel methodology to obtain failure determination for electromechanical Whmeters. It utilizes Wh-databases from an electrical company and of the process of knowledge discovery in databases to specify the most significant variables in determining failures in electromechanical Wh-meters, including in the failure set the operation with metering errors above those permitted by national regulations (2010). Two techniques of data mining were used in this work: stepwise regression and decision trees. The obtained variables were utilized on the construction of a model of clustering similar equipments and the probability of failure of those clusters were determined. As final results, an application in a friendly platform were developed in order to apply the methodology, and a case study was accomplished in order to demonstrate its feasibility.
|
1125 |
FITOSSOCIOLOGIA DE COMUNIDADES ARBÓREAS EM SAVANAS DO BRASIL CENTRAL / PHYTOSOCIOLOGY OF THE ARBOREAL COMMUNITIES IN SAVANNAS FROM CENTRAL BRAZILFinger, Zenesio 11 February 2008 (has links)
These studies were undertaken in the state of Mato Grosso, Brazil, in the area of Chapada dos Guimarães and Baixada Cuiabana, which are constituted of a high plateau and a big low plain, respectively, being limited to two areas covered by vegetation with a savannic physiognomy, type Cerrado stricto sensu. Considering the hypothesis that the knowledge both of the biotic and abiotic components of the scenery and their interrelations allows a better understanding of the environmental dynamic, this dissertation had as objectives to characterize the savanna communities' arboreal stratum floristically and phytosociologically, concerning their richness, phytosociological structures and diversity; to identify floristic groupings through varied statistical techniques, representing them by dendrograms; to select species which are really able to make discrimination among the groups; to obtain some discriminant functions to allow classification and reclassification of specimen units, in the groups, to which they have more probability of belonging; to analyze and to characterize the obtained groups; to determine the patterns of distribution of the species of trees by the analysis of correlations of environmental variables with the distribution of the species and plots in the communities being studied; to determine the similarity indexes among the floristic groups and to compare themselves and, finally, to test methods of assorted statistical analysis for application in studies of vegetable communities. Data of vegetation were obtained by the method of multiple plots, with size of 20 X 20 m (400 m2), randomly disposed in each one of the areas being studied. 82 plots were randomly installed. In each one of the 82 patternless units, the circumferences of all the arboreal plants with perimeter to 0,30 m from the level of the soil (PAB) larger or equal to 15,7 cm (DAB 5,0 cm) and the total height of the plants were obtained. In the core of each plot, for determination of the chemical and textural variables of the soil, simple samples of superficial soil were collected (0-30 cm depth). Species were organized according to the families recognized by Angiosperm Phylogeny Group II. The sampling sufficiency was obtained based on the analysis of the curve of the collector. Phytosociological parameters were calculated for each formed group, with the purpose of characterizing them phytosociologically. Having as variables the Index of Covering Value (IVC) of the species, the classification was accomplished by the TWINSPAN (Two-Way Indicator Species Analysis) method, regarding the plots, with the objective of classifying them in floristic groups. The diversity was determined by the Shannon-Wienner and the Simpson Index. The discriminant analysis was undertaken through the STEPWISE method. Considering the matrix of presence and absence of the species in the groups, the floristic similarity was calculated among the groups by the Sorensen Index. To evaluate the hypothesis of the correlation existence between the distribution of the species and environmental variables, the canonical correspondence analysis was accomplished (CCA). The test of permutation of Monte Carlo was applied to verify the importance of the correlations between the emerging distribution patterns of the species and the environmental variables in final CCA. To determine the responsible environmental factors for the distribution of the species, the analysis of regression logistics was used. The Forward Stepwise (Wald) method was used for the sequential selection of the variables. By the species-area curve, it could be observed that, from the plot 75 (30.000 m2 out of the area used as sample), the curve is stabilized with the occurrence of 114 species in the 82 studied plots, distributed between 81 genera and 36 botanical families. The families better represented were Fabaceae, Myrtaceae and Vochysiaceae. The alpha diversity from the arboreal vegetation found in the area being studied was of 4,033 considering the Shannon-Wiener Index and of 0,975 considering the Simpson Index, representing a great floristic diversity. The divisions generated
by the classification through the TWINSPAN method separated the plots into four groups: Group 1 Myrcia albo-tomentosa Camb. Association; Group 2 Pterodon emarginatus Vog. Association ; Group 3 Curatella americana L. Association; and Group 4 Qualea multiflora Mart. Association. In the discriminant analysis, 100% of the plots were classified correctly in the Groups 1, 2, 3 and 4, indicating precision of the grouping technique used. The largest similarity could be observed in the Groups 2 and 3, whose Sorensen Index was close to 1 (0,7310). In the four floristic groups, Fabaceae, Myrtaceae, Vochysiaceae, Annonaceae and Apocynaceae families were the most representative floristically in terms of genera and species. In CCA the correlations of the environmental variables with the first ordination axis were, in decreasing order of absolute values, saturation for aluminum, altitude s.n.m., saturation of bases, saturation for magnesium, relationship magnesium/potassium, saturation for hydrogen, potassium tenor, pH(H2O) and relationship calcium/potassium. The saturation for calcium variable presented very weak correlation with the first axis, however, with the second ordination axis, it was very strong. In the diagram of ordination of the plots, the four floristic groups were discriminated in sections different from the diagram, reinforcing their visualization as much defined habitats and with composition of particular species, resulting in clear separation of the four soil classes previously identified. The logistic regression analysis was useful to prove the results obtained from CCA, concerning the environmental variables which determined the distribution of the indicative species of the floristic groups in the studied communities. / Estes estudos foram desenvolvidos no estado de Mato Grosso, Brasil, na região de Chapada dos Guimarães e Baixada Cuiabana, que compreendem, respectivamente, um alto platô e uma grande planície baixa, restringindo-se a duas áreas cobertas por vegetação com fisionomia savânica do tipo Cerrado stricto sensu. Partindo-se da hipótese de que o conhecimento tanto dos componentes bióticos e abióticos da paisagem como de suas inter-relações permite um melhor entendimento da dinâmica ambiental, o presente estudo teve como objetivos caracterizar o estrato arbóreo das comunidades de savana estudadas, florística e fitossociologicamente, quanto a riqueza, estrutura fitossociológica e diversidade; identificar agrupamentos florísticos, por meio de técnicas estatísticas multivariadas, representando-os por meio de dendrograma; selecionar espécies com poder real de discriminação entre os grupos; obter funções discriminantes que permitam classificar e reclassificar unidades amostrais, nos grupos, para os quais têm maior probabilidade de pertencerem; analisar e caracterizar os grupos obtidos; determinar os padrões de distribuição das espécies de árvores, por meio da análise de correlações de variáveis ambientais com a distribuição das espécies e parcelas nas comunidades estudadas; determinar os índices de similaridade entre os grupos florísticos obtidos e compará-los; e testar métodos de análise estatística multivariada para aplicação em estudos de comunidades vegetais. Os dados da vegetação foram obtidos empregando-se o método de parcelas múltiplas, com tamanho de 20 X 20 m (400 m2), dispostas aleatoriamente em cada uma das áreas de estudos. Foram instaladas aleatoriamente 82 parcelas. Em cada uma das 82 unidades amostrais, foram obtidas as circunferências de todos as plantas arbóreas com perímetro a 0,30 m do nível do solo (PAB) maior ou igual a 15,7 cm (DAB 5,0 cm), e a altura total das plantas. No centro de cada parcela, para determinação das variáveis químicas e texturais do solo, coletaram-se amostras simples de solo superficial (0-30 cm de profundidade). As espécies foram organizadas de acordo com as famílias reconhecidas pelo Angiosperm Phylogeny Group II. A suficiência de amostragem foi obtida com base na análise da curva do coletor. Os parâmetros fitossociológicos foram calculados para cada grupo formado, com a finalidade de caracterizá-los fitossociológicamente. Tendo como variáveis o Índice de Valor de Cobertura (IVC) das espécies, foi realizada a classificação, por meio do método TWINSPAN (Two-Way Indicator Species Analisys), com relação às parcelas, com o objetivo de classificá-las em grupos florísticos. A diversidade foi determinada por meio do Índice de Shannon-Wienner e de Simpson. Realizou-se a análise discriminante por meio do método STEPWISE. A partir da matriz de presença e ausência das espécies nos grupos, foi calculada a similaridade florística entre os grupos, por meio do Índice de Sorensen. Para avaliar a hipótese da existência de correlação entre a distribuição das espécies e variáveis ambientais, foi realizada a análise de correspondência canônica (CCA). Foi aplicado o teste de permutação de Monte Carlo para verificar a significância das correlações entre os padrões de distribuição emergentes das espécies e as variáveis ambientais na CCA final. Para determinar os fatores ambientais responsáveis pela distribuição das espécies, foi utilizada a análise de regressão logística. À seleção seqüencial das variáveis foi utilizado o método Forward Stepwise (Wald). Pela curva espécie-área, pode-se observar que, a partir da parcela 75 (30.000 m2 da área amostrada), a curva estabiliza-se com a ocorrência de 114 espécies nas 82 parcelas estudadas, distribuídas entre 81 gêneros e 36 famílias botânicas. As famílias mais bem representadas foram Fabaceae, Myrtaceae e Vochysiaceae. A diversidade alfa da vegetação arbórea encontrada na área estudada foi de 4,033 pelo índice de Shannon-Wiener e de 0,975 pelo de Simpson, indicando alta diversidade florística. As divisões geradas pela classificação por meio do método TWINSPAN separaram as parcelas em quatro grupos. Grupo 1 - Associação Myrcia albo-tomentosa Camb.; Grupo 2 - Associação Pterodon emarginatus Vog.; Grupo 3 - Associação Curatella americana L.; e Grupo 4 - Associação Qualea multiflora Mart.. Na análise discriminante, observou-se que 100% das parcelas foram classificadas corretamente nos grupos 1, 2, 3 e 4, indicando precisão da técnica de agrupamento utilizada. A maior similaridade se deu entre os grupos 2 e 3, cujo índice de Sorensen foi próximo de 1 (0,7310). Nos quatro grupos florísticos obtidos, as famílias Fabaceae, Myrtaceae, Vochysiaceae, Annonaceae e Apocynaceae foram as mais representativas florísticamente em número de gêneros e espécies. Na CCA, as correlações das variáveis ambientais com o primeiro eixo de ordenação foram, em ordem decrescente de valores absolutos, saturação por alumínio, altitude s.n.m., saturação de bases, saturação por magnésio, relação magnésio/potássio, saturação por hidrogênio, teor de potássio, pH(H2O) e relação cálcio/potássio. A variável saturação por cálcio apresentou correlação muito fraca com o primeiro eixo, entretanto, com o segundo eixo de ordenação, foi muito forte. No diagrama de ordenação das parcelas, os quatro grupos florísticos foram discriminados em setores diferentes do diagrama, reforçando a visualização dos mesmos como hábitats bem definidos e com composição de espécies particular, resultando em clara separação das quatro classes de solo identificadas previamente. A análise de regressão logística comprovou os resultados obtidos da CCA, em relação às variáveis ambientais que determinaram a distribuição das espécies indicadoras dos grupos florísticos nas comunidades estudadas.
|
1126 |
Análise de diagnóstico em modelos de regressão ZAGA e ZAIG / Diagnostic analysis in ZAGA and ZAIG regression models.Rodrigues, Juliana Scudilio 10 March 2016 (has links)
Submitted by Luciana Sebin (lusebin@ufscar.br) on 2016-09-30T12:41:21Z
No. of bitstreams: 1
DissJSR.pdf: 1876095 bytes, checksum: c73d62c08322c1ffad6e30271b52d706 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-13T20:40:15Z (GMT) No. of bitstreams: 1
DissJSR.pdf: 1876095 bytes, checksum: c73d62c08322c1ffad6e30271b52d706 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-13T20:40:24Z (GMT) No. of bitstreams: 1
DissJSR.pdf: 1876095 bytes, checksum: c73d62c08322c1ffad6e30271b52d706 (MD5) / Made available in DSpace on 2016-10-13T20:40:33Z (GMT). No. of bitstreams: 1
DissJSR.pdf: 1876095 bytes, checksum: c73d62c08322c1ffad6e30271b52d706 (MD5)
Previous issue date: 2016-03-10 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Residuals play an important role in checking model adequacy and in the identi cation of outliers and in uential observations. In this paper, we studied two class of residuals for the zero adjusted gamma regression model (ZAGA) and the zero adjusted inverse Gaussian regression model (ZAIG). These classes of residuals are function of a residual for the continuous component of the model and the maximum likelihood estimate of the probability of the observation assuming the zero value. Monte Carlo simulation studies are performed to examine the properties of this class of residuals in both models (ZAGA and ZAIG). Results showed that a residual of one of these class has some similar properties to the standard normal distribution in the studied models. We also described ZAGA and ZAIG regression models, studied properties of some residuals in generalized linear models with response gamma and
inverse Gaussian and discussed other aspects of diagnostic analysis in ZAGA and ZAIG models. To nsih, we presented a real dataset application from investment funds of Brazil. We tted the ZAIG model to illustrate the topics discussed and showed the importance of these models and the advantages of one of the studied residuals in the analysis of real dataset. / Resíduos desempenham um papel importante na veri cação do ajuste do modelo e na identi cação de observações discrepantes e/ou in uentes. Neste trabalho, estudamos duas classes de resíduos para os modelos de regressão gama in acionados no zero (ZAGA) e gaussiana inversa in acionados no zero (ZAIG). Essas classes de resíduos são uma função de um
resíduo para o componente contínuo do modelo e da estimativa de máxima verossimilhança da probabilidade da observação assumir o valor zero. Estudos de simulação de Monte Carlo foram realizados para examinar as propriedades dessas classes de resíduos em ambos os modelos de regressão (ZAGA e ZAIG). Os resultados mostraram que um resíduo de uma dessas
classes tem algumas propriedades semelhantes à da distribuição normal padrão nos modelos estudados. Além desse objetivo principal, descrevemos os modelos de regressão ZAGA e ZAIG, estudamos propriedades de alguns resíduos em modelos lineares generalizados com resposta gama e gaussiana inversa e discutimos outros aspectos de análise de diagnóstico nos
modelos ZAGA e ZAIG. Para nalizar, foi feita uma aplicação com dados reais de fundos de investimentos, em que ajustamos o modelo ZAIG, para exempli car os tópicos discutidos e mostrar a importância desses modelos e as vantagens de um dos resíduos estudados na análise de dados reais.
|
1127 |
Aplicação estruturada de dados de redes sociais na modelagem de instrumentos de apoio às decisões de concessão de crédito / Social networks structured data application: modelins support tools for credit acquisitions decisionsFattibene, Marcos 27 January 2015 (has links)
Made available in DSpace on 2016-06-02T19:53:33Z (GMT). No. of bitstreams: 1
FATTIBENE_Marcos_2015.pdf: 1035875 bytes, checksum: 9f4308478818fe20ad4a239e96c1bb67 (MD5)
Previous issue date: 2015-01-27 / The credit analysis for individuals has traditionally relied on three pillars: documentary proof of income and residence; refers to negative credit bureaus as SERASA and SCPC and the use of forecasting models based on the hypothesis that similar profiles in the future will reproduce the same credit behavior of the past, such as the "credit scores" (HAND; HENLEY, 2007) . This approach has been adequate, while being susceptible to moments of economic crisis or to fast profile changing of the target market, as occurred in the U.S. subprime in 2008. This study aims to point out ways to use Social Networks informational content, where individuals express and record their opinions, preferences, and especially get evident their network of relationships, in the credit analysis context. It was made evident the feasibility to investigate the assumption that an individual's proximity to other appropriate profile payers, or vice versa, influences the repayment rate. To illustrate such a conclusion, a real social network, enriched with credit data obtained by statistical simulation, was used. Three models of data weighting and three other based on multiple linear regression models were developed. In general the results were not statistically significant, by need to use a non-brazilian social network, as well synthetic data bureau score, since real information was not available in this country. It was shown a way to investigate the hypothesis that the informational content of a social network may generate greater efficiency into credit analysis when added to decision-making, operational and control systems of this segment. / A análise de crédito para pessoas físicas tem tradicionalmente se apoiado em três pilares: comprovação documental de renda e de residência; consulta a birôs negativos de crédito, como SERASA Experian e SCPC e a utilização de modelos de projeção baseados na hipótese que perfis semelhantes reproduzirão no futuro o comportamento de crédito do passado, como por exemplo, os credit scores (HAND ; HENLEY, 2007). Tal abordagem tem se mostrado adequada, sendo, entretanto suscetível a momentos de crise econômica ou mudança rápida do perfil do mercado alvo, a exemplo do ocorrido no mercado imobiliário dos EUA no ano de 2008. O presente trabalho propõe-se indicar alternativas para a utilização do teor informacional presente nas Redes Sociais, onde os indivíduos registram suas opiniões, preferências e especialmente evidenciam sua rede de relacionamentos, no contexto da análise de risco de crédito. Evidenciaram-se formas de averiguação da premissa que proximidade de um indivíduo a outros com perfil de bons pagadores, ou vice-versa, influencia a taxa de adimplência. Para se ilustrar tais sugestões, foi utilizada uma rede social real, enriquecida com dados de crédito obtidos por simulação estatística. Foram elaborados três modelos de ponderação de dados e três modelos baseados em regressão linear múltipla. Em geral os resultados não foram estatisticamente significantes, dada a necessidade de uso de rede social estrangeira como também da geração de dados sintéticos de score de birô de crédito, dada a indisponibilidade de informações reais no País. Porém, ficou evidenciada a viabilidade da averiguação da hipótese de que o conteúdo informacional contido em redes sociais pode ampliar a eficiência do sistema de análise de crédito, se incorporado aos sistemas decisórios, operativos e de controle.
|
1128 |
Estimativa de demanda de energia elétrica em uma instituição de ensino superior.Garcia, Altemir Tomaz de Carvalho 28 August 2015 (has links)
Submitted by Maike Costa (maiksebas@gmail.com) on 2016-04-25T12:59:29Z
No. of bitstreams: 1
arquivo total.pdf: 2399944 bytes, checksum: b31ffd454938b9e66e2494032cb6d9ee (MD5) / Made available in DSpace on 2016-04-25T12:59:29Z (GMT). No. of bitstreams: 1
arquivo total.pdf: 2399944 bytes, checksum: b31ffd454938b9e66e2494032cb6d9ee (MD5)
Previous issue date: 2015-08-28 / In recent years, several studies where published regarding to the estimation of variables related to the use of electricity, where the most varied methodologies are used to perform modeling and estimation of demand for energy of countries, States, companies in general and educational systems. In this dissertation where chosen this last category and the focus is on Higher Education Institutions (HEIs). Looking for drawing up an estimate of Wing Maxim Demand (WMD), monthly of electrical energy power, for the (HEIs), from the amount of students and, if necessary, from other causal variables, which can contribute to managerial way for the renegotiation of contracts with concessionaires that lead to annual cost savings and still contribute to a better control of the levels of maxim demand of electricity. To achieve this objective, it was realized a review of the literature regarding to the variables that could introduce correlation with the dependent variable WMD. This review indicated several methodologies that could contribute to the solution of the problem proposed: Markov Chain, Support vector Regression methodology, Genetic Programming Model and Artificial Neural Networks. It was adopted the methodology of Multiple Linear Regression (MLR) because it is less complex and a methodology directed at large companies. It was selected an IES and were carried out interviews with some engineers and technician of his electrical engineering division, seeking to better understand energy use and the behavior of the variable WMD in this IES being made available the reports of power energy monitoring where the WMD data of January-December 2008 of 2014 were contained. So on the basis of these data and documental research of the independent variables, and, through the methodologies of Multiple Linear Regression (MLR), it was developed a model from the data of 72 months which had their waste evaluated, showing a coefficient of determination R ^ 2 equal to 0.883. Independent variables that remained in the model, from the use of the backward method, were 4 (four) Dummy variables associated with the years, six variables of this type associated with the months and a variable which is the product of school days for graduates and the quantity of graduate students registered. This model was able to identify seasonality presents in the behavior of the WMD of this HIE. It would allow the hiring of WMD per month, that would make savings of 57% compared to the traditional contracting mode (WMD fixed for the entire period), considering the period from July to December, before the period left for validation. In conclusion, a forecast for the period of January to May 2015 and the adoption of the proposed model was able to provide a savings of 45% in relation to the scheme currently used by this HEI. / Nos últimos anos, diversos trabalhos foram publicados em relação à estimativa de variáveis relacionadas ao uso da energia elétrica, onde as mais variadas metodologias são utilizadas para realizar a modelagem e estimação da demanda por energia de países, Estados, empresas em geral e dos sistemas de ensino. Nesta dissertação foi escolhida esta última categoria e o foco consiste nas Instituições de Ensino Superior (IES). Procurando elaborar uma estimativa de Demanda Máxima de Ponta (DMP), mensal de potência de energia elétrica adequada às IESS, a partir da quantidade de alunos, e, se necessário, a partir de outras variáveis causais, que possam contribuir de maneira gerencial para a renegociação de contratos com concessionárias que levem à redução de custos anuais e que ainda podem contribuir para um melhor controle dos níveis de demanda máxima de energia elétrica. Para alcançar tal objetivo, foi realizada uma revisão da literatura a respeito de variáveis que poderiam apresentar correlação com a variável dependente DMP. Esta revisão indicou várias metodologias que poderiam contribuir para a solução do problema proposto: a Cadeia de Markov, a Metodologia de Regressão do vetor de Suporte, o Modelo de Programação Genética e as Redes Neurais Artificiais. Por ser uma metodologia menos complexa e direcionada a empresas de grande porte, adotou-se a Metodologia de Regressão Linear Múltipla (RLM). Foi selecionada uma IES e foram realizadas entrevistas com alguns engenheiros e técnico da sua divisão de engenharia elétrica, procurando entender melhor o uso da energia e o comportamento da variável DMP nesta IES, sendo disponibilizados os relatórios de energia do sistema de monitoração de energia onde os dados de DMP de janeiro de 2008 a dezembro de 2014 estavam contidos. Então, com base nestes dados e em pesquisa documental das candidatas a variáveis independentes, e, através da Metodologia (RLM), foi desenvolvido um modelo a partir dos dados de 72 meses, que teve seus resíduos avaliados, apresentando um coeficiente de determinação 𝑅2 igual a 0,883 .As variáveis independentes que permaneceram no modelo, a partir da utilização do método backward, foram 4(quatro) variáveis Dummy associadas a anos, seis variáveis deste tipo associadas a meses e uma variável fruto do produto entre dias letivos de graduação e quantidade de alunos da graduação matriculados. O modelo foi capaz de identificar a sazonalidade presente no comportamento da DMP da IES em estudo. Ele possibilitaria a contratação de DMP por mês, o que daria uma economia de 57% em relação ao modo de contratação tradicional (DMP fixo para todo o período), considerando o período de julho a dezembro, antes do período deixado para validação. Concluindo, foi realizada uma previsão para o período de janeiro a maio de 2015 e a adoção do modelo proposto foi capaz de proporcionar uma economia de 45% em relação ao esquema utilizado atualmente pela IES.
|
1129 |
Um novo método para transferência de modelos de calibração NIR e uma nova estratégia para classificação de sementes de algodão usando imagem hiperespectral NIRSoares, Sófacles Figueredo Carreiro 20 June 2016 (has links)
Submitted by ANA KARLA PEREIRA RODRIGUES (anakarla_@hotmail.com) on 2017-08-09T15:33:48Z
No. of bitstreams: 1
arquivototal.pdf: 4699110 bytes, checksum: ef3b7c0aa5c4758d2c77e65ad6a81ad3 (MD5) / Made available in DSpace on 2017-08-09T15:33:48Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 4699110 bytes, checksum: ef3b7c0aa5c4758d2c77e65ad6a81ad3 (MD5)
Previous issue date: 2016-06-20 / Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPq / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This work involves the development of two studies that are presented in chapters 2 and 3. At
first, a new method to perform the calibration transfer was designed. This method was
developed to make use of separate variables instead of using the full spectrum or spectral
windows. To accomplish this task a univariate procedure is initially used to correct the spectra
recorded in the secondary equipment, given a set of transfer samples. A robust regression
technique is then used to obtain a model with small sensitivity with respect to the univariate
correction. The proposed method is employed in two case studies involving near infrared
spectrometric determination of specific mass, research octane number and naphtenes in
gasoline, and moisture and oil in corn. In both cases, better calibration transfer results were
obtained in comparison with piecewise direct standardization (PDS). In the second, a new
strategy for cotton seed classification using near infrared (NIR) hyperspectral images (HSI)
was developed. Initially the cotton seeds samples were recorded on a station HSI image-NIR
and a conventional spectrometer NIR. Thereon, the images were segmented and the mean
spectrum of each seed was extract. Classification models SPA-LDA e PLS-DA based on the
mean spectral were developed for two data sets. The results for models SPA-LDA and PLSDA
showed that the classification with HSI-NIR data set has been achieved with greater
accuracy when compared to models for the NIR-conventional data set. / Este trabalho envolve o desenvolvimento de dois estudos, que são apresentados nos capítulos
2 e 3. No primeiro, um novo método para realizar a transferência de calibração foi concebido.
Este método foi desenvolvido para fazer uso de variáveis isoladas em vez de usar todo o
espectro ou janelas espectrais. Para realizar essa tarefa, um procedimento univariado é
inicialmente usado para corrigir os espectros registrados no equipamento secundário, dado um
conjunto de amostras de transferência. Uma técnica de regressão robusta é então usada para
obter um modelo com pequena sensibilidade em relação aos resíduos da correção univariada.
O novo método é então empregado em dois estudos de caso envolvendo análise
espectrométrica NIR, em que foram determinados os parâmetros massa específica, RON
(Research Octane Number) e teor de naftênicos em gasolina e os teores de água e óleo em
amostras de milho. Os resultados do novo método foram melhores do que os obtidos usando o
método PDS. No segundo, uma nova estratégia para classificação de sementes de algodão
usando imagens hiperespectrais no NIR foi desenvolvido. Inicialmente as amostras de
sementes de algodão foram registradas em uma estação de imagem HSI-NIR e em um
equipamento NIR convencional. Após isso, as imagens foram segmentadas e os espectros
médios de cada semente foram extraídos. Os modelos de classificação SPA-LDA e PLS-DA
baseados nos espectros médios foram construídos para os dois conjuntos de dados. Os
resultados SPA-LDA e PLS-DA para os modelos demonstraram que a classificação com os
dados HSI-NIR foi alcançada com maior exatidão quando comparada aos modelos obtidos
usando o NIR-convencional.
|
1130 |
Proposta metodológica para identificar fatores contribuintes de acidentes viários por meio de geotecnologias / Methodological proposal to identify contributing factors of road accidents through geotechnologiesBatistão, Mariana Dias Chaves [UNESP] 02 February 2018 (has links)
Submitted by Mariana Dias Chaves null (mariana.unesp@hotmail.com) on 2018-02-16T19:43:53Z
No. of bitstreams: 1
Batistao, MDC-TeseDr.pdf: 6348711 bytes, checksum: 0f1b9c7f3392530f6d2f279ee0b58768 (MD5) / Approved for entry into archive by Claudia Adriana Spindola null (claudia@fct.unesp.br) on 2018-02-19T11:31:34Z (GMT) No. of bitstreams: 1
batistao_mdc_dr_prud.pdf: 6348711 bytes, checksum: 0f1b9c7f3392530f6d2f279ee0b58768 (MD5) / Made available in DSpace on 2018-02-19T11:31:34Z (GMT). No. of bitstreams: 1
batistao_mdc_dr_prud.pdf: 6348711 bytes, checksum: 0f1b9c7f3392530f6d2f279ee0b58768 (MD5)
Previous issue date: 2018-02-02 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Essa pesquisa apresenta um estudo acerca dos fatores contribuintes de acidentes rodoviários com o objetivo de fornecer evidências para analisar o comportamento dos fatores contribuintes envolvidos nesses acidentes, mais especificamente nos trechos críticos. Desejase identificar a relação dos fatores com o grau de severidade de um acidente (danos materiais, sem vítimas fatais e com vítimas fatais) e o impacto de cada classe de fator na ocorrência de um acidente. A intensão é embasar uma análise geoespacial levando em consideração técnicas estatísticas e cartográficas e contribuir para melhorar a qualidade das informações sobre segurança viária no país e seu atual cenário crítico. A estrutura metodológica da pesquisa consiste em três etapas principais: (I) Identificação e determinação de segmentos de trechos críticos, (II) Mapeamento dos fatores contribuintes “via” para o acidente e (III) Investigação e estudo dos fatores contribuintes. Quatro trechos de rodovias do oeste do estado de São Paulo foram escolhidos como área de estudo. Na etapa I propôs-se um método de interpolação espacial de escolha de segmentos de trechos críticos levando a premissa existência da dependência geográfica dos acidentes em consideração. No total, foram identificados oito segmentos de trechos críticos na área de estudo. A etapa II concentrou-se no mapeamento dos fatores contribuintes desses segmentos de trechos críticos. Essa etapa trouxe o caráter tecnológico à pesquisa por fazer uso da integração de geotecnologias e a contribuição das Ciências Cartográficas para os estudos de segurança viária, por gerar informação a partir do mapeamento da localização dos fatores contribuintes. Das quatro classes de fatores (humano, ambiente, veículo e via) as características da via foram escolhidas para serem mapeadas, tendo-se deparado com a ausência de qualquer dado dessa classe de fatores tanto no banco de dados dos acidentes como no boletim de ocorrências. A relação com as outras três classes de fatores foi tratada na etapa III da pesquisa, cujos resultados proporcionaram montar o ranking dos seis fatores contribuintes da via mais frequentes nos segmentos de trechos críticos. Adicionalmente, foram construídos três modelos de regressão logística ordinal para investigar o impacto de cada uma das quatro classes de fatores no grau de severidade do acidente (três graus de severidade). Para isso, o grau foi tratado como variável dependente dos modelos. Quatro variáveis independentes (fatores contribuintes) foram consideradas significativas e escolhidas para compor os modelos: consumo de drogas (da classe de fator contribuinte humano), estado dos pneus (da classe de fator veículo), vegetação (da classe de fator via) e sinalização (da classe de fator via). Por fim, os modelos puderam ser analisados a partir da razão de chances (odds ratio) para complementar as informações e sintetizar os resultados como contribuições da pesquisa. / This research presents a study about the contributing factors of road accidents in order to provide evidences to analyse the behaviour of contributing factors involved in these accidents more specifically in critical sections. The intention is to identify the relationship between those factors and the severity degree of an accident (material damage, no fatalities and fatalities) and the impact of each factor class on an accident occurrence. The aim is to base on geospatial analysis taking into account statistical and cartographic techniques and contribute to improve the quality of the road safety information in the country which has a current critical scene. The methodological structure of this thesis consists of following three main steps: (I) Identification and determination of critical sections segments, (II) mapping “road” contributing factors for each accident and (III) Investigation and study of the contributing factors. Four sections of highways in the west of São Paulo state were chosen as the study area. In Step I, proposed a spatial interpolation method to choose critical sections segments premising the existence of geographical dependence of the considered accidents. In entire, eight critical sections segments were identified in the study area. Step II focused on mapping the contributing factors of these segments. This step brought the technological character to this research by making use of geotechnologies integration and the contribution of Cartographic Sciences to road safety by generating information of the contributing factors location from mapping. Of the four factors classes (human, environment, vehicle and road), the road characteristics were chosen to be mapped, since no data from this factor class was found in both the accident database and the occurrence report. The relation with the other three factors classes was the subject of step III, which results provided a ranking of the six most frequent contributing factors in critical sections segments. In addition, three ordinal logistic regression models were constructed to investigate the impact of each of the four factors classes on the accident severity degree (three severity degrees). For this, the severity degree was considered as the models dependent variable. Four significant independent variables (contributing factors) were chosen to compose the following models: drug consumption (from the human contributing factor class), tire condition (vehicle factor class), vegetation (road factor class) and signaling (road factor class). Lastly, the models could be analysed by the odds ratio method to complement the information and synthesize the results as research contributions.
|
Page generated in 0.0719 seconds