1001 |
Uma abordagem Forward-Looking para estimar a PD segundo IFRS9 / A Forward Looking Approach to estimate PD according to IFRS9Luiz Henrique Outi Kauffmann 20 November 2017 (has links)
Este trabalho tem por objetivo discutir as metodologias de estimação da PD utilizadas na indústria financeira. Além disso, contextualizar a aplicação do trabalho ao IFRS9 e seu direcionamento para o tema de Risco de Crédito. Historicamente os grandes bancos múltiplos utilizam variadas metodologias econométricas para modelar a Probabilidade de Descumprimento (PD),um dos métodos mais tradicionais é a regressão logística, entretanto com a necessidade do cálculo da Perda Esperada de Crédito através do IFRS9, se torna necessário mudar o paradigma de estimação para uma abordagem forward-looking, isto está sendo interpretado por muitas instituições e consultorias como a inclusão de fatores e variáveis projetadas dentro do processo de estimação, ou seja, não serão utilizados apenas os dados históricos para prever o descumprimento ou inadimplência. Dentro deste contexto será proposto uma abordagem que une a estimação da Probabilidade de Descumprimento com a inclusão de um fator foward-looking. / This paper aims to discuss the methodologies used to estimate the Probability Of Default used in the financial industry. In addition, contextualize the application of the work to IFRS9 requirements and its targeting to the Credit Risk theme. Historically large multi-banks use a variety of econometric methodologies to model the Probability of Default, one of the more traditional methods is logistic regression. However, with the need to calculate the expected credit loss through IFRS9, it becomes necessary to change the estimation paradigm to a forwardlooking approach, this is being interpreted by many institutions and consultancies companies as the inclusion of factors and variables projected within the estimation process, that is, not only historical data are used to predict the default. Within this context will be proposed an approach that joins the estimation of Probability of Default with the inclusion of a forward-looking factor.
|
1002 |
Feed efficiency traits in Santa Inês sheep under genomic approaches / Eficiência alimentar em ovinos da raça Santa Inês sob abordagem genômicaAmanda Botelho Alvarenga 28 September 2017 (has links)
The selection on genetic values predicted from markers could substantially increase the rate of genetic gain in animals by increasing accuracy of prediction and reducing generation interval, especially for difficult to measure traits, such as feed efficiency. Feed efficiency is the most important trait in animal production due to its impacts on cost of production and environmental factors. Many metrics measure the feed efficiency, such as ratio of gain to feed (FER), the ratio of feed to gain (FCR) and residual feed intake (RFI). Nevertheless, in ovine, no study with the aim of understand the genetic variants or the accuracy of genomic estimated breeding value (GEBV) for feed efficiency traits was published yet. Moreover, before to apply the genomic information, it is necessary to understand and characterized the population structure, for instance, by linkage disequilibrium (LD). Both genome-wide association studies (GWAS) and genomic selection (GS) leverage LD between marker and causal mutation. Based on the above considerations, the aim of this study was to map LD in ovine, characterized by Brazilian Santa Inês sheep; to search genetic variants for feed efficiency traits (FER, FCR and RFI) through GWAS; and to verify the accuracy of GEBV for RFI. In total, 396 samples (animals) of Longissimus dorsi muscle were collect. A high-density panel of SNP (Illumina High-Density Ovine SNP BeadChip®) comprising 54,241 SNPs was used to obtain the genotyping data. The phenotype data was comprised of 387 animals. The average LD between adjacent markers for two LD metrics, r² and |D\'|, were 0.166 and 0.617, respectively. The degree of LD estimated was lower than reported in other species and it was characterized by short haplotype blocks. Consequently, for genomic analyses, high-density panels of marker are recommended. Many markers were associated to feed efficiency traits in GWAS, mainly to RFI trait. Few candidate genes were reported in this study, highlighting NRF-1 (nuclear respiratory factor 1), which controls mitochondrial biosynthesis, the most important process responsible by a great fraction of the produced energy. Finally, we verified the accuracy of GEBV for RFI using few Bayesian regression models, and we found low accuracy, ranging from 0.033 (BayesB with π=0.9912) to 0.036 (BayesA), which might be explained by the low relationship among animals and small training population. / A seleção com base nos valores genéticos genômicos preditos pode aumentar substancialmente a taxa de ganho genético em animais por meio do aumento da acurácia de predição e redução do intervalo de gerações, especialmente para características de difícil e/ou onerosa mensuração, como eficiência alimentar. A eficiência alimentar é uma das características mais importantes na produção animal devido principalmente aos seus impactos econômicos e ambientais. Muitas métricas representam a eficiência alimentar, por exemplo: a relação do ganho de peso e consumo alimentar (EA), a proporção do consumo alimentar e ganho de peso (CA) e o consumo alimentar residual (CAR). Em ovinos, nenhum estudo com o objetivo de buscar variantes genéticas ou verificar a acurácia do valor genético genômico estimado para eficiência alimentar foi publicado. Adicionalmente, antes de aplicar a informação genômica, é necessário compreender e caracterizar a estrutura da população, como por meio do desequilíbrio de ligação (LD). O estudo de associação genômica (GWAS) e seleção genômica (GS) consideram o LD entre marcador e a mutação causal. Com base nas considerações acima, o objetivo deste estudo foi mapear o LD em ovinos, caracterizado pela raça ovina Santa Inês; localizar variantes genéticas para as características de eficiência alimentar (EA, CA e CAR) utilizando a abordagem GWAS; e verificar a acurácia da estimação dos valores genéticos genômico para o CAR. No total, foram coletadas 396 amostras (animais) do músculo Longissimus dorsi, para posterior genotipagem utilizando o painel de alta densidade (Illumina High-Density Ovine SNP BeadChip®), compreendendo 54.241 SNPs. O banco fenotípico é composto por 387 animais. O LD médio entre marcadores adjacentes para duas métricas de LD, r² e |D\'|, foram 0,166 e 0,617, respectivamente. O grau de LD estimado foi menor que o relatado em outras espécies e foi caracterizado por blocos de haplótipos curtos. Consequentemente, para as análises genômicas são recomendados painéis de marcadores de alta densidade. No GWAS, foram encontrados muitos marcadores associados aos fenótipos, em especial, à característica CAR. Alguns genes candidatos foram relatados neste estudo, destacando-se o NRF-1 (fator respiratório nuclear 1), que controla a biossíntese mitocondrial, o processo mais importante responsável por grande parte da produção de energia. Finalmente, verificamos a acurácia do valor genético genômico estimado para o CAR usando modelos de regressão Bayesiana, e encontramos baixos valores para acurácia (0,033 a 0,036) o que pode ser explicado pelo baixo grau de relacionamento entre os indivíduos e tamanho reduzido da população de treinamento.
|
1003 |
O gerenciamento do planejamento de mercado nas distribuidoras de energia elétrica: do racionamento ao ambiente regulado e livre de contratação de energia / The Management of Market Planning in the Utilities: From the Rationing to the Regulated Environment and Free Costumers.Ricardo Savoia 27 March 2009 (has links)
Este trabalho tem por objetivo quantificar as relações entre a demanda de energia elétrica e suas principais relações com os indicadores econômicos, socioeconômicos e comportamentais do País, busca a relação do consumo de eletricidade com o PIB - Produto Interno Bruto, seus agregados econômicos e o consumo de eletricidade do Brasil, Região Sudeste e o Estado de São Paulo, com suas principais classes de consumo residencial, comercial e Industrial, no período de 1984 a 2007. Para análise estatística, foi utilizado o E-Views como suporte e avanços para obtenção de melhores coeficientes estatísticos e tratamento dos dados. Os resultados encontrados foram condizentes com o esperado. A demanda nacional mostrou-se elástica ao comportamento do Produto Interno Bruto do País, para o período de 2003 2007, sendo constatada uma forte correlação aos indicadores econômicos. A Região Sudeste, denominada a locomotiva do crescimento nacional por sua maior predominância de indústria e comércio na região, mostrou-se elástica ao PIB, mas ligeiramente menor comparada ao comportamento do consumo nacional, reflexo de mudanças e incentivos governamentais para expansão e criação de pólos industriais em regiões pioneiras e em plena expansão demográfica. Com relação à classe residencial do Estado de São Paulo, o consumo mostrou-se inelástico com as taxas de crescimento da renda, isto é, o crescimento do consumo residencial é inferior ao crescimento da renda, mas com fracos resultados estatísticos nas variações apresentadas por este indicador econômico; necessitando porém, de estudos mais avançados incluindo outras variáveis de controle como o preço e outros fatores que são apresentados ao decorrer do trabalho. Para a classe comercial do Estado de São Paulo, encontrou-se a melhor relação com PIB Serviços Brasil e para a demanda industrial, sua aderência ao PIB Industrial Brasileiro. / The objective of this work is to quantify the relations between the demand of electric energy and its main relations with the economic, socio-economic and behavioral indicators of the Country, searching the relation of electricity consumption with the GDP Gross Domestic Product, its economic aggregates and the consumption of electricity of Brazil, Southeast region and the State of São Paulo, with its main classes of residential, commercial and Industrial consumption, in the period between 1984 to 2007. For statistical analysis, the E-Views were used as a support and advances to obtain the best statistical coefficients and data processing. The results obtained were compatible with those expected. The national demand proved to be flexible to the behavior of the Gross Domestic Product of the Country for the period of 2003 - 2008, being evidenced the strong relation to the economic indicators. The Southeast Region called the locomotive of the national growth for its bigger predominance of industry and commerce in the region, proved to be elastic to the GDP, but slightly lower compared with the behavior of the national consumption, reflexion of changes and government incentives for expansion and the creation of industrial areas in pioneer regions with booming population. Regarding to the residential classes of the State of São Paulo, the consumption proved to be inelastic with the growth rates of the income, that is, the growth of the residential consumption is inferior to the growth of the income, but with small statistics relations in the variations presented for this economic indicator, needing however, more advanced studies including other control variables as the price and other things presented in the work. For the commercial class of the State of São Paulo, the relation with the Services GDP Brazil was better and for the industrial demand its adhesion to the Brazilian Industrial GDP.
|
1004 |
Short selling recall option pricing: empirical and theoretical approaches / Precificação da opção de recompra nas operações de venda descoberta: abordagem empírica e teóricaLeonardo Viana de Almeida 01 September 2016 (has links)
Short selling is important for price efficiency as it helps negative information to be incorporated into prices. As short selling requires borrowing stock in advance, the equity lending market plays a central role in price efficiency. For instance, when the costs of borrowing certain equities are high, these stocks are likely to be overpriced. Unfortunately, not much is known about the equity lending market, particularly the Brazilian market. Here, we have investigated a particular feature of the equity lending contract, namely, the lender recall option. Lending contracts either i) allow the lender to recall the stock at an earlier date than initially agreed, or ii) allow no early recall, that is, they are fixed term contracts. We have derived a simple model for recall option pricing and confirmed the model empirically / A venda descoberta desempenha uma importante participação na eficiência da precificação de ativos, pois permite incorporar informações negativas aos seus preços. Como a venda descoberta requer que um ativo seja alugado previamente, o mercado de aluguel de ativos tem um papel central na formação eficiente de preços. Por exemplo, quando os custos de aluguel são altos, ativos estão provavelmente sobrevalorizados. Infelizmente pouco se conhece a fundo sobre o mercado de aluguel de ativos. Neste artigo, investigamos uma característica do aluguel de ações, propriamente dita, a opção de liquidação antecipada pelo doador. Contratos de aluguel, quanto a este aspecto, podem i) permitir que o doador requeira suas ações antes do prazo acordado ou ii) não permitir esta opção, possuindo prazo fixo. Derivamos um modelo simples de precificação desta opção e confirmamos o modelo empiricamente
|
1005 |
Internações de crianças por doenças respiratórias em São Paulo e suas relações com as condições climáticas e o contexto socioeconômico / Hospital admissions due to respiratory diseases in children in the municipality of São Paulo and their relationship with climatic conditions and the socioeconomic contextSara Lopes de Moraes 05 July 2018 (has links)
As transformações no clima urbano das cidades, bem como a excessiva poluição atmosférica e o aumento da segregação e das desigualdades sociais tornaram-se fatores determinantes das altas taxas de morbidade e mortalidade por doenças respiratórias. Desta forma, o objetivo principal desta pesquisa foi compreender como os atributos climáticos, a poluição do ar e as condições socioeconômicas estão relacionadas às internações hospitalares por doenças respiratórias em crianças com até 9 anos de idade em 14 distritos da cidade de São Paulo. Esta pesquisa foi dividida em duas etapas de trabalho, sendo a primeira a relação entre as variáveis meteorológicas, índices de conforto térmico e a poluição do ar (MP10) com as internações hospitalares no período de 2003 a 2013 a partir dos modelos estatísticos de distribuição binomial negativa e do modelo Distributed Lag Non-linear Model. A segunda etapa consistiu em analisar o padrão espacial entre a Razão Padronizada dos Internamentos Suavizada - RPIS e a privação sócio material da população na área de estudo ao longo do período de 2006 a 2013, com a utilização da autocorrelação espacial e dos modelos dos Mínimos Quadrados Ordinários e da Regressão Geograficamente Ponderada. Os resultados mostraram relações significativas de alto risco relativo entre a temperatura média do ar (17,5ºC a 21ºC, para o total analisado), umidade relativa do ar (84% a 98% para o sexo feminino), precipitação (0 mm a 2,3 mm para o total e ambos os sexos e >120mm para o sexo feminino) e do Material Particulado (MP10) (>35 g/m³ para o total e para o sexo feminino). Espacialmente foi possível identificar os setores com maior e menor privação sócio material, bem como da RPIS. Os resultados da dependência espacial da relação entre a privação e a RPIS também foram significativos e permitiram identificar os setores mais e menos vulneráveis às doenças respiratórias. Além disso, encontramos que as crianças do sexo feminino apresentaram alto risco (RR = 2,30) quando relacionados à maior privação. Esta pesquisa, portanto, permitiu concluir que determinados intervalos (valores específicos) dos atributos climáticos e a privação sócio material podem contribuir para o aumento das internações por doenças respiratórias nas crianças de 0 a 9 anos de idade na área de estudo. / The urban climate change, the excessive air pollution, the large social inequalities and segregation in the cities have become a determinant factors of high morbidity and mortality rates due to respiratory diseases. Therefore, the aims of this research was to understand how the climatic attributes, air pollution and socioeconomic conditions are related with hospital admissions for respiratory diseases in children up to 9 years of age in 14 districts of São Paulo. This research were divided into two working steps; the first step was the relationship between the meteorological variables, thermal comfort indexes and air pollution (PM10) with hospital admissions during 2003 to 2013, based on the statistical models of binomial distribution and Distributed Lag Model Non-linear Model. The second step was to analyze the spatial pattern between the Smoothed Standardized Admissions Ratio - RPIS and the deprivation index of the population in the study area over the period 2006-2013, considering the spatial autocorrelation and the spatial models, Ordinary Least Squares and Geographically Weighted Regression. The results showed significant relationship between the high relative risk with the mean air temperature (17.5ºC at 21°C, for the total), relative humidity (84% to 98% for females), rainfall (0 mm to 2.3mm for the total and both sexes and > 120 mm for the females) and PM10 (> 35g/m³ for the total and for the females). It was possible to identify the highest and lowest social deprivation material spatial pattern in the study area, and it was possible to identify the spatial pattern of the RPIS. The spatial dependence results showed a significant relationship between the deprivation index and RPIS. Therefore, these results allowed us to identify the most and least vulnerable census tracts related to respiratory diseases. In addition, we found that female children presented high risk (RR = 2.30) when they were related to greater deprivation. This research, therefore, allowed us to conclude that certain intervals (specific values) of climatic attributes and the deprivation index may contribute to increase the hospital admissions of respiratory diseases in children from 0 to 9 years of age in the study area.
|
1006 |
Associações genéticas entre características reprodutivas, de crescimento e produção de leite em animais Guzerá utilizando modelos de dimensão finita e infinita / Genetic associations between reproductive, growth and milk production traits in Guzerat cattle using finite and infinite dimensional modelsManuela Pires Monteiro da Gama 19 January 2018 (has links)
Os objetivos deste trabalho foram estimar as associações genéticas entre características de crescimento e produção de leite, utilizando análises bicaracterísticas, e entre características de crescimento, perímetro escrotal e idade ao primeiro parto utilizando modelos de regressão aleatória, de animais da raça Guzerá. Para as análises bicaracterísticas foram utilizadas 252.257 informações de pesos de machos e fêmeas aos 120 dias (P120), ao desmame (PD), ao ano (P365), ao sobreano (PSOBRE) aos 24 meses de idade (P24) e 6.493 lactações encerradas (P305), pertencentes a 4.723 vacas, e os modelos incluíram como os efeitos aleatórios o genético aditivo direto, de ambiente permanente materno e residual, e como efeitos fixos os grupos de contemporâneos e a idade da vaca ao parto (efeito linear e quadrático). Para as análises com os modelos de regressão aleatória foram utilizadas 159.366 observações de pesos e 23.780 de perímetro escrotal, realizadas entre 335 e 724 dias de idade dos animais e agrupadas em classes com intervalo de 10 dias, e 63.596 observações de idade ao primeiro parto. Os efeitos aleatórios considerados foram o genético aditivo direto, de ambiente permanente e residual e como efeitos fixos os grupos de contemporâneos, a idade da vaca ao parto (efeito linear e quadrático) e a curva fixa para modelar a tendência média da população (quadrática) sobre as classes de idade. Foram testados quatro possíveis graus de polinômios de Legendre (zero, linear, quadrático e cúbico), sendo o quadrático mais adequado para descrever as variâncias das características analisadas. Para verificar a existência de diferentes padrões de crescimento e agrupar os touros com base nos seus valores genéticos para produção de carne, leite e duplo propósito, foram realizadas análises de componentes principais e de agrupamento. As herdabilidades estimadas foram 0,23; 0,14; 0,16; 0,17; 021 e 0,22 para P305, P120, PD, P365, PSOBRE e P24, respectivamente, sugerindo que para as características de pesos, as herdabilidades aumentam com o aumento da idade dos animais. Mesma tendência foi observada pelas análises de regressão aleatória, cujas herdabilidades variaram de 0,17 a 0,31. As correlações genéticas entre os pesos em diferentes idades e a produção de leite foram positivas e de magnitude moderada a baixa, variando de 0,27 a 0,38 sugerindo que a seleção para peso e P305 possa ser realizada de forma simultânea nos mesmos animais. As análises de componentes principais indicaram a mesma tendência observada pelas correlações genéticas. As análises de agrupamento mostraram que a raça Guzerá possui touros com diferentes perfis genéticos, sendo possível realizar a seleção para corte, leite ou duplo propósito. As correlações genéticas entre os pesos e perímetro escrotal foram positivas e favoráveis, variando de 0,31 a 0,47, indicando que a seleção para aumento do peso poderá resultar em animais com maior perímetro escrotal. As correlações entre peso e idade ao primeiro parto variaram de -0,56 a -0,38 e perímetro escrotal e idade ao primeiro parto variaram de -0,55 a 0,08, sugerindo que a redução da idade ao primeiro parto poderá ocorrer, a longo prazo, quando peso e perímetro escrotal forem objetivos de seleção. A eficiência relativa de seleção indicou maior resposta pela seleção indireta para idade ao primeiro parto, quando realizada a seleção para perímetro escrotal a partir dos 615 dias de idade, quando comparada com o ganho genético direto para idade ao primeiro parto. / The objectives of this study were to estimate the genetic associations between growth and milk production traits in Guzerat cattle using two-trait analysis and between growth traits, scrotal circumference and age at first calving using random regression models. For two-trait analysis, 252,257 weight records of males and females obtained at 120 days of age (W120), weaning (WW), yearling (YW), post-weaning (PWW) and 24 months of age (W24), as well as 6,493 complete lactation records (W305) of 4,723 cows, were used. The models included direct additive genetic, maternal permanent environmental and residual effects as random effects, and the contemporary groups and age of cow at calving (linear and quadratic effect) as fixed effects. For the random regression models, 159,366 observations of weight and 23,780 observations of scrotal circumference, obtained at 335 and 724 days of age of the animals and divided into classes at 10-day intervals, as well as 63,596 observations of age at first calving, were used. Random direct additive genetic, permanent environmental and residual effects and the fixed effects of contemporary group and age of cow at calving (linear and quadratic effect) were considered. A fixed curve was used to model the average trend of the population (quadratic) on the age classes. Four possible degrees of Legendre polynomials (zero, linear, quadratic and cubic) were tested and the quadratic polynomial was the most appropriate to describe the variances in the traits analyzed. Principal component and cluster analyses were performed to determine the existence of different growth patterns and to group bulls based on their breeding values for meat, milk and dual-purpose production. The estimated heritabilities were 0.23, 0.14, 0.16, 0.17, 0.21 and 0.22 for W305, W120, WW, YW, PWW and W24, respectively, suggesting that, for the growth traits, heritabilities increased with increasing age of the animals. The same trend was observed when random regression analysis was performed, with heritabilities ranging from 0.17 to 0.31. The genetic correlations between weights at different ages and milk yield were positive and of moderate to low magnitude, ranging from 0.27 to 0.38. These estimates suggest that selection for weight and W305 can be performed simultaneously in the same animals. Principal component analysis indicated the same trend as observed by the genetic correlations. Cluster analysis showed the presence of bulls with different genetic profiles in the Guzerat breed, thus permitting selection for meat, milk or dual purpose. The genetic correlations between weights and scrotal circumference were positive and favorable (0.31 to 0.47), indicating that selection for increased weight will result in animals with greater scrotal circumference. The correlations between weights and age at first calving ranged from -0.56 to -0.38 and between scrotal circumference and age at first calving from -0.55 to 0.08, suggesting that the use of weight and scrotal circumference as selection objectives will result in the long-term reduction of age at first calving. The relative efficiency of selection indicated a greater response to indirect selection for age at first calving when selecting for scrotal circumference after 615 days of age, compared to the genetic gain obtained by direct selection for age at first calving.
|
1007 |
Métodos de correção de autovalores e regressão isotônica nos modelos AMMI / Methods of eigenvalue correction and isotonic regression in models AMMILúcio Borges de Araújo 02 February 2006 (has links)
Em experimentação agrícola, é freqüente a necessidade de análise conjunta de grupos de experimentos. Em muitos casos, o pesquisador deseja generalizar resultados para condições gerais de regiões e/ou em avaliar o desempenho de vários genótipos (tratamentos) em diversos ambientes (locais e/ou ano). Quando um conjunto de experimentos é planejado para vários locais é necessário considerar o delineamento individual em cada local e a combinação total dos genótipos com os locais (interação genótipo × ambiente). Logo, os dados observados podem ser organizados em uma tabela de dupla entrada. Existem várias metodologias de análise e interpretação para a interação genótipo × ambiente proveniente de um grupo de cultivares testados em vários ambientes. Entre essas metodologias destaca-se os modelos AMMI (additive main effects and multiplicative interaction model), como o próprio nome diz é um método uni-multivariado, que engloba uma análise de variância para os efeitos principais, que são os efeitos dos genótipos (G) e os ambientes (E) e para efeitos multiplicativos (interação genótipo × ambiente), utiliza-se a decomposição em valor singular (DVS). Essa técnica multivariada baseia-se no uso dos autovalores e autovetores provenientes da matriz de interação genótipo × ambiente. Araújo e Dias (2005) verificaram o problema de superestimação e subestimação de autovalores estimados da maneira convencional. Para superar esses problemas de estimação de autovalores, Muirhead (1987) apresenta três métodos para corrigir autovalores estimados a partir das matrizes de covariâncias amostral e alerta que nem sempre essas correções mantêm a ordem decrescente de valores, assim é sugerido o uso de regressão isotônica para ordenar esses dados, mas propriamente um algoritmo apresentado por Lin e Pearlman (1985). Os resultados indicaram que: A regressão isotônica juntamente com o algoritmo foi necessária e se mostrou muito importante em todos conjuntos de dados; Houve uma redução no número de componentes significativos para serem retidos nos modelos, fazendo com que os modelos AMMI selecionados sejam mais parcimoniosos quando se utiliza qualquer um dos métodos de correção; O método 2 apresentou as menores taxa de correção da soma de quadrados da interação genótipo × ambiente e o método 3 apresentou a maiores taxa de correção; Em relação a medida RMSPDPRESS, os menores valores foram obtidos quando se utilizou o método de correção 2. Já o método de correção 3 apresentou os maiores valores para RMSPDPRESS; O método 2 também se mostrou melhor quando o interesse era verificar o ganho em número de repetições, sendo que este benefício esteve sempre próximo de 3 repetições. Já o método 3 é o que apresenta um menor ganho em número de repetições, em torno de duas repetições. / In agricultural research is common to analyse groups of experiments. In many cases, the researcher intends to generalize results to general conditions of areas and/or evaluate the responses of several genotypes (treatments) in several environments (places and/or years). When a group of experiments is planned for several places it is necessary to consider the of design in each place and the combinations of the genotypes with the places (the interaction of genotype × environment). The observed data can be organized in an array. There are several methods of analysis and interpretation for the genotype × environment interaction from a group of genotype tested in several environments. These methods include AMMI models (additive main effect and multiplicative interaction models). As the name says it is a uni-multivariate method, that includes an analysis of variance for the main effects (the effects of the genotypes (G) and environments (E)) and assumes multiplicative effects for the genotype × environment interaction, using a singular value decomposition (DVS). This method estimates the eigenvalues and eigenvectors deriving from the matrix of genotype × environment interaction. Araújo and Dias (2005) found an overestimation and underestimation problem with the eigenvalues in the conventional way. To correct these problems Muirhead (1987) presents three methods to correct the eigenvalues from covariance the matrix and noted that these do not always maintain the order of values. The author suggested the use of isotonic regression to correct the eigenvalues, using an algorithm presented by Lin and Pearlman (1985). The results indicated that: The isotonic regression with the algorithm is necessary and it showed very important in all groups of data; There was a reduction in the number of significant components to be kept in the models and the order that the AMMI model selected is more parsimonious when any of the correction methods is used; The method 2 has the smallest rate of correction to the sum of squares of the genotype × environment interaction and method 3 has the largest correction rate; The measure RMSPDPRESS was smallest when method of correction 2 was used. The method of correction 3 has the largest values for RMSPDPRESS; Method 2 was also better when the interest was to verify the gain in number of replicates, and this benefit was always close to 3 replicates. The method 3 gives the smaller gain in the number of replicates, of around two replicates.
|
1008 |
Análise da taxa de mortalidade por câncer de mama nos municípios brasileiros no período de 1987 a 2013 e fatores associadosCouto, Maria Silvia de Azevedo 21 March 2016 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2016-07-21T17:32:33Z
No. of bitstreams: 1
mariasilviadeazevedocouto.pdf: 2895688 bytes, checksum: 20bccf6c5e6305b3ba035985a75ebf3b (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2016-07-22T15:34:14Z (GMT) No. of bitstreams: 1
mariasilviadeazevedocouto.pdf: 2895688 bytes, checksum: 20bccf6c5e6305b3ba035985a75ebf3b (MD5) / Made available in DSpace on 2016-07-22T15:34:14Z (GMT). No. of bitstreams: 1
mariasilviadeazevedocouto.pdf: 2895688 bytes, checksum: 20bccf6c5e6305b3ba035985a75ebf3b (MD5)
Previous issue date: 2016-03-21 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Alguns estudos sobre o câncer de mama no Brasil indicam que a mortalidade associada a esta doença cresceu nas últimas décadas. Contudo, após verificar que tal crescimento não ocorreu de forma homogênea no território nacional, buscou-se, nesse trabalho, analisar a taxa de mortalidade por câncer de mama nos municípios brasileiros e os fatores associados a esta neoplasia. Foram calculadas taxas de mortalidade, padronizadas por faixa etária, centradas nos anos de 1990, 2000 e 2010. Deste modo, foi possível estimar modelos de regressão, com dados em painel e corte transversal, que permitiram verificar o grau de associação de alguns destes fatores em diferentes períodos e regiões do Brasil. Os resultados indicaram que o crescimento da renda per capita, o aumento da expectativa de vida, a queda no nível de escolaridade, a redução da taxa de fecundidade e menores gastos públicos em saúde poderiam elevar a taxa da mortalidade por câncer de mama. No caso da taxa corrigida por causas mal definidas, apenas a longevidade e os gastos públicos em saúde afetariam a mortalidade pela doença. Constatou-se ainda que a mortalidade por câncer de mama é maior no Sul e no Sudeste e menor no Norte, Nordeste e Centro Oeste, respectivamente. Além disso, as menores taxas de mortalidade são encontradas em cidades com 20 a 100 mil habitantes. Já as maiores ocorreriam tanto nos municípios com mais de 500 mil habitantes quanto naqueles onde a população não chega a 5 mil. A análise de tendência revelou que as regiões brasileiras só não reduziram suas respectivas taxas de mortalidade devido a outros fenômenos vivenciados pelo país, tais como o crescimento da renda, a elevação da expectativa de vida e a diminuição da taxa de fecundidade. Por fim, os dados apresentados sobre o câncer de mama revelaram uma qualidade inferior dos registros de óbitos desta neoplasia nas regiões Norte, Centro-Oeste e Nordeste em comparação ao Sudeste e Sul do país. Entretanto, esta situação melhorou durante o período analisado. Além disso, a diminuição dos óbitos por causas mal definidas parece ter reduzido o impacto deste problema sobre a mortalidade por câncer de mama. / Some researchers have indicated an increase on breast cancer mortality in Brazil in recent decades. However, this growth has not been homogeneous along the national territory. Therefore, this research aimed to analyze the factors associated to mortality rate from breast cancer of Brazilian counties. In order to accomplish this task, mortality rates, standardized by age group, were calculated to each county of Brazil to the years 1990, 2000 and 2010. It allowed us to estimate regression models, with cross-section and panel data, in order to verify the degree of association of these factors to different periods and regions of Brazil. The results revealed that a growth rate of per capita income, an increase of longevity, a decrease in the level of education, a reduction of fertility rates and a reduction of public spending on health could increase the mortality from breast cancer. However, when considering the mortality rate with correction by ill-defined causes, the results indicated that only the longevity and public spending on health would affect mortality. It was also found that mortality is higher in the South and Southeast and it is lower in the North, Northeast and Midwest, respectively. In addition, the lowest mortality rates were found in cities with 20.-100 thousand inhabitants. The highest mortality rates belong both to the big cities, with over 500 thousand inhabitants, as to the small ones, where the population does not reach 5 thousand. The trend analysis showed that Brazilian regions could have reduced their respective mortality rates if other phenomena (such as income growth, increased life expectancy and declining fertility rate) had not happened in Brazil. Finally, the compilation of data on breast cancer still showed a lower level of coverage of this neoplasm in the North, Midwest and Northeast and a higher level in the Southeast and South. However, this situation has improved over the considered period. Moreover, the reduction of deaths coming from ill-defined causes, verified along 1990, 2000 and 2010, appears to have reduced the effect of this problem on mortality from breast cancer.
|
1009 |
Algoritmos online baseados em vetores suporte para regressão clássica e ortogonalSouza, Roberto Carlos Soares Nalon Pereira 21 February 2013 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-05-30T20:07:56Z
No. of bitstreams: 1
robertocarlossoaresnalonpereirasouza.pdf: 1346845 bytes, checksum: e248f967f42f4ef763b613dc39ed0649 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-06-01T11:51:04Z (GMT) No. of bitstreams: 1
robertocarlossoaresnalonpereirasouza.pdf: 1346845 bytes, checksum: e248f967f42f4ef763b613dc39ed0649 (MD5) / Made available in DSpace on 2017-06-01T11:51:04Z (GMT). No. of bitstreams: 1
robertocarlossoaresnalonpereirasouza.pdf: 1346845 bytes, checksum: e248f967f42f4ef763b613dc39ed0649 (MD5)
Previous issue date: 2013-02-21 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Neste trabalho apresenta-se uma nova formulação para regressão ortogonal. O problema é definido como a minimização do risco empírico em relação a uma função de perda com tubo desenvolvida para regressão ortogonal, chamada ρ-insensível. Um algoritmo para resolver esse problema é proposto, baseado na abordagem da descida do gradiente estocástica. Quando formulado em variáveis duais o método permite a introdução de funções kernel e flexibilidade do tubo. Até onde se sabe, este é o primeiro método que permite a introdução de kernels, através do chamado “kernel-trick”, para regressão ortogonal. Apresenta-se ainda um algoritmo para regressão clássica que usa a função de perda ε-insensível e segue também a abordagem da descida do gradiente. Para esse algo ritmo apresenta-se uma prova de convergência que garante um número finito de correções. Finalmente, introduz-se uma estratégia incremental que pode ser usada acoplada com ambos os algoritmos para obter soluções esparsas e também uma aproximação para o “tubo mínimo”que contém os dados. Experimentos numéricos são apresentados e os resultados comparados a outros métodos da literatura. / In this work, we introduce a new formulation for orthogonal regression. The problem
is defined as minimization of the empirical risk with respect to a tube loss function de
veloped for orthogonal regression, named ρ-insensitive. The method is constructed via
an stochastic gradient descent approach. The algorithm can be used in primal or in dual
variables. The latter formulation allows the introduction of kernels and soft margins. To
the best of our knowledge, this is the first method that allows the introduction of kernels
via the so-called “kernel-trick” for orthogonal regression. Also, we present an algorithm
to solve the classical regression problem using the ε-insensitive loss function. A conver
gence proof that guarantees a finite number of updates is presented for this algorithm.
In addition, an incremental strategy algorithm is introduced, which can be used to find
sparse solutions and also an approximation to the “minimal tube” containing the data.
Numerical experiments are shown and the results compared with other methods.
|
1010 |
Avaliação do uso de classificadores para verificação de atendimento a critérios de seleção em programas sociaisSantos, Cinara de Jesus 07 March 2017 (has links)
Submitted by isabela.moljf@hotmail.com (isabela.moljf@hotmail.com) on 2017-08-15T12:01:50Z
No. of bitstreams: 1
cinaradejesussantos.pdf: 4566569 bytes, checksum: bddc2ea97276541c0a8ad30a371102d1 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-08-15T12:02:54Z (GMT) No. of bitstreams: 1
cinaradejesussantos.pdf: 4566569 bytes, checksum: bddc2ea97276541c0a8ad30a371102d1 (MD5) / Made available in DSpace on 2017-08-15T12:02:54Z (GMT). No. of bitstreams: 1
cinaradejesussantos.pdf: 4566569 bytes, checksum: bddc2ea97276541c0a8ad30a371102d1 (MD5)
Previous issue date: 2017-03-07 / Classificadores são separadores de grupos que mediante determinadas características organiza os dados agrupando elementos que apresentem traços semelhantes, o que permite reconhecimento de padrões e identificação de elementos que não se encaixam. Esse procedimento de classificação e separação pode ser observado em processos do cotidiano como exames (clínicos ou por imagem), separadores automáticos de grãos na agroindústria, identificador de probabilidades, reconhecedores de caracteres, identificação biométrica - digital, íris, face, etc. O estudo aqui proposto utiliza uma base
de dados do Ministério do Desenvolvimento Social e Combate a Fome (MDS), contendo informações sobre beneficiários do Programa Bolsa Família (PBF), onde contamos com registros descritores do ambiente domiciliar, grau de instrução dos moradores do domicílio assim como o uso de serviços de saúde pelos mesmos e informações de cunho financeiro (renda e gastos das famílias). O foco deste estudo não visa avaliar o PBF, mas o comportamento de classificadores aplicados sobre bases de caráter social, pois estas apresentam certas particularidades. Sobre as variáveis que descrevem uma família como beneficiária ou não do PBF, testamos três algoritmos classificadores - regressão
logística, árvore binária de decisão e rede neural artificial em múltiplas camadas. O desempenho destes processos foi medido a partir de métricas decorrentes da chamada matriz de confusão. Como os erros e acertos de uma classe n˜ao s˜ao os complementares da outra classe é de suma importância que ambas sejam corretamente identificadas. Um desempenho satisfatório para ambas as classes em um mesmo cenário não foi alçado - a identificação do grupo minoritário apresentou baixa eficiência mesmo com reamostragem seguida de reaplicação dos três processos classificatórios escolhidos, o
que aponta para a necessidade de novos experimentos. / Classifiers are group separators that, by means of certain characteristics, organize the data by grouping elements that present similar traits, which allows pattern recognition and the identification of elements that do not fit. Classification procedures can be used in everyday processes such as clinical or imaging exams, automatic grain separators in agribusiness, probability identifiers, character recognition, biometric identification by thumbprints, iris, face, etc. This study uses a database of the Ministry of Social Development and Fight against Hunger (MDS), containing information on beneficiaries of the Bolsa Fam´ılia Program (PBF). The data describe the home environment, the level of education of the residents of the household, their use of public health services, and some financial information (income and expenses of families). The focus of this study is not to evaluate the PBF, but to analyze the performance of the classifiers when applied to bases of social character, since these have certain peculiarities. We have tested three classification algorithms - logistic regression, binary decision trees
and artificial neural networks. The performance of these algorithms was measured by metrics computed from the so-called confusion matrix. As the probabilities of right and wrong classifications of a class are not complementary, it is of the utmost importance that both are correctly identified. A good evaluation could not be archive for both classes in a same scenario was not raised - the identification of the minority group showed low efficiency even with resampling followed by reapplication of the three
classificatory processes chosen, which points to the need for new experiments.
|
Page generated in 0.0656 seconds