31 |
The Strucplot Framework: Visualizing Multi-way Contingency Tables with vcdMeyer, David, Zeileis, Achim, Hornik, Kurt January 2005 (has links) (PDF)
This paper describes the `strucplot' framework for the visualization of multi-way contingency tables. Strucplot displays include hierarchical conditional plots such as mosaic, association, and sieve plots, and can be combined into more complex, specialized plots for visualizing conditional independence, GLMs, and the results of independence tests. The framework's modular design allows flexible customization of the plots' graphical appearance, including shading, labeling, spacing, and legend, by means of graphical appearance control (`grapcon') functions. The framework is provided by the R package vcd. (author's abstract) / Series: Research Report Series / Department of Statistics and Mathematics
|
32 |
Kategorinių požymių priklausomybių struktūros statistinė analizė ir jos taikymas genetikoje / Dependence Structure Analysis of Categorical Variables With Applications in GeneticsŽidanavičiūtė, Jurgita 03 March 2010 (has links)
Disertacijoje nagrinėjami kai kurie kategorinių požymių statistinės analizės
uždaviniai – ryšių struktūros bei modelio parinkimo ir jo parametrų įvertinimo
uždaviniai. Disertacijos tikslas – pasiūlyti ryšių struktūros tarp kategorinių
požymių įvertinimo metodą tuo atveju, kai turime didelės dimensijos
duomenų rinkinius ir išsklaidytas dažnių lenteles, t. y. kai daugumoje dažnių
lentelės ląstelių yra mažas stebinių skaičius arba jos yra tuščios. Ši situacija
iliustruojama DNR genetinių sekų statistine analize.
Disertaciją sudaro įvadas, trys pagrindiniai skyriai, išvados, naudotos literatūros
ir autoriaus publikacijų sąrašai.
Įvadiniame skyriuje pristatoma tiriamoji problema ir jos aktualumas, aprašomas
tyrimų objektas, formuluojamas darbo tikslas ir uždaviniai, aptariamas
darbo mokslinis naujumas bei ginamieji teiginiai. Įvado pabaigoje pateikiami
autoriaus pranešimai konferencijose disertacijos tema.
Pirmame skyriuje pateikta kategorinių požymių statistinėje analizėje taikomų
matematinių modelių apžvalga, šių modelių ryšys su Markovo laukų
teorija ir Gibso skirstiniu.
Antrame skyriuje atlikta statistinė analizė kai kurioms realioms DNR sekoms
Markovo eilės jose įvertinimui bei pirminių ir antrinių DNR grandinių
vijų palyginimui: pasiūlyta kategorinių duomenų statistinės analizės metodika,
pagrįsta specialia stebimų duomenų forma, apibendrintu logit modeliu bei
savirankos testais.
Trečiame skyriuje išsklaidytų dažnių lentelės problemai spręsti pasiūlytas
semiparametrinis... [toliau žr. visą tekstą] / The dissertation considers some problems in the statistical analysis of categorical
variables – the dependence structure between categorical variables
and the problems of selecting and assessing the models for this structure. The
aim of this dissertation is to propose the method to estimate dependence structure
between multivariate categorical variables in case of sparse frequency tables
and to apply the proposed method in the statistical analysis of genetic
sequences.
The thesis layout consists of introduction chapter, three main chapters,
conclusions, list of authors’s publications and bibliography chapter.
The introduction reveals the investigated problem, importance of the thesis
and the object of research and describes the purpose and tasks of the dissertation,
research methodology, scientific novelty, the practical significance and
defended statements. The introduction end in presenting the author’s publications
on the subject of the defended dissertation.
In the first chapter of the dissertation various models available for describing
the nature of the association between categorical variables are introduced
and their link with Markov field theory and Gibbs distribution.
In the second chapter the basic notions of DNA sequences and a special
structure of genetic data is introduced. The logit models and Markov field theory
are applied to assess the dependence structure (interactions) between DNA
nucleotides and to test hypothesis about Markov order of these dependencies... [to full text]
|
33 |
Dependence Structure Analysis of Categorical Variables With Applications in Genetics / Kategorinių požymių priklausomybių struktūros statistinė analizė ir jos taikymas genetikojeŽidanavičiūtė, Jurgita 03 March 2010 (has links)
The dissertation considers some problems in the statistical analysis of categorical
variables – the dependence structure between categorical variables
and the problems of selecting and assessing the models for this structure. The
aim of this dissertation is to propose the method to estimate dependence structure
between multivariate categorical variables in case of sparse frequency tables
and to apply the proposed method in the statistical analysis of genetic
sequences.
The thesis layout consists of introduction chapter, three main chapters,
conclusions, list of authors’s publications and bibliography chapter.
The introduction reveals the investigated problem, importance of the thesis
and the object of research and describes the purpose and tasks of the dissertation,
research methodology, scientific novelty, the practical significance and
defended statements. The introduction end in presenting the author’s publications
on the subject of the defended dissertation.
In the first chapter of the dissertation various models available for describing
the nature of the association between categorical variables are introduced
and their link with Markov field theory and Gibbs distribution.
In the second chapter the basic notions of DNA sequences and a special
structure of genetic data is introduced. The logit models and Markov field theory
are applied to assess the dependence structure (interactions) between DNA
nucleotides and to test hypothesis about Markov order of these dependencies... [to full text] / Disertacijoje nagrinėjami kai kurie kategorinių požymių statistinės analizės
uždaviniai – ryšių struktūros bei modelio parinkimo ir jo parametrų įvertinimo
uždaviniai. Disertacijos tikslas – pasiūlyti ryšių struktūros tarp kategorinių
požymių įvertinimo metodą tuo atveju, kai turime didelės dimensijos
duomenų rinkinius ir išsklaidytas dažnių lenteles, t. y. kai daugumoje dažnių
lentelės ląstelių yra mažas stebinių skaičius arba jos yra tuščios. Ši situacija
iliustruojama DNR genetinių sekų statistine analize.
Disertaciją sudaro įvadas, trys pagrindiniai skyriai, išvados, naudotos literatūros
ir autoriaus publikacijų sąrašai.
Įvadiniame skyriuje pristatoma tiriamoji problema ir jos aktualumas, aprašomas
tyrimų objektas, formuluojamas darbo tikslas ir uždaviniai, aptariamas
darbo mokslinis naujumas bei ginamieji teiginiai. Įvado pabaigoje pateikiami
autoriaus pranešimai konferencijose disertacijos tema.
Pirmame skyriuje pateikta kategorinių požymių statistinėje analizėje taikomų
matematinių modelių apžvalga, šių modelių ryšys su Markovo laukų
teorija ir Gibso skirstiniu.
Antrame skyriuje atlikta statistinė analizė kai kurioms realioms DNR sekoms
Markovo eilės jose įvertinimui bei pirminių ir antrinių DNR grandinių
vijų palyginimui: pasiūlyta kategorinių duomenų statistinės analizės metodika,
pagrįsta specialia stebimų duomenų forma, apibendrintu logit modeliu bei
savirankos testais.
Trečiame skyriuje išsklaidytų dažnių lentelės problemai spręsti pasiūlytas
semiparametrinis... [toliau žr. visą tekstą]
|
34 |
Zkoumání závislosti charakteristik a vybavení bytu na typu domácnosti / Investigation of dependence of the housing characteristics and the amenities in the dwelling on the household typeČapková, Kateřina January 2010 (has links)
The aim of the diploma thesis is to provide a comprehensive overview regarding survey of income and living conditions of households in the Czech Republic and propose a feasible approach to the exploitation of the collected data. The diploma thesis describes the framework of the EU-SILC survey and presents its practical implementation in the Czech Republic. A technique utilizing contingency table analysis is proposed for studying asymmetric relationships between selected housing characteristics and amenities in the dwelling with respect to different household types. The analysis is based on the relative frequencies of housing characteristics observed for particular types of households. The frequencies stem from the sample survey of income and living conditions of households carried out in the Czech Republic under the official title of Living Conditions 2008. Asymmetric measures of association for nominal and ordinal variables were used for the description of the relationships as the examined housing characteristics and household types have the character of alternative, nominal or ordinal variables. The analyses show significant relationship of the selected housing characteristics and the amenities in the dwelling on the monitored types of households.
|
35 |
Assessing Crash Occurrence On Urban Freeways Using Static And Dynamic Factors By Applying A System Of Interrelated EquationsPemmanaboina, Rajashekar 01 January 2005 (has links)
Traffic crashes have been identified as one of the main causes of death in the US, making road safety a high priority issue that needs urgent attention. Recognizing the fact that more and effective research has to be done in this area, this thesis aims mainly at developing different statistical models related to the road safety. The thesis includes three main sections: 1) overall crash frequency analysis using negative binomial models, 2) seemingly unrelated negative binomial (SUNB) models for different categories of crashes divided based on type of crash, or condition in which they occur, 3) safety models to determine the probability of crash occurrence, including a rainfall index that has been estimated using a logistic regression model. The study corridor is a 36.25 mile stretch of Interstate 4 in Central Florida. For the first two sections, crash cases from 1999 through 2002 were considered. Conventionally most of the crash frequency analysis model all crashes, instead of dividing them based on type of crash, peaking conditions, availability of light, severity, or pavement condition, etc. Also researchers traditionally used AADT to represent traffic volumes in their models. These two cases are examples of macroscopic crash frequency modeling. To investigate the microscopic models, and to identify the significant factors related to crash occurrence, a preliminary study (first analysis) explored the use of microscopic traffic volumes related to crash occurrence by comparing AADT/VMT with five to twenty minute volumes immediately preceding the crash. It was found that the volumes just before the time of crash occurrence proved to be a better predictor of crash frequency than AADT. The results also showed that road curvature, median type, number of lanes, pavement surface type and presence of on/off-ramps are among the significant factors that contribute to crash occurrence. In the second analysis various possible crash categories were prepared to exactly identify the factors related to them, using various roadway, geometric, and microscopic traffic variables. Five different categories are prepared based on a common platform, e.g. type of crash. They are: 1) Multiple and Single vehicle crashes, 2) Peak and Off-peak crashes, 3) Dry and Wet pavement crashes, 4) Daytime and Dark hour crashes, and 5) Property Damage Only (PDO) and Injury crashes. Each of the above mentioned models in each category are estimated separately. To account for the correlation between the disturbance terms arising from omitted variables between any two models in a category, seemingly unrelated negative binomial (SUNB) regression was used, and then the models in each category were estimated simultaneously. SUNB estimation proved to be advantageous for two categories: Category 1, and Category 4. Road curvature and presence of On-ramps/Off-ramps were found to be the important factors, which can be related to every crash category. AADT was also found to be significant in all the models except for the single vehicle crash model. Median type and pavement surface type were among the other important factors causing crashes. It can be stated that the group of factors found in the model considering all crashes is a superset of the factors that were found in individual crash categories. The third analysis dealt with the development of a logistic regression model to obtain the weather condition at a given time and location on I-4 in Central Florida so that this information can be used in traffic safety analyses, because of the lack of weather monitoring stations in the study area. To prove the worthiness of the weather information obtained form the analysis, the same weather information was used in a safety model developed by Abdel-Aty et al., 2004. It was also proved that the inclusion of weather information actually improved the safety model with better prediction accuracy.
|
36 |
多維列聯表離群細格的偵測研究 / Identification of Outlying Cells in Cross-Classified Tables陳佩妘, Chen, Pei-Yun Unknown Date (has links)
在處理列聯表時,適合度檢定的結果如果是顯著的話,則意味著配適的模式並不恰當,這其中一個可能的原因是資料中存在離群細格.因此我們希望能夠針對問題癥結所在,找出離群細格,使得我們的資料可以利用一個比較簡單且容易解釋的模式來做分析.在這篇論文中,我們主要依據施苑玉[1995]所提出的方法作些許的改變,使得改進後的方法可以適用於三維列聯表的所有情形.此外我們也將 Simonoff 在1988年所提出的方法,以及 BMDP 統計軟體的程序 4F ,與我們所提出的方法相比較.由模擬實驗的結果可發現我們的方法比前述兩種方法更具可行性. / When fitting a loglinear model to a contingency table, a significant goodness-of-fit can be resulted because of the existence of a few outlyingcells. Since a simpler model is easier to interpret and conveys more easilyunderstood information about a table than a complicated one, we would liketo identify those outliers so that a simpler model would fit a given data set. In this research, a modification of Shih's [1995] procedure is provided, and the revised method is now applicable to any type of models related tothree-way tables. Some data sets are simulated to compare outliers detectedusing procedures proposed by Simonoff [1988], and BMDP program 4F with our proposed method. Based on the results through simulation, our revised procedure outperforms the other two procedures most
of the time.
|
37 |
Subsídios à operação de reservatórios baseada na previsão de variáveis hidrológicasBravo, Juan Martín January 2010 (has links)
Diversas atividades humanas são fortemente dependentes do clima e da sua variabilidade, especialmente aquelas relacionadas ao uso da água. A operação integrada de reservatórios com múltiplos usos requer uma série de decisões que definem quanta água deve ser alocada, ao longo do tempo para cada um dos usos, e quais os volumes dos reservatórios a serem mantidos. O conhecimento antecipado das condições climáticas resulta de vital importância para os operadores de reservatórios, pois o insumo dos reservatórios é a vazão dos rios, que por sua vez é dependente de condições atmosféricas e hidrológicas em diferentes escalas de tempo e espaço. A pesquisa trata sobre três importantes elementos de subsídio à tomada de decisão na operação de reservatórios baseada na previsão de variáveis hidrológicas: (a) as previsões de vazão de curto prazo; (b) as previsões de precipitação de longo prazo e (c) as medidas de desempenho das previsões. O reservatório de Furnas, localizado na bacia do Rio Grande, em Minas Gerais, foi selecionado como estudo de caso devido, principalmente, à disponibilidade de previsões quantitativas de chuva e pela importância desse reservatório na região analisada. A previsão de curto prazo de vazão com base na precipitação foi estimada com um modelo empírico (rede neural artificial) e a previsão de precipitação foi obtida pelo modelo regional ETA. Uma metodologia de treinamento e validação da rede neural artificial foi desenvolvida utilizando previsões perfeitas de chuva (considerando a chuva observada como previsão) e utilizando o maior número de dados disponíveis, favorecendo a representatividade dos resultados obtidos. A metodologia empírica alcançou os desempenhos obtidos com um modelo hidrológico conceitual, mostrando-se menos sensitiva aos erros na previsão quantitativa de precipitação nessa bacia. Os resultados obtidos mostraram que as previsões de vazão utilizando modelos empíricos e conceituais e incorporando previsões quantitativas de precipitação são melhores que a metodologia utilizada pelo ONS no local de estudo. A redução dos erros de previsão relativos à metodologia empregada pelo ONS foi em torno de 20% quando usadas previsões quantitativas de precipitação definidas pelo modelo regional ETA e superiores a 50% quando usadas previsões perfeitas de precipitação. Embora essas últimas previsões nunca possam ser obtidas na prática, os resultados sugerem o quanto o incremento do desempenho das previsões quantitativas de chuva melhoraria as previsões de vazão. A previsão de precipitação de longo prazo para a bacia analisada foi também estimada com um modelo empírico de redes neurais artificiais e utilizando índices climáticos como variáveis de entrada. Nesse sentido, foram estimadas previsões de precipitação acumulada no período mais chuvoso (DJF) utilizando índices climáticos associados a fenômenos climáticos, como o El Niño - Oscilação Sul e a Oscilação Decadal do Pacífico, e a modos de variabilidade climática, como a Oscilação do Atlântico Norte e o Modo Anular do Hemisfério Sul. Apesar das redes neurais artificiais terem sido aplicadas em diversos problemas relacionados a hidrometeorologia, a aplicação dessas técnicas na previsão de precipitação de longo prazo é ainda rara. Os resultados obtidos nesse trabalho mostraram que consideráveis reduções dos erros da previsão relativos ao uso apenas da média climatológica como previsão podem ser obtidos com a metodologia utilizada. Foram obtidas reduções dos erros de, no mínimo 50%, e chegando até um valor próximo a 75% nos diferentes testes efetuados no estudo de caso. Uma medida de desempenho da previsão foi desenvolvida baseada no uso de tabelas de contingência e levando em conta a utilidade da previsão. Essa medida de desempenho foi calculada com base nos resultados do uso das previsões por um modelo de operação de reservatório, e não apenas na comparação de vazões previstas e observadas. Nos testes realizados durante essa pesquisa, ficou evidente que não existe uma relação unívoca entre qualidade das previsões e utilidade das previsões. No entanto, em função de comportamentos particulares das previsões, tendências foram encontradas, como por exemplo nos modelos cuja previsão apresenta apenas defasagem. Nesses modelos, a utilidade das previsões tende a crescer na medida que a qualidade das mesmas aumenta. Por fim, uma das grandes virtudes da medida de desempenho desenvolvida nesse trabalho foi sua capacidade de distinguir o desempenho de modelos que apresentaram a mesma qualidade. / Several human activities are strongly dependent on climate and its variability, especially those related to water use. The operation of multi-purpose reservoirs systems defines how much water should be allocated and the reservoir storage volumes to be maintained, over time. Knowing in advance the weather conditions helps the decision making process, as the major inputs to reservoirs are the streamflows, which are dependent on atmospheric and hydrological conditions at different time-space scales. This research deals with three important aspects towards the decision making process of multi-purpose reservoir operation based on forecast of hydrological variables: (a) short-term streamflow forecast, (b) long-range precipitation forecast and (c) performance measures. The Furnas reservoir on the Rio Grande basin was selected as the case study, primarily because of the availability of quantitative precipitation forecasts from the Brazilian Center for Weather Prediction and Climate Studies and due to its importance in the Brazilian hydropower generation system. Short-term streamflow forecasts were estimated by an empirical model (artificial neural network – ANN) and incorporating forecast of rainfall. Quantitative precipitation forecasts (QPFs), defined by the ETA regional model, were used as inputs to the ANN models. A methodology for training and validating the ANN models was developed using perfect precipitation forecasts (i.e., using the observed precipitation as if it was a forecast) and considering the largest number of available samples, in order to increase the representativeness of the results. The empirical methodology achieved the performance obtained with a conceptual hydrological model and seemed to be less sensitive to precipitation forecast error relative to the conceptual hydrological model. Although limited to one reservoir, the results obtained show that streamflow forecasting using empirical and conceptual models and incorporating QPFs performs better than the methodology used by ONS. Reduction in the forecast errors relative to the ONS method was about 20% when using QPFs provided by ETA model, and greater than 50% when using the perfect precipitation forecast. Although the latter can never be achieved in practice, these results suggest that improving QPFs would lead to better forecasts of reservoir inflows. Long-range precipitation forecast was also estimated by an empirical model based on artificial neural networks and using climate indices as input variables. The output variable is the summer (DJF) precipitation over the Furnas watershed. It was estimated using climate indices related to climatic phenomena such as El Niño - Southern Oscillation and the Pacific Decadal Oscillation and modes of climate variability, such as the North Atlantic Oscillation and the Southern Annular Mode. Despite of ANN has been applied in several problems of hydrometeorological areas, the application of such technique for long-range precipitation forecast is still rare. The results obtained demonstrate how the methodology for seasonal precipitation forecast based on ANN can be particularly helpful, with the use of available time series of climate indices. Reductions in the forecast errors achieved by using only the climatological mean as forecast were considerable, being at least of 50% and reaching values close to 75% in several tests. A performance measure based on the use of contingency tables was developed taking into account the utility of the forecast. This performance measure was calculated based on the results of the use of the forecasts by a reservoir operation model, and not only by comparing streamflow observed and forecast. The performed tests show that there is no unequivocal relationship between quality and utility of the forecasts. However, when the forecast has a particular behavior, trends were found in the relationship between utility and quality of the forecast, such as models that generate streamflow forecast with lags in comparison to the observed values. In these models, the utility of the forecasts tends to enhance as the quality increases. Finally, the ability to distinguish the performance of forecast models having similar quality was one of the main merits of the performance measure developed in this research.
|
38 |
Subsídios à operação de reservatórios baseada na previsão de variáveis hidrológicasBravo, Juan Martín January 2010 (has links)
Diversas atividades humanas são fortemente dependentes do clima e da sua variabilidade, especialmente aquelas relacionadas ao uso da água. A operação integrada de reservatórios com múltiplos usos requer uma série de decisões que definem quanta água deve ser alocada, ao longo do tempo para cada um dos usos, e quais os volumes dos reservatórios a serem mantidos. O conhecimento antecipado das condições climáticas resulta de vital importância para os operadores de reservatórios, pois o insumo dos reservatórios é a vazão dos rios, que por sua vez é dependente de condições atmosféricas e hidrológicas em diferentes escalas de tempo e espaço. A pesquisa trata sobre três importantes elementos de subsídio à tomada de decisão na operação de reservatórios baseada na previsão de variáveis hidrológicas: (a) as previsões de vazão de curto prazo; (b) as previsões de precipitação de longo prazo e (c) as medidas de desempenho das previsões. O reservatório de Furnas, localizado na bacia do Rio Grande, em Minas Gerais, foi selecionado como estudo de caso devido, principalmente, à disponibilidade de previsões quantitativas de chuva e pela importância desse reservatório na região analisada. A previsão de curto prazo de vazão com base na precipitação foi estimada com um modelo empírico (rede neural artificial) e a previsão de precipitação foi obtida pelo modelo regional ETA. Uma metodologia de treinamento e validação da rede neural artificial foi desenvolvida utilizando previsões perfeitas de chuva (considerando a chuva observada como previsão) e utilizando o maior número de dados disponíveis, favorecendo a representatividade dos resultados obtidos. A metodologia empírica alcançou os desempenhos obtidos com um modelo hidrológico conceitual, mostrando-se menos sensitiva aos erros na previsão quantitativa de precipitação nessa bacia. Os resultados obtidos mostraram que as previsões de vazão utilizando modelos empíricos e conceituais e incorporando previsões quantitativas de precipitação são melhores que a metodologia utilizada pelo ONS no local de estudo. A redução dos erros de previsão relativos à metodologia empregada pelo ONS foi em torno de 20% quando usadas previsões quantitativas de precipitação definidas pelo modelo regional ETA e superiores a 50% quando usadas previsões perfeitas de precipitação. Embora essas últimas previsões nunca possam ser obtidas na prática, os resultados sugerem o quanto o incremento do desempenho das previsões quantitativas de chuva melhoraria as previsões de vazão. A previsão de precipitação de longo prazo para a bacia analisada foi também estimada com um modelo empírico de redes neurais artificiais e utilizando índices climáticos como variáveis de entrada. Nesse sentido, foram estimadas previsões de precipitação acumulada no período mais chuvoso (DJF) utilizando índices climáticos associados a fenômenos climáticos, como o El Niño - Oscilação Sul e a Oscilação Decadal do Pacífico, e a modos de variabilidade climática, como a Oscilação do Atlântico Norte e o Modo Anular do Hemisfério Sul. Apesar das redes neurais artificiais terem sido aplicadas em diversos problemas relacionados a hidrometeorologia, a aplicação dessas técnicas na previsão de precipitação de longo prazo é ainda rara. Os resultados obtidos nesse trabalho mostraram que consideráveis reduções dos erros da previsão relativos ao uso apenas da média climatológica como previsão podem ser obtidos com a metodologia utilizada. Foram obtidas reduções dos erros de, no mínimo 50%, e chegando até um valor próximo a 75% nos diferentes testes efetuados no estudo de caso. Uma medida de desempenho da previsão foi desenvolvida baseada no uso de tabelas de contingência e levando em conta a utilidade da previsão. Essa medida de desempenho foi calculada com base nos resultados do uso das previsões por um modelo de operação de reservatório, e não apenas na comparação de vazões previstas e observadas. Nos testes realizados durante essa pesquisa, ficou evidente que não existe uma relação unívoca entre qualidade das previsões e utilidade das previsões. No entanto, em função de comportamentos particulares das previsões, tendências foram encontradas, como por exemplo nos modelos cuja previsão apresenta apenas defasagem. Nesses modelos, a utilidade das previsões tende a crescer na medida que a qualidade das mesmas aumenta. Por fim, uma das grandes virtudes da medida de desempenho desenvolvida nesse trabalho foi sua capacidade de distinguir o desempenho de modelos que apresentaram a mesma qualidade. / Several human activities are strongly dependent on climate and its variability, especially those related to water use. The operation of multi-purpose reservoirs systems defines how much water should be allocated and the reservoir storage volumes to be maintained, over time. Knowing in advance the weather conditions helps the decision making process, as the major inputs to reservoirs are the streamflows, which are dependent on atmospheric and hydrological conditions at different time-space scales. This research deals with three important aspects towards the decision making process of multi-purpose reservoir operation based on forecast of hydrological variables: (a) short-term streamflow forecast, (b) long-range precipitation forecast and (c) performance measures. The Furnas reservoir on the Rio Grande basin was selected as the case study, primarily because of the availability of quantitative precipitation forecasts from the Brazilian Center for Weather Prediction and Climate Studies and due to its importance in the Brazilian hydropower generation system. Short-term streamflow forecasts were estimated by an empirical model (artificial neural network – ANN) and incorporating forecast of rainfall. Quantitative precipitation forecasts (QPFs), defined by the ETA regional model, were used as inputs to the ANN models. A methodology for training and validating the ANN models was developed using perfect precipitation forecasts (i.e., using the observed precipitation as if it was a forecast) and considering the largest number of available samples, in order to increase the representativeness of the results. The empirical methodology achieved the performance obtained with a conceptual hydrological model and seemed to be less sensitive to precipitation forecast error relative to the conceptual hydrological model. Although limited to one reservoir, the results obtained show that streamflow forecasting using empirical and conceptual models and incorporating QPFs performs better than the methodology used by ONS. Reduction in the forecast errors relative to the ONS method was about 20% when using QPFs provided by ETA model, and greater than 50% when using the perfect precipitation forecast. Although the latter can never be achieved in practice, these results suggest that improving QPFs would lead to better forecasts of reservoir inflows. Long-range precipitation forecast was also estimated by an empirical model based on artificial neural networks and using climate indices as input variables. The output variable is the summer (DJF) precipitation over the Furnas watershed. It was estimated using climate indices related to climatic phenomena such as El Niño - Southern Oscillation and the Pacific Decadal Oscillation and modes of climate variability, such as the North Atlantic Oscillation and the Southern Annular Mode. Despite of ANN has been applied in several problems of hydrometeorological areas, the application of such technique for long-range precipitation forecast is still rare. The results obtained demonstrate how the methodology for seasonal precipitation forecast based on ANN can be particularly helpful, with the use of available time series of climate indices. Reductions in the forecast errors achieved by using only the climatological mean as forecast were considerable, being at least of 50% and reaching values close to 75% in several tests. A performance measure based on the use of contingency tables was developed taking into account the utility of the forecast. This performance measure was calculated based on the results of the use of the forecasts by a reservoir operation model, and not only by comparing streamflow observed and forecast. The performed tests show that there is no unequivocal relationship between quality and utility of the forecasts. However, when the forecast has a particular behavior, trends were found in the relationship between utility and quality of the forecast, such as models that generate streamflow forecast with lags in comparison to the observed values. In these models, the utility of the forecasts tends to enhance as the quality increases. Finally, the ability to distinguish the performance of forecast models having similar quality was one of the main merits of the performance measure developed in this research.
|
39 |
Subsídios à operação de reservatórios baseada na previsão de variáveis hidrológicasBravo, Juan Martín January 2010 (has links)
Diversas atividades humanas são fortemente dependentes do clima e da sua variabilidade, especialmente aquelas relacionadas ao uso da água. A operação integrada de reservatórios com múltiplos usos requer uma série de decisões que definem quanta água deve ser alocada, ao longo do tempo para cada um dos usos, e quais os volumes dos reservatórios a serem mantidos. O conhecimento antecipado das condições climáticas resulta de vital importância para os operadores de reservatórios, pois o insumo dos reservatórios é a vazão dos rios, que por sua vez é dependente de condições atmosféricas e hidrológicas em diferentes escalas de tempo e espaço. A pesquisa trata sobre três importantes elementos de subsídio à tomada de decisão na operação de reservatórios baseada na previsão de variáveis hidrológicas: (a) as previsões de vazão de curto prazo; (b) as previsões de precipitação de longo prazo e (c) as medidas de desempenho das previsões. O reservatório de Furnas, localizado na bacia do Rio Grande, em Minas Gerais, foi selecionado como estudo de caso devido, principalmente, à disponibilidade de previsões quantitativas de chuva e pela importância desse reservatório na região analisada. A previsão de curto prazo de vazão com base na precipitação foi estimada com um modelo empírico (rede neural artificial) e a previsão de precipitação foi obtida pelo modelo regional ETA. Uma metodologia de treinamento e validação da rede neural artificial foi desenvolvida utilizando previsões perfeitas de chuva (considerando a chuva observada como previsão) e utilizando o maior número de dados disponíveis, favorecendo a representatividade dos resultados obtidos. A metodologia empírica alcançou os desempenhos obtidos com um modelo hidrológico conceitual, mostrando-se menos sensitiva aos erros na previsão quantitativa de precipitação nessa bacia. Os resultados obtidos mostraram que as previsões de vazão utilizando modelos empíricos e conceituais e incorporando previsões quantitativas de precipitação são melhores que a metodologia utilizada pelo ONS no local de estudo. A redução dos erros de previsão relativos à metodologia empregada pelo ONS foi em torno de 20% quando usadas previsões quantitativas de precipitação definidas pelo modelo regional ETA e superiores a 50% quando usadas previsões perfeitas de precipitação. Embora essas últimas previsões nunca possam ser obtidas na prática, os resultados sugerem o quanto o incremento do desempenho das previsões quantitativas de chuva melhoraria as previsões de vazão. A previsão de precipitação de longo prazo para a bacia analisada foi também estimada com um modelo empírico de redes neurais artificiais e utilizando índices climáticos como variáveis de entrada. Nesse sentido, foram estimadas previsões de precipitação acumulada no período mais chuvoso (DJF) utilizando índices climáticos associados a fenômenos climáticos, como o El Niño - Oscilação Sul e a Oscilação Decadal do Pacífico, e a modos de variabilidade climática, como a Oscilação do Atlântico Norte e o Modo Anular do Hemisfério Sul. Apesar das redes neurais artificiais terem sido aplicadas em diversos problemas relacionados a hidrometeorologia, a aplicação dessas técnicas na previsão de precipitação de longo prazo é ainda rara. Os resultados obtidos nesse trabalho mostraram que consideráveis reduções dos erros da previsão relativos ao uso apenas da média climatológica como previsão podem ser obtidos com a metodologia utilizada. Foram obtidas reduções dos erros de, no mínimo 50%, e chegando até um valor próximo a 75% nos diferentes testes efetuados no estudo de caso. Uma medida de desempenho da previsão foi desenvolvida baseada no uso de tabelas de contingência e levando em conta a utilidade da previsão. Essa medida de desempenho foi calculada com base nos resultados do uso das previsões por um modelo de operação de reservatório, e não apenas na comparação de vazões previstas e observadas. Nos testes realizados durante essa pesquisa, ficou evidente que não existe uma relação unívoca entre qualidade das previsões e utilidade das previsões. No entanto, em função de comportamentos particulares das previsões, tendências foram encontradas, como por exemplo nos modelos cuja previsão apresenta apenas defasagem. Nesses modelos, a utilidade das previsões tende a crescer na medida que a qualidade das mesmas aumenta. Por fim, uma das grandes virtudes da medida de desempenho desenvolvida nesse trabalho foi sua capacidade de distinguir o desempenho de modelos que apresentaram a mesma qualidade. / Several human activities are strongly dependent on climate and its variability, especially those related to water use. The operation of multi-purpose reservoirs systems defines how much water should be allocated and the reservoir storage volumes to be maintained, over time. Knowing in advance the weather conditions helps the decision making process, as the major inputs to reservoirs are the streamflows, which are dependent on atmospheric and hydrological conditions at different time-space scales. This research deals with three important aspects towards the decision making process of multi-purpose reservoir operation based on forecast of hydrological variables: (a) short-term streamflow forecast, (b) long-range precipitation forecast and (c) performance measures. The Furnas reservoir on the Rio Grande basin was selected as the case study, primarily because of the availability of quantitative precipitation forecasts from the Brazilian Center for Weather Prediction and Climate Studies and due to its importance in the Brazilian hydropower generation system. Short-term streamflow forecasts were estimated by an empirical model (artificial neural network – ANN) and incorporating forecast of rainfall. Quantitative precipitation forecasts (QPFs), defined by the ETA regional model, were used as inputs to the ANN models. A methodology for training and validating the ANN models was developed using perfect precipitation forecasts (i.e., using the observed precipitation as if it was a forecast) and considering the largest number of available samples, in order to increase the representativeness of the results. The empirical methodology achieved the performance obtained with a conceptual hydrological model and seemed to be less sensitive to precipitation forecast error relative to the conceptual hydrological model. Although limited to one reservoir, the results obtained show that streamflow forecasting using empirical and conceptual models and incorporating QPFs performs better than the methodology used by ONS. Reduction in the forecast errors relative to the ONS method was about 20% when using QPFs provided by ETA model, and greater than 50% when using the perfect precipitation forecast. Although the latter can never be achieved in practice, these results suggest that improving QPFs would lead to better forecasts of reservoir inflows. Long-range precipitation forecast was also estimated by an empirical model based on artificial neural networks and using climate indices as input variables. The output variable is the summer (DJF) precipitation over the Furnas watershed. It was estimated using climate indices related to climatic phenomena such as El Niño - Southern Oscillation and the Pacific Decadal Oscillation and modes of climate variability, such as the North Atlantic Oscillation and the Southern Annular Mode. Despite of ANN has been applied in several problems of hydrometeorological areas, the application of such technique for long-range precipitation forecast is still rare. The results obtained demonstrate how the methodology for seasonal precipitation forecast based on ANN can be particularly helpful, with the use of available time series of climate indices. Reductions in the forecast errors achieved by using only the climatological mean as forecast were considerable, being at least of 50% and reaching values close to 75% in several tests. A performance measure based on the use of contingency tables was developed taking into account the utility of the forecast. This performance measure was calculated based on the results of the use of the forecasts by a reservoir operation model, and not only by comparing streamflow observed and forecast. The performed tests show that there is no unequivocal relationship between quality and utility of the forecasts. However, when the forecast has a particular behavior, trends were found in the relationship between utility and quality of the forecast, such as models that generate streamflow forecast with lags in comparison to the observed values. In these models, the utility of the forecasts tends to enhance as the quality increases. Finally, the ability to distinguish the performance of forecast models having similar quality was one of the main merits of the performance measure developed in this research.
|
40 |
Real Estate Forecasting – An evaluation of forecasts / Prognoser på fastighetsmarknaden – Utvärdering av träffsäkerheten hos prognoserHorttana, Jonas January 2013 (has links)
This degree project aims to explore the subject of forecasting, which is an ongoing and much alive debate within economics and finance. Within the forecasting field the available research is vast and even if restricted to real estate, which is the main focus of this paper, the available material is comprehensive. A large fraction of published research concerning the subject of real estate forecasting consists of post mortem studies, with econometric models trying to replicate historical trends with the help of available micro and macro data. This branch within the field of forecasting seems to advance and progress with help of refined econometric models. This paper, on the other hand, rather examines the fundamentals behind forecasting and why forecasting can be a difficult task in general. This is shown with an examination of the accuracy of 160 unique forecasts within the field of real estate. To evaluate the accuracy and predictability from different perspectives we state three main null hypotheses: 1. Correct forecasts and the direction of the predictions are independent variables. 2. Correct forecasts and the examined consultants are independent variables. 3. Correct forecasts and the examined cities are independent variables. 4 The observed frequencies for Hypothesis 1 indicate that upward predictions seem to be easier to predict than downward predictions. This is however not supported by the statistical tests. The observed frequencies for Hypothesis 2 clearly indicate that one consultant is a superior forecaster than compared to the other consultants. The statistical tests confirm this. The observed frequencies for Hypothesis 3 indicate no signs of dependence for the variables. The statistical tests confirm this. / Detta examensarbete ämnar att utforska ämnesområdet kring prognoser och prognosmakande, vilket är en högst levande debatt inom ekonomi och finans. Inom detta område är tillgänglig forskning mycket omfattande och även om materialet begränsas till fastighetsmarknaden, som är huvudspåret i denna uppsats, är mängden information ansenlig. En stor andel av publicerad forskning som berör prognoser av fastighetsmarkanden består ofta av studier av typen "post mortem", där man med ekonometriska modeller försöker efterlikna tidigare historiska trender med hjälp av tillgänglig mikro- eller makrodata. Denna gren av forskningen tycks vinna mark och fortsätter att utvecklas med hjälp av allt mer avancerade ekonometriska modeller. Denna studie fokuserar däremot snarare på de fundamentala elementen av prognosmakande och varför detta ibland kan vara en problematisk uppgift. Detta visas med hjälp av en undersökning gällande utfallet och träffsäkerheten av 160 unika prognoser på fastighetsmarknaden. 7 För att utvärdera träffsäkerheten hos prognoserna sätts tre olika nollhypoteser upp: 1. Korrekt prognos och riktning av prognos är oberoende variabler. 2. Korrekt prognos och konsult är oberoende variabler. 3. Korrekt prognos och undersökta städer är oberoende variabler. De observerade frekvenserna för Hypotes 1 indikerar att uppåtgående prognoser är enklare att förutspå än övriga prognoser. Detta kan dock inte stödjas av de statistiska testerna. De observerade frekvenserna för Hypotes 2 indikerar tydligt att en konsult är en överlägsen prognosmakare än övriga konsulter. Detta stöds av de statistiska testerna. De observerade frekvenserna för Hypotes 3 indikerar inget samband av beroende mellan variablerna. Detta kan dock inte stödjas av de statistiska testerna.
|
Page generated in 0.1037 seconds