1 |
[en] DATABASE SELF-TUNING WITH PARTIAL INDEXES / [pt] SINTONIA FINA AUTOMÁTICA COM ÍNDICES PARCIAISALAIN DOMINGUEZ FUENTES 27 April 2017 (has links)
[pt] Os índices parciais são estruturas de acesso no nível físico dos bancos de dados que permitem definir um subconjunto das tuplas de uma tabela, através de uma expressão condicional. Nesta dissertação estuda-se a identificação e subsequente criação automática de índices parciais que possam contribuir na melhoria do desempenho de um sistema de banco de dados. É proposto um algoritmo que examina, para cada consulta relevante, os conjuntos de atributos indexáveis para os quais a criação de um índice parcial poderia influenciar o otimizador de consultas na geração de planos mais eficientes. É realizada uma mineração de padrões de atributos indexáveis para se obter atributos correlacionados segundo a frequência das consultas na carga de trabalho considerada. Chega-se a uma proposta para um conjunto de índices parciais candidatos também se considerando uma heurística de benefícios. Realiza-se uma análise de sintonia fina em função da seleção de uma configuração de índices parciais e índices completos. A implementação das técnicas e algoritmos propostos nesta pesquisa é feita no framework DBX, que permite instanciar técnicas de sintonia fina local e global para bancos de dados relacionais. / [en] Partial indexes are access structures on the physical level of the databases. They are indexes that allow the definition of a subset of tuples in a table through a conditional expression. This dissertation studies the identification and subsequent automatic creation of partial indexes that can contribute in improving the performance of a database system. We propose an algorithm that examines, for each relevant query, the indexable attributes set, for which the creation of a partial index could influence the query optimizer to generate plans that are more efficient. We perform data mining on indexable attributes patterns to obtain correlated attributes according to their frequency in queries within the particular workload. We obtain a proposal for a set of candidate partial indexes considering also a benefit heuristics. We may consider a self-tuning analysis of an index configuration with both complete and partial indexes. We have implemented techniques and algorithms proposed in this research into DBX, a framework that allows local and global self-tuning regarding relational databases.
|
2 |
[en] SAZONAL ADJUSTEMENT OF PRICE ÍNDICES TIME SERIES / [pt] DESSAZONALIZAÇÃO DE SÉRIES DE ÍNDICE DE PREÇOSKELLY CRISTINA FERNANDES MALUF 17 July 2006 (has links)
[pt] Esta tese tem como objetivo a comparação entre
procedimentos para dessazonalização de séries temporais.
As metodologias usadas serão a de Modelos Estruturais
Clássicos e Bayesianos e a metodologia padrão de
dessazonalização X11 ARIMA. Os dados utilizados são as 35
séries reais de índice de preços ao consumidor - IPC para
a Região Metropolitana do Rio de Janeiro, fornecidas pelo
Instituto Brasileiro de Geografia e Pesquisa - IBGE, no
período de janeiro de 1991 até dezembro de 1997. Os
pacotes computacionais utilizados no decorrer do trabalho
são FORECAST PRO (X11 ARIMA0, STAMP (Estruturais
Clássicos) e BATS (Estruturais Bayesianos). Além disso,
foram também utilizadas séries simuladas com sazonalidade,
para melhor analisar os resultados desejados. / [en] The aim of this thesis is a comparisson study among three
existing procedures for seasonal adjustment of time
series, namely: the tradicional X11 ARIMA and those
based on the structural model formulation, i.e., the
classical approach of A. Harvey and the Bayesian
counterpart of Harrison and Stevens.
The data used are 25 real time series of Consumer Price
Index for Metropolitan area from Rio de Janeiro from 1991
to 1997, supllied by the Instituto Brasileiro de Geografia
e Estatística - IBGE. The computacional packages used
during the thesis were SPSS and FORECAST PRO (X11 ARIMA),
STAMP (structural classical approach) and BATS (structural
bayesian approach). Also, simulated seasonal data were to
provide a better understanding of the procedures.
|
3 |
[en] THE INFLUENCE OF CLIMATIC FACTORS, ECONOMIC AND TEMPORAL LOAD FORECASTING AND BILLING OF AN ELECTRIC UTILITIES / [pt] A INFLUÊNCIA DE FATORES CLIMÁTICOS, ECONÔMICOS E TEMPORAIS NA PREVISÃO DE CARGA E DE FATURAMENTO DE UMA CONCESSIONÁRIA DE ENERGIA ELÉTRICAJULIANA CARDOSO ARAUJO MATTOSO 17 September 2013 (has links)
[pt] Com a entrada do novo modelo do setor elétrico, a previsão do consumo
e de faturamento de energia elétrica passou a ter grande importância para as
distribuidoras de energia elétrica, pois melhorando sua acertividade as empresas
poderão elaborar seus programas de planejamento energético, manutenção e
expansão de seu sistema de distribuição e principalmente evitar gastos com
multas pelo não atendimento à totalidade de seu mercado consumidor. Para que
esta previsão seja feita é necessário que se obtenham, os dados históricos do
consumo de energia elétrica, da carga fornecida pela Distribuidora, porém como
esses dados são séries multivariadas, isto é, são séries temporais que
dependem de outras variáveis exógenas, levou-se em consideração também as
séries climáticas (sensação térmica), as econômicas (índices financeiros) e o
fator temporal (dias úteis, feriados, finais de semana.....). Este estudo, propõe
um método alternativo para previsão de consumo e faturamento de energia
elétrica, 15 passos a frente, através do desenvolvimento de um sistema
inteligente, chamado SIPEE, baseado em redes neurais MLP multistep e foi
desenvolvido para uma Distribuidora de Energia Elétrica que atende a boa parte
do mercado consumidor do Estado do Rio de Janeiro, a Light Serviços de
Eletricidade S.A.. / [en] When the new model of the electricity sector began to be used, the
forecast of consumption and billing of electricity began to have great importance
for the electricity distributors, improving their assertiveness as companies can
develop their programs for energy planning, maintenance and expansion of its
distribution system and particularly to avoid fines for not spending all of his
service to the consumer market. For this prediction is made it is necessary to
obtain historical data of energy consumption, the load supplied by the distributor,
but as these data sets are multivariate, ie, they are time series which depend on
other exogenous variables took into account also the series weather (wind chill),
economic (financial ratios) and the factor of time (days, holidays, weekends .....).
This study proposes an alternative method to forecast sales and consumption of
electricity, 15 steps forward, by developing an intelligent system, called SIPEE,
MLP neural networks based on multistep and was developed for an Electricity
Distributor serving much of the consumer market in the State of Rio de Janeiro,
Light Electrical Services SA.
|
4 |
[en] TUNINGCHEF: AN APPROACH FOR CHOOSING THE BEST COST-BENEFIT DATABASE TUNING ACTIONS / [pt] TUNINGCHEF: UMA ABORDAGEM PARA ESCOLHER AS AÇÕES DE SINTONIA FINA DE BANCO DE DADOS COM MELHOR CUSTO-BENEFÍCIOVICTOR AUGUSTO LIMA LINS DE SOUZA 29 November 2022 (has links)
[pt] Enquanto muitos trabalhos de pesquisa propõem uma forma de listar um
conjunto de opções de sintonia fina para uma determinada carga de trabalho,
poucos oferecem uma maneira de ajudar o DBA a tomar melhores decisões
ao encontrar um conjunto de ações disponíveis. TuningChef é o resultado do
desenvolvimento de uma proposta do passo a passo desse processo de decisão.
Dado um conjunto de opções de sintonia fina, recomendamos um subconjunto
com boa proporção de custo-benefício, com contexto suficiente para que o
DBA entenda a motivação por trás de cada decisão, incluindo a possibilidade
de deixar o usuário construir seu próprio subconjunto e verificar o impacto
esperado. Também são apresentados resultados experimentais que demonstram
a importância do processo de decisão, onde dentro de um subconjunto de
50+ ações de sintonia fina sugeridas por uma ferramenta externa, apenas 8
mostram-se como benéficas para a carga de trabalho utilizada. / [en] While many research works propose a way to list a set of fine-tuning options for a given workload, only a few offer a way to help the DBA make better
decisions when encountering a set of available options, especially when taking
his possibilities into consideration. We propose and develop a step-by-step decision process. Given a set of fine-tuning options, we recommend a subset with
good cost-benefit proportion. Enough context for the DBA accompanies the
recommendation to understand its reasoning, with the possibility of letting the
user build his own subset and check the expected impact. Some experimental
results are also described, showing the importance of the decision step when
fine tuning a database, where in a set on 50+ fine tuning actions suggested by
an external tool, only 8 are considered beneficial for the a specific workload.
|
5 |
[en] CALCULATION OF SECURITY INDEXES IN POWER SYSTEMS BASED ON TIME DOMAIN SIMULATION / [pt] CÁLCULO DE ÍNDICES DE SEGURANÇA EM SISTEMAS DE ENERGIA ELÉTRICA BASEADO EM SIMULAÇÃO NO DOMÍNIO DO TEMPOJOAO MAGALHAES DAHL 16 October 2006 (has links)
[pt] Os sistemas de energia elétrica estão operando atualmente
próximos dos
limites de estabilidade, comprometendo a segurança. Este
fato tem sido
evidenciado por diversos blackouts no mundo inteiro. A
avaliação da segurança
dinâmica torna-se, então, fundamental. O objetivo é a
busca de um método rápido
e, sobretudo, confiável, para analisar o comportamento
dinâmico de um sistema de
energia elétrica. Esta dissertação trata, portanto, do
problema da avaliação da
segurança dinâmica de sistemas de energia elétrica. A
avaliação é realizada através
da determinação das margens de estabilidade, utilizando os
resultados de
simulações no domínio do tempo, que fornece informações
qualitativas a respeito
da estabilidade na primeira oscilação. O grupo de
geradores severamente
perturbados é determinado e a margem de estabilidade de
cada um deles é
calculada. O gerador que apresentar a menor margem
determina a margem de
estabilidade do sistema. Quando a margem de estabilidade
assume valor nulo, o
tempo crítico de eliminação da falta é obtido. Estes
resultados são comparados
com aqueles determinados pelo método de tentativa e erro,
utilizando um
programa convencional de estabilidade transitória. Desta
forma, as contingências
são classificadas em função dos tempos críticos de
eliminação de falta, de acordo
com o nível de severidade. Essa classificação permite
reduzir o conjunto de
contingências a ser estudado. A contribuição deste
trabalho é mostrar que o critério
baseado na aceleração imediatamente após a eliminação da
falta é mais eficaz que
aquele baseado na aceleração imediatamente após a
ocorrência da falta para a
indicação do grupo de geradores severamente perturbados. / [en] Power systems have been operating nowadays near to the
stability limits
putting security under risk. This is one of the reasons
why the dynamic security
assessment is a fundamental tool to avoid the occurrence
of blackouts in the whole
world. The goal is a reliable and fast way to evaluate the
dynamic behavior of a
power system. This dissertation deals with the problem of
dynamic security
assessment of power systems. The evaluation is performed
based on stability
margins calculated from time domain simulation results,
providing qualitative
information about the first swing stability. The group of
severely disturbed
machines is defined and the stability margins are
determined. The machine with
the lowest margin determines the stability margin of the
system. When the system
margin approaches the zero value, the critical clearing
time is obtained. These
outcomes are compared with that ones determined by trial
and error method using
a conventional transient stability program. Having done
that, a contingency
ranking is defined according to the critical clearing
time. The ranking minimizes
the number of contingencies that have to be studied. This
dissertation shows that
the criterion to define the group of severely disturbed
machines based on the
machine accelerations at the instant immediately after the
fault clearing time is
more efficient than that one based on the machine
accelerations at the instant
immediately after the fault occurrence.
|
6 |
[en] APPROXIMATE NEAREST NEIGHBOR SEARCH FOR THE KULLBACK-LEIBLER DIVERGENCE / [pt] BUSCA APROXIMADA DE VIZINHOS MAIS PRÓXIMOS PARA DIVERGÊNCIA DE KULLBACK-LEIBLER19 March 2018 (has links)
[pt] Em uma série de aplicações, os pontos de dados podem ser representados como distribuições de probabilidade. Por exemplo, os documentos podem ser representados como modelos de tópicos, as imagens podem ser representadas como histogramas e também a música pode ser representada como uma distribuição de probabilidade. Neste trabalho, abordamos o problema do Vizinho Próximo Aproximado onde os pontos são distribuições de probabilidade e a função de distância é a divergência de Kullback-Leibler (KL). Mostramos como acelerar as estruturas de dados existentes, como a Bregman Ball Tree, em teoria, colocando a divergência KL como um produto interno. No lado prático, investigamos o uso de duas técnicas de indexação muito populares: Índice Invertido e Locality Sensitive Hashing. Os experimentos realizados em 6 conjuntos de dados do mundo real mostraram que o Índice Invertido é melhor do que LSH e Bregman Ball Tree, em termos
de consultas por segundo e precisão. / [en] In a number of applications, data points can be represented as probability distributions. For instance, documents can be represented as topic models, images can be represented as histograms and also music can be represented as a probability distribution. In this work, we address the problem of the Approximate Nearest Neighbor where the points are probability distributions and the distance function is the Kullback-Leibler (KL) divergence. We show how to accelerate existing data structures such as the Bregman Ball Tree, by posing the KL divergence as an inner product embedding. On the practical side we investigated the use of two, very popular, indexing techniques: Inverted Index and Locality Sensitive Hashing. Experiments performed on 6 real world data-sets showed the Inverted Index performs better than LSH and Bregman Ball Tree, in terms of queries per second and precision.
|
7 |
[pt] ESTIMADOR INTELIGENTE DE BIOMASSA EM PASTOS USANDO ÍNDICES DE VEGETAÇÃO A PARTIR DE IMAGENS CAPTURADAS POR VANTS / [en] INTELLIGENT BIOMASS ESTIMATION IN PASTURES USING RGB-BASED VEGETATION INDICES FROM UAV IMAGERYLUCIANA DOS SANTOS NETTO DOS REYS 11 August 2022 (has links)
[pt] O gerenciamento correto das pastagens em regiões agropecuárias tem
papel fundamental na própria produção, na prevenção ao desperdício da
biomassa vegetal e a liberação de gases de efeito estufa (GEE). Além disso,
é necessário evitar o movimento inapropriado do rebanho entre pastos, pois
este é um processo demorado e pode ser estressante para o animal. O sucesso
desta gestão requer uma avaliação eficiente dos recursos da plantação. Os
estudos desenvolvidos com esta finalidade tem relação direta com a estimativa
da quantidade de biomassa em uma região específica da pastagem, pois, na
prática, ela não é realizada de forma precisa, devido à dificuldade de medição
em toda a área delimitada. Este trabalho tem como objetivo desenvolver
uma metodologia de estimativa de biomassa de baixo custo, baseada em
modelos de regressão que correlacionem os atributos de entrada mais relevantes
para a aplicação com o real peso da plantação, medido em g/m2
. Para os
atributos, foi medida a altura da grama forrageira e calculados os índices
de vegetação baseados em RGB a partir de imagens de veículos aéreos não
tripulados (VANTs). Como metodologia, utilizou-se regressões lineares, não
lineares, redes neurais artificiais baseados em perceptrons de múltiplas camadas
e a combinação de todos os modelos gerados (stacking ensemble). Foram
alcançados resultados satisfatórios utilizando modelos de redes neurais com
ainda duas camadas e com a metodologia de empilhamento de modelos,
alcançando um RMSE de 31.76 g/m2
, MAPE de 13.35 por cento e R
2 de 0.9. Portanto,
a metodologia proposta pode se tornar uma solução promissora e acessível para
a estimativa de biomassa vegetal para uma gestão eficiente e sustentável do
rebanho. / [en] The correct management of pastures in agricultural regions plays a
fundamental role in the production itself, in the prevention of plant biomass
waste and the release of greenhouse gases (GHG). In addition, it is necessary
to avoid inappropriate movement of the herd between pastures, as this is a
time-consuming process and can be stressful for the animal. The success of this
management requires an efficient assessment of the plant resources. The studies
developed for this purpose are directly related to the amount estimation of
biomass in a specific region of the pasture, because, in practice, it is not carried
out accurately, due to the difficulty of measurement throughout the field.
This work aims to develop a low-cost biomass estimation methodology, based
on regression models that correlate the most relevant input features for the
application with the actual density of the plantation, measured in g/m2
. For the
features, the height of the forage grass was measured and the vegetation indexes
based on RGB were calculated from images of unmanned aerial vehicles (UAV).
Linear, nonlinear regression (MNLR), artificial neural networks (ANN) based
on multi-layer perceptron (MLP) and the combination of all models generated
(stacking ensemble) were the methodologies tested in order to achieve the
best correlation. Satisfactory results were achieved using models of neural
networks with two layers and using stacking ensemble methodology, reaching a
RMSE of 31.76 g/m2
, MAPE of 13.35 percent and R-Squared of 0.9. Therefore, the
proposed methodology may become a promising and affordable solution for
plant biomass estimation toward efficient and sustainable herd management.
|
8 |
[pt] GESTÃO ESCOLAR, DESEMPENHO E EQUIDADE NOS ANOS FINAIS DO ENSINO FUNDAMENTAL: CONSTRUÇÃO E VALIDAÇÃO DE ÍNDICES / [en] SCHOOL MANAGEMENT, ACHIEVEMENT, AND EQUITY IN THE FINAL YEARS OF ELEMENTARY SCHOOL: CONSTRUCTION AND VALIDATION OF INDICESJOAO CARLOS DE SOUZA ANHAIA GINO 03 July 2023 (has links)
[pt] A presente tese teve como objetivo principal construir, validar e discutir a
pertinência de índices que relacionassem aspectos da gestão escolar (liderança do
diretor, autoeficácia pedagógica do diretor e complexidade da gestão) com o
desempenho e a equidade dos resultados dos alunos dos anos finais do ensino
fundamental. A pesquisa foi um estudo quantitativo de natureza exploratória, tendo
como amostra principal as escolas da rede municipal do Rio de Janeiro que ofertam
nono ano e foram avaliadas no SAEB 2019. Complementarmente foram realizadas
análises para as escolas que ofereciam o quinto ano da mesma rede e para as escolas
públicas do Brasil de quinto e nono anos que participaram do SAEB 2019. Em termos
metodológicos, foram construídos três índices por meio da análise fatorial: o Índice
de Liderança do Diretor (ILD), o Índice de Autoeficácia Pedagógica do Diretor
(IAEPD), e um Índice de Complexidade da Gestão (ICG) para a rede municipal do
Rio de Janeiro, alternativo ao índice criado pelo INEP. Foram então realizadas
regressões lineares multivariadas usando a média da proficiência em matemática
dos alunos e seu desvio padrão em cada escola como variáveis dependentes e o
Índice de Nível Socioeconômico (Inse) do INEP como variável de controle. Os
principais resultados indicaram que a liderança do diretor e a crença em autoeficácia
pedagógica do diretor apresentaram correlação positiva com a proficiência e com
as desigualdades no desempenho dos alunos. Quanto a complexidade da gestão a
correlação foi negativa: quanto mais complexa a escola, pior o resultado dos alunos.
Não foi possível encontrar resultados estatisticamente confiáveis para a relação
entre a complexidade da gestão e a equidade do desempenho dos alunos. Os
modelos para o Rio de Janeiro só apresentaram significância estatística em alguns
coeficientes para o quinto ano. Todos os índices e respectivos coeficientes tiveram
significância estatística nos modelos nacionais. / [en] The main objective of this thesis was to construct, validate, and discuss the relevance
of indices that relate aspects of school management (principal s leadership,
principal s pedagogical self-efficacy, and management complexity) to the outcome
and equity of students results in the final years of elementary school. The research
was a quantitative study of exploratory nature, having as main samplethe schools of
the municipal network of Rio de Janeiro that offer 9th grade and were evaluated in
SAEB 2019. In a complementary way, analyses were carried out for schools that
offered 5th grade in the same system and for Brazil s 5th and 9th grade public schools
that participated in SAEB 2019. In methodological terms, three indices were
constructed using factor analysis: the Principal Leadership Index (PLI), the
Principal Pedagogical Self-Efficacy Index (PPSEI), and a Management Complexity
Index (MCI) for the municipal system of Rio de Janeiro, an alternativeto the index
created by INEP. Multivariate linear regressions were then performed using the
average math proficiency of students and its standard deviation in each school as
dependent variables and INEP s Socioeconomic Level Index (SELI) as control
variable. The main results indicated that the principal s leadership and the principal s
belief in pedagogical self-efficacy were positively correlated with student
proficiency and achievement inequalities. Management complexity, on the other
hand, showed a negative correlation: the more complex the school, the worse the
student achievement. It was not possible to find statistically reliable results for the
relationship between management complexity and equity in student achievement.
The models for Rio de Janeiro only showed statistical significance in some
coefficients for the 5th grade. All indices and respective coefficients were
statistically significant in the national models.
|
Page generated in 0.0419 seconds