Spelling suggestions: "subject:"minimos quadrado."" "subject:"vinimos quadrado.""
21 |
[en] ALGORITHMS FOR PARTIAL LEAST SQUARES REGRESSION / [pt] ALGORITMOS PARA REGRESSÃO POR MÍNIMOS QUADRADOS PARCIAISRAUL PIERRE RENTERIA 08 January 2004 (has links)
[pt] Muitos problemas da área de aprendizagem automática tem por
objetivo modelar a complexa relação existente num
sisitema , entre variáveis de entrada X e de saída Y na
ausência de um modelo teórico. A regressão por mínimos
quadrados parciais PLS ( Partial Least Squares) constitui
um método linear para resolução deste tipo de
problema , voltado para o caso de um grande número de
variáveis de entrada quando comparado com número de
amostras. Nesta tese , apresentamos uma variante do
algoritmo clássico PLS para o tratamento de grandes
conjuntos de dados , mantendo um bom poder preditivo.
Dentre os principais resultados destacamos um versão
paralela PPLS (Parallel PLS ) exata para o caso de apenas
um variável de saída e um versão rápida e aproximada DPLS
(DIRECT PLS) para o caso de mais de uma variável de saída.
Por outro lado ,apresentamos também variantes para o
aumento da qualidade de predição graças à formulação não
linear. São elas o LPLS ( Lifted PLS ), algoritmo para o
caso de apenas uma variável de saída, baseado na teoria
de funções de núcleo ( kernel functions ), uma
formulação kernel para o DPLS e um algoritmo multi-kernel
MKPLS capaz de uma modelagemmais compacta e maior poder
preditivo, graças ao uso de vários núcleos na geração do
modelo. / [en] The purpose of many problems in the machine learning
field isto model the complex relationship in a system
between the input X and output Y variables when no
theoretical model is available. The Partial Least Squares
(PLS)is one linear method for this kind of problem, for the
case of many input variables when compared to the number of
samples. In this thesis we present versions of the
classical PLS algorithm designed for large data sets while
keeping a good predictive power. Among the main results we
highlight PPLS (Parallel PLS), a parallel version for the
case of only one output variable, and DPLS ( Direct PLS), a
fast and approximate version, for the case fo more than one
output variable. On the other hand, we also present some
variants of the regression algorithm that can enhance the
predictive quality based on a non -linear formulation. We
indroduce LPLS (Lifted PLS), for the case of only one
dependent variable based on the theory of kernel functions,
KDPLS, a non-linear formulation for DPLS, and MKPLS, a
multi-kernel algorithm that can result in a more compact
model and a better prediction quality, thankas to the use
of several kernels for the model bulding.
|
22 |
[en] EVALUATION METHODOLOGY COMPANY CONSIDERING INTANGIBLE ASSETS THROUGH LEAST SQUARE MONTE CARLO AND MEAN REVERSION / [pt] METODOLOGIA DE AVALIAÇÃO DE EMPRESAS CONSIDERANDO ATIVOS INTANGÍVEIS ATRAVÉS DE MÍNIMOS QUADRADOS DE MONTE CARLO E REVERSÃO À MÉDIARODRIGO BARCELLOS SECCHIN 09 July 2010 (has links)
[pt] No modelo de Pesquisa e Desenvolvimento (P&D) para o setor farmacêutico,
considerando a proteção da patente, Schwartz fez uma contribuição muito importante
para a precificação do valor de uma empresa. Alem de considerar a possibilidade dos
eventos catastróficos, o autor aplicou uma ferramenta simples, mas ao mesmo tempo
bastante poderosa, até então não utilizada pela literatura para tal fim (denominada
Mínimos Quadrados de Monte Carlo). Na última etapa do seu modelo (período pós
patente), o autor aproxima o processo por um valor constante (obtido por meio de uma
estimativa), acreditando que o mercado absolverá imediatamente a tecnologia e, com isto,
a simplificação não alterará significativamente o resultado final.Contudo, com o avanço
da globalização e o desenvolvimento dos meios de comunicação, o mercado tem-se
tornado cada vez mais dinâmico e competitivo. Uma vez que as táticas clássicas já se
tornaram acessíveis a todos (e. g. produção em escala ou corte dos custos), elas não são
mais suficientes para manter a lucratividade de uma empresa. Diversos estudiosos e
instituições renomadas (como por exemplo, BNDES) observaram que, para sobreviverem
a isso, as empresas precisam suplantar a concorrência, através de um conjunto de
capacitações denominadas bens intangíveis, o que na maioria das ocasiões é uma
operação bastante complexa. Devido a essas evidencias a absorção de uma nova
tecnologia não necessariamente é uma atividade imediata (contrariando as suposições de
Schwartz). Com o intuito de uma melhor descrição da realidade, esta dissertação propõe
um aperfeiçoamento matemático (não mais aproximando a etapa pós-patente) e
algorítmico do modelo de Schwartz. O modelo foi criado a partir de um conjunto de
conceitos da Microeconomia, Opções Reais e das Métricas de Avaliação do BNDES,
previamente desenvolvido com o auxílio da equipe do BNDES. Os resultados obtidos na
simulação do exemplo teórico, a qual foi analisada uma empresa de TI que pretende
desenvolver uma nova tecnologia, não apresentaram nenhuma incoerência, indicando,
desta forma, nenhum erro sob a ótica matemática ou algorítmica e confirmando, ao
mesmo tempo, a importância dos ativos intangíveis, que, por sua vez, propiciaram
maiores ganhos, antes desprezados. / [en] In the model of Research and Development (R & D) for the pharmaceutical
industry, considering patent protection, Schwartz made an important contribution to the
valuation of a company. Besides considering the possibility of catastrophic events, the
author applied a simple tool, but at the same time very powerful, hitherto not used in the
literature for this purpose (called Least Squares Monte Carlo). In the last stage of its type
(post patent), the author approaches the process with a constant value (obtained via an
estimate), believing that the market immediately absolve the technology and, thus, the
simplification does not significantly change the outcome final. Canted, with the advance
of globalization and the media, the market has become increasingly dynamic and
competitive. Since the classic tactics have become accessible to all (egg scale production
or cut costs), they are no longer sufficient to maintain the profitability of a company.
Several renowned scholars and institutions (such as BNDES) observed that, to survive
this, companies must overcome competition through a set of skills called intangibles,
which in most cases is a complex operation. Because of these evidences the absorption of
new technology is not necessarily an immediate activity (contrary to the assumptions of
Schwartz). Aiming at a better description of reality, this study proposes a mathematical
processing (no longer approaching the post-patent) and the algorithmic model of
Schwartz. The model was created from a set of concepts of microeconomics, Real
Options and Metrics Assessment of BNDES, previously developed with the assistance of
staff from BNDES. The simulation results of the theoretical example, which was
considered an IT company that aims to develop a new technology, did not show any
inconsistency, indicating thus no error in the mathematical or algorithmic perspective and
confirming at the same time, importance of intangible assets, which, in turn, lead to the
greatest earnings before slighted.
|
23 |
[en] SPATIAL FILTERS APPLICATION TO THE RESTAURATION OF NON-DESTRUCTIVE ESSAY MAGNETIC IMAGES / [pt] APLICAÇÃO DE FILTROS ESPACIAIS À RESTAURAÇÃO DE IMAGENS MAGNÉTICAS OBTIDAS EM ENSAIOS NÃO-DESTRUTIVOSEDUARDO ANDRADE LIMA 26 July 2006 (has links)
[pt] Desenvolveu-se uma técnica de restauração de imagens de
defeitos existentes em materiais ferromagnéticos, obtidas
pela solução do problema inverso para sinais simulados
proveniente do método de Ensaios Não-Destrutivos conhecido
como Magnetic Flux Leakage. Baseada em princípios de
filtragem ótima, a técnica visa reduzir distorções
introduzidas nas imagens pela Inversa MNSL (Minimum-Norm
Least-Squares Inverse). Com a aplicação desta técnica, é
possível caracterizar mais precisamente diversos tipos de
defeitos. / [en] Na image processing technique was developed to restore
images of defects in ferromagnetic materials. Such images
are obtained by solving the eletromagnetic inverse problem
associated with the Magnetic Flux Leakage method of
Nondestructive Evaluation. Based upon optimal filtering,
the technique aims to reduce distortions introduced by the
Minimum-Norm Least-Square Inverse. By applying such
technique it is possible to better characterize various
defect types.
|
24 |
[pt] PREVISÃO DE POTÊNCIA REATIVA / [en] REACTIVE POWER FORECASTINGELIANE DA SILVA CHRISTO 28 December 2005 (has links)
[pt] No novo modelo do Setor Elétrico é essencial desenvolver novas técnicas
que estimem valores futuros, a curto e longo-prazos, das potências ativa e reativa.
Com base nisso, este trabalho tem por objetivo apresentar uma nova técnica de
previsão horária de potência reativa a curto-prazo, por subestação, baseada na
linearidade existente entre as potências ativa e reativa. O modelo proposto,
denominado de Modelo Híbrido de Previsão de Reativo, é dividido em duas
etapas: A primeira etapa é feita uma classificação dos dados através de uma rede
neural não supervisionada Mapas Auto-Organizáveis de Kohonen (SOM); A
segunda etapa, utiliza-se um modelo de defasagem distribuída auto-regressivo
(ADL) com estimação de Mínimos Quadrados Reponderados Iterativamente
(IRLS) acoplado a uma correção para autocorrelação serial dos resíduos - Método
Iterativo de Cochrane-Orcutt. Este Modelo Híbrido tem como variável dependente
a potência reativa, e como variáveis explicativas dados horários de potência ativa
e reativa no instante atual e defasadas no tempo. A previsão de potência reativa a
curto-prazo é dividida em in sample e em out of sample. A previsão out of
sample é aplicada a períodos horários em até um mês à frente. O modelo
proposto é aplicado aos dados de uma concessionária específica de Energia
Elétrica e os resultados são comparados a um modelo de Regressão Dinâmica
convencional e a um modelo de Redes Neurais Artificiais Feedforward de
Múltiplas camadas (MLP) com um algoritmo de retropropagação do erro. / [en] The forecasting of reactive and active power is an
important tool in the
monitoring of an Electrical Energy System. The main
purpose of the present work
is the development of a new short-term reactive power
hourly forecast technique,
which can be used at utility or substations levels. The
proposed model, named A
Hybrid Model for Reactive Forecasting, is divided in two
stages. In the first
stage, the active and reactive power data are classified
by an unsupervised neural
network - the Self-Organized Maps of Kohonen (SOM). In the
second stage, a
Autoregressive Distributed Lags Model (ADL) is used with
its parameters
estimated by an Iteratively Reweighted Least Square
(IRLS). It also includes a
correction lag structure for serial autocorrelation of the
residuals as used in the
Cochrane-Orcutt formulation. The short term reactive power
forecasting is
divided in in sample and out of sample. The out of sample
forecast is
applied to hourly periods until one month ahead. The
proposed model is applied to
real data of one substation and the results are compared
with two other
approaches, a conventional Dynamic Regression and a
Feedforward Multi-layer
Perceptron (MLP) Artificial Neural Network model.
|
25 |
[en] A SYSTEM FOR STOCK MARKET FORECASTING AND SIMULATION / [pt] UM SISTEMA PARA PREDIÇÃO E SIMULAÇÃO DO MERCADO DE CAPITAISPAULO DE TARSO GOMIDE CASTRO SILVA 02 February 2017 (has links)
[pt] Nos últimos anos, vem crescendo o interesse acerca da predição do comportamento do mercado de capitais, tanto por parte dos investidores quanto dos pesquisadores. Apesar do grande número de publicações tratando esse problema, predizer com eficiência futuras tendências e desenvolver estratégias de negociação capazes de traduzir boas predições em lucros são ainda grandes desafios. A dificuldade em realizar tais tarefas se deve tanto à não linearidade e grande volume de ruídos presentes nos dados do mercado, quanto à falta de sistemas que possam avaliar com propriedade a qualidade das predições realizadas. Nesse trabalho, são realizadas predições de séries temporais visando auxiliar o investidor tanto em operações de compra e venda, como em Pairs Trading. Além disso, as predições são feitas considerando duas diferentes periodicidades. Uma predição interday, que considera apenas dados diários e tem como objetivo a predição de valores referentes ao presente dia. E uma predição intraday, que visa predizer valores referentes a cada hora de negociação do dia atual e para isso considera também os dados intraday conhecidos até o momento que se deseja prever. Para ambas as tarefas propostas, foram testadas três ferramentas de predição, quais sejam, Regressão por Mínimos Quadrados Parciais, Regressão por Vetores de Suporte e Redes Neurais Artificiais. Com o intuito de melhor avaliar a qualidade das predições realizadas, é proposto ainda um trading system. Os testes foram realizados considerando ativos das companhias mais negociadas da BM e FBOVESPA, a bolsa de valores oficial do Brasil e terceira maior do mundo. Os resultados dos três preditores são apresentados e comparados a quatro benchmarks, bem como com a solução ótima. A diferença na qualidade de predição, considerando o erro de predição ou as métricas do trading system, são notáveis. Se quando analisado apenas o Erro Percentual Absoluto Médio os preditores propostos não mostram uma melhora significativa, quando as métricas do trading system são consideradas eles apresentam um resultado bem superior. O retorno anual do investimento em alguns casos atinge valor superior a 300 por cento. / [en] The interest of both investors and researchers in stock market behavior forecasting has increased throughout the recent years. Despite the wide number of publications examining this problem, accurately predicting future stock trends and developing business strategies capable of turning good predictions into profits are
still great challenges. This is partly due to the nonlinearity and noise inherent to the stock market data source, and partly because benchmarking systems to assess the forecasting quality are not publicly available. Here, we perform time series forecasting aiming to guide the investor both into Pairs Trading and buy and sell
operations. Furthermore, we explore two different forecasting periodicities. First, an interday forecast, which considers only daily data and whose goal is predict values referring to the current day. And second, the intraday approach, which aims to predict values referring to each trading hour of the current day and also
takes advantage of the intraday data already known at prediction time. In both forecasting schemes, we use three regression tools as predictor algorithms, which are: Partial Least Squares Regression, Support Vector Regression and Artificial Neural Networks. We also propose a trading system as a better way to assess
the forecasting quality. In the experiments, we examine assets of the most traded companies in the BM and FBOVESPA Stock Exchange, the world s third largest and official Brazilian Stock Exchange. The results for the three predictors are presented and compared to four benchmarks, as well as to the optimal solution.
The difference in the forecasting quality, when considering either the forecasting error metrics or the trading system metrics, is remarkable. If we consider just the mean absolute percentage error, the proposed predictors do not show a significant superiority. Nevertheless, when considering the trading system evaluation, it shows really outstanding results. The yield in some cases amounts to an annual return on investment of more than 300 per cent.
|
26 |
Direcionadores de preferencia para nectares de uva comerciais tradicionais e "lights" utilizando regressão por minimos quadrados parciais (PLSR) / Drivers of liking for grape nectars in the traditional commercial and light versions using partial least squares regression (PLSR)Alves, Leonardo Rangel 07 October 2008 (has links)
Orientador: Helena Maria Andre Bolini / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia de Alimentos / Made available in DSpace on 2018-08-11T04:55:59Z (GMT). No. of bitstreams: 1
Alves_LeonardoRangel_M.pdf: 410164 bytes, checksum: eed7ffe76f347f00d0abb009ed908230 (MD5)
Previous issue date: 2008 / Resumo: Este estudo objetivou Identificar direcionadores de preferência de oito amostras comerciais de néctar de uva (tradicionais e ¿light¿) utilizando metodologias estatísticas avançadas para relacionar dados de perfil sensorial, físico-químicos e aceitabilidade. Oito amostras comerciais de néctares de uva (quatro tradicionais e suas respectivas versões ¿light¿) foram analisadas. Um teste de Aceitação utilizando a escala hedônica híbrida foi realizado com 114 consumidores. Quatorze termos descritivos foram avaliados por uma equipe sensorial e seis atributos físico-químicos foram medidos. As amostras de néctar de uva A e C foram as mais aceitas e as amostras CL e DL (¿light¿) foram as mais rejeitadas. Construiu-se um Mapa de Preferência Interno e em seguida uma Análise de ¿Cluster¿ foi realizada para o atributo Impressão Global. Dois grupos de consumidores foram encontrados. A principal diferença entre os grupos foi com relação à utilização de diferentes porções da escala pelos consumidores de cada grupo. A metodologia PLSR foi utilizada para relacionar a aceitação dos consumidores com os termos descritivos e atributos físico-químicos, fornecendo correlações entre eles. Os resultados mostraram que os atributos Sabor de Uva, Sabor Residual de Uva, Acidez Total Titulável, Aroma de Uva, Cor Vinho, °Brix, Viscosidade, Acidez, Turbidez, Adstringência, Fenóis Totais e Consistência nesta ordem de importância, estavam fortemente correlacionados com a Impressão Global dos consumidores sendo portanto os direcionadores de preferência encontrados / Abstract: This study depicts the PLS regression method used to help find drivers of liking of the grape nectar. Eight commercial brands (four traditional and four lights) were analyzed. An acceptance test using hybrid hedonic scale was performed with 114 consumers. Fourteen attributes were evaluated by a sensory team of fourteen members, and six physical-chemical attributes were measured. The most accepted samples were A and C, and the less accepted ones were CL and DL (lights). An Internal Preference Mapping followed by a Cluster Analysis was performed on the consumer grades to Global Impression. Two clusters of consumers were found. The mainly difference between clusters was the use of different portions of the scale by the consumers. The PLSR methodology was used to relate the acceptance with the sensory and physical-chemical attributes giving a correlation between them. The model showed the importance of each sensory or physicalchemical attribute for the model projection. The results showed that Grape Flavor; Residual Grape Flavor, Total Sourness Titration, Grape Aroma, Wine Color, °Brix, Viscosity, Sourness, Turbidity, Astringency, Total Phenols and Consistency were positive correlated with consumer grades to Global Impression, therefore they are called drivers of liking / Mestrado / Consumo e Qualidade de Alimentos / Mestre em Alimentos e Nutrição
|
27 |
[en] LINEAR ELASTIC FRACTURE MECHANICS ANALYSIS OF FATIGUE CRACK GROWTH UNDER COMPLEX LOADING USING THE DIGITAL IMAGE CORRELATION TECHNIQUE / [pt] ANÁLISE DO CRESCIMENTO DE TRINCAS DE FADIGA PELA MECÂNICA DE FRATURA ELASTICA LINEAR SOB CARGA COMPLEXA UTILIZANDO A TÉCNICA DE CORRELAÇÃO DE IMAGENS DIGITAISJORGE GUILLERMO DIAZ RODRIGUEZ 25 January 2019 (has links)
[pt] A avaliação da propagação de trincas de fadiga inclui a identificação da direção da trinca, o conhecimento do Fator de Intensidade de Tensões (SIF) equivalente, a determinação de uma taxa de crescimento de comprimento de trinca por número de ciclos da/dN e o estabelecimento de uma regra de propagação de trinca conectando SIF e da/dN, como uma regra de tipo Paris. Quando ocorrem cargas mistas e não proporcionais, esses parâmetros ainda não são totalmente compreendidos. Esta tese trata de algumas das variáveis que influenciam a propagação de trincas sob carregamento no modo misto não proporcional. A técnica de Correlação de Imagens Digitais (DIC) foi utilizada para a aquisição de imagens de corpos de prova submetidos a carregamento proporcional e não proporcional cíclico. Dois tipos de corpos de prova foram utilizados. Primeiramente, dois corpos de prova planos foram testados; um disk compact tension (DCT, em inglês) e um compact tension modificado (C (T) em inglês). Eles foram submetidos a carregamento cíclico induzindo o modo I de abertura de trinca ou modos I e II de abertura de trinca proporcionais. Em segundo lugar, os dados DIC adquiridos anteriormente, e em outro lugar, para cinco tubos finos sujeitos a carregamento cíclico foram analisados. Os tubos finos tiveram entalhes usinados a partir dos quais as trincas por fadiga iniciaram e se propagaram. Esses cinco tubos finos foram submetidos a diferentes casos de carga proporcional e não proporcional. Um corpo de prova tipo tubo fino foi exposto a carga axial e apresentou modo de abertura de trinca tipo I. Os outros quatro foram submetidos a carregamento de torção ou carga axial-torcional mista e exibiram todos os três modos de abertura de trinca I, II e III. Os campos de deslocamento adquiridos experimentalmente com a técnica DIC foram processados para calcular independentemente o SIF para cada modo de abertura existente usando formulações de mecânica de fratura elástica linear (MFLE). Uma formulação delas utilizou dados de deslocamento de campo completos adquiridos em pequenas áreas que circundavam a ponta da trinca. Outra formulação usou dados adquiridos de um par de pontos localizados ao longo dos flancos opostos das faces da trinca. Os SIFs determinados foram usados para encontrar os SIFs equivalentes e faixas de SIF equivalentes usando o critério da tensão máxima de tração (para ambas as versões 2D e 3D de combinações dos modos I-II e modos I-II-III respectivamente) que implicitamente incluíram o ângulo de propagação de trinca. Verificou-se que a inclusão do SIF no modo III experimentalmente determinado efetivamente faz diferença nas faixas do SIF e dos SIF equivalentes estimados. A curva da/dN versus faixa do SIF equivalente foi elaborado com as taxas de crescimento de trinca medidas experimentalmente e as faixas de SIF que foram encontradas usando a suposição amplamente aceita de que as trincas cresceram na direção que maximiza a tensão de tração. Para isso, extensões do modelo de Schollmann et. al. e bem como o modelo de Erdogan-Sih, que são geralmente aplicados ao carregamento proporcional, foram usados para determinar os SIFs equivalentes e faixas de SIF equivalentes para os casos de carregamento proporcional e não proporcional. Finalmente, a segunda zona da regra de Paris (da/dN versus faixa do SIF equivalente) foi plotada para os cinco casos de carregamento nos tubos finos mostrando que eles caíram dentro de uma faixa razoavelmente fina e dispersa. / [en] Fatigue crack propagation assessment includes identifying the crack direction, knowing the equivalent Stress Intensity Factor (SIF) range, determining a crack length growth rate per number of cycles (da/dN), and establishing a crack propagation rule connecting the equivalent SIF and da/dN rate, such as a Paris type of rule. When mixed and non-proportional loading occur, those parameters are not fully understood yet. This thesis deals with some of the variables that influence crack propagation under non-proportional mixed mode loading. The Digital Image Correlation (DIC) technique was used to acquire images of test specimens subjected to cyclic proportional and non-proportional loading. Two types of specimen samples were used. Firstly, two different plate test specimens were tested; a disk compact tension (DCT), and a modified compact tension, C(T). They were subjected cyclic loading inducing crack opening mode I or proportional crack opening modes I and II. Secondly, the previously and elsewhere acquired DIC data for five thin tubes subject to cyclic loading were analyzed. The thin tubes had pre-fabricated slit-notches from which fatigue cracks initiated and propagated. Those five thin tubes were subjected to different cases of proportional and non- proportional loading. One tube specimen was exposed to axial loading and presented mode I crack opening. The other four were subjected to torsion loading or mixed axial-torsional loading and exhibited all three I, II and III crack-opening modes. The experimentally acquired DIC displacement fields were processed to independently calculate SIF for each existing opening mode using linear elastic fracture mechanics (LEFM) formulations. One formulation used full field displacement data acquired in small areas that surrounded the crack tip. Another formulation used data acquired from a pair of points located along the opposite crack flanks. The determined SIFs were used to find equivalent SIFs and equivalent SIF ranges using the maximum tensile stress criterion (for both 2D and 3D versions of combinations of modes I-II and modes I-II-III respectively) which implicitly included the crack propagation angle. It was found that the inclusion of the experimentally determined mode III SIF indeed makes a difference in the determined equivalent SIF and equivalent SIF ranges. A da/dN versus equivalent SIF ranges plot was drafted with the experimentally measured crack growth rates and the SIF ranges that were found by using the widely accepted assumption that the cracks grew in the direction that maximizes the tensile stress. For this, extensions of the Schollmann et. al. model as well as of the Erdogan-Sih model, which are generally applied to proportional loading, were used to determine equivalent SIFs and equivalent SIF ranges for the cases of proportional and non-proportional loading. Finally, the second stage of the Paris rule (da/dN versus SIF range) was plotted for the five thin tubes loading cases showing that they fell inside a reasonably thin scattered band.
|
28 |
[en] TS-TARX: TREE STRUCTURED - THRESHOLD AUTOREGRESSION WITH EXTERNAL VARIABLES / [pt] TS-TARX: UM MODELO DE REGRESSÃO COM LIMIARES BASEADO EM ÁRVORE DE DECISÃOCHRISTIAN NUNES ARANHA 28 January 2002 (has links)
[pt] Este trabalho propõe um novo modelo linear por partes
para a extração de regras de conhecimento de banco de
dados. O modelo é uma heurística baseada em análise de
árvore de regressão, como introduzido por Friedman (1979)
e discutido em detalhe por Breiman (1984). A motivação
desta pesquisa é trazer uma nova abordagem combinando
técnicas estatísticas de modelagem e um algoritmo de
busca por quebras eficiente. A decisão de quebra usada no
algoritmo de busca leva em consideração informações do
ajuste de equações lineares e foi implementado tendo por
inspiração o trabalho de Tsay
(1989). Neste, ele sugere um procedimento para construção
um modelo para a análise de séries temporais chamado TAR
(threshold autoregressive model), introduzido por
Tong (1978) e discutido em detalhes por Tong e Lim (1980)
e Tong (1983). O modelo TAR é um modelo linear por partes
cuja idéia central é alterar os parâmetros do modelo
linear autoregressivo de acordo com o valor de uma
variável observada, chamada de variável limiar. No
trabalho de Tsay, a Identificação do número e
localização do potencial limiar era baseada na analise de
gráficos. A idéia foi então criar um novo algoritmo todo
automatizado. Este processo é um algoritmo que preserva
o método de regressão por mínimos quadrados recursivo
(MQR) usado no trabalho de Tsay. Esta talvez seja uma das
grandes vantagens da metodologia introduzida neste
trabalho, visto que Cooper (1998) em seu trabalho de
análise de múltiplos regimes afirma não ser possível
testar cada quebra. Da combinação da árvore de decisão
com a técnica de regressão (MQR), o modelo se tornou o
TS-TARX (Tree Structured - Threshold AutoRegression with
eXternal variables). O procedimento consiste numa busca
em árvore binária calculando a estatística F para a
seleção das variáveis e o critério de informação BIC para
a seleção dos modelos. Ao final, o algoritmo gera como
resposta uma árvore de decisão (por meio de regras) e as
equações de regressão estimadas para cada regime da
partição. A principal característica deste tipo de
resposta é sua fácil interpretação. O trabalho conclui
com algumas aplicações em bases de dados padrões
encontradas na literatura e outras que auxiliarão o
entendimento do processo implementado. / [en] This research work proposes a new piecewise linear model to
extract knowledge rules from databases. The model is an
heuristic based on analysis of regression trees, introduced
by Friedman (1979) and discussed in detail by Breiman
(1984). The motivation of this research is to come up with
a new approach combining both statistical modeling
techniques and an efficient split search algorithm.
The split decision used in the split search algorithm
counts on information from adjusted linear equation and was
implemented inspired by the work of Tsay (1989). In his
work, he suggests a model-building procedure for a
nonlinear time series model called by TAR (threshold
autoregressive model), first proposed by Tong (1978) and
discussed in detail by Tong and Lim (1980) and Tong (1983).
The TAR model is a piecewise linear model which main idea
is to set the coefficients of a linear autoregressive
process in accordance with a value of observed variable,
called by threshold variable. Tsay`s identification of the
number and location of the potential thresholds was based
on supplementary graphic devices. The idea is to get the
whole process automatic on a new model-building process.
This process is an algorithm that preserves the method of
regression by recursive least squares (RLS) used in Tsay`s
work. This regression method allowed the test of all
possibilities of data split. Perhaps that is the main
advantage of the methodology introduced in this work,
seeing that Cooper, S. (1998) said about the impossibility
of testing each break.Thus, combining decision tree
methodology with a regression technique (RLS), the model
became the TS-TARX (Tree Structured - Threshold
AutoRegression with eXternal variables). It searches on a
binary tree calculating F statistics for variable selection
and the information criteria BIC for model selection. In
the end, the algorithm produces as result a decision tree
and a regression equation adjusted to each regime of the
partition defined by the decision tree. Its major advantage
is easy interpretation.This research work concludes with
some applications in benchmark databases from literature
and others that helps the understanding of the algorithm
process.
|
29 |
[pt] ESTIMAÇÃO DE MODELOS NÃO-LINEARES BASEADOS EM CONDIÇÕES DE MOMENTO / [en] MOMENT-BASED ESTIMATION OF NONLINEAR MODELSDANILO CAIANO DELGADO 10 July 2020 (has links)
[pt] O objetivo desta dissertação é comparar através de um estudo de simulação diferentes estimadores de modelos não-lineares. Nós consideramos neste trabalho o estimador não-linear de mínimos quadrados em dois estágios (NL2SLS), o estimador não-linear de máxima verossimilhança de informação limitada (LIML)
e o estimador com função controle (CF). Os resultados mostram que os estimadores CF e LIML possuem em geral uma performance superior ao do NL2SLS para os modelos selecionados. O trabalho considera uma aplicação de uma Curva de Phillips não-linear para a Economia Brasileira. / [en] The aim of this dissertation is to compare, in a simulation study, different nonlinear estimators for selected models. We consider the two-stage nonlinear least-squares (NL2SLS), the nonlinear limited information maximum likelihood (LIML), and the control function (CF) estimator. Our results show that usually either CF or LIML estimators perform better than the NL2SLS estimator for the selected models. In an application with real data, we consider the estimation a nonlinear Phillips Curve for Brazilian economy.
|
Page generated in 0.0736 seconds