• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 26
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • Tagged with
  • 29
  • 29
  • 14
  • 14
  • 13
  • 6
  • 5
  • 4
  • 4
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

[en] ALGORITHMS FOR PARTIAL LEAST SQUARES REGRESSION / [pt] ALGORITMOS PARA REGRESSÃO POR MÍNIMOS QUADRADOS PARCIAIS

RAUL PIERRE RENTERIA 08 January 2004 (has links)
[pt] Muitos problemas da área de aprendizagem automática tem por objetivo modelar a complexa relação existente num sisitema , entre variáveis de entrada X e de saída Y na ausência de um modelo teórico. A regressão por mínimos quadrados parciais PLS ( Partial Least Squares) constitui um método linear para resolução deste tipo de problema , voltado para o caso de um grande número de variáveis de entrada quando comparado com número de amostras. Nesta tese , apresentamos uma variante do algoritmo clássico PLS para o tratamento de grandes conjuntos de dados , mantendo um bom poder preditivo. Dentre os principais resultados destacamos um versão paralela PPLS (Parallel PLS ) exata para o caso de apenas um variável de saída e um versão rápida e aproximada DPLS (DIRECT PLS) para o caso de mais de uma variável de saída. Por outro lado ,apresentamos também variantes para o aumento da qualidade de predição graças à formulação não linear. São elas o LPLS ( Lifted PLS ), algoritmo para o caso de apenas uma variável de saída, baseado na teoria de funções de núcleo ( kernel functions ), uma formulação kernel para o DPLS e um algoritmo multi-kernel MKPLS capaz de uma modelagemmais compacta e maior poder preditivo, graças ao uso de vários núcleos na geração do modelo. / [en] The purpose of many problems in the machine learning field isto model the complex relationship in a system between the input X and output Y variables when no theoretical model is available. The Partial Least Squares (PLS)is one linear method for this kind of problem, for the case of many input variables when compared to the number of samples. In this thesis we present versions of the classical PLS algorithm designed for large data sets while keeping a good predictive power. Among the main results we highlight PPLS (Parallel PLS), a parallel version for the case of only one output variable, and DPLS ( Direct PLS), a fast and approximate version, for the case fo more than one output variable. On the other hand, we also present some variants of the regression algorithm that can enhance the predictive quality based on a non -linear formulation. We indroduce LPLS (Lifted PLS), for the case of only one dependent variable based on the theory of kernel functions, KDPLS, a non-linear formulation for DPLS, and MKPLS, a multi-kernel algorithm that can result in a more compact model and a better prediction quality, thankas to the use of several kernels for the model bulding.
22

[en] EVALUATION METHODOLOGY COMPANY CONSIDERING INTANGIBLE ASSETS THROUGH LEAST SQUARE MONTE CARLO AND MEAN REVERSION / [pt] METODOLOGIA DE AVALIAÇÃO DE EMPRESAS CONSIDERANDO ATIVOS INTANGÍVEIS ATRAVÉS DE MÍNIMOS QUADRADOS DE MONTE CARLO E REVERSÃO À MÉDIA

RODRIGO BARCELLOS SECCHIN 09 July 2010 (has links)
[pt] No modelo de Pesquisa e Desenvolvimento (P&D) para o setor farmacêutico, considerando a proteção da patente, Schwartz fez uma contribuição muito importante para a precificação do valor de uma empresa. Alem de considerar a possibilidade dos eventos catastróficos, o autor aplicou uma ferramenta simples, mas ao mesmo tempo bastante poderosa, até então não utilizada pela literatura para tal fim (denominada Mínimos Quadrados de Monte Carlo). Na última etapa do seu modelo (período pós patente), o autor aproxima o processo por um valor constante (obtido por meio de uma estimativa), acreditando que o mercado absolverá imediatamente a tecnologia e, com isto, a simplificação não alterará significativamente o resultado final.Contudo, com o avanço da globalização e o desenvolvimento dos meios de comunicação, o mercado tem-se tornado cada vez mais dinâmico e competitivo. Uma vez que as táticas clássicas já se tornaram acessíveis a todos (e. g. produção em escala ou corte dos custos), elas não são mais suficientes para manter a lucratividade de uma empresa. Diversos estudiosos e instituições renomadas (como por exemplo, BNDES) observaram que, para sobreviverem a isso, as empresas precisam suplantar a concorrência, através de um conjunto de capacitações denominadas bens intangíveis, o que na maioria das ocasiões é uma operação bastante complexa. Devido a essas evidencias a absorção de uma nova tecnologia não necessariamente é uma atividade imediata (contrariando as suposições de Schwartz). Com o intuito de uma melhor descrição da realidade, esta dissertação propõe um aperfeiçoamento matemático (não mais aproximando a etapa pós-patente) e algorítmico do modelo de Schwartz. O modelo foi criado a partir de um conjunto de conceitos da Microeconomia, Opções Reais e das Métricas de Avaliação do BNDES, previamente desenvolvido com o auxílio da equipe do BNDES. Os resultados obtidos na simulação do exemplo teórico, a qual foi analisada uma empresa de TI que pretende desenvolver uma nova tecnologia, não apresentaram nenhuma incoerência, indicando, desta forma, nenhum erro sob a ótica matemática ou algorítmica e confirmando, ao mesmo tempo, a importância dos ativos intangíveis, que, por sua vez, propiciaram maiores ganhos, antes desprezados. / [en] In the model of Research and Development (R & D) for the pharmaceutical industry, considering patent protection, Schwartz made an important contribution to the valuation of a company. Besides considering the possibility of catastrophic events, the author applied a simple tool, but at the same time very powerful, hitherto not used in the literature for this purpose (called Least Squares Monte Carlo). In the last stage of its type (post patent), the author approaches the process with a constant value (obtained via an estimate), believing that the market immediately absolve the technology and, thus, the simplification does not significantly change the outcome final. Canted, with the advance of globalization and the media, the market has become increasingly dynamic and competitive. Since the classic tactics have become accessible to all (egg scale production or cut costs), they are no longer sufficient to maintain the profitability of a company. Several renowned scholars and institutions (such as BNDES) observed that, to survive this, companies must overcome competition through a set of skills called intangibles, which in most cases is a complex operation. Because of these evidences the absorption of new technology is not necessarily an immediate activity (contrary to the assumptions of Schwartz). Aiming at a better description of reality, this study proposes a mathematical processing (no longer approaching the post-patent) and the algorithmic model of Schwartz. The model was created from a set of concepts of microeconomics, Real Options and Metrics Assessment of BNDES, previously developed with the assistance of staff from BNDES. The simulation results of the theoretical example, which was considered an IT company that aims to develop a new technology, did not show any inconsistency, indicating thus no error in the mathematical or algorithmic perspective and confirming at the same time, importance of intangible assets, which, in turn, lead to the greatest earnings before slighted.
23

[en] SPATIAL FILTERS APPLICATION TO THE RESTAURATION OF NON-DESTRUCTIVE ESSAY MAGNETIC IMAGES / [pt] APLICAÇÃO DE FILTROS ESPACIAIS À RESTAURAÇÃO DE IMAGENS MAGNÉTICAS OBTIDAS EM ENSAIOS NÃO-DESTRUTIVOS

EDUARDO ANDRADE LIMA 26 July 2006 (has links)
[pt] Desenvolveu-se uma técnica de restauração de imagens de defeitos existentes em materiais ferromagnéticos, obtidas pela solução do problema inverso para sinais simulados proveniente do método de Ensaios Não-Destrutivos conhecido como Magnetic Flux Leakage. Baseada em princípios de filtragem ótima, a técnica visa reduzir distorções introduzidas nas imagens pela Inversa MNSL (Minimum-Norm Least-Squares Inverse). Com a aplicação desta técnica, é possível caracterizar mais precisamente diversos tipos de defeitos. / [en] Na image processing technique was developed to restore images of defects in ferromagnetic materials. Such images are obtained by solving the eletromagnetic inverse problem associated with the Magnetic Flux Leakage method of Nondestructive Evaluation. Based upon optimal filtering, the technique aims to reduce distortions introduced by the Minimum-Norm Least-Square Inverse. By applying such technique it is possible to better characterize various defect types.
24

[pt] PREVISÃO DE POTÊNCIA REATIVA / [en] REACTIVE POWER FORECASTING

ELIANE DA SILVA CHRISTO 28 December 2005 (has links)
[pt] No novo modelo do Setor Elétrico é essencial desenvolver novas técnicas que estimem valores futuros, a curto e longo-prazos, das potências ativa e reativa. Com base nisso, este trabalho tem por objetivo apresentar uma nova técnica de previsão horária de potência reativa a curto-prazo, por subestação, baseada na linearidade existente entre as potências ativa e reativa. O modelo proposto, denominado de Modelo Híbrido de Previsão de Reativo, é dividido em duas etapas: A primeira etapa é feita uma classificação dos dados através de uma rede neural não supervisionada Mapas Auto-Organizáveis de Kohonen (SOM); A segunda etapa, utiliza-se um modelo de defasagem distribuída auto-regressivo (ADL) com estimação de Mínimos Quadrados Reponderados Iterativamente (IRLS) acoplado a uma correção para autocorrelação serial dos resíduos - Método Iterativo de Cochrane-Orcutt. Este Modelo Híbrido tem como variável dependente a potência reativa, e como variáveis explicativas dados horários de potência ativa e reativa no instante atual e defasadas no tempo. A previsão de potência reativa a curto-prazo é dividida em in sample e em out of sample. A previsão out of sample é aplicada a períodos horários em até um mês à frente. O modelo proposto é aplicado aos dados de uma concessionária específica de Energia Elétrica e os resultados são comparados a um modelo de Regressão Dinâmica convencional e a um modelo de Redes Neurais Artificiais Feedforward de Múltiplas camadas (MLP) com um algoritmo de retropropagação do erro. / [en] The forecasting of reactive and active power is an important tool in the monitoring of an Electrical Energy System. The main purpose of the present work is the development of a new short-term reactive power hourly forecast technique, which can be used at utility or substations levels. The proposed model, named A Hybrid Model for Reactive Forecasting, is divided in two stages. In the first stage, the active and reactive power data are classified by an unsupervised neural network - the Self-Organized Maps of Kohonen (SOM). In the second stage, a Autoregressive Distributed Lags Model (ADL) is used with its parameters estimated by an Iteratively Reweighted Least Square (IRLS). It also includes a correction lag structure for serial autocorrelation of the residuals as used in the Cochrane-Orcutt formulation. The short term reactive power forecasting is divided in in sample and out of sample. The out of sample forecast is applied to hourly periods until one month ahead. The proposed model is applied to real data of one substation and the results are compared with two other approaches, a conventional Dynamic Regression and a Feedforward Multi-layer Perceptron (MLP) Artificial Neural Network model.
25

[en] A SYSTEM FOR STOCK MARKET FORECASTING AND SIMULATION / [pt] UM SISTEMA PARA PREDIÇÃO E SIMULAÇÃO DO MERCADO DE CAPITAIS

PAULO DE TARSO GOMIDE CASTRO SILVA 02 February 2017 (has links)
[pt] Nos últimos anos, vem crescendo o interesse acerca da predição do comportamento do mercado de capitais, tanto por parte dos investidores quanto dos pesquisadores. Apesar do grande número de publicações tratando esse problema, predizer com eficiência futuras tendências e desenvolver estratégias de negociação capazes de traduzir boas predições em lucros são ainda grandes desafios. A dificuldade em realizar tais tarefas se deve tanto à não linearidade e grande volume de ruídos presentes nos dados do mercado, quanto à falta de sistemas que possam avaliar com propriedade a qualidade das predições realizadas. Nesse trabalho, são realizadas predições de séries temporais visando auxiliar o investidor tanto em operações de compra e venda, como em Pairs Trading. Além disso, as predições são feitas considerando duas diferentes periodicidades. Uma predição interday, que considera apenas dados diários e tem como objetivo a predição de valores referentes ao presente dia. E uma predição intraday, que visa predizer valores referentes a cada hora de negociação do dia atual e para isso considera também os dados intraday conhecidos até o momento que se deseja prever. Para ambas as tarefas propostas, foram testadas três ferramentas de predição, quais sejam, Regressão por Mínimos Quadrados Parciais, Regressão por Vetores de Suporte e Redes Neurais Artificiais. Com o intuito de melhor avaliar a qualidade das predições realizadas, é proposto ainda um trading system. Os testes foram realizados considerando ativos das companhias mais negociadas da BM e FBOVESPA, a bolsa de valores oficial do Brasil e terceira maior do mundo. Os resultados dos três preditores são apresentados e comparados a quatro benchmarks, bem como com a solução ótima. A diferença na qualidade de predição, considerando o erro de predição ou as métricas do trading system, são notáveis. Se quando analisado apenas o Erro Percentual Absoluto Médio os preditores propostos não mostram uma melhora significativa, quando as métricas do trading system são consideradas eles apresentam um resultado bem superior. O retorno anual do investimento em alguns casos atinge valor superior a 300 por cento. / [en] The interest of both investors and researchers in stock market behavior forecasting has increased throughout the recent years. Despite the wide number of publications examining this problem, accurately predicting future stock trends and developing business strategies capable of turning good predictions into profits are still great challenges. This is partly due to the nonlinearity and noise inherent to the stock market data source, and partly because benchmarking systems to assess the forecasting quality are not publicly available. Here, we perform time series forecasting aiming to guide the investor both into Pairs Trading and buy and sell operations. Furthermore, we explore two different forecasting periodicities. First, an interday forecast, which considers only daily data and whose goal is predict values referring to the current day. And second, the intraday approach, which aims to predict values referring to each trading hour of the current day and also takes advantage of the intraday data already known at prediction time. In both forecasting schemes, we use three regression tools as predictor algorithms, which are: Partial Least Squares Regression, Support Vector Regression and Artificial Neural Networks. We also propose a trading system as a better way to assess the forecasting quality. In the experiments, we examine assets of the most traded companies in the BM and FBOVESPA Stock Exchange, the world s third largest and official Brazilian Stock Exchange. The results for the three predictors are presented and compared to four benchmarks, as well as to the optimal solution. The difference in the forecasting quality, when considering either the forecasting error metrics or the trading system metrics, is remarkable. If we consider just the mean absolute percentage error, the proposed predictors do not show a significant superiority. Nevertheless, when considering the trading system evaluation, it shows really outstanding results. The yield in some cases amounts to an annual return on investment of more than 300 per cent.
26

Direcionadores de preferencia para nectares de uva comerciais tradicionais e "lights" utilizando regressão por minimos quadrados parciais (PLSR) / Drivers of liking for grape nectars in the traditional commercial and light versions using partial least squares regression (PLSR)

Alves, Leonardo Rangel 07 October 2008 (has links)
Orientador: Helena Maria Andre Bolini / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia de Alimentos / Made available in DSpace on 2018-08-11T04:55:59Z (GMT). No. of bitstreams: 1 Alves_LeonardoRangel_M.pdf: 410164 bytes, checksum: eed7ffe76f347f00d0abb009ed908230 (MD5) Previous issue date: 2008 / Resumo: Este estudo objetivou Identificar direcionadores de preferência de oito amostras comerciais de néctar de uva (tradicionais e ¿light¿) utilizando metodologias estatísticas avançadas para relacionar dados de perfil sensorial, físico-químicos e aceitabilidade. Oito amostras comerciais de néctares de uva (quatro tradicionais e suas respectivas versões ¿light¿) foram analisadas. Um teste de Aceitação utilizando a escala hedônica híbrida foi realizado com 114 consumidores. Quatorze termos descritivos foram avaliados por uma equipe sensorial e seis atributos físico-químicos foram medidos. As amostras de néctar de uva A e C foram as mais aceitas e as amostras CL e DL (¿light¿) foram as mais rejeitadas. Construiu-se um Mapa de Preferência Interno e em seguida uma Análise de ¿Cluster¿ foi realizada para o atributo Impressão Global. Dois grupos de consumidores foram encontrados. A principal diferença entre os grupos foi com relação à utilização de diferentes porções da escala pelos consumidores de cada grupo. A metodologia PLSR foi utilizada para relacionar a aceitação dos consumidores com os termos descritivos e atributos físico-químicos, fornecendo correlações entre eles. Os resultados mostraram que os atributos Sabor de Uva, Sabor Residual de Uva, Acidez Total Titulável, Aroma de Uva, Cor Vinho, °Brix, Viscosidade, Acidez, Turbidez, Adstringência, Fenóis Totais e Consistência nesta ordem de importância, estavam fortemente correlacionados com a Impressão Global dos consumidores sendo portanto os direcionadores de preferência encontrados / Abstract: This study depicts the PLS regression method used to help find drivers of liking of the grape nectar. Eight commercial brands (four traditional and four lights) were analyzed. An acceptance test using hybrid hedonic scale was performed with 114 consumers. Fourteen attributes were evaluated by a sensory team of fourteen members, and six physical-chemical attributes were measured. The most accepted samples were A and C, and the less accepted ones were CL and DL (lights). An Internal Preference Mapping followed by a Cluster Analysis was performed on the consumer grades to Global Impression. Two clusters of consumers were found. The mainly difference between clusters was the use of different portions of the scale by the consumers. The PLSR methodology was used to relate the acceptance with the sensory and physical-chemical attributes giving a correlation between them. The model showed the importance of each sensory or physicalchemical attribute for the model projection. The results showed that Grape Flavor; Residual Grape Flavor, Total Sourness Titration, Grape Aroma, Wine Color, °Brix, Viscosity, Sourness, Turbidity, Astringency, Total Phenols and Consistency were positive correlated with consumer grades to Global Impression, therefore they are called drivers of liking / Mestrado / Consumo e Qualidade de Alimentos / Mestre em Alimentos e Nutrição
27

[en] LINEAR ELASTIC FRACTURE MECHANICS ANALYSIS OF FATIGUE CRACK GROWTH UNDER COMPLEX LOADING USING THE DIGITAL IMAGE CORRELATION TECHNIQUE / [pt] ANÁLISE DO CRESCIMENTO DE TRINCAS DE FADIGA PELA MECÂNICA DE FRATURA ELASTICA LINEAR SOB CARGA COMPLEXA UTILIZANDO A TÉCNICA DE CORRELAÇÃO DE IMAGENS DIGITAIS

JORGE GUILLERMO DIAZ RODRIGUEZ 25 January 2019 (has links)
[pt] A avaliação da propagação de trincas de fadiga inclui a identificação da direção da trinca, o conhecimento do Fator de Intensidade de Tensões (SIF) equivalente, a determinação de uma taxa de crescimento de comprimento de trinca por número de ciclos da/dN e o estabelecimento de uma regra de propagação de trinca conectando SIF e da/dN, como uma regra de tipo Paris. Quando ocorrem cargas mistas e não proporcionais, esses parâmetros ainda não são totalmente compreendidos. Esta tese trata de algumas das variáveis que influenciam a propagação de trincas sob carregamento no modo misto não proporcional. A técnica de Correlação de Imagens Digitais (DIC) foi utilizada para a aquisição de imagens de corpos de prova submetidos a carregamento proporcional e não proporcional cíclico. Dois tipos de corpos de prova foram utilizados. Primeiramente, dois corpos de prova planos foram testados; um disk compact tension (DCT, em inglês) e um compact tension modificado (C (T) em inglês). Eles foram submetidos a carregamento cíclico induzindo o modo I de abertura de trinca ou modos I e II de abertura de trinca proporcionais. Em segundo lugar, os dados DIC adquiridos anteriormente, e em outro lugar, para cinco tubos finos sujeitos a carregamento cíclico foram analisados. Os tubos finos tiveram entalhes usinados a partir dos quais as trincas por fadiga iniciaram e se propagaram. Esses cinco tubos finos foram submetidos a diferentes casos de carga proporcional e não proporcional. Um corpo de prova tipo tubo fino foi exposto a carga axial e apresentou modo de abertura de trinca tipo I. Os outros quatro foram submetidos a carregamento de torção ou carga axial-torcional mista e exibiram todos os três modos de abertura de trinca I, II e III. Os campos de deslocamento adquiridos experimentalmente com a técnica DIC foram processados para calcular independentemente o SIF para cada modo de abertura existente usando formulações de mecânica de fratura elástica linear (MFLE). Uma formulação delas utilizou dados de deslocamento de campo completos adquiridos em pequenas áreas que circundavam a ponta da trinca. Outra formulação usou dados adquiridos de um par de pontos localizados ao longo dos flancos opostos das faces da trinca. Os SIFs determinados foram usados para encontrar os SIFs equivalentes e faixas de SIF equivalentes usando o critério da tensão máxima de tração (para ambas as versões 2D e 3D de combinações dos modos I-II e modos I-II-III respectivamente) que implicitamente incluíram o ângulo de propagação de trinca. Verificou-se que a inclusão do SIF no modo III experimentalmente determinado efetivamente faz diferença nas faixas do SIF e dos SIF equivalentes estimados. A curva da/dN versus faixa do SIF equivalente foi elaborado com as taxas de crescimento de trinca medidas experimentalmente e as faixas de SIF que foram encontradas usando a suposição amplamente aceita de que as trincas cresceram na direção que maximiza a tensão de tração. Para isso, extensões do modelo de Schollmann et. al. e bem como o modelo de Erdogan-Sih, que são geralmente aplicados ao carregamento proporcional, foram usados para determinar os SIFs equivalentes e faixas de SIF equivalentes para os casos de carregamento proporcional e não proporcional. Finalmente, a segunda zona da regra de Paris (da/dN versus faixa do SIF equivalente) foi plotada para os cinco casos de carregamento nos tubos finos mostrando que eles caíram dentro de uma faixa razoavelmente fina e dispersa. / [en] Fatigue crack propagation assessment includes identifying the crack direction, knowing the equivalent Stress Intensity Factor (SIF) range, determining a crack length growth rate per number of cycles (da/dN), and establishing a crack propagation rule connecting the equivalent SIF and da/dN rate, such as a Paris type of rule. When mixed and non-proportional loading occur, those parameters are not fully understood yet. This thesis deals with some of the variables that influence crack propagation under non-proportional mixed mode loading. The Digital Image Correlation (DIC) technique was used to acquire images of test specimens subjected to cyclic proportional and non-proportional loading. Two types of specimen samples were used. Firstly, two different plate test specimens were tested; a disk compact tension (DCT), and a modified compact tension, C(T). They were subjected cyclic loading inducing crack opening mode I or proportional crack opening modes I and II. Secondly, the previously and elsewhere acquired DIC data for five thin tubes subject to cyclic loading were analyzed. The thin tubes had pre-fabricated slit-notches from which fatigue cracks initiated and propagated. Those five thin tubes were subjected to different cases of proportional and non- proportional loading. One tube specimen was exposed to axial loading and presented mode I crack opening. The other four were subjected to torsion loading or mixed axial-torsional loading and exhibited all three I, II and III crack-opening modes. The experimentally acquired DIC displacement fields were processed to independently calculate SIF for each existing opening mode using linear elastic fracture mechanics (LEFM) formulations. One formulation used full field displacement data acquired in small areas that surrounded the crack tip. Another formulation used data acquired from a pair of points located along the opposite crack flanks. The determined SIFs were used to find equivalent SIFs and equivalent SIF ranges using the maximum tensile stress criterion (for both 2D and 3D versions of combinations of modes I-II and modes I-II-III respectively) which implicitly included the crack propagation angle. It was found that the inclusion of the experimentally determined mode III SIF indeed makes a difference in the determined equivalent SIF and equivalent SIF ranges. A da/dN versus equivalent SIF ranges plot was drafted with the experimentally measured crack growth rates and the SIF ranges that were found by using the widely accepted assumption that the cracks grew in the direction that maximizes the tensile stress. For this, extensions of the Schollmann et. al. model as well as of the Erdogan-Sih model, which are generally applied to proportional loading, were used to determine equivalent SIFs and equivalent SIF ranges for the cases of proportional and non-proportional loading. Finally, the second stage of the Paris rule (da/dN versus SIF range) was plotted for the five thin tubes loading cases showing that they fell inside a reasonably thin scattered band.
28

[en] TS-TARX: TREE STRUCTURED - THRESHOLD AUTOREGRESSION WITH EXTERNAL VARIABLES / [pt] TS-TARX: UM MODELO DE REGRESSÃO COM LIMIARES BASEADO EM ÁRVORE DE DECISÃO

CHRISTIAN NUNES ARANHA 28 January 2002 (has links)
[pt] Este trabalho propõe um novo modelo linear por partes para a extração de regras de conhecimento de banco de dados. O modelo é uma heurística baseada em análise de árvore de regressão, como introduzido por Friedman (1979) e discutido em detalhe por Breiman (1984). A motivação desta pesquisa é trazer uma nova abordagem combinando técnicas estatísticas de modelagem e um algoritmo de busca por quebras eficiente. A decisão de quebra usada no algoritmo de busca leva em consideração informações do ajuste de equações lineares e foi implementado tendo por inspiração o trabalho de Tsay (1989). Neste, ele sugere um procedimento para construção um modelo para a análise de séries temporais chamado TAR (threshold autoregressive model), introduzido por Tong (1978) e discutido em detalhes por Tong e Lim (1980) e Tong (1983). O modelo TAR é um modelo linear por partes cuja idéia central é alterar os parâmetros do modelo linear autoregressivo de acordo com o valor de uma variável observada, chamada de variável limiar. No trabalho de Tsay, a Identificação do número e localização do potencial limiar era baseada na analise de gráficos. A idéia foi então criar um novo algoritmo todo automatizado. Este processo é um algoritmo que preserva o método de regressão por mínimos quadrados recursivo (MQR) usado no trabalho de Tsay. Esta talvez seja uma das grandes vantagens da metodologia introduzida neste trabalho, visto que Cooper (1998) em seu trabalho de análise de múltiplos regimes afirma não ser possível testar cada quebra. Da combinação da árvore de decisão com a técnica de regressão (MQR), o modelo se tornou o TS-TARX (Tree Structured - Threshold AutoRegression with eXternal variables). O procedimento consiste numa busca em árvore binária calculando a estatística F para a seleção das variáveis e o critério de informação BIC para a seleção dos modelos. Ao final, o algoritmo gera como resposta uma árvore de decisão (por meio de regras) e as equações de regressão estimadas para cada regime da partição. A principal característica deste tipo de resposta é sua fácil interpretação. O trabalho conclui com algumas aplicações em bases de dados padrões encontradas na literatura e outras que auxiliarão o entendimento do processo implementado. / [en] This research work proposes a new piecewise linear model to extract knowledge rules from databases. The model is an heuristic based on analysis of regression trees, introduced by Friedman (1979) and discussed in detail by Breiman (1984). The motivation of this research is to come up with a new approach combining both statistical modeling techniques and an efficient split search algorithm. The split decision used in the split search algorithm counts on information from adjusted linear equation and was implemented inspired by the work of Tsay (1989). In his work, he suggests a model-building procedure for a nonlinear time series model called by TAR (threshold autoregressive model), first proposed by Tong (1978) and discussed in detail by Tong and Lim (1980) and Tong (1983). The TAR model is a piecewise linear model which main idea is to set the coefficients of a linear autoregressive process in accordance with a value of observed variable, called by threshold variable. Tsay`s identification of the number and location of the potential thresholds was based on supplementary graphic devices. The idea is to get the whole process automatic on a new model-building process. This process is an algorithm that preserves the method of regression by recursive least squares (RLS) used in Tsay`s work. This regression method allowed the test of all possibilities of data split. Perhaps that is the main advantage of the methodology introduced in this work, seeing that Cooper, S. (1998) said about the impossibility of testing each break.Thus, combining decision tree methodology with a regression technique (RLS), the model became the TS-TARX (Tree Structured - Threshold AutoRegression with eXternal variables). It searches on a binary tree calculating F statistics for variable selection and the information criteria BIC for model selection. In the end, the algorithm produces as result a decision tree and a regression equation adjusted to each regime of the partition defined by the decision tree. Its major advantage is easy interpretation.This research work concludes with some applications in benchmark databases from literature and others that helps the understanding of the algorithm process.
29

[pt] ESTIMAÇÃO DE MODELOS NÃO-LINEARES BASEADOS EM CONDIÇÕES DE MOMENTO / [en] MOMENT-BASED ESTIMATION OF NONLINEAR MODELS

DANILO CAIANO DELGADO 10 July 2020 (has links)
[pt] O objetivo desta dissertação é comparar através de um estudo de simulação diferentes estimadores de modelos não-lineares. Nós consideramos neste trabalho o estimador não-linear de mínimos quadrados em dois estágios (NL2SLS), o estimador não-linear de máxima verossimilhança de informação limitada (LIML) e o estimador com função controle (CF). Os resultados mostram que os estimadores CF e LIML possuem em geral uma performance superior ao do NL2SLS para os modelos selecionados. O trabalho considera uma aplicação de uma Curva de Phillips não-linear para a Economia Brasileira. / [en] The aim of this dissertation is to compare, in a simulation study, different nonlinear estimators for selected models. We consider the two-stage nonlinear least-squares (NL2SLS), the nonlinear limited information maximum likelihood (LIML), and the control function (CF) estimator. Our results show that usually either CF or LIML estimators perform better than the NL2SLS estimator for the selected models. In an application with real data, we consider the estimation a nonlinear Phillips Curve for Brazilian economy.

Page generated in 0.0736 seconds