Spelling suggestions: "subject:"multilayer perceptrons"" "subject:"multilayer perceptrones""
1 |
Priors Stabilizers and Basis Functions: From Regularization to Radial, Tensor and Additive SplinesGirosi, Federico, Jones, Michael, Poggio, Tomaso 01 June 1993 (has links)
We had previously shown that regularization principles lead to approximation schemes, as Radial Basis Functions, which are equivalent to networks with one layer of hidden units, called Regularization Networks. In this paper we show that regularization networks encompass a much broader range of approximation schemes, including many of the popular general additive models, Breiman's hinge functions and some forms of Projection Pursuit Regression. In the probabilistic interpretation of regularization, the different classes of basis functions correspond to different classes of prior probabilities on the approximating function spaces, and therefore to different types of smoothness assumptions. In the final part of the paper, we also show a relation between activation functions of the Gaussian and sigmoidal type.
|
2 |
Estudo das dispersões metrológicas em redes neurais artificiais do tipo Multilayer Perceptrons através da aplicação em curvas de calibração. / Study of metrological dispersions in Mulltilayer Perceptrons, one type of artificial neural networks, through calibration curve application.Barbosa, Itamar Magno 07 December 2009 (has links)
Este trabalho é um estudo das dispersões metrológicas em aproximações de funções tidas como não conhecidas ou não totalmente conhecidas. A metodologia alternativa para esse fim são as redes neurais artificiais do tipo Multilayer Perceptrons (MLP), aqui utilizadas como aproximadoras de funções. As funções aproximadas são curvas de calibração decorrentes de indicações de instrumentos ou sistemas de medição numa calibração. Essas curvas levam consigo propriedades metrológicas e possuem, neste trabalho, papel de ponte entre os elementos considerados da teoria metrológica e os elementos considerados da teoria da Inteligência Computacional: as Multilayer Perceptrons (MLPs). Uma balança externa de medição de esforços aerodinâmicos e uma Língua Eletrônica (LE), aplicada na medição da concentração de cátions, foram os meios de aplicação dos conceitos dessa metodologia alternativa. As proposições desta tese visam implementar melhorias na exatidão do ajuste das curvas de calibração por meio da consideração dos seguintes fatores: grandezas de influências, incertezas nos Valores Objetivos (VOs), tendência de medição de erros sistemáticos ocultos ou não solvidos e indicadores de desempenho metrológicos. A indicação da qualidade na medição ou a indicação da competência metrológica de um laboratório de calibração é estabelecida pelos valores das incertezas, e a curva de calibração é o ponto de partida para os cálculos desses valores. Visto que o estabelecimento dessa curva é uma das dificuldades para o cálculo das incertezas e a própria curva é uma fonte de incerteza, sua aproximação requer uma a cuidadosa e meticulosa metodologia, daí a importância estratégica deste trabalho. As dispersões metrológicas possuem conotação de incertezas nas medições e elas são a base para a determinação de seu valor numérico; assim, os indicadores de desempenho podem representar essas dispersões e a recíproca também é verdadeira: a incerteza padrão pode ser um dos indicadores de desempenho. Sintetizando, nesta tese é mostrado de que forma a teoria da inteligência computacional adentra na teoria da metrologia e vice versa, nas esferas dos elementos aqui considerados. / The present study investigates metrological dispersions in fitting partially or totally unknown functions. An alternative method is the application of a multilayer perceptron neural network used here to fit functions. The fitting functions are calibration curves from calibration indications of measurement systems or instruments. These curves hold metrological properties and establish a link between elements of Metrological theory and elements of Computing Intelligence theory: the Multilayer Perceptrons. An external balance of aerodynamic forces and moments and an electronic tongue applied in the measurement of cation concentrations were the measurement systems used to apply the concepts of this alternative methodology. This thesis proposes improvements in the accuracy of fitting calibration curves considering the following factors: influence quantities, uncertainties about target values, tendency of hidden or not solved systematic errors and metrological performance functions. The measurement quality indicator or the laboratory metrological competence indicator is established by uncertainty values and the calibration curve is the starting point for the calculation of these values. The establishment of this curve is one of the difficulties in assessing uncertainties and the curve itself is an uncertainty source. Therefore, a careful and meticulous methodology is necessary in curve approximation, which explains the strategic importance of this work. Metrological dispersions have connotation of uncertainty in measurements and are the basis for calculating their numerical values, the performance functions can represent metrological dispersions and the opposite is also true: the standard uncertainty can be a performance function. Making a synthesis, this thesis demonstrates how computing intelligence theory takes into account the metrological theory and vice versa, in the elements of these theories that were discussed in the present study.
|
3 |
Estudo das dispersões metrológicas em redes neurais artificiais do tipo Multilayer Perceptrons através da aplicação em curvas de calibração. / Study of metrological dispersions in Mulltilayer Perceptrons, one type of artificial neural networks, through calibration curve application.Itamar Magno Barbosa 07 December 2009 (has links)
Este trabalho é um estudo das dispersões metrológicas em aproximações de funções tidas como não conhecidas ou não totalmente conhecidas. A metodologia alternativa para esse fim são as redes neurais artificiais do tipo Multilayer Perceptrons (MLP), aqui utilizadas como aproximadoras de funções. As funções aproximadas são curvas de calibração decorrentes de indicações de instrumentos ou sistemas de medição numa calibração. Essas curvas levam consigo propriedades metrológicas e possuem, neste trabalho, papel de ponte entre os elementos considerados da teoria metrológica e os elementos considerados da teoria da Inteligência Computacional: as Multilayer Perceptrons (MLPs). Uma balança externa de medição de esforços aerodinâmicos e uma Língua Eletrônica (LE), aplicada na medição da concentração de cátions, foram os meios de aplicação dos conceitos dessa metodologia alternativa. As proposições desta tese visam implementar melhorias na exatidão do ajuste das curvas de calibração por meio da consideração dos seguintes fatores: grandezas de influências, incertezas nos Valores Objetivos (VOs), tendência de medição de erros sistemáticos ocultos ou não solvidos e indicadores de desempenho metrológicos. A indicação da qualidade na medição ou a indicação da competência metrológica de um laboratório de calibração é estabelecida pelos valores das incertezas, e a curva de calibração é o ponto de partida para os cálculos desses valores. Visto que o estabelecimento dessa curva é uma das dificuldades para o cálculo das incertezas e a própria curva é uma fonte de incerteza, sua aproximação requer uma a cuidadosa e meticulosa metodologia, daí a importância estratégica deste trabalho. As dispersões metrológicas possuem conotação de incertezas nas medições e elas são a base para a determinação de seu valor numérico; assim, os indicadores de desempenho podem representar essas dispersões e a recíproca também é verdadeira: a incerteza padrão pode ser um dos indicadores de desempenho. Sintetizando, nesta tese é mostrado de que forma a teoria da inteligência computacional adentra na teoria da metrologia e vice versa, nas esferas dos elementos aqui considerados. / The present study investigates metrological dispersions in fitting partially or totally unknown functions. An alternative method is the application of a multilayer perceptron neural network used here to fit functions. The fitting functions are calibration curves from calibration indications of measurement systems or instruments. These curves hold metrological properties and establish a link between elements of Metrological theory and elements of Computing Intelligence theory: the Multilayer Perceptrons. An external balance of aerodynamic forces and moments and an electronic tongue applied in the measurement of cation concentrations were the measurement systems used to apply the concepts of this alternative methodology. This thesis proposes improvements in the accuracy of fitting calibration curves considering the following factors: influence quantities, uncertainties about target values, tendency of hidden or not solved systematic errors and metrological performance functions. The measurement quality indicator or the laboratory metrological competence indicator is established by uncertainty values and the calibration curve is the starting point for the calculation of these values. The establishment of this curve is one of the difficulties in assessing uncertainties and the curve itself is an uncertainty source. Therefore, a careful and meticulous methodology is necessary in curve approximation, which explains the strategic importance of this work. Metrological dispersions have connotation of uncertainty in measurements and are the basis for calculating their numerical values, the performance functions can represent metrological dispersions and the opposite is also true: the standard uncertainty can be a performance function. Making a synthesis, this thesis demonstrates how computing intelligence theory takes into account the metrological theory and vice versa, in the elements of these theories that were discussed in the present study.
|
4 |
Redes neurais artificiais como ferramenta para prognose de crescimento e melhoramento genético florestal /Silva, William de Medeiros January 2019 (has links)
Orientador: Rinaldo Cesar de Paula / Resumo: RESUMO – O eucalipto é a cultura de maior destaque para o setor florestal brasileiro. No entanto, a expansão do setor para áreas com condições climáticas limitantes ao desenvolvimento da cultura e a instabilidade climática atual, são alguns dos fatores que têm comprometido o desenvolvimento desta cultura no país nos últimos anos. Assim, é importante a busca contínua por ferramentas que possibilitem a prognose de crescimento, a seleção de indivíduos e famílias e a análise do comportamento de genótipos de eucalipto frente às variações ambientais de forma cada vez mais acurada. Desta forma, o objetivo geral deste trabalho foi testar o desempenho das Redes Neurais Artificiais (RNA) na modelagem de crescimento de clones de eucalipto, na predição de valores genéticos de indivíduos e famílias, e na seleção quanto à produtividade, estabilidade e adaptabilidade de progênies de Eucalyptus sp. Para a prognose de crescimento foram utilizados dados de 18 clones comerciais de Eucalyptus em diferentes estados do Brasil, e para a estimação de valor genético e análise de produtividade, estabilidade e adaptabilidade foram utilizados dados de testes de progênies de Eucalyptus grandis. Neste trabalho foram testadas diferentes arquiteturas de RNA do tipo múltiplas camadas com o algoritmo de aprendizado de retropropagação do erro e função de ativação do tipo tangente hiperbólica. O modelo desenvolvido para prognose do diâmetro à altura do peito (DAP) de árvores individuais em um local foi capaz de... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: ABSTRACT – Eucalyptus is the most important crop of the most important for the Brazilian forest sector. However, the expansion of the sector to areas with climatic conditions limiting the development of the crop and current climate instability are some of the factors that have compromised the development of this culture in the country in recent years. Thus, it is important to continuously search for tools that allow the prognosis of growth, the selection of individuals and families and the analysis of the behavior of eucalyptus genotypes in the face of environmental changes in an increasingly accurate way. Thus, the general objective of this work was to test the performance of artificial neural networks (ANN) in the modeling of growth of eucalyptus clones, prediction of genetic values of individuals and families, and selection of productivity, stability and adaptability of progenies of Eucalyptus sp. For the prognosis of growth, data from 18 commercial Eucalyptus clones were used in different states of Brazil, and for genetic value estimation and productivity, stability and adaptability analysis data from Eucalyptus grandis progenies were used. In this work, different ANN architectures of the multilayer type were tested with the backpropagation error algorithm and hyperbolic tangent activation function. The model developed for prognosis of the diameter at breast height (DBH) individual trees in one place was able to maintain good accuracy when applied at other sites. The thre... (Complete abstract click electronic access below) / Doutor
|
5 |
Link Prediction Using Learnable Topology Augmentation / Länkprediktion med hjälp av en inlärningsbar topologiförstärkningLeatherman, Tori January 2023 (has links)
Link prediction is a crucial task in many downstream applications of graph machine learning. Graph Neural Networks (GNNs) are a prominent approach for transductive link prediction, where the aim is to predict missing links or connections only within the existing nodes of a given graph. However, many real-life applications require inductive link prediction for the newly-coming nodes with no connections to the original graph. Thus, recent approaches have adopted a Multilayer Perceptron (MLP) for inductive link prediction based solely on node features. In this work, we show that incorporating both connectivity structure and features for the new nodes provides better model expressiveness. To bring such expressiveness to inductive link prediction, we propose LEAP, an encoder that features LEArnable toPology augmentation of the original graph and enables message passing with the newly-coming nodes. To the best of our knowledge, this is the first attempt to provide structural contexts for the newly-coming nodes via learnable augmentation under inductive settings. Conducting extensive experiments on four real- world homogeneous graphs demonstrates that LEAP significantly surpasses the state-of-the-art methods in terms of AUC and average precision. The improvements over homogeneous graphs are up to 22% and 17%, respectively. The code and datasets are available on GitHub*. / Att förutsäga länkar är en viktig uppgift i många efterföljande tillämpningar av maskininlärning av grafer. Graph Neural Networks (GNNs) är en framträdande metod för transduktiv länkförutsägelse, där målet är att förutsäga saknade länkar eller förbindelser endast inom de befintliga noderna i en given graf. I många verkliga tillämpningar krävs dock induktiv länkförutsägelse för nytillkomna noder utan kopplingar till den ursprungliga grafen. Därför har man på senare tid antagit en Multilayer Perceptron (MLP) för induktiv länkförutsägelse som enbart bygger på nodens egenskaper. I det här arbetet visar vi att om man införlivar både anslutningsstruktur och egenskaper för de nya noderna får man en bättre modelluttryck. För att ge induktiv länkförutsägelse en sådan uttrycksfullhet föreslår vi LEAP, en kodare som innehåller LEArnable toPology augmentation av den ursprungliga grafen och möjliggör meddelandeöverföring med de nytillkomna noderna. Såvitt vi vet är detta det första försöket att tillhandahålla strukturella sammanhang för de nytillkomna noderna genom en inlärningsbar ökning i induktiva inställningar. Omfattande experiment på fyra homogena grafer i den verkliga världen visar att LEAP avsevärt överträffar "state-of-the-art" metoderna när det gäller AUC och genomsnittlig precision. Förbättringarna jämfört med homogena grafer är upp till 22% och 17%. Koden och datamängderna finns tillgängliga på Github*.
|
6 |
Modelagem de um processo fermentativo por rede Perceptron multicamadas com atraso de tempo / not availableManesco, Luis Fernando 09 August 1996 (has links)
A utilização de Redes Neurais Artificias para fins de identificação e controle de sistemas dinâmicos têm recebido atenção especial de muitos pesquisadores, principalmente no que se refere a sistemas não lineares. Neste trabalho é apresentado um estudo sobre a utilização de um tipo em particular de Rede Neural Artificial, uma Perceptron Multicamadas com Atraso de Tempo, na estimação de estados da etapa fermentativa do processo de Reichstein para produção de vitamina C. A aplicação de Redes Neurais Artificiais a este processo pode ser justificada pela existência de problemas associados à esta etapa, como variáveis de estado não mensuráveis e com incertezas de medida e não linearidade do processo fermentativo, além da dificuldade em se obter um modelo convencional que contemple todas as fases do processo. É estudado também a eficácia do algoritmo de Levenberg-Marquadt, na aceleração do treinamento da Rede Neural Artificial, além de uma comparação do desempenho de estimação de estados das Redes Neurais Artificiais estudadas com o filtro estendido de Kalman, baseado em um modelo não estruturado do processo fermentativo. A análise do desempenho das Redes Neurais Artificiais estudadas é avaliada em termos de uma figura de mérito baseada no erro médio quadrático sendo feitas considerações quanto ao tipo da função de ativação e o número de unidades da camada oculta. Os dados utilizados para treinamento e avaliação da Redes Neurais Artificiais foram obtidos de um conjunto de ensaios interpolados para o intervalo de amostragem desejado. / ldentification and Control of dynamic systems using Artificial Neural Networks has been widely investigated by many researchers in the last few years, with special attention to the application of these in nonlinear systems. ls this works, a study on the utilization of a particular type of Artificial Neural Networks, a Time Delay Multi Layer Perceptron, in the state estimation of the fermentative phase of the Reichstein process of the C vitamin production. The use of Artificial Neural Networks can be justified by the presence of problems, such as uncertain and unmeasurable state variables and process non-linearity, and by the fact that a conventional model that works on all phases of the fermentative processes is very difficult to obtain. The efficiency of the Levenberg Marquadt algorithm on the acceleration of the training process is also studied. Also, a comparison is performed between the studied Artificial Neural Networks and an extended Kalman filter based on a non-structured model for this fermentative process. The analysis of lhe Artificial Neural Networks is carried out using lhe mean square errors taking into consideration lhe activation function and the number of units presents in the hidden layer. A set of batch experimental runs, interpolated to the desired time interval, is used for training and validating the Artificial Neural Networks.
|
7 |
Detecção e diagnóstico de falhas em robôs manipuladores via redes neurais artificiais. / Fault detection and diagnosis in robotic manipulators via artificial neural networks.Tinós, Renato 11 February 1999 (has links)
Neste trabalho, um novo enfoque para detecção e diagnóstico de falhas (DDF) em robôs manipuladores é apresentado. Um robô com falhas pode causar sérios danos e pode colocar em risco o pessoal presente no ambiente de trabalho. Geralmente, os pesquisadores têm proposto esquemas de DDF baseados no modelo matemático do sistema. Contudo, erros de modelagem podem ocultar os efeitos das falhas e podem ser uma fonte de alarmes falsos. Aqui, duas redes neurais artificiais são utilizadas em um sistema de DDF para robôs manipuladores. Um perceptron multicamadas treinado por retropropagação do erro é usado para reproduzir o comportamento dinâmico do manipulador. As saídas do perceptron são comparadas com as variáveis medidas, gerando o vetor de resíduos. Em seguida, uma rede com função de base radial é usada para classificar os resíduos, gerando a isolação das falhas. Quatro algoritmos diferentes são empregados para treinar esta rede. O primeiro utiliza regularização para reduzir a flexibilidade do modelo. O segundo emprega regularização também, mas ao invés de um único termo de penalidade, cada unidade radial tem um regularização individual. O terceiro algoritmo emprega seleção de subconjuntos para selecionar as unidades radiais a partir dos padrões de treinamento. O quarto emprega o mapa auto-organizável de Kohonen para fixar os centros das unidades radiais próximos aos centros dos aglomerados de padrões. Simulações usando um manipulador com dois graus de liberdade e um Puma 560 são apresentadas, demostrando que o sistema consegue detectar e diagnosticar corretamente falhas que ocorrem em conjuntos de padrões não-treinados. / In this work, a new approach for fault detection and diagnosis in robotic manipulators is presented. A faulty robot could cause serious damages and put in risk the people involved. Usually, researchers have proposed fault detection and diagnosis schemes based on the mathematical model of the system. However, modeling errors could obscure the fault effects and could be a false alarm source. In this work, two artificial neural networks are employed in a fault detection and diagnosis system to robotic manipulators. A multilayer perceptron trained with backpropagation algorithm is employed to reproduce the robotic manipulator dynamical behavior. The perceptron outputs are compared with the real measurements, generating the residual vector. A radial basis function network is utilized to classify the residual vector, generating the fault isolation. Four different algorithms have been employed to train this network. The first utilizes regularization to reduce the flexibility of the model. The second employs regularization too, but instead of only one penalty term, each radial unit has a individual penalty term. The third employs subset selection to choose the radial units from the training patterns. The forth algorithm employs the Kohonens self-organizing map to fix the radial unit center near to the cluster centers. Simulations employing a two link manipulator and a Puma 560 manipulator are presented, demonstrating that the system can detect and isolate correctly faults that occur in nontrained pattern sets.
|
8 |
Detecção e diagnóstico de falhas em robôs manipuladores via redes neurais artificiais. / Fault detection and diagnosis in robotic manipulators via artificial neural networks.Renato Tinós 11 February 1999 (has links)
Neste trabalho, um novo enfoque para detecção e diagnóstico de falhas (DDF) em robôs manipuladores é apresentado. Um robô com falhas pode causar sérios danos e pode colocar em risco o pessoal presente no ambiente de trabalho. Geralmente, os pesquisadores têm proposto esquemas de DDF baseados no modelo matemático do sistema. Contudo, erros de modelagem podem ocultar os efeitos das falhas e podem ser uma fonte de alarmes falsos. Aqui, duas redes neurais artificiais são utilizadas em um sistema de DDF para robôs manipuladores. Um perceptron multicamadas treinado por retropropagação do erro é usado para reproduzir o comportamento dinâmico do manipulador. As saídas do perceptron são comparadas com as variáveis medidas, gerando o vetor de resíduos. Em seguida, uma rede com função de base radial é usada para classificar os resíduos, gerando a isolação das falhas. Quatro algoritmos diferentes são empregados para treinar esta rede. O primeiro utiliza regularização para reduzir a flexibilidade do modelo. O segundo emprega regularização também, mas ao invés de um único termo de penalidade, cada unidade radial tem um regularização individual. O terceiro algoritmo emprega seleção de subconjuntos para selecionar as unidades radiais a partir dos padrões de treinamento. O quarto emprega o mapa auto-organizável de Kohonen para fixar os centros das unidades radiais próximos aos centros dos aglomerados de padrões. Simulações usando um manipulador com dois graus de liberdade e um Puma 560 são apresentadas, demostrando que o sistema consegue detectar e diagnosticar corretamente falhas que ocorrem em conjuntos de padrões não-treinados. / In this work, a new approach for fault detection and diagnosis in robotic manipulators is presented. A faulty robot could cause serious damages and put in risk the people involved. Usually, researchers have proposed fault detection and diagnosis schemes based on the mathematical model of the system. However, modeling errors could obscure the fault effects and could be a false alarm source. In this work, two artificial neural networks are employed in a fault detection and diagnosis system to robotic manipulators. A multilayer perceptron trained with backpropagation algorithm is employed to reproduce the robotic manipulator dynamical behavior. The perceptron outputs are compared with the real measurements, generating the residual vector. A radial basis function network is utilized to classify the residual vector, generating the fault isolation. Four different algorithms have been employed to train this network. The first utilizes regularization to reduce the flexibility of the model. The second employs regularization too, but instead of only one penalty term, each radial unit has a individual penalty term. The third employs subset selection to choose the radial units from the training patterns. The forth algorithm employs the Kohonens self-organizing map to fix the radial unit center near to the cluster centers. Simulations employing a two link manipulator and a Puma 560 manipulator are presented, demonstrating that the system can detect and isolate correctly faults that occur in nontrained pattern sets.
|
9 |
Modelagem de um processo fermentativo por rede Perceptron multicamadas com atraso de tempo / not availableLuis Fernando Manesco 09 August 1996 (has links)
A utilização de Redes Neurais Artificias para fins de identificação e controle de sistemas dinâmicos têm recebido atenção especial de muitos pesquisadores, principalmente no que se refere a sistemas não lineares. Neste trabalho é apresentado um estudo sobre a utilização de um tipo em particular de Rede Neural Artificial, uma Perceptron Multicamadas com Atraso de Tempo, na estimação de estados da etapa fermentativa do processo de Reichstein para produção de vitamina C. A aplicação de Redes Neurais Artificiais a este processo pode ser justificada pela existência de problemas associados à esta etapa, como variáveis de estado não mensuráveis e com incertezas de medida e não linearidade do processo fermentativo, além da dificuldade em se obter um modelo convencional que contemple todas as fases do processo. É estudado também a eficácia do algoritmo de Levenberg-Marquadt, na aceleração do treinamento da Rede Neural Artificial, além de uma comparação do desempenho de estimação de estados das Redes Neurais Artificiais estudadas com o filtro estendido de Kalman, baseado em um modelo não estruturado do processo fermentativo. A análise do desempenho das Redes Neurais Artificiais estudadas é avaliada em termos de uma figura de mérito baseada no erro médio quadrático sendo feitas considerações quanto ao tipo da função de ativação e o número de unidades da camada oculta. Os dados utilizados para treinamento e avaliação da Redes Neurais Artificiais foram obtidos de um conjunto de ensaios interpolados para o intervalo de amostragem desejado. / ldentification and Control of dynamic systems using Artificial Neural Networks has been widely investigated by many researchers in the last few years, with special attention to the application of these in nonlinear systems. ls this works, a study on the utilization of a particular type of Artificial Neural Networks, a Time Delay Multi Layer Perceptron, in the state estimation of the fermentative phase of the Reichstein process of the C vitamin production. The use of Artificial Neural Networks can be justified by the presence of problems, such as uncertain and unmeasurable state variables and process non-linearity, and by the fact that a conventional model that works on all phases of the fermentative processes is very difficult to obtain. The efficiency of the Levenberg Marquadt algorithm on the acceleration of the training process is also studied. Also, a comparison is performed between the studied Artificial Neural Networks and an extended Kalman filter based on a non-structured model for this fermentative process. The analysis of lhe Artificial Neural Networks is carried out using lhe mean square errors taking into consideration lhe activation function and the number of units presents in the hidden layer. A set of batch experimental runs, interpolated to the desired time interval, is used for training and validating the Artificial Neural Networks.
|
10 |
Preprocesserings påverkan på prediktiva modeller : En experimentell analys av tidsserier från fjärrvärme / Impact of preprocessing on predictive models : An experimental analysis of time series from district heatingAndersson, Linda, Laurila, Alex, Lindström, Johannes January 2021 (has links)
Värme står för det största energibehovet inom hushåll och andra byggnader i samhället och olika tekniker används för att kunna reducera mängden energi som går åt för att spara på både miljö och pengar. Ett angreppssätt på detta problem är genom informatiken, där maskininlärning kan användas för att analysera och förutspå värmebehovet. I denna studie används maskininlärning för att prognostisera framtida energiförbrukning för fjärrvärme utifrån historisk fjärrvärmedata från ett fjärrvärmebolag tillsammans med exogena variabler i form av väderdata från Sveriges meteorologiska och hydrologiska institut. Studien är skriven på svenska och utforskar effekter av preprocessering hos prediktionsmodeller som använder tidsseriedata för att prognostisera framtida datapunkter. Stegen som utförs i studien är normalisering, interpolering, hantering av numeric outliers och missing values, datetime feature engineering, säsongsmässighet, feature selection, samt korsvalidering. Maskininlärningsmodellen som används i studien är Multilayer Perceptron som är en subkategori av artificiellt neuralt nätverk. Forskningsfrågan som besvaras fokuserar på effekter av preprocessering och feature selection för prediktiva modellers prestanda inom olika datamängder och kombinationer av preprocesseringsmetoder. Modellerna delades upp i tre olika datamängder utifrån datumintervall: 2009, 2007–2011, samt 2007–2017, där de olika kombinationerna utgörs av preprocesseringssteg som kombineras inom en iterativ process. Procentuella ökningar på R2-värden för dessa olika intervall har uppnått 47,45% för ett år, 9,97% för fem år och 32,44% för 11 år. I stora drag bekräftar och förstärker resultatet befintlig teori som menar på att preprocessering kan förbättra prediktionsmodeller. Ett antal mindre observationer kring enskilda preprocesseringsmetoders effekter har identifierats och diskuterats i studien, såsom DateTime Feature Engineerings negativa effekter på modeller som tränats med ett mindre antal iterationer. / Heat accounts for the greatest energy needs in households and other buildings in society. Effective production and distribution of heat energy require techniques for minimising economic and environmental costs. One approach to this problem is through informatics where machine learning is used to analyze and predict the heating needs with the help of historical data from a district heating company and exogenous variables in the form of weather data from Sweden's Meteorological and Hydrological Institute (SMHI). This study is written in Swedish and explores the importance of preprocessing practices before training and using prediction models which utilizes time-series data to predict future energy consumption. The preprocessing steps explored in this study consists of normalization, interpolation, identification and management of numerical outliers and missing values, datetime feature engineering, seasonality, feature selection and cross-validation. The machine learning model used in this study is Multilayer Perceptron which is a subcategory of artificial neural network. The research question focuses on the effects of preprocessing and feature selection for predictive model performance within different datasets and combinations of preprocessing methods. The models were divided into three different data sets based on date ranges: 2009, 2007–2011, and 2007–2017, where the different combinations consist of preprocessing steps that are combined within an iterative process. Percentage increases in R2 values for these different ranges have reached 47,45% for one year, 9,97% for five years and 32,44% for 11 years. The results broadly confirm and reinforce the existing theory that preprocessing can improve prediction models. A few minor observations about the effects of individual preprocessing methods have been identified and discussed in the study, such as DateTime Feature Engineering having a detrimental effect on models with very few training iterations.
|
Page generated in 0.068 seconds