Spelling suggestions: "subject:"redes neurais artificial"" "subject:"aedes neurais artificial""
281 |
Reconhecimento do Padrão Pluvial na cidade de Presidente Prudente - SP através de rede neural artificial / Reconhecimento do Padrão Pluvial na cidade de Presidente Prudente - SP através de rede neural artificial / Recognition of rainfall pattern in Presidente Prudente SP city by Artificial Neural Network / Recognition of rainfall pattern in Presidente Prudente SP city by Artificial Neural NetworkOikawa, Ronaldo Toshiaki 16 March 2015 (has links)
Made available in DSpace on 2016-07-18T17:46:20Z (GMT). No. of bitstreams: 1
Ronaldo Oikawa.pdf: 3711757 bytes, checksum: 5d13d9ef8b2d092d0bb1a6fe62a73248 (MD5)
Previous issue date: 2015-03-16 / The Artificial Neural Networks are nonlinear mathematical models that resemble the human brain, and this ability to learn was applied to recognize the rain patterns in the city of Presidente Prudente, located in the region of Pontal do Paranapanema. Through these calculations, it was possible to indicate another way to rain forecast. This study used two algorithms with supervised learning, the first one the Multiple Layer Network Propagation, with 23 neurons and with one, two and three hidden layers, and the second one the Support Vector Machine (SVM) with polynomial, radial basis function and hyper tangent cores. The set analyzed covers the period from January 1996 to May 2012, collected from Weather Forecast Center and Climate Studies (CPTEC). The results showed that the atmospheric pressure, wind direction, minimum temperature and air relative humidity were the parameters more related with the rain precipitation. The SVM model with base radial function core, using sigma=0.1, showed the best results with Kappa coefficient, equal to 0.675 for first test group, equal to 0.746 to the second test group 0.746 and equal to 0.826 for the third test group. These results demonstrate the data set robustness and allowed achieve high accuracy rate in recognition of rain precipitation. / As Redes Neurais Artificiais são modelos matemáticos não lineares que se assemelham ao cérebro humano, e esta capacidade de aprender foi aplicada no reconhecimento de padrões da chuva na cidade de Presidente Prudente, localizada na região do Pontal do Paranapanema. Através desses cálculos foi possível indicar uma forma alternativa de se reconhecer o padrão da precipitação da chuva. O presente trabalho utilizou dois algoritmos com aprendizagem supervisionada, sendo o primeiro a Rede de Múltipla Camada de Retro Propagação, com 23 neurônios e com uma, duas e três camadas ocultas, já o segundo, a Máquina de Vetor de Suporte (SVM) utilizou o núcleo polinomial, função de base radial e hiper tangente. O conjunto de dados analisados compreende o período de Janeiro de 1996 até Maio de 2012, sendo obtidos do Centro de Previsão de Tempo e Estudos Climáticos (CPTEC). Os resultados demonstraram que a pressão atmosférica, direção do vento, temperatura mínima e umidade relativa do ar são os parâmetros que estão mais relacionados à precipitação da chuva. O modelo SVM, com núcleo função de base radial, utilizando o parâmetro sigma=0,1 obteve os melhores resultados, apresentando o coeficiente Kappa (resposta), igual a 0,675 para o grupo de teste um, 0,746 para o grupo de teste dois e 0,826 para o grupo de teste três. Estes resultados demonstram a robustez do conjunto de dados e permitiram atingir altos índices de acerto no reconhecimento da precipitação da chuva.
|
282 |
Modelos probabilísticos e não probabilísticos de classificação binária para pacientes com ou sem demência como auxílio na prática clínica em geriatria.Galdino, Maicon Vinícius. January 2020 (has links)
Orientador: Liciana Vaz de Arruda Silveira / Resumo: Os objetivos deste trabalho foram apresentar modelos de classificação (Regressão Logística, Naive Bayes, Árvores de Classificação, Random Forest, k-Vizinhos mais próximos e Redes Neurais Artificiais) e a comparação destes utilizando processos de reamostragem em um conjunto de dados da área de geriatria (diagnóstico de demência). Analisar as pressuposições de cada metodologia, vantagens, desvantagens e cenários em que cada metodologia pode ser melhor utilizada. A justificativa e relevância desse projeto se baseiam na importância e na utilidade do tema proposto, visto que a população idosa aumenta em todo o mundo (nos países desenvolvidos e nos em desenvolvimento como o Brasil), os modelos de classificação podem ser úteis aos profissionais médicos, em especial aos médicos generalistas, no diagnóstico de demências, pois em diversos momentos o diagnóstico não é simples. / Doutor
|
283 |
[pt] APLICAÇÃO DE REDES NEURAIS ARTIFICIAIS NO DIAGNÓSTICO DE FALHAS DE TURBINAS A GÁS / [en] ARTIFICIAL NEURAL NETWORKS APPLIED TO GAS TURBINE FAULT DIAGNOSTICS26 November 2010 (has links)
[pt] A deterioração do desempenho da turbina a gás é resultado de vários tipos de falhas, como acúmulo de sujeira, erosão e corrosão, que afetam os componentes no caminho do gás, sendo os principais o compressor, o combustor e a turbina. No presente trabalho é avaliado o desempenho de Redes Neurais Artificiais (RNA) no emprego de diagnóstico de falha de turbinas a gás. Todas as redes projetadas são do tipo MLP (multi-layer perceptron) com algoritmo de retropropagação (backpropagation). Para cada função de diagnóstico, várias arquiteturas foram testadas, modificando parâmetros de rede como o número de camadas escondidas e o número de neurônios em cada uma destas camadas. As RNAs para diagnóstico de falhas foram aplicadas ao modelo termodinâmico de uma turbina a gás industrial. Este modelo foi responsável pela criação de dados da usina saudável e também degradada, utilizados para o treinamento e validação das redes. Com os resultados obtidos do treinamento das redes é possível mostrar que as mesmas são capazes de detectar, isolar e quantificar falhas de componentes de turbinas a gás de forma satisfatória. / [en] The gas turbine performance deterioration is a result of several types of faults such as fouling, erosion and corrosion, which affects the components throughout the gas path. As the most significant of these components we can enumerate the compressor, the combustion chamber and the turbine itself. In this work the performance of different types of Artificial Neural Networks (ANN) are evaluated in the diagnosis of this kind of fault. Every neural network designed in this work is MLP (multi-layer perceptron) with back propagation algorithm. For each diagnosis function several architectures were tested, varying network parameters as the numbers of hidden layers and the number of neurons in each layer. The ANNs for fault diagnosis were applied in an industrial gas turbine thermodynamic model. This model was also used for healthy and degraded turbine data generation, which were used for ANNs training and validation. With the ANNs training results we can conclude that these networks are capable of detecting, isolating and quantifying gas turbine components faults in a satisfactory way.
|
284 |
A Utilização de Redes Neurais Artificiais na Estimação da Cobertura do Sinal de Televisão Digital / The Use of Artificial Neural Networks in the Estimation of Coverage Digital TV SignalSILVA, Douglas Dias da 21 August 2009 (has links)
Made available in DSpace on 2014-07-29T15:08:23Z (GMT). No. of bitstreams: 1
Douglas.pdf: 4375187 bytes, checksum: d9accad35a506b54190dbd65888f2818 (MD5)
Previous issue date: 2009-08-21 / THIS works presents information about signal intensity obtained on field and
from simulations for one-seg and full-seg receptions, the city of Goi ania. The
values obtained from measurements were used for a comparisson among propagation
models that are presented in literature, and the goal is to determine the real
condition of digital TV signal in the region of Goi ania.
The propagation models presented are available in literature and can be implemented
in digital transmission system. The studied models were Free Space model,
Log-Distance model, Hata model and ITU-R P.1546-1 method, and the objective
was to determine the signal intensity of digital television transmission in the city
of Goi ania (RAPPAPORT, 1996) (UNION, 2003). Focusing on the development of a
tool for signal intensity estimation, some researches were done about neural networks
theory and its applications. Perceptron and Multilayer Perceptron were the
analised architectures, emphasyzing on the last one and on its supervisioned trainning
through the backpropagation error algorithm (HAYKIN, 2001). The Brazilian
Digital Television System was described by reference rules made by Associa¸c ao
Brasileira de Normas T´ecnicas, which has detailed its transmission system and
reception devices (T´ECNICAS, 2008a) (T´ECNICAS, 2008h).
Measurements of signal intensity for one-seg and full-seg reception methods
were made on field in the region of Goi ania. These measurements followed the
sugestions presented by Report ITU-R BT. 2035-1 and it used a radiofrequency
analyzer and a Global Positioning System (GPS). With the obtained data, the
digital signal covering situation in the city of Goi ania was mapped, which revealed
a lower intensity level to the studied models. A tool for signal intensity estimation
was developed using Artificial Neural Networks, which was trained with the dada
obtained from the performed measurements. This tool was used to obtain the
signal intensity for several proposed scenarios. The signal intensity estimation for
the scenario that has tree density and target absence distinguished as the one that
was closest to the reality of Goi ania, which is a consequence of high density of
trees. / NESTE trabalho, são apresentadas informações sobre a intensidade de sinal obtidas em campo e em simulações para as recepções one-seg e full-seg na grande Goiânia. Os valores obtidos pelas medições foram utilizados para uma comparação entre os modelos de propagação presentes na literatura, com o objetivo de determinar a real condição do sinal de TV digital na região da grande Goiânia.
Foram apresentados os modelos de propagação encontrados na literatura e válidos para aplicação no sistema de transmissão digital. Os modelos estudados foram
o modelo Espaço Livre, modelo Log-distância, o modelo Hata e o método ITU-RP.1546-1 com o objetivo de determinar a intensidade de sinal para a transmissão de televisão digital na cidade de Goiânia (RAPPAPORT, 1996) (UNION, 2003).
Objetivando o desenvolvimento de uma ferramenta de estimação da intensidade de sinal, realizou-se estudos referentes à teoria de redes neurais e suas aplicações.
Foram estudadas as arquiteturas Perceptron e Perceptron de Múltiplas Camadas, com ênfase na última arquitetura e no seu treinamento supervisionado através do algoritmo de retropropagação do erro (HAYKIN, 2001). O Sistema Brasileiro de Televisão Digital foi descrito através das normas de referências elaboradas pela Associação Brasileira de Normas Técnicas, detalhando seu sistema de transmissão e dispositivos de recepção (TÉCNICAS, 2008a) (TÉCNICAS, 2008h).
Medições em campos da intensidade de sinal para os modos de recepção one-seg e full-seg foram realizadas na região da grande Goiânia. Essas medições seguiram as sugestões apresentadas pelo Relatório ITU-R BT.2035-1 e utilizou um analisador de radiofrequência e um sistema de posicionamento global (do inglês: Global Positioning System -GPS). Com os dados obtidos nas medições, mapeou-se a situação da cobertura do sinal digital na cidade de Goiânia, que revelou um nível de intensidade inferior aos modelos estudados. Foi desenvolvida uma ferramenta para a estimação da intensidade do sinal utilizando uma Rede Neural Artificial (RNA),
sendo treinada com os dados obtidos das medições. A ferramenta foi utilizada para a obtenção da intensidade de sinal para diversos cenários propostos. A estimativa
da intensidade de sinal para o cenário com concentração de árvores e ausência de visada direta mostrou-se mais próximo da realidade encontrada na cidade de Goiânia, consequência da grande concentração de árvores existente.
|
285 |
Detecção e classificação de falhas estruturais de um sistema mecânico por meio de uma rede neural artificial /Chaim, Lucas Perroni. January 2019 (has links)
Orientador: Fábio Roberto Chavarette / Resumo: Redes Neurais Artificiais (RNAs) são algoritmos de aprendizado, geralmente estruturados em torno de categorização de dados de entrada e/ou seu agrupamento por similaridade. Tendo em vista características desejáveis como aprendizado rápido e estabilidade frente a vetores de entrada altamente mutáveis, adotou-se uma RNA do tipo Fuzzy ARTMAP como mecanismo central de um método de monitoramento de saúde estrutural para detectar e categorizar falhas em dados experimentais provenientes de um sistema mecânico similar a um pequeno prédio de dois andares. Mais especificamente, com o objetivo de detectar alterações das frequências naturais da estrutura, fenômeno ligado à deterioração da mesma, e determinar qual(is) andar(es) está(ão) ligado(s) ao comportamento anômalo, se detectado. A acurácia da rede foi avaliada, sendo realizado um estudo da quantidade de dados necessárias para o desempenho satisfatório da rede. Observou-se desempenho satisfatório, a acurácia do método tendendo a aproximadamente 94% a partir de certas quantidades de dados. / Abstract: Artificial Neural Networks (ANNs) are learning algorithms, largely revolving around categorizing data sets based on measures of similarity between its members. Due to desirable characteristics such as fast learning and stability when dealing with highly mutable input vectors, a Fuzzy ARTMAP ANN was selected as the core mechanism of a structural health monitoring method. Its goal was to detect and categorize faults in experimental data collected from a mechanical system akin to a small two-story building. More specifically, to detect disturbances on the structure's natural frequencies, phenomenon linked to its deterioration, and to determine which story or stories are linked to anomalous behavior, if any. The accuracy of the method was evaluated, and the amount of data needed for optimal operation was determined. Satisfactory performance was observed; the method's accuracy tended towards 94% with enough training samples. / Mestre
|
286 |
[en] GENETIC-NEURAL MODEL FOR PORTFOLIO OPTIMIZATION WITH FINANCIAL OPTIONS IN THE BRAZILIAN MARKET / [pt] MODELO GENÉTICO-NEURAL PARA OTIMIZAÇÃO DE CARTEIRAS COM OPÇÕES FINANCEIRAS NO MERCADO BRASILEIROMICHEL CARDONSKY CASPARY 18 July 2012 (has links)
[pt] A presente dissertação tem por objetivo desenvolver um modelo inteligente
que permita, por uma análise quantitativa e probabilística, gerar uma carteira
otimizada composta de um ativo financeiro e opções sobre este ativo. Procurou-se
estudar inicialmente as características da distribuição de retornos e da volatilidade
das ações mais líquidas da Bolsa de Valores de São Paulo, no período de Jan/2005
a Jul/2010, através de regressões polinomiais univariadas e bivariadas. Observouse
características como a de reversão a média da volatilidade, correlação da
volatilidade futura com um período histórico mais longo e outro mais curto e uma
relação possivelmente quadrática entre a volatilidade histórica e a volatilidade
futura. Desenvolveu-se então, satisfatoriamente, uma rede neural para prever a
volatilidade futura das ações, por este ser o fator mais crítico para se determinar o
preço de uma opção. Utilizando-se da precificação das opções, avaliou-se o
desempenho de algoritmos genéticos na otimização de carteiras estruturadas com
esses derivativos, com três funções de avaliação diferentes, a fim de aumentar o
potencial retorno de um investimento, minimizando seus riscos. O sistema
evolucionário implementado demonstrou ser satisfatório quando comparado a
carteira otimizada com diversas outras estratégias comuns de mercado,
demonstrando ser uma alternativa de apoio a decisão para investidores e gestores
de carteiras. / [en] This dissertation develops an intelligent, quantitative and probabilistic
model to determine an optimal composition of a portfolio consisting of a financial
asset and options over this asset. Initially we studied the characteristics of the
historical distribution of returns and volatility of the most liquid stocks from the
BOVESPA Stock Exchange, from January 2005 to July 2010, through a
univariate and a bivariate polynomial regression. Characteristics such as mean
reversion of volatility, strong correlation of historical and future volatility and a
quadratic polynomial relationship between them were observed. A neural network
was then developed to predict the future volatility of these stocks, since that is the
most critical variable in determining an option´s price. Using the option pricing,
we evaluated the performance of genetic algorithms in optimizing portfolios,
structured with these derivatives, with three different evaluation functions in order
to increase the potential return of investments while minimizing downside risks.
The developed evolutionary system showed satisfactory results when the optimal
portfolio was compared with several other market option strategies, demonstrating
to be a relevant decision support system for investors and portfolio managers.
|
287 |
Economic evaluation, strategy and prediction studies of results into beef cattle production using different scenarios /Romanzini, Eliéder Prates. January 2019 (has links)
Orientador: Euclides Braga Malheiros / Resumo: A pecuária de corte brasileira tem sido pressionada no sentido de cada vez obter melhores resultados, o que força os proprietários a utilizar práticas e manejos específicos, os quais possibilitarão a manutenção dentro da atividade. Este estudo teve como objetivos avaliar o uso de inteligência artificial, mais especificamente redes neurais artificiais (RNA), para predizer resultados futuros tanto da produção de pasto quanto animal. Determinar dentre diversos cenários de recria e terminação de bovinos de corte em pastagens tropicais, qual foi o melhor cenário no que diz respeito aos resultados econômicos. Avaliar dentre diferentes doses de adubação nitrogenada, qual foi aquela que retornou melhores índices econômicos. As RNA se mostraram melhores que as regressões normalmente utilizadas para predizer as produções de pastagem (valores médios obtidos pelo uso das RNA foram 0,84; 0,78 e 0,75 para massa de forragem, porcentagens de folha e colmo, versus 0,74; 0,39 e 0,50 obtidos usando regressão linear múltipla) e animal (0,72 [RNA] e 0,67 regressão). No estudo referente aos cenários, os melhores resultados foram obtidos quando utilizado apenas sal mineral (lucratividade de 26,3%; período de “payback” simples igual à 11 ciclos e taxa interna de retorno de 9,30%) na recria dos bovinos de corte e na terminação, quando as variáveis climáticas possibilitaram via manejo de pastagem o uso de maior taxa de lotação (3,18 UA ha-1) na área. Quando avaliados os efeitos das doses de adubação n... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: Brazilian beef cattle has been under pression to obtain better results, which drives owners to use specific practices and management, which will allow the maintenance within livestock. This study aimed to evaluate use of artificial intelligence, specifically artificial neural networks (ANN), to predict future results both forage and animal productions. Determine between a lot of rearing and finishing phase scenarios of beef cattle production using tropical pastures, how was the best scenario considering economic results. Evaluate between different nitrogen fertilizers levels, how was there obtained best economic indexes. The ANN was better than regressions normally used to predict forage production (mean values obtained by ANN use were 0.84, 0.78 and 0.75 for forage mass, leaf and stem percentages, versus 0.74, 0.39 and 0.50 obtained using multiple linear regression) and animal (0.72 [ANN] and 0.67 regression). Into study about scenarios, the best results were obtained when used mineral mix just (profitability of 26.3%, simple payback period equal to 11 cycles and internal return ratio of 9.30%) during rearing phase of beef cattle. During finishing phase, the best results occurred when weather variables allowed by pasture handled, the use of higher stocking rate (3.18 AU ha-1) into area. The evaluation of economic results caused by different nitrogen fertilizer levels. Allowed to say that was possible to observe that there was linear increase both on costs, and gross revenue,... (Complete abstract click electronic access below) / Doutor
|
288 |
Aplicação de redes neurais artificiais paraconsistentes como método de auxílio no diagnóstico da doença de Alzheimer / Application of artificial neural networks paraconsistents as a method of aid in the diagnosis of Alzheimer diseaseLopes, Helder Frederico da Silva 02 July 2009 (has links)
A análise visual do eletroencefalograma (EEG) tem se mostrado útil na ajuda diagnóstica da doença de Alzheimer (DA), sendo indicado em alguns protocolos clínicos quando o diagnóstico permanece em aberto após a avaliação inicial. Porém, tal análise está sujeita naturalmente à imprecisão inerente de equipamentos, movimentos do paciente, registros elétricos e variação da interpretação da análise visual do médico. A teoria das Redes Neurais Artificiais (RNA) tem-se mostrado muito apropriado para tratar problemas como predição e reconhecimento de padrões de sinais em outras áreas do conhecimento. Neste trabalho utilizou-se uma nova classe de RNA, a Rede Neural Artificial Paraconsistente (RNAP), caracterizada pela manipulação de informações incertas, inconsistentes e paracompletas, destinada a reconhecer padrões predeterminados de EEG e de avaliar sua aplicabilidade como método auxiliar para o diagnóstico da DA. Trinta e três pacientes com DA provável e trinta e quatro pacientes controles foram submetidos ao registro de exames de EEG durante a vigília em repouso. Considerou-se como padrão normal de um paciente, a atividade de base entre 8,0 Hz e 12,0 Hz (com uma frequência média de 10 Hz), permitindo uma variação de 0.5 Hz. A RNAP foi capaz de reconhecer ondas de diferentes bandas de frequência (teta, delta, alfa e beta) aplicadas ao uso clínico do EEG, levando a uma concordância com o diagnóstico clínico de 82% de sensibilidade e 61% de especificidade. Com estes resultados, acredita-se que a RNAP possa vir a ser uma ferramenta promissora para manipular análise de EEG, tendo em mente as seguintes considerações: o interesse crescente de especialistas em análise visual de EEG e a capacidade da RNAP tratar diretamente dados imprecisos, inconsistentes e paracompletos, fornecendo uma interessante análise quantitativa e qualitativa / The visual analysis of EEG has shown useful in helping the diagnosis of Alzheimer disease (AD) when the diagnosis remains uncertain, being used in some clinical protocols. However, such analysis is subject to the inherent equipment imprecision, patient movement, electrical records, and physician interpretation of the visual analysis variation. The Artificial Neural Network (ANN) could be a helpful tool, appropriate to address problems such as prediction and pattern recognition. In this work, it has use a new class of ANN, the Paraconsistent Artificial Neural Network (PANN), which is capable of handling uncertain, inconsistent, and paracomplet information, for recognizing predetermined patterns of EEG and to assess its value as a possible auxiliary method for AD diagnosis. Thirty three patients with Alzheimer\'s disease and thirty four controls patients of EEG records were obtained during relaxed wakefulness. It was considered as normal patient pattern, the background EEG activity between 8.0 Hz and 12.0 Hz (with an average frequency of 10 Hz), allowing a range of 0.5 Hz. The PANN was able to recognize waves that belonging to their respective bands of clinical use (theta, delta, alpha, and beta), leading to an agreement with the clinical diagnosis at 82% of sensitivity and at 61% of specificity. Supported with these results, the PANN could be a promising tool to manipulate EEG analysis, bearing in mind the following considerations: the growing interest of specialists in EEG analysis visual and the ability of the PANN to deal directly imprecise, inconsistent and paracomplet data, providing an interesting quantitative and qualitative analysis
|
289 |
Quantificação óptica de carboidratos e etanol em mosto cervejeiro / Optical quantification of carbohidrates ; ethanol in beer wortEstracanholli, Éverton Sérgio 08 October 2012 (has links)
Neste estudo realizamos uma prova de conceito através da combinação de três técnicas com a finalidade de monitorar a mosturação e fermentação da cerveja durante o processo de fabricação. O princípio deste trabalho é baseado em uma análise espectral, utilizando um equipamento de absorção na região do infravermelho médio por transformada de Fourier (FTIR - Fourier Transform Infrared) de amostras coletadas durante a fabricação da cerveja. Combinado com técnicas de processamento de Análise de Componentes Principais e Redes Neurais Artificiais é possível quantificar a concentração dos principais carboidratos e etanol presentes nestas amostras. Estas medidas físicas e químicas irão permitir a redução de erros durante a produção de cerveja além de optimizar as reações enzimáticas intrínsecas de suas principais etapas de análise. As técnicas ópticas de absorção, juntamente com o processamento neural, apresentam grandes vantagens, principalmente devido ao fato de serem facilmente adaptáveis aos equipamentos industriais, fornecendo respostas em curtos intervalos de tempo com alta sensibilidade e especificidade. / This study is fundamentally a proof of concept. By the combination of three techniques, our aim is to develop a new method of monitoring beer wort production and fermentation during brewing. The principle is based on spectral analyses, using Fourier Transform Infrared (FTIR) spectroscopy to collect absorption data from beer wort samples. This data is refined by the application of a statistical method, Principal Component Analysis (PCA), to reduce the number of variables. A computational method, Artificial Neural Network (ANN), enables quantification of carbohydrates and ethanol concentrations. Such physical-chemical measurements are expected to allow both reduction of mistakes during beer processing and optimization of enzymatic reactions, enhancing brewing processes. Optical absorption techniques associated with Artificial Neural Network present great advantages, mainly because the first ones are more easily inserted in industries than the latter ones, since they enable assessing the process status at short intervals, with high sensibility ; specificity.
|
290 |
Generalização e Robustez: Aprendizagem em Redes Neurais na Presença de Ruído / Generalization and robustness: learning in neural networks in the presence of noiseSimonetti, Roberta 09 May 1997 (has links)
Neste trabalho investigamos o aprendizado supervisionado on-line, com ênfase nas habilidades de generalização, de redes neurais feedforward. O estudo de algoritmos de aprendizagem ótimos, no sentido da generalização, é estendido para duas diferentes classes de arquiteturas: a máquina paridade com estrutura de árvore e K unidades escondidas, e o perceptron reversed wedge, uma máquina de uma camada com função de transferência não monotônica. O papel do ruído é de fundamental importância na teoria de aprendizagem. Neste trabalho estudamos os processos com ruído que podem ser parametrizados por uma única quantidade, o nível de ruído. No caso da máquina paridade analisamos o aprendizado na presença de ruído multiplicativo (na saída). O algoritmo ótimo é muito superior aos algoritmos de aprendizagem até então apresentados, como o algoritmo de mínima ação (LAA), como podemos ver, por exemplo, através do comportamento do erro de generalização que decai após a apresentação de p exemplos, com l/p ao invés de l/\'p POT. 1/3\' como no caso do LAA. Além deste fato, observa-se que não existe um nível de ruído crítico a partir do qual a rede não é capaz de generalizar, como ocorre no LAA. Além do ruído multiplicativo, no caso do perceptron reversed wedge consideramos também o ruído aditivo. Analisamos a função de modulação fornecida pelo algoritmo ótimo e as curvas de aprendizagem. A aprendizagem ótima requer o uso de parâmetros que usualmente não estão disponíveis. Neste caso estudamos a influência da utilização de uma estimativa do nível de ruído sobre as curvas de aprendizado. Estes resultados são apresentados na forma do que chamamos de diagrama de robustez, no espaço de nível de ruído real versus nível de ruído estimado. As linhas de transição deste diagrama definem regiões com comportamentos dinâmicos diferentes. Entre as propriedades mais interessantes encontradas, destacamos a universalidade do diagrama de robustez para ruído multiplicativo, uma vez que é exatamente o mesmo para a máquina paridade e comitê com estrutura de árvore, e para o perceptron reversed-wedge. Entretanto, esta universalidade não se estende para o caso de ruído aditivo, uma vez que, neste caso, os diagramas dependem da arquitetura em questão. / In this work online supervised learning is investigated with emphasis on the generalization abilities of feedforward neural networks. The study of optimal learning algorithms, in the sense of generalization, is extended to two different classes of architectures; the tree parity machine (PM) with K hidden units and the reverse wedge perceptron (RWP), a single layer machine with a non monotonic transfer function. The role of noise is of fundamental importance in learning theory, and we study noise processes which can be parametrized by a single quantity, the noise level. For the PM we analize learning in the presence of multiplicative or output noise. The optimal algorithm is far superior than previous learning algorithms, such as the Least Action Algorithm (LAA), since for example, the generalization error\'s decay is proportional to l /p instead of l/\'p POT. 1/3\' for the LAA, after p examples have been used for training. Furthermore there is no critical noise level, beyond which no generalization ability is attainable, as is the case for the LAA. For the RW perceptron in addition to multiplicative noise we also consider additive noise. The optimal algorithm modulation function and the learning curves are analized. Optimal learning requires using certain usually unavailable parameters. In this case, we study the influence that misevaluation of the noise levels has on the learning curves. The results are presented in terms of what we have called Robustness Phase Diagrams (RPD), in a space of real noise level against assumed noise level. The RPD boundary lines separate between different dynamical behaviours. Among the most interesting properties, we have found the universality of the RPD for multiplicative noise, since it is exactly the same for the PM, RWP and the tree committee machine. However this universality does not hold for the additive noise case, since RPD\'s are shown to be architecture dependent.
|
Page generated in 0.101 seconds