351 |
Méthodologie de détection et d'identification des défauts multiples dans les systèmes complexes à partir d'évènements discrets et de réseaux de neurones : applications aux aérogénérateurs / Detection methodology and identify multiple faults in complex systems from discrete events and neural networks : applications for wind turbinesToma, Samuel 08 September 2014 (has links)
L'étude présentée dans ce mémoire concerne le diagnostic des machines électriques à l'aide d'une association innovante entre la modélisation à évènements discrets, la Simulation Comparative et Concurrente (SCC) et les Réseaux de Neurones Artificiels (RNAs). Le diagnostic des machines électriques est effectué à partir d'une analyse temporelle des signaux statoriques et rotoriques à l'aide de réseaux de neurones de type Feed-Forward. Afin de comparer les différentes configurations de ces réseaux de neurones, l'approche proposée dans ce document utilise la simulation comparative et concurrente implémentée grâce au formalisme à évènements discrets DEVS (Discrete EVent system Specification). L'intégration des algorithmes de la SCC et des RNAs au sein du formalisme DEVS a été effectuée de manière générique et indépendamment du simulateur en développent des extensions et une librairie de modèles dans l'environnement de modélisation et de simulation à évènements discrets DEVSimPy. L'application de cette nouvelle solution pour le diagnostic des machines électriques permet de détecter les défauts à partir d'une architecture logiciel facilement portable sur des systèmes embarqués de type FPGA. / This thesis deals with the time-domain analysis of the electrical machines fault diagnosis due to early short-circuits detection in both stator and rotor windings. It also introduces to the Discrete EVent system Specification (DEVS) a generic solution to enable concurrent and comparative simulations (CCS). The DEVS-based CCS is an extension introduced using an aspect-oriented programming (AOP) to interact with the classic DEVS simulator. A new DEVS-based artificial neural network (ANN) is also introduced with a separation between learning and calculation models. The DEVS-based CCS is validated on the proposed ANN DEVS library inside the DEVSimPy environment. The concurrent ANN contributes in the time-domains analysis for the electrical machine fault diagnosis. This new method is based on data coming directly from the sensors without any computation but with a new dedicated preprocessing technique. Later, some enhancements are brought to the artificial neural network based on a new multistage architecture reducing the training time and errors compared to the single ANN. The new architecture and techniques has been validated on real data sixteen non-destructive windings faults analysis and localization.
|
352 |
Modelo computacional de um rebanho bovino de corte virtual utilizando simulação Monte Carlo e redes neurais artificiais / Computational model of virtual beef cattle heard applying Monte Carlo simulation and artificial neural networksMeirelles, Flávia Devechio Providelo 04 February 2005 (has links)
Neste trabalho, foram utilizadas duas ferramentas computacionais para fins de auxiliar tomadas de decisões na produção de bovinos de corte, criados de maneira extensivas, em condições de manejo encontrados no Brasil. A primeira parte do trabalho visou à construção de um software utilizando a técnica de Simulação Monte Carlo para analisar características de produção (ganho de peso) e manejo (fertilidade, anestro pós-parto, taxa de natalidade e puberdade). Na segunda parte do trabalho foi aplicada a técnica de Redes Neurais Artificiais para classificar animais, segundo ganho de peso nas fases de crescimento (nascimento ao desmame, do desmame ao sobreano) relacionado com o valor genético do ganho de peso do desmame ao sobreano (GP345) obtidos pelo BLUP. Ambos modelos mostraram potencial para auxiliar a produção de gado de corte / Herein we applied two different computational techniques with the specific objective to help the decision-making at Brazilian extensive beef cattle production systems. The first part of the work was dedicated to the construction of software based on Monte Carlo Simulation. Two different models were designed for further fusion and willing the analysis of productions (weight gain) and reproduction traits (fertility, post partum anestrus, born rate and puberty). The second part of the work applied Artificial Neural Network techniques to classify animals related to the weight gain during growing period (Weight at Calving, Weaning Weight, Weight at 550 days) comparing data with genetic value of the daily gain from weaning to 550 days adjusted to 345 days BLUP output. The results obtained in both models showed potential to help beef cattle production
|
353 |
Predição de séries temporais econômicas por meio de redes neurais artificiais e transformada Wavelet: combinando modelo técnico e fundamentalista / Technique of economic time series prediction by artificial neural network and wavelet transform: joining technical and fundamental modelSoares, Anderson da Silva 07 March 2008 (has links)
Este trabalho apresenta um método de predição não linear de séries temporais econômicas. O método baseia-se na análise técnica e fundamentalista de cotação de ações, filtragem wavelet, seleção de padrões e redes neurais artificiais. No modelo técnico emprega-se a transformada wavelet para filtrar a série temporal econômica de comportamentos aleatórios ou não econômicos. Após a filtragem dos dados o algoritmo de projeções sucessivas é utilizado para a seleção de padrões de treinamento para a rede neural artificial, com o objetivo de selecionar os padrões de comportamento mais importantes na série. No modelo fundamentalista utiliza-se variáveis econômicas que podem estar correlacionadas com a série, com o objetivo de aprimorar a predição da série na rede neural artificial. Para avaliação do método são utilizados dados de séries temporais econômicas referentes à cotação de preços de ações negociadas na bolsa de valores de São Paulo, onde os resultados da predição do comportamento futuro são comparados com modelos matemáticos clássicos e com o modelo convencional, que se baseia somente na análise técnica. Apresenta-se uma comparação dos resultados entre modelos técnicos, modelos matemáticos e o método proposto. O modelo matemático utilizado (ARIMA) apresentou seu melhor desempenho em séries com pouca variância, porém com desempenho inferior quando comparado com o modelo técnico e com o método proposto. A avaliação do erro de predição em termos de RMSEP evidenciou que o método proposto apresenta os melhores resultados em relação aos demais métodos. / This work presents a method for predicting nonlinear economic time series. The method is based on fundamental and technical analysis of script quotation, a multiscale wavelet filtering, pattern selection and artificial neural networks. In the technical model is used the wavelet transform in order to filter the economic time series from random or not economic behaviors. After the data filtering, the successive projections algorithm was used for the training pattern selection to the artificial neural network. In the fundamentalist model is used financial and macroeconomics variables that is correlated with the time serie in order to improve the network forecasting. For the evaluation of the proposed method are used temporal series data related to scrips prices quotation of São Paulo stock market. It presents a comparison of the results between technical model, mathematical model and proposed method. The mathematical model (ARIMA) presented better results in series with few variance, however have low performance when compared with the technical model and with the proposed method. The prediction error evaluation shows that the proposed method has better results than the other methods.
|
354 |
Extração de regras de redes neurais artificiais aplicadas ao problema da determinação da estrutura secundária de proteínas / Rule extraction from artificial neural networks applied to the problem of protein secondary structure predictionBattistella, Eduardo 09 March 2004 (has links)
Made available in DSpace on 2015-03-05T13:53:43Z (GMT). No. of bitstreams: 0
Previous issue date: 9 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Extração de Regras de Redes Neurais Artificiais Aplicadas ao Problema da Previsão da Estrutura Secundária de Proteínas apresenta o estudo feito sobre a extração de conhecimento de Redes Neurais na forma de regras difusas. Na aplicação desta técnica, foi utilizado o problema da classificação da estrutura secundária de proteínas, em alfa, beta e coil, a partir da estrutura primária.
Serão apresentadas as implementações feitas para viabilizar esta tarefa. Dentre elas: a implementação de recursos adicionais ao software de extração de regras; a definição de uma metodologia de extração de regras; a implementação desta metodologia; e a análise das regras extraídas.
Dentre os recursos implementados no processo de extração, sra visto que o foco principal foi o de embasar o conhecimento extraído sobre um suporte estático e disponibilizar medidas complementares para sua avaliação.
Na definição da metodologia, será visto que cuidados devem ser tomados na preparação da base de dados e na definição da estrutura da rede / This work presents a study about knowledge extraction from Neural Networks in the form of fuzzy rules. In the application of this technique, it was investigated the problem of classification of the protein secondary structure (alpha, beta and coil) from its primary structure.
The implementations that make possible this task will be presented. Amongst them: the implementation of new features in the rule extraction software; the definition of a methodology for the rule extraction process; the implementation of this methodology; and the analysis of the rules.
Amongst the implemented features in the rules extraction process, it will be noticed that the main point was to provide a statistical support for the knowledge extracted and to make available additional resources to measure this information.
In the definition of this methodology, it will be seen that some considerations must be observed in the database preparation and in definition of the network structure. Observations that had been followed and pr
|
355 |
MAPEAMENTO PREDITIVO DE SOLOS DO FAXINAL TAQUARI DOS RIBEIROS: ABORDAGEM PEDOLÓGICA E ETNOPEDOLÓGICAGomes, Ingrid Aparecida 15 April 2011 (has links)
Made available in DSpace on 2017-07-21T18:13:49Z (GMT). No. of bitstreams: 1
Ingrid Ap Gomes.pdf: 3731245 bytes, checksum: 1b9fff5805889f3ab2c04b40f9f9a4ea (MD5)
Previous issue date: 2011-04-15 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The faxinais are a traditional form of peasant organization characteristic of South-Central region of Parana, where the occupation of the territory is determined by the social community use of land, although land ownership is private. The present faxinalenses techniques in their use and management of soils, developed from the local empirical knowledge. The objective of this research was to perform the mapping of soils of the Faxinal Taquari dos Ribeiros, located in Rio Azul - PR, based on knowledge of the local community and scientific knowledge. Information from the Remote Sensing and Geographic Information Systems were used for the characterization of the study area and location of soils. The perception and the way the producers faxinalenses classified and used the land was obtained through structured interviews (informal talks) and field observations. The mapping of predictive etnosolos was performed using the technique of classification of Artificial Neural Networks (ANN). For the formal pedological mapping techniques were used classic photo interpretation, supplemented by surveys of the soil toposequence, further observations and correlations of the field. The scientific characterization of the soils was performed by means of morphological, physical and chemical profiles, and classification, according to the Brazilian System of Soil Classification (SiBCS). The results showed that the local community recognizes different types of soils in the study area, in accordance with the following attributes: color, texture, water infiltration rates, presence of rocks or minerals, depth, power demand in operations with mechanical traction or animal. We automatically send defined eight classes of land according to local knowledge: 1) Terra Branca Batumadeira, 2) Terra Branca Solta, 3) Terra Preta Batumadeira (pesada), 4) Terra Preta Solta, 5) Terra Vermelha do Faxinal (farmer) , 6) Terra Vermelha, 7) Terra de Cascalho, and, 8) Terra Roxa. According to SiBCS were found the following soil classes: CAMBISSOLOS, LATOSSOLOS and NEOSSOLOS. The soils that dominate the region are the CAMBISSOLOS and NEOSSOLOS, all of low fertility and highly susceptible to erosion. The technique of RNA was able to individualize etnosolos through the integration of input image and SPOT5 and MDT (Digital Terrain Model). The technique of RNA was able to separate the etnosolos through the integration of input variables from different sources and, when compared to traditional soil survey allowed to characterize the landscape in more detail and define the mapping units of soils. / Os faxinais são uma forma de organização camponesa tradicional característica da região Centro-Sul do Paraná, onde a ocupação do território social é determinada pelo uso comunitário das terras, apesar da propriedade da terra ser privada. Os faxinalenses apresentam técnicas próprias de uso e manejo dos solos, desenvolvidas a partir do conhecimento empírico local. O objetivo desta pesquisa foi realizar o mapeamento dos solos do Faxinal Taquari dos Ribeiros, localizado no município de Rio Azul, estado do Paraná, com base no conhecimento da comunidade local e conhecimento científico. Informações advindas do Sensoriamento Remoto e Sistemas de Informação Geográfica serviram de base para a caracterização da área de estudo e localização dos solos. A percepção e a maneira como os produtores faxinalenses classificavam e utilizavam os solos foram obtidas por meio de entrevistas semiestruturadas (conversas informais) e observações em campo. O mapeamento preditivo dos etnosolos foi realizado por meio da técnica de classificação de Redes Neurais Artificiais (RNAs). Para o mapeamento pedológico formal foram utilizadas técnicas clássicas de fotointerpretação, complementadas por prospecções do solo em topossequência, observações complementares e correlações de campo. A caracterização científica dos solos foi realizada por meio de análises morfológicas, físicas e químicas de perfis e, a classificação, de acordo com o Sistema Brasileiro de Classificação de Solos (SiBCS). Os resultados demonstraram que a comunidade local reconhece diferentes tipos de solos na área de estudo, de acordo com os seguintes atributos: cor, textura, taxas de infiltração de água, presença de rochas ou minerais, profundidade, demanda de força nas operações com tração mecânica ou animal. Foram definidas oito classes de solo segundo o conhecimento local: 1) Terra Branca Batumadeira; 2) Terra Branca Solta; 3) Terra Preta Batumadeira (ou Pesada); 4) Terra Preta Solta; 5) Terra Vermelha do Faxinal (ou do agricultor); 6) Terra Vermelha; 7) Terra de Cascalho; e, 8) Terra Roxa. De acordo com o SiBCS foram encontrados as seguintes classes de solos: CAMBISSOLOS, LATOSSOLOS e NEOSSOLOS. Os solos que dominam a região são os CAMBISSOLOS HÁPLICOS e os NEOSSOLOS LITÓLICOS, todos de baixa fertilidade natural e altamente susceptíveis à erosão. A técnica de RNA foi capaz de individualizar os etnosolos por meio da integração das variáveis de entrada Imagem SPOT5 e MDT (Modelo Digital do Terreno). A técnica de RNA foi capaz de separar os etnosolos por meio da integração de variáveis de entrada de diferentes origens e, quando comparada ao levantamento de solos tradicional, permitiu caracterizar a paisagem de modo mais detalhado e delimitar as unidades de mapeamento de solos.
|
356 |
Variáveis sistemicamente prevalentes para a eficiência técnica: avaliação da operação de um forno de reaquecimento no setor siderúrgicoBrasil, João Eduardo Sampaio 23 August 2018 (has links)
Submitted by JOSIANE SANTOS DE OLIVEIRA (josianeso) on 2018-11-08T13:01:52Z
No. of bitstreams: 1
João Eduardo Sampaio_.pdf: 5481805 bytes, checksum: ff4fd651d904071e9a30223e3222c4dc (MD5) / Made available in DSpace on 2018-11-08T13:01:52Z (GMT). No. of bitstreams: 1
João Eduardo Sampaio_.pdf: 5481805 bytes, checksum: ff4fd651d904071e9a30223e3222c4dc (MD5)
Previous issue date: 2018-08-23 / Nenhuma / O Brasil precisa de um setor siderúrgico eficiente e competitivo para enfrentar a concorrência externa. A siderurgia é um ramo da metalurgia responsável pela fabricação do aço, e dentre os processos produtivos do setor, destaca-se o processo de laminação do aço, que utiliza fornos de reaquecimento. Esta pesquisa emprega a modelagem com as técnicas do Pensamento Sistêmico e da Dinâmica de Sistemas na formulação de um modelo computacional no contexto dos fornos de reaquecimento. A partir da validação do modelo, são utilizadas a Análise Envoltória de dados, para avaliar a eficiência técnica, e a regressão Tobit, para identificar variáveis estatisticamente significantes. Essas variáveis são usadas para definição dos cenários simulados. Posteriormente, as eficiências dos cenários são avaliadas por meio de estatística descritiva. Também são avaliados alvos e folgas e é testada a hipótese de igualdade da média com o teste de Welch e Post-Hoc Kruskal-Wallis. Finalmente, é realizada a análise explicativa e, com a aplicação da técnica computacional da Rede Neural Artificial, são identificadas as variáveis prevalentes da eficiência técnica do forno de reaquecimento. Tal estudo possibilita e estimula o planejamento, a gestão e a tomada de decisão a partir da análise das melhores opções. Permite, ainda, a tomada de ações com base no conhecimento prévio, contribuindo para iniciativas pontuais e focadas na competitividade. / Brazil needs an efficient and competitive steel sector to face external competition. The siderurgy is a branch of metallurgy responsible for steelmaking, and among the productive processes in the industry the steelmaking process that uses the reheating furnaces can be highlighted. This research employs the modeling with the techniques of Systemic Thinking and Systems Dynamics in the formulation of a computational model in the context of reheating furnaces. Then, using the validated model, Data Envelopment Analysis was used, evaluating the technical efficiency and the use of the Tobit regression of statistically significant
variables. These variables are used to define the simulated scenarios. Subsequently, the scenarios efficiencies were evaluated by means of descriptive statistics, evaluated targets and backlash and tested the hypothesis of equality of the average with the test of Welch and Post-Hoc Kruskal-Wallis. Finally, the explanatory analysis and identified with the application of the computational technique of the Artificial Neural Network are the prevalent variables of the technical efficiency of the reheating furnace. This study enables and stimulates planning, management and decision making based on the analysis of the best options and allows the taking of actions based on previous knowledge, and thus contributes to specific initiatives focused on competitiveness.
|
357 |
Identificação de variáveis prevalentes para situações de stress em parques de tancagem: uma análise a partir das redes neurais artificiaisBortolini, Filipe 20 November 2015 (has links)
Submitted by Silvana Teresinha Dornelles Studzinski (sstudzinski) on 2016-04-28T12:47:41Z
No. of bitstreams: 1
FILIPE BORTOLINI_.pdf: 6329595 bytes, checksum: 3dd8331791bb827a0806c8da5947b553 (MD5) / Made available in DSpace on 2016-04-28T12:47:41Z (GMT). No. of bitstreams: 1
FILIPE BORTOLINI_.pdf: 6329595 bytes, checksum: 3dd8331791bb827a0806c8da5947b553 (MD5)
Previous issue date: 2015-11-20 / Nenhuma / A melhoria no planejamento de operações é uma das preocupações constantes das refinarias de petróleo, e a gestão eficiente dos estoques em parques de tancagem é um ponto fundamental nesse contexto. No entanto, são poucos os trabalhos que tratam especificamente deste assunto e as ferramentas de simulação existentes são caras e não refletem a realidade de muitas refinarias. A gestão ineficiente ou o dimensionamento inadequado dos parques de tancagem, por sua vez, podem gerar uma série de prejuízos. Um parque superdimensionado gera custos de gestão e manutenção, além dos custos do estoque. Um parque subdimensionado pode gerar perdas devido a desabastecimentos e degradação de produtos, entre outros. Às situações em que o subdimensionamento gera impactos na produção, com ou sem perdas financeiras, dá-se a denominação de stress em parques de tancagem. Esse trabalho descreve a implantação de uma ferramenta que possibilita a quantificação do stress em parques de tancagem. Essa quantificação é feita com o apoio de uma heurística baseada em dados relativos às movimentações, manutenções e níveis de estoque dos tanques. Também descreve a forma de cálculo de cinquenta e nove variáveis relacionadas às movimentações dos tanques. A influência que essas variáveis têm na formação de situações de stress foi analisada através do uso de redes neurais artificiais. Essa influência foi quantificada em cinco diferentes cenários, considerando-se a existência ou não de um ciclo de certificação de produto e a natureza das variáveis analisadas. Como resultado, identifica-se que as variáveis relacionadas ao tempo de esvaziamento, tempo de tanque parado em nível baixo e tempo de enchimento são as prevalentes na criação de situações de stress em parques de tancagem no contexto analisado. Também são mapeados e formalizados os fluxos dos algoritmos para determinação das etapas do ciclo de um tanque, e é definida uma fórmula para a determinação do nível de stress em um parque de tancagem em um determinado período de tempo. / The improvement in operations planning is a constant concern of oil refineries, and the efficient management of inventories in tank farm sites is a key point in this context. However, there are few studies that deal specifically with this issue and existing simulation tools are expensive and do not reflect the reality of many refineries. The inefficient management or improper sizing of tank farm sites, in turn, can generate significant financial losses. A oversized tank farm generates management and maintenance costs, in addition to inventory costs. An undersized tank farm can generate losses due to shortages and degradation of products, among others. The situations in which the undersizing generates impact in operations, with or without financial losses, is defined as stress in tank farm sites. The present study describes the implementation of a tool that allows the quantification of stress in tank farm sites. This measurement is made using a heuristic based on data on the inventory movimentation, maintenance status and inventory levels of the tanks. It also describes the calculation method of fifty-nine variables related to the movimentation of inventory. The influence of these variables on the formation of stress situations was analyzed using artificial neural networks. This influence was quantified in five different scenarios, considering whether or not a product certification cycle and the nature of the variables. As a result, it is identified that the variables related to emptying time, tank downtime at low level and fill time are prevalent in creating stressful situations in tank farm sites in the analyzed context. They are also mapped and formalized flows of algorithms to determine the stages of a tank cycle, and is defined a formula for determining the stress level in a tankage park at a given time.
|
358 |
Predição de séries temporais econômicas por meio de redes neurais artificiais e transformada Wavelet: combinando modelo técnico e fundamentalista / Technique of economic time series prediction by artificial neural network and wavelet transform: joining technical and fundamental modelAnderson da Silva Soares 07 March 2008 (has links)
Este trabalho apresenta um método de predição não linear de séries temporais econômicas. O método baseia-se na análise técnica e fundamentalista de cotação de ações, filtragem wavelet, seleção de padrões e redes neurais artificiais. No modelo técnico emprega-se a transformada wavelet para filtrar a série temporal econômica de comportamentos aleatórios ou não econômicos. Após a filtragem dos dados o algoritmo de projeções sucessivas é utilizado para a seleção de padrões de treinamento para a rede neural artificial, com o objetivo de selecionar os padrões de comportamento mais importantes na série. No modelo fundamentalista utiliza-se variáveis econômicas que podem estar correlacionadas com a série, com o objetivo de aprimorar a predição da série na rede neural artificial. Para avaliação do método são utilizados dados de séries temporais econômicas referentes à cotação de preços de ações negociadas na bolsa de valores de São Paulo, onde os resultados da predição do comportamento futuro são comparados com modelos matemáticos clássicos e com o modelo convencional, que se baseia somente na análise técnica. Apresenta-se uma comparação dos resultados entre modelos técnicos, modelos matemáticos e o método proposto. O modelo matemático utilizado (ARIMA) apresentou seu melhor desempenho em séries com pouca variância, porém com desempenho inferior quando comparado com o modelo técnico e com o método proposto. A avaliação do erro de predição em termos de RMSEP evidenciou que o método proposto apresenta os melhores resultados em relação aos demais métodos. / This work presents a method for predicting nonlinear economic time series. The method is based on fundamental and technical analysis of script quotation, a multiscale wavelet filtering, pattern selection and artificial neural networks. In the technical model is used the wavelet transform in order to filter the economic time series from random or not economic behaviors. After the data filtering, the successive projections algorithm was used for the training pattern selection to the artificial neural network. In the fundamentalist model is used financial and macroeconomics variables that is correlated with the time serie in order to improve the network forecasting. For the evaluation of the proposed method are used temporal series data related to scrips prices quotation of São Paulo stock market. It presents a comparison of the results between technical model, mathematical model and proposed method. The mathematical model (ARIMA) presented better results in series with few variance, however have low performance when compared with the technical model and with the proposed method. The prediction error evaluation shows that the proposed method has better results than the other methods.
|
359 |
Otimização e análise das máquinas de vetores de suporte aplicadas à classificação de documentos. / Optimization and analysis of support vector machine applied to text classification.Kinto, Eduardo Akira 17 June 2011 (has links)
A análise das informações armazenadas é fundamental para qualquer tomada de decisão, mas para isso ela deve estar organizada e permitir fácil acesso. Quando temos um volume de dados muito grande, esta tarefa torna-se muito mais complicada do ponto de vista computacional. É fundamental, então, haver mecanismos eficientes para análise das informações. As Redes Neurais Artificiais (RNA), as Máquinas de Vetores-Suporte (Support Vector Machine - SVM) e outros algoritmos são frequentemente usados para esta finalidade. Neste trabalho, iremos explorar o SMO (Sequential Minimal Optimization) e alterá-lo, com a finalidade de atingir um tempo de treinamento menor, mas, ao mesmo tempo manter a capacidade de classificação. São duas as alterações propostas, uma, no seu algoritmo de treinamento e outra, na sua arquitetura. A primeira modificação do SMO proposta neste trabalho é permitir a atualização de candidatos ao vetor suporte no mesmo ciclo de atualização de um coeficiente de Lagrange. Dos algoritmos que codificam o SVM, o SMO é um dos mais rápidos e um dos que menos consome memória. A complexidade computacional do SMO é menor com relação aos demais algoritmos porque ele não trabalha com inversão de uma matriz de kernel. Esta matriz, que é quadrada, costuma ter um tamanho proporcional ao número de amostras que compõem os chamados vetores-suporte. A segunda proposta para diminuir o tempo de treinamento do SVM consiste na subdivisão ordenada do conjunto de treinamento, utilizando-se a dimensão de maior entropia. Esta subdivisão difere das abordagens tradicionais pelo fato de as amostras não serem constantemente submetidas repetidas vezes ao treinamento do SVM. Finalmente, é aplicado o SMO proposto para classificação de documentos ou textos por meio de uma abordagem nova, a classificação de uma-classe usando classificadores binários. Como toda classificação de documentos, a análise dos atributos é uma etapa fundamental, e aqui uma nova contribuição é apresentada. Utilizamos a correlação total ponto a ponto para seleção das palavras que formam o vetor de índices de palavras. / Stored data analysis is very important when taking a decision in every business, but to accomplish this task data must be organized in a way it can be easily accessed. When we have a huge amount of information, data analysis becomes a very computational hard job. So, it is essential to have an efficient mechanism for information analysis. Artificial neural networks (ANN), support vector machine (SVM) and other algorithms are frequently used for information analysis, and also in huge volume information analysis. In this work we will explore the sequential minimal optimization (SMO) algorithm, a learning algorithm for the SVM. We will modify it aiming for a lower training time and also to maintaining its classification generalization capacity. Two modifications are proposed to the SMO, one in the training algorithm and another in its architecture. The first modification to the SMO enables more than one Lagrange coefficient update by choosing the neighbor samples of the updating pair (current working set). From many options of SVM implementation, SMO was chosen because it is one of the fastest and less memory consuming one. The computational complexity of the SMO is lower than other types of SVM because it does not require handling a huge Kernel matrix. Matrix inversion is one of the most time consuming step of SVM, and its size is as bigger as the number of support vectors of the sample set. The second modification to the SMO proposes the creation of an ordered subset using as a reference one of the dimensions; entropy measure is used to choose the dimension. This subset creation is different from other division based SVM architectures because samples are not used in more than one training pair set. All this improved SVM is used on a one-class like classification task of documents. Every document classification problem needs a good feature vector (feature selection and dimensionality reduction); we propose in this work a novel feature indexing mechanism using the pointwise total correlation.
|
360 |
Desenvolvimento de modelos neurais para o processamento de sinais acústicos visando a medição de propriedades topológicas em escoamentos multifásicos / Development of neural models for the processing of acoustic signals aiming at the measurement of topological properties in multi-phase flowNascimento, Érica Regina Filletti 15 February 2007 (has links)
Uma nova metodologia para a medida não intrusiva da fração volumétrica e da área interfacial é proposta neste trabalho, com base em redes neurais para processar respostas obtidas de sinais acústicos. A distribuição geométrica das fases dentro do escoamento é mapeada pela velocidade local de propagação acústica, considerada na equação diferencial que governa o problema. Esta equação é resolvida numericamente pelo método de diferenças finitas com as condições de contorno reproduzindo a estratégia de pulso/eco. Um número significativo de distribuições das velocidades de propagação foi considerado na solução da equação diferencial para construir uma base de dados, da qual os parâmetros da rede podem ser ajustados. Especificamente, o modelo neural é construído para mapear características extraídas dos sinais obtidos de quatro sensores acústicos, localizados no contorno externo do domínio de sensoriamento, estimando a fração volumétrica e a área interfacial correspondentes. Estas características correspondem às amplitudes e aos tempos de chegada dos três maiores picos da onda acústica. Os resultados numéricos mostram que o modelo neural pode ser treinado em um tempo computacional razoável e é capaz de estimar os valores da fração volumétrica e da área interfacial dos exemplos do conjunto de teste. / A new methodology for measuring the volumetric fraction and interfacial area in two-phase flows is proposed in this work, based on neural network for processing the responses obtained from an acoustic interrogation signal. The geometrical distribution of the phases within the flow is mapped by the local acoustic propagation velocity which is considered in the governing differential equation. This equation is solved numerically by the finite difference method with boundary conditions reproducing the pulse/echo strategy. A significant number of propagation velocities distributions were considered in the solution of the differential equation in order to construct a database from which the neural model parameters could be adjusted. Specifically, the neural model is constructed to map the features extracted from the signals delivered by four acoustic sensors, placed on the external boundary of the sensing domain, into the corresponding volumetric fraction and interfacial area. These features correspond to the amplitudes and the times of arrival on the three first peaks of the acoustic wave. Numerical results showed that the neural model can be trained in a reasonable computational time and it is capable of estimating the values of the volumetric fraction and the interfacial area of examples of the set of test.
|
Page generated in 0.0921 seconds