Global ETD Search

41	Algoritmos evolutivos multi-objetivo para a reconstrução de árvores filogenéticas / Evolutionary multi-objective algorithms for Phylogenetic Inference Waldo Gonzalo Cancino Ticona 11 February 2008 (has links) O problema reconstrução filogenética têm como objetivo determinar as relações evolutivas das espécies, usualmente representadas em estruturas de árvores. No entanto, esse problema tem se mostrado muito difícil uma vez que o espaço de busca das possíveis árvores é muito grande. Diversos métodos de reconstrução filogenética têm sido propostos. Vários desses métodos definem um critério de otimalidade para avaliar as possíveis soluções do problema. Porém, a aplicação de diferentes critérios resulta em árvores diferentes, inconsistentes entre sim. Nesse contexto, uma abordagem multi-objetivo para a reconstrução filogenética pode ser útil produzindo um conjunto de árvores consideradas adequadas por mais de um critério. Nesta tese é proposto um algoritmo evolutivo multi-objetivo, denominado PhyloMOEA, para o problema de reconstrução filogenética. O PhyloMOEA emprega os critérios de parcimônia e verossimilhança que são dois dos métodos de reconstru ção filogenética mais empregados. Nos experimentos, o PhyloMOEA foi testado utilizando quatro bancos de seqüências freqüentemente empregados na literatura. Para cada banco de teste, o PhyloMOEA encontrou as soluções da fronteira de Pareto que representam um compromisso entre os critérios considerados. As árvores da fronteira de Pareto foram validadas estatisticamente utilizando o teste SH. Os resultados mostraram que o PhyloMOEA encontrou um número de soluções intermediárias que são consistentes com as soluções obtidas por análises de máxima parcimônia e máxima verossimilhança realizados separadamente. Além disso, os graus de suporte dos clados pertencentes às árvores encontradas pelo PhyloMOEA foram comparadas com a probabilidade posterior dos clados calculados pelo programa Mr.Bayes aplicados aos quatro bancos de teste. Os resultados indicaram que há uma relação entre ambos os valores para vários grupos de clados. Em resumo, o PhyloMOEA é capaz de encontrar uma diversidade de soluções intermediárias que são estatisticamente tão boas quanto as melhores soluções de máxima parcimônia e máxima verossimilhança. Tais soluções apresentam um compromisso entre os dois objetivos / The phylogeny reconstruction problem consists of determining the evolutionary relationships (usually represented as a tree) among species. This is a very complex problem since the tree search space is huge. Several phylogenetic reconstruction methods have been proposed. Many of them defines an optimality criterion for evaluation of possible solutions. However, different criteria may lead to distinct phylogenies, which often conflict with each other. In this context, a multi-objective approach for phylogeny reconstruction can be useful since it could produce a set of optimal trees according to mdifficultultiple criteria. In this thesis, a multi-objective evolutionary algorithm for phylogenetic reconstruction, called PhyloMOEA, is proposed. PhyloMOEA uses the parsimony and likelihood criteria, which are two of the most used phylogenetic reconstruction methods. PhyloMOEA was tested using four datasets of nucleotide sequences found in the literature. For each dataset, the proposed algorithm found a Pareto front representing a trade-off between the used criteria. Trees in the Pareto front were statistically validated using the SH-test, which has shown that a number of intermediate solutions from PhyloMOEA are consistent with solutions found by phylogenetic methods using one criterion. Moreover, clade support values from trees found by PhyloMOEA was compared to clade posterior probabilities obtained by Mr.Bayes. Results indicate a correlation between these probabilities for several clades. In summary, PhyloMOEA is able to find diverse intermediate solutions, which are not statistically worse than the best solutions for the maximum parsimony and maximum likelihood criteria. Moreover, intermediate solutions represent a trade-off between these criteria Algoritmos evolutivos Filogenia Otimização multi-objetivo Evolutionary algorithms Multi-objective optimization Phylogeny
42	Agrupamento de dados em fluxos contínuos com estimativa automática do número de grupos / Clustering data streams with automatic estimation of the number of cluster Jonathan de Andrade Silva 04 March 2015 (has links) Técnicas de agrupamento de dados usualmente assumem que o conjunto de dados é de tamanho fixo e pode ser alocado na memória. Neste contexto, um desafio consiste em aplicar técnicas de agrupamento em bases de dados de tamanho ilimitado, com dados gerados continuamente e em ambientes dinâmicos. Dados gerados nessas condições originam o que se convencionou chamar de Fluxo Contínuo de Dados (FCD). Em aplicações de FCD, operações de acesso aos dados são restritas a apenas uma leitura ou a um pequeno número de acessos aos dados, com limitações de memória e de tempo de processamento. Além disso, a distribuição dos dados gerados por essas fontes pode ser não estacionária, ou seja, podem ocorrer mudanças ao longo do tempo, denominadas de mudanças de conceito. Nesse sentido, algumas técnicas de agrupamento em FCD foram propostas na literatura. Muitas dessas técnicas são baseadas no algoritmo das k-Médias. Uma das limitações do algoritmo das k-Médias consiste na definição prévia do número de grupos. Ao se assumir que o número de grupos é desconhecido a priori e que deveria ser estimado a partir dos dados, percorrer o grande espaço de soluções possíveis (tanto em relação ao número de grupos, k, quanto em relação às partições possíveis para um determinado k) torna desafiadora a tarefa de agrupamento de dados - ainda mais sob a limitação de tempo e armazenamento imposta em aplicações de FCD. Neste contexto, essa tese tem como principais contribuições: (i) adaptar algoritmos que têm sido usados com sucesso em aplicações de Fluxo Contínuo de Dados (FCD) nas quais k é conhecido para cenários em que se deseja estimar o número de grupos; (ii) propor novos algoritmos para agrupamento que estimem k automaticamente a partir do FCD; (iii) avaliar sistematicamente, e de maneira quantitativa, os algoritmos propostos de acordo com as características específicas dos cenários de FCD. Foram desenvolvidos 14 algoritmos de agrupamento para FCD capazes de estimar o número de grupos a partir dos dados. Tais algoritmos foram avaliados em seis bases de dados artificiais e duas bases de dados reais amplamente utilizada na literatura. Os algoritmos desenvolvidos podem auxiliar em diversas áreas da Mineração em FCD. Os algoritmos evolutivos desenvolvidos mostraram a melhor relação de custo-benefício entre eficiência computacional e qualidade das partições obtidas. / Several algorithms for clustering data streams based on k-Means have been proposed in the literature. However, most of them assume that the number of clusters, k, is known a priori by the user and can be kept fixed throughout the data analysis process. Besides the dificulty in choosing k, data stream clustering imposes several challenges to be dealt with, such as addressing non-stationary, unbounded data that arrives in an online fashion. In data stream applications, the dataset must be accessed in order and that can be read only once or a small number of times. In this context, the main contributions of this thesis are: (i) adapt algorithms that have been used successfully in data stream applications where k is known to be able to estimate the number of clusters from data; (ii) propose new algorithms for clustering to estimate k automatically from the data stream; (iii) evaluate the proposed algorithms according to diferent scenarios. Fourteen clustering data stream algorithms were developed which are able to estimate the number of clusters from data. They were evaluated in six artificial datasets and two real-world datasets widely used in the literature. The developed algorithms are useful for several data mining tasks. The developed evolutionary algorithms have shown the best trade-off between computational efficiency and data partition quality. Agrupamento de dados Algoritmos evolutivos Fluxo contínuo de dados Clustering Data stream Evolutionary algorithms
43	Estruturas de dados eficientes para algoritmos evolutivos aplicados a projeto de redes / Efficient Data Structures to Evolutionary Algorithms Applied to Network Design Problems. Telma Woerle de Lima Soares 22 May 2009 (has links) Problemas de projeto de redes (PPRs) são muito importantes uma vez que envolvem uma série de aplicações em áreas da engenharia e ciências. Para solucionar as limitações de algoritmos convencionais para PPRs que envolvem redes complexas do mundo real (em geral modeladas por grafos completos ou mesmo esparsos de larga-escala), heurísticas, como os algoritmos evolutivos (EAs), têm sido investigadas. Trabalhos recentes têm mostrado que estruturas de dados adequadas podem melhorar significativamente o desempenho de EAs para PPRs. Uma dessas estruturas de dados é a representação nó-profundidade (NDE, do inglês Node-depth Encoding). Em geral, a aplicação de EAs com a NDE tem apresentado resultados relevantes para PPRs de larga-escala. Este trabalho investiga o desenvolvimento de uma nova representação, baseada na NDE, chamada representação nó-profundidade-grau (NDDE, do inglês Node-depth-degree Encoding). A NDDE é composta por melhorias nos operadores existentes da NDE e pelo desenvolvimento de novos operadores de reprodução possibilitando a recombinação de soluções. Nesse sentido, desenvolveu-se um operador de recombinação capaz de lidar com grafos não-completos e completos, chamado EHR (do inglês, Evolutionary History Recombination Operator). Foram também desenvolvidos operadores de recombinação que lidam somente com grafos completos, chamados de NOX e NPBX. Tais melhorias tem como objetivo manter relativamente baixa a complexidade computacional dos operadores para aumentar o desempenho de EAs para PPRs de larga-escala. A análise de propriedades de representações mostrou que a NDDE possui redundância, assim, foram propostos mecanismos para evitá-la. Essa análise mostrou também que o EHR possui baixa complexidade de tempo e não possui tendência, além de revelar que o NOX e o NPBX possuem uma tendência para árvores com topologia de estrela. A aplicação de EAs usando a NDDE para PPRs clássicos envolvendo grafos completos, tais como árvore geradora de comunicação ótima, árvore geradora mínima com restrição de grau e uma árvore máxima, mostrou que, quanto maior o tamanho das instâncias do PPR, melhor é o desempenho relativo da técnica em comparação com os resultados obtidos com outros EAs para PPRs da literatura. Além desses problemas, um EA utilizando a NDE com o operador EHR foi aplicado ao PPR do mundo real de reconfiguração de sistemas de distribuição de energia elétrica (envolvendo grafos esparsos). Os resultados mostram que o EHR possibilita reduzir significativamente o tempo de convergência do EA / Network design problems (NDPs) are very important since they involve several applications from areas of Engineering and Sciences. In order to solve the limitations of traditional algorithms for NDPs that involve real world complex networks (in general, modeled by large-scale complete or sparse graphs), heuristics, such as evolutionary algorithms (EAs), have been investigated. Recent researches have shown that appropriate data structures can improve EA performance when applied to NDPs. One of these data structures is the Node-depth Encoding (NDE). In general, the performance of EAs with NDE has presented relevant results for large-scale NDPs. This thesis investigates the development of a new representation, based on NDE, called Node-depth-degree Encoding (NDDE). The NDDE is composed for improvements of the NDE operators and the development of new reproduction operators that enable the recombination of solutions. In this way, we developed a recombination operator to work with both non-complete and complete graphs, called EHR (Evolutionary History Recombination Operator). We also developed two other operators to work only with complete graphs, named NOX and NPBX. These improvements have the advantage of retaining the computational complexity of the operators relatively low in order to improve the EA performance. The analysis of representation properties have shown that NDDE is a redundant representation and, for this reason, we proposed some strategies to avoid it. This analysis also showed that EHR has low running time and it does not have bias, moreover, it revealed that NOX and NPBX have bias to trees like stars. The application of an EA using the NDDE to classic NDPs, such as, optimal communication spanning tree, degree-constraint minimum spanning tree and one-max tree, showed that the larger the instance is, the better the performance will be in comparison whit other EAs applied to NDPs in the literatura. An EA using the NDE with EHR was applied to a real-world NDP of reconfiguration of energy distribution systems. The results showed that EHR significantly decrease the convergence time of the EA Algoritmos evolutivos Estutura de dados Projeto de redes Representações de grafos Data structure Evolutionary algorithms Graph representations Networks design
44	Replicação assíncrona em bancos de dados evolutivos / Asynchronous Replication in Evolutionary Databases Helves Humberto Domingues 02 June 2011 (has links) A modelagem evolutiva de bancos de dados é necessária devido às frequentes mudanças de requisitos das aplicações. O desafio é ainda maior quando o banco de dados tem de atender simultaneamente a várias aplicações. A solução proposta por Scott Ambler para evolução utiliza refatorações e define um período de transição, durante o qual tanto o esquema antigo quanto o novo coexistem e os dados são replicados por meio de um processo síncrono que apresenta várias dificuldades, como a interferência no funcionamento normal das aplicações. Para minimizar essas dificuldades, esta tese propõe um processo assíncrono para manter atualizados esses esquemas e apresenta um protótipo de uma ferramenta para auxiliar as evoluções dos bancos de dados. A proposta foi validada por meio de um experimento em laboratório que comparou a solução aqui apresentada com a proposta por Ambler. / Evolutionary database modeling is necessary due to the frequent changes in application requirements. The challenge is greater when the database must support multiple applications simultaneously. The solution for evolution proposed by Scott Ambler is refactoring with a transition period, during which both the old and the new database schemas coexist and data is replicated via a synchronous process, what brings several difficulties, such as interference with the normal operation of applications. To minimize these difficulties, this thesis proposes an asynchronous process to keep these schemas updated and presents a prototype tool to evolve databases. The proposal was validated by a laboratory experiment in which the solution presented here was compared with the one proposed by Ambler. Banco de Dados Evolutivos Métodos Ágeis Refatoração Replicação de Dados Agile Methods Data Replication Evolutionary Database Refactoring
45	Diseño óptimo de sistemas de distribución de agua mediante Agent Swarm Optimization Montalvo Arango, Idel 02 March 2012 (has links) La necesidad de hacer eficientes y económicamente viables las grandes inversiones relacionadas con la construcción y el mantenimiento de las redes de abastecimiento de agua, hace que se preste especial atención al diseño de este tipo de redes. Concebir soluciones económicamente optimizadas y que garanticen un adecuado funcionamiento de los sistemas de distribución de agua (SDA), tomando en cuenta la fiabilidad de la red para ofrecer sus servicios, incluso ante posibles condiciones de fallo, es uno de los grandes retos que han tenido desde hace muchos años varios hombres y mujeres de ciencias que han trabajado el tema. Se impone obtener los mayores beneficios con los menores costes. En el diseño óptimo de sistemas de distribución de agua, como muchos otros problemas de optimización, los objetivos a optimizar están frecuentemente en conflicto unos con otros. Ante este hecho, más conveniente que encontrar una única solución, es elaborar un conjunto de soluciones que representen el mejor compromiso posible entre todos los objetivos involucrados. En los últimos 15 años, varios investigadores se han desviado de las técnicas tradicionales de optimización basadas en la programación lineal y no lineal, para dirigirse hacia la implementación de Algoritmos Evolutivos. En esta investigación se proponen soluciones para el diseño óptimo de SDA basadas en el empleo de una generalización del algoritmo Particle Swarm Optimization (PSO) orientada a la inteligencia artificial distribuida tomando como base a los sistemas multi-agente (MA). El algoritmo final propuesto recibió la denominación de Agent Swarm Optimization (ASO) El algoritmo ASO se aprovecha de las ventajas de la computación paralela y distribuida para hacer interactuar diversas poblaciones de agentes que pueden tener comportamientos diferentes. Su versatilidad da origen a su principal fortaleza: la introducción de agentes con reglas de comportamiento específicas para la mejor solución de un problema, que problema, que trabajan de manera conjunta con algoritmos evolutivos de carácter general como PSO, Algoritmos Genéticos, Ant Colony Optimization, etcétera. / Montalvo Arango, I. (2011). Diseño óptimo de sistemas de distribución de agua mediante Agent Swarm Optimization [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/14858 / Palancia Sistema de distribución de agua Diseño óptimo Agent swarm optimization Algoritmos evolutivos Optimización INGENIERIA HIDRAULICA MATEMATICA APLICADA
46	Eficiencia energética en la programación de tareas con recursos restringidos Morillo Torres, Daniel 07 November 2017 (has links) In the field of operations research, the set of scheduling problems of activities is considered as one of the most relevant ones due to its great applicability and complexity. Within the broad variety of problems in this set, it is remarkable the Resource-Constrained Project Scheduling Problem (RCPSP), since it is regarded as the most important-base problem in this area and it has been the object of study in countless research projects. Basically, this problem consists of a project split into sets of activities that are related to each other by means of precedence-constraints, and require an amount of each limited resource, to be performed. The objective, then, is to allocate in the most efficient way those resources to the activities in order to optimize a scoring function such as the makespan. Similar in importance is the multimodal-version of the RCPSP, called MRCPSP, in which for each activity there exists multiple execution modes that involve a different combination of limited resources, giving rise to a different execution time. In the literature, it has been addressed widely these two problems with both exact methods and approximation methods, being these latter the most successful. These research works have focused mainly on obtaining economic advantages such as costs and project time minimization. However, with the accelerating globalization and the fast countries' growing economies, the race for power resources have increased sharply. In fact, the importance of taking into account the energy consumption on modeling has become so important that it is now considered as important as other performance measures such as productivity and costs. Hence, the main goal of this Ph.D. dissertation is to develop a new RCPSP and MRCPSP approach based on the energetic efficiency, which is aimed at searching for sustainable solutions in terms of time and energy consumption. To this end, it has been proposed an extension of the RCPSP, named MRCPSP-ENERGY, which considers besides the traditional resources of the RCPSP, a variable energetic consumption that generates different execution modes for the activities. This proposal includes a new optimization criterion based on the energetic efficiency of a project, which considers simultaneously the minimization of both the total duration and the energy consumption of such project. Moreover, in order to assess the solution methods for the MRCPSP-ENERGY, the standard library mostly used for this purpose has been extended and a new one has been proposed, called PSPLIB-ENERGY. In order to solve the proposed problem, firstly, the most successful metaheuristics methods, which address the RCPSP, were analyzed. Secondly, it was shown that these methods lead to redundant solutions, hindering the search. Therefore, an evolutive method was proposed, whose main contribution is the development of a new mutation operator that reduces the number of redundant solutions. Similarly, in the multimodal case, it was determined that the most widespread searching methods are also focused on the activity list representation and therefore they yield redundant solutions. As a solution alternative for the MRCPSP-ENERGY, it was shown that such search can be carried out by focusing on the mode list representation, as different mode lists also reach diverse solutions, giving rise to a less number of redundant solutions. Keeping in mind this finds, it was proposed a new evolutive method for solving the MRCPSP-ENERGY, which unifies both searching methods such that the search is conducted with two optimization phases. Based on the obtained results given by the PSPLIB-ENERGY library, the proposed method proved to be able to reach highly efficient solutions. / En la investigación operativa, el conjunto de problemas de secuenciación de actividades es considerado como uno de los más relevantes debido a su gran aplicabilidad y complejidad. Dentro de la amplia variedad de problemas en este conjunto, destaca el problema de programación de tareas con recursos restringidos (RCPSP por su sigla en inglés), pues es considerado como el problema base más importante en esta área y ha sido objeto de estudio de numerosas investigaciones. Básicamente, consiste de un proyecto subdividido en un conjunto de actividades que se encuentran relacionadas mediante restricciones de precedencia y requieren, para ser ejecutadas, una cantidad de cada tipo de recurso cuya disponibilidad máxima se encuentra limitada. El objetivo es asignar los recursos a las actividades de la manera más eficiente posible para optimizar una medida de desempeño, por ejemplo, la duración total del proyecto. Igualmente importante es la versión multi-modal del RCPSP, llamada MRCPSP, en la que para cada actividad existen múltiples modos de ejecución que involucran una combinación diferente de recursos limitados, dando origen a un tiempo de ejecución distinto. En la literatura se han abordado ampliamente estos dos problemas tanto con métodos exactos como de aproximación, siendo estos últimos los más exitosos. Estos trabajos se han centrado principalmente en la obtención de beneficios económicos, como la minimización de los costes o la obtención de la mínima duración del proyecto. Sin embargo, con la aceleración de la globalización y el rápido desarrollo de los países, la competencia por recursos energéticos ha aumentado drásticamente. Incluso, la importancia de tener en cuenta el consumo de energía en los modelos ha crecido de tal manera que, ahora es considerado con la misma relevancia que otras medidas de desempeño como la productividad y los costes. Así, el objetivo principal de esta tesis es desarrollar un nuevo enfoque del RCPSP y del MRCPSP, basado en la eficiencia energética, la cual busca soluciones sostenibles en términos de tiempo y de consumo energético. Para este fin, se ha propuesto una extensión del RCPSP denominada MRCPSP-ENERGY, la cual considera, además de los recursos tradicionales del RCPSP, un consumo de energía variable que da origen a distintos modos de ejecución de las actividades. Esta propuesta incluye un nuevo criterio de optimización basado en la eficiencia energética del proyecto, que tiene en cuenta de manera simultánea la minimización de la duración del proyecto y el consumo total de energía. Adicionalmente, con el objetivo de evaluar los métodos de solución para el MRCPSP-ENERGY, se ha ampliado la librería estándar de prueba más extendida para el RCPSP y se ha propuesto una nueva librería, denominada PSPLIB-ENERGY. Para encontrar solución al problema propuesto, primero se analizaron los mejores métodos metaheurísticos que abordan el RCPSP. Luego, se identificó que estos métodos conducen a soluciones redundantes, entorpeciendo la búsqueda. Por tanto, se propuso un método evolutivo cuya principal aportación es el desarrollo de un nuevo operador de mutación que disminuye la generación de soluciones redundantes. Similarmente, en el caso multi-modal se detectó que los principales métodos de búsqueda también se centran en la representación de lista de actividades y por tanto generan soluciones redundantes. Como alternativa de solución para el MRCPSP-ENERGY, se mostró que la búsqueda puede realizarse enfocándose en la lista de modos, ya que diferentes listas de modos también pueden alcanzar soluciones distintas, generando un menor número de soluciones redundantes. Teniendo en cuenta estos hallazgos, se propuso un nuevo método evolutivo para resolver el MRCPSP-ENERGY, que unifica ambos métodos de búsqueda para realizarla en dos fases de optimización. Basándose en los resultados obtenidos en la PSPLIB-ENERGY, se concluye que el m / En la investigació operativa, el conjunt de problemes de seqüenciació d'activitats és considerat com un dels més rellevants a causa de la seua gran aplicabilitat i complexitat. Dins de l'àmplia varietat de problemes en este conjunt, destaca el problema de programació de tasques amb recursos restringits (RCPSP per la seua sigla en anglés) , perquè és considerat com el problema base més important en esta àrea i ha sigut objecte d'estudi de nombroses investigacions. Bàsicament, consistix d'un projecte subdividit en un conjunt d'activitats que es troben relacionades per mitjà de restriccions de precedència i requerixen, per a ser executades, una quantitat de cada tipus de recurs la disponibilitat màxima de la qual es troba limitada. L'objectiu és assignar els recursos a les activitats de la manera més eficient possible per a optimitzar una mesura d'exercici, per exemple, la duració total del projecte. Igualment important és la versió multi- modal del RCPSP, crida MRCPSP, en la que per a cada activitat hi ha múltiples modes d'execució que involucren una combinació diferent de recursos limitats, donant origen a un temps d'execució distint. En la literatura s'han abordat àmpliament estos dos problemes tant amb mètodes exactes com d'aproximació, sent estos últims els més reeixits. Estos treballs s'han centrat principalment en l'obtenció de beneficis econòmics, com la minimització dels costos o l'obtenció de la mínima duració del projecte. No obstant això, amb l'acceleració de la globalització i el ràpid desenrotllament dels països, la competència per recursos energètics ha augmentat dràsticament. Inclús, la importància de tindre en compte el consum d'energia en els models ha crescut de tal manera que, ara és considerat amb la mateixa rellevància que altres mesures d'exercici com la productivitat i els costos. Així, l'objectiu principal d'esta tesi és desenrotllar un nou enfocament del RCPSP i del MRCPSP, basat en l'eficiència energètica, la qual busca solucions sostenibles en termes de temps i de consum energètic. Per a este fi, s'ha proposat una extensió del RCPSP denominada MRCPSP- ENERGY, la qual considera, a més dels recursos tradicionals del RCPSP, un consum d'energia variable que dóna origen a distints modes d'execució de les activitats. Esta proposta inclou un nou criteri d'optimització basat en l'eficiència energètica del projecte, que té en compte de manera simultània la minimització de la duració del projecte i el consum total d'energia. Addicionalment, amb l'objectiu d'avaluar els mètodes de solució per al MRCPSP-ENERGY, s'ha ampliat la llibreria estàndard de prova més estesa per al RCPSP i s'ha proposat una nova llibreria, denominada PSPLIB-ENERGY. Per a trobar solució al problema proposat, primer es van analitzar els millors mètodes metaheurísticos que aborden el RCPSP. Després, es va identificar que estos mètodes conduïxen a solucions redundants, entorpint la busca. Per tant, es va proposar un mètode evolutiu la principal aportació del qual és el desenrotllament d'un nou operador de mutació que disminuïx la generació de solucions redundants. Semblantment, en el cas multi- modal es va detectar que els principals mètodes de busca també se centren en la representació de llista d'activitats i per tant generen solucions redundants. Com a alternativa de solució per al MRCPSP-ENERGY, es va mostrar que la busca pot realitzar-se enfocant-se en la llista de modes, ja que diferents llistes de modes també poden aconseguir solucions distintes, generant un menor nombre de solucions redundants. Tenint en compte estes troballes, es va proposar un nou mètode evolutiu per a resoldre el MRCPSP-ENERGY, que unifica ambdós mètodes de busca per a realitzar-la en dos fases d'optimització. Basant-se en els resultats obtinguts en la PSPLIB-ENERGY, es conclou que el mètode proposat és capaç d'aconseguir solucions altament eficients. / Morillo Torres, D. (2017). Eficiencia energética en la programación de tareas con recursos restringidos [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/90654 / TESIS Programación de tareas RCPSP MRCPSP métodos evolutivos eficiencia energética PSPLIB metaheurísticas LENGUAJES Y SISTEMAS INFORMATICOS
47	Descubrimiento Automático de Flujos de Aprendizaje de Máquina basado en Gramáticas Probabilı́sticas Estévez-Velarde, Suilan 02 December 2021 (has links) El aprendizaje de máquinas ha ganado terreno utilizándose en casi todas las áreas de la vida cotidiana, ayudando a tomar decisiones en las finanzas, la medicina, el comercio y el entretenimiento. El desarrollo continuo de nuevos algoritmos y técnicas de aprendizaje automático, y la amplia gama de herramientas y conjuntos de datos disponibles han traído nuevas oportunidades y desafíos para investigadores y profesionales tanto del mundo académico como de la industria. Seleccionar la mejor estrategia posible para resolver un problema de aprendizaje automático es cada vez más difícil, en parte porque requiere largos tiempos de experimentación y profundos conocimientos técnicos. En este escenario, el campo de investigación Automated Machine Learning (AutoML) ha ganado protagonismo, proponiendo estrategias para automatizar progresivamente tareas usuales durante el desarrollo de aplicaciones de aprendizaje de máquina. Las herramientas de AutoML más comunes permiten seleccionar automáticamente dentro de un conjunto restringido de algoritmos y parámetros la mejor estrategia para cierto conjunto de datos. Sin embargo, los problemas prácticos a menudo requieren combinar y comparar algoritmos heterogéneos implementados con diferentes tecnologías subyacentes. Un ejemplo es el procesamiento del lenguaje natural, un escenario donde varía el espacio de posibles técnicas a aplicar ampliamente entre diferentes tareas, desde el preprocesamiento hasta la representación y clasificación de textos. Realizar AutoML en un escenario heterogéneo como este es complejo porque la solución necesaria podría incluir herramientas y bibliotecas no compatibles entre sí. Esto requeriría que todos los algoritmos acuerden un protocolo común que permita la salida de un algoritmo para ser compartida como entradas a cualquier otro. En esta investigación se diseña e implementa un sistema de AutoML que utiliza técnicas heterogéneas. A diferencia de los enfoques de AutoML existentes, nuestra contribución puede combinar técnicas y algoritmos de diferentes bibliotecas y tecnologías, incluidos algoritmos de aprendizaje de máquina clásicos, extracción de características, herramientas de procesamiento de lenguaje natural y diversas arquitecturas de redes neuronales. Definimos el problema heterogéneo de optimización de AutoML como la búsqueda de la mejor secuencia de algoritmos que transforme datos de entrada específicos en la salida deseada. Esto proporciona un enfoque teórico y práctico novedoso para AutoML. Nuestra propuesta se evalúa experimentalmente en diversos problemas de aprendizaje automático y se compara con enfoques alternativos, lo que demuestra que es competitiva con otras alternativas de AutoML en los puntos de referencia estándar. Además, se puede aplicar a escenarios novedosos, como varias tareas de procesamiento de lenguaje natural, donde las alternativas existentes no se pueden implementar directamente. El sistema está disponible de forma gratuita e incluye compatibilidad incorporada con una gran cantidad de marcos de aprendizaje automático populares, lo que hace que nuestro enfoque sea útil para resolver problemas prácticos con relativa facilidad y esfuerzo. El uso de la herramienta propuesta en esta investigación permite a los investigadores y profesionales desarrollar rápidamente algoritmos de referencia optimizados en diversos problemas de aprendizaje automático. En algunos escenarios, la solución proporcionada por nuestro sistema podría ser suficiente. Sin embargo, los sistemas AutoML no deben intentar reemplazar a los expertos humanos, sino servir como herramientas complementarias que permitan a los investigadores obtener rápidamente mejores prototipos y conocimientos sobre las estrategias más prometedoras en un problema concreto. Las técnicas de AutoML abren las puertas a revolucionar la forma en que se realiza la investigación y el desarrollo del aprendizaje automático en la academia y la industria. AutoML Aprendizaje Automático Algoritmos evolutivos Gramática Tecnologías del Lenguaje Humano Lenguajes y Sistemas Informáticos
48	Desarrollo de técnicas de computación evolutiva : multiobjetivo y aprendizaje automático para la inferencia, modelado y simulación de redes regulatorias Gallo, Cristian Andrés 19 March 2014 (has links) Durante las últimas décadas el desarrollo de la bioinformática nos ha permitido lograr una mayor comprensión de los procesos biológicos que ocurren con nuestras células a nivel molecular. Al respecto, las mejoras e innovaciones en la tecnología continúan estimulando la mejora en la calidad de los datos biológicos que pueden ser obtenidos a nivel genómico. En tal sentido, grandes volúmenes de información pueden ser encontrados en formas de anotaciones o bases de datos computacionales. Estos conjuntos de datos, apropiadamente combinados, tienen el potencial de posibilitar descubrimientos novedosos que lleven a avances en campos tan relevantes para el desarrollo nacional como son la biotecnología o la medicina post-genómica. En particular, esta tesis se centra en la investigación de técnicas de aprendizaje automático y computación evolutiva para la inferencia de redes regulatorias de genes a partir de datos de expresión de genes, a nivel de genomas completos. Una red regulatoria de genes es una colección de segmentos de ADN (ácido desoxirribonucleico) en una célula que interactúan unos con otros (indirectamente a través del producto de su expresión) y con otras sustancias en la célula, gobernando así las tasas de transcripción de los genes de la red en ARNm (ácido ribonucleico mensajero). La principal contribución de esta tesis esta relacionada con el desarrollo de metodologías computacionales que asistan, a expertos en bioinformática, en la ingeniería inversa de las redes regulatorias de genes. En tal sentido, se desarrollaron algoritmos de computación evolutiva que permiten la identificación de grupos de genes co-expresados bajo ciertos subconjuntos de condiciones experimentales. Estos algoritmos se aplican sobre datos de expresión de genes, y optimizan características deseables desde el punto de vista biológico, posibilitando la obtención de relaciones de co-expresión relevantes. Tales algoritmos fueron cuidadosamente validados por medio de comparaciones con otras técnicas similares disponibles en la literatura, realizando estudios con datos reales y sintéticos a fin de mostrar la utilidad de la información extraída. Además, se desarrolló un algoritmo de inferencia que permite la extracción de potenciales relaciones causa-efecto entre genes, tanto simultáneas como también aquellas diferidas en el tiempo. Este algoritmo es una evolución de una técnica presentada con anterioridad, e incorpora características novedosas como la posibilidad de inferir reglas con múltiples retardos en el tiempo, a nivel genoma completo, e integrando múltiples conjuntos de datos. La técnica se validó mostrando su eficacia respecto de otros enfoques relevantes de la literatura. También se estudiaron los resultados obtenidos a partir de conjuntos de datos reales en términos de su relevancia biológica, exponiendo la viabilidad de la información inferida. Finalmente, estos algoritmos se integraron en una plataforma de software que facilita la utilización de estas técnicas permitiendo la inferencia, manipulación y visualización de redes regulatorias de genes. / In recent decades, the development of bioinformatics has allowed us to achieve a greater understanding of the biological processes that occur at the molecular level in our cells. In this regard, the improvements and innovations in technology continue to boost the improvement in the quality of the biological data that can be obtained at the genomic level. In this regard, large volumes of information can be found in forms of ontology's or computer databases. These datasets, appropriately combined, have the potential to enable novel discoveries that lead to progress in relevant fields to national development such as biotechnology and post-genomic medicine. In particular, this thesis focuses on the research of machine learning techniques and evolutionary computation for the inference of gene regulatory networks from gene expression data at genome-wide levels. A gene regulatory network is a collection of segments of DNA (deoxyribonucleic acid) in a cell which interact with each other (indirectly through their products of expression) and with other substances in the cell, thereby governing the rates of network genes transcription into mRNA (messenger ribonucleic acid). The main contribution of this thesis is related to the development of computational methodologies to attend experts in bioinformatics in the reverse engineering of gene regulatory networks. In this sense, evolutionary algorithms that allow the identification of groups of coexpressed genes under certain subsets of experimental conditions were developed. These algorithms are applied to gene expression data, and optimize desirable characteristics from the biological point of view, allowing the inference of relevant co-expression relationships. Such algorithms were carefully validated by the comparison with other similar techniques available in the literature, conducting studies with real and synthetic data in order to show the usefulness of the information extracted. Furthermore, an inference algorithm that allows the extraction of potential cause-effect relationships between genes, both simultaneous and time-delayed, were developed. This algorithm is an evolution of a previous approach, and incorporates new features such as the ability to infer rules with multiple time delays, at genome-wide level, and integrating multiple datasets. The technique was validated by showing its effectiveness over other relevant approaches in the literature. The results obtained from real datasets were also studied in terms of their biological relevance by exposing the viability of the inferred information. Finally, these algorithms were integrated into a software platform that facilitates the use of these techniques allowing the inference, manipulation and visualization of gene regulatory networks. Ciencias de la computación Redes regulatorias de genes Aprendizaje automático Algoritmos evolutivos Gene regulatory networks Machine learning Evolutionary algorithms
49	Planificación operativa del ruteo de vehículos y programación de cargas desde un enfoque multi-objetivo, en una red de distribución urbana de mercaderías perecederas, usando técnicas computacionales evolutivas Miguel, Fabio Maximiliano 28 March 2017 (has links) Esta tesis se enmarca en el campo de las Operaciones, un área de las Ciencias de la Administración. El objetivo es el desarrollo y la validación de herramientas tecnológicas para la toma de decisiones en la rama logística de la gestión de la cadena de suministro de la industria alimentaria. Más específicamente, presentamos un novedoso procedimiento inteligente híbrido que ayuda a los responsables de la toma de decisiones a optimizar en un entorno multi-objetivo. Examinamos los modelos habituales de la distribución física de los bienes, clasificándolos según sus principales características. También presentamos los algoritmos evolutivos multi-objetivo que generalmente brindan las soluciones a esos modelos. Nuestro enfoque es introducir una nueva variante multi-objetivo del problema de distribución de bienes en un área urbana. Para modelar la red de centros de distribución, al servicio de los puntos de venta finales de productos, agregamos franjas horarias y otros requisitos. Consideramos la dependencia temporal de los programas óptimos de distribución, a diferencia del caso de los sistemas logísticos de media y larga distancia, para los cuales la distancia es el criterio clave. También agregamos el objetivo de equilibrar cargas entre las diferentes unidades operativas. Una hibridación del algoritmo evolutivo multi-objetivo NSGA-II es nuestra elección de herramienta computacional, junto con el concepto de g-dominación para preferencias parciales, que proporciona la guía informativa en el espacio de búsqueda. Las fases de validación y prueba de este algoritmo utilizan datos del mundo real, comparando sus resultados con los resultados de otros procedimientos evolutivos multi-objetivo utilizados para la solución de problemas complejos de distribución. La información fue proporcionada por un operador logístico, especializado en el transporte y la distribución de cargas fraccionarias. En todos los casos examinados, nuestro algoritmo se desempeñó mejor que los habituales. / This thesis is framed in the field of Operations, an area of Management Science. The goal is the development and validation of technological tools for decision- making in the logistic branch of supply chain management of the food industry. More specifically, we present a novel hybrid intelligent procedure aiding decision- makers optimizing in a multi-objective environment. We examine the usual models of the physical distribution of goods, classifying them according to their main features. We also present the multi-objective evolutionary algorithms that usually yield the solutions to those models. Our approach is to introduce a new multi-objective variant of the distribution problem of goods in an urban area. To model the network of distribution centers, serving the final outlets of goods, we add time frames and other requirements. We consider the time dependence of the optimal programs of distribution, unlike the case of medium and long-distance logistical systems, for which the distance is the key criterion. We also add the objective of balancing loads among the different operating units. A hybridation of the multi-objective evolutionary algorithm NSGA-II is our choice of computational tool, jointly with the concept of g-dominance for partial preferences, which provides the informational guide in the search space. The validation and testing phases of this algorithm uses real-world data, comparing its outcomes to the results of other evolutionary multi-objective procedures used for the solution of complex problems of distribution. The information was provided by a logistic operator, specialized in transporting and distributing fractional loads. In all the cases examined, our algorithm performed better than the usual ones. Ciencias administrativas Logística Distribución urbana de mercadería Algoritmos evolutivos multi-objetivos Transporte de alimentos
50	[en] NEUROEVOLUTIONARY MODELS WITH ECHO STATE NETWORKS APPLIED TO SYSTEM IDENTIFICATION / [pt] MODELOS NEUROEVOLUCIONÁRIOS COM ECHO STATE NETWORKS APLICADOS À IDENTIFICAÇÃO DE SISTEMAS PAULO ROBERTO MENESES DE PAIVA 11 January 2019 (has links) [pt] Através das técnicas utilizadas em Identificação de Sistemas é possível obter um modelo matemático para um sistema dinâmico somente a partir de dados medidos de suas entradas e saídas. Por possuírem comportamento naturalmente dinâmico e um procedimento de treinamento simples e rápido, o uso de redes neurais do tipo Echo State Networks (ESNs) é vantajoso nesta área. Entretanto, as ESNs possuem hiperparâmetros que devem ser ajustados para que obtenham um bom desempenho em uma dada tarefa, além do fato de que a inicialização aleatória de pesos da camada interna destas redes (reservatório) nem sempre ser a ideal em termos de desempenho. Por teoricamente conseguirem obter boas soluções com poucas avaliações, o AEIQ-R (Algoritmo Evolutivo com Inspiração Quântica e Representação Real) e a estratégia evolucionária com adaptação da matriz de covariâncias (CMA-ES) representam alternativas de algoritmos evolutivos que permitem lidar de maneira eficiente com a otimização de hiperparâmetros e/ou pesos desta rede. Sendo assim, este trabalho propõe um modelo neuroevolucionário que define automaticamente uma ESN para aplicações de Identificação de Sistemas. O modelo inicialmente foca na otimização dos hiperparâmetros da ESN utilizando o AEIQ-R ou o CMA-ES, e, num segundo momento, seleciona o reservatório mais adequado para esta rede, o que pode ser feito através de uma segunda otimização focada no ajuste de alguns pesos do reservatório ou por uma escolha simples baseando-se em redes com reservatórios aleatórios. O método proposto foi aplicado a 9 problemas benchmark da área de Identificação de Sistemas, apresentando bons resultados quando comparados com modelos tradicionais. / [en] Through System Identification techniques is possible to obtain a mathematical model for a dynamic system from its input/output data. Due to their intrinsic dynamic behavior and simple and fast training procedure, the use of Echo State Networks, which are a kind of neural networks, for System Identification is advantageous. However, ESNs have global parameters that should be tuned in order to improve their performance in a determined task. Besides, a random reservoir may not be ideal in terms of performance. Due to their theoretical ability of obtaining good solutions with few evaluations, the Real Coded Quantum-Inspired Evolutionary Algorithm (QIEA-R) and the Covariance Matrix Adaptation Evolution Strategy (CMA-ES) represent efficient alternatives of evolutionary algorithms for optimizing ESN global parameters and/or weights. Thus, this work proposes a neuro-evolutionary method that automatically defines an ESN for System Identification problems. The method initially focuses in finding the best ESN global parameters by using the QIEA-R or the CMA-ES, then, in a second moment, in selecting its best reservoir, which can be done by a second optimization focused on some reservoir weights or by doing a simple choice based on networks with random reservoirs. The method was applied to 9 benchmark problems in System Identification, showing good results when compared to traditional methods. [pt] ECHO STATE NETWORKS [en] ECHO STATE NETWORKS [pt] IDENTIFICACAO DE SISTEMAS [en] SYSTEM IDENTIFICATION [pt] ALGORITMOS EVOLUTIVOS [en] EVOLUTIONARY ALGORITHMS [pt] ESTRATEGIAS EVOLUCIONARIAS [en] EVOLUTION STRATEGIES

Search results