Spelling suggestions: "subject:"sistemes"" "subject:"epistemes""
211 |
Propuesta de un método de validación de esquemas conceptuales y análisis comparativo de la noción de información en los métodos de desarrollo de sistemas de informaciónSesé, Feliciano 16 February 2007 (has links)
Las técnicas de modelado conceptual son un componente esencial en un gran número de métodos de desarrollo de sistemas de información. Sin embargo,normalmente dedican muy poca --o ninguna atención al problema de la validación del esquema conceptual.En este trabajo se explora una técnica que, partiendo del esquema conceptual, permite realizar especificaciones del sistema de información que son formales e inteligibles para los usuarios. La técnica que se propone está basada en la axiomatización de los formularios de empresa. Para ello, se define una gramática que permite expresar mediante fórmulas los formularios de empresa y se presenta un procedimiento que permite transformar el esquema conceptual en fórmulas de dicha gramática. El esquema conceptual así transformado representa el conjunto de axiomas del cálculo que, mediante un conjunto de reglas de inferencia que se proponen, permite obtener, como teoremas del cálculo, los formularios que utilizará el usuario. De esta manera, el usuario puede validar el esquema conceptual a través de los formularios que utilizará, y además se consigue una especificación formal del sistema a construir que los programadores no malinterpretarán.Para comparar la propuesta con otras aproximaciones al problema, se estudian propuestas concretas de las áreas de la ingeniería del software, la ingeniería ontológica, el diseño ontológico, el modelado conceptual, la normalización de bases de datos y los métodos formales de especificación de sistemas. Se muestra que las posiciones que mantienen dichas propuestas respecto a la noción de información son distintas y en algunos casos contradictorias. Para mostrar esto, se estudian las diferentes posiciones que han mantenido a lo largo de la historia distintos filósofos frente a la noción de información.Una comprensión más profunda de las premisas filosóficas que se asumen, normalmente de manera implícita, en los distintos métodos, puede ayudar a la elección del método apropiado a cada tipo de problemas que se presenta durante el desarrollo de sistemas de información y además puede ayudar a comprender la génesis filosófica de las distintas técnicas de desarrollo. / Les tècniques de modelatge conceptual són un component essencial en un gran nombre de mètodes de desenvolupament de sistemes d'informació. No obstant això, normalment dediquen molt poca, o cap, atenció al problema de la validació de l'esquema conceptual.En aquest treball s'explora una tècnica que, partint de l'esquema conceptual, permet realitzar especificacions del sisstema d'informació que són formals i intel.ligibles per als usuaris. La tècnica que es proposa està basada en l'axiomatització dels formularis d'empresa. Per a això es defineix una gramàtica que permet expressar mitjançant fórmules els formularis d'empresa i es presenta un procediment que permet transformar l'esquema conceptual en fórmules d'aquesta gramàtica. L'esquema conceptual així transformat representa el conjunt d'axiomes del càlcul que, mitjançant un conjunt de regles d'inferència que es proposen, permet obtenir, com a teoremes del càlcul, els formularis que utilitzarà l'usuari. D'aquesta manera, l'usuari pot validar l'esquema conceptual a través dels formularis que utilitzarà i , a més, s'aconsegueix una especificació formal del sistema a construir que els programadors no malinterpretaran.Per a comparar la proposta amb altres aproximacions al problema, s'han revisat mètodes concrets de les àrees de l'enginyeria del software, l'enginyeria ontològica, el disseny ontològic, el modelatge conceptual, la normalització de bases de dades i els mètodes formals d'especificació de sistemes. En aquest treball es mostra que les posicions que mantenen aquestes propostes respecte a la noció d'informació són diferents i en alguns casos contradictòries. Per a mostrar això s'estudien les diferents posicions que han mantingut, al llarg de la història, distints filòsofs sobre la noció d'informació.Una comprensió més profunda de les premises filosòfiques que assumeixen, normalment de manera implícita, els distints mètodes, pot ajudar a l'elecció del mètode apropiat per a cada tipus de problema que es presenta durant el desenvolupament de sistemes d'informació i a més pot ajudar a comprendre la gènesi filosòfica de les diferents tècniques de desenvolupament. / Misunderstanding system requirements is one of the main causes of failure when developing corporate information systems. Requirements engineering tackles this problem in two ways: (1) by getting users to validate the system requirements; and (2) by formally specifying requirements to ensure that programmers do not misinterpret specifications. However, some authors argue that it is impossible to both formally state requirements in a way that cannot be misinterpreted by programmers and to make the specifications intelligible to the users performing the validation.The techniques used by conceptual modelling are an essential component in many development methods for Information Systems (IS). However, such techniques usually pay little or no attention to the problem of validating the conceptual schema. This paper explores a technique that is based upon a conceptual schema to draw up IS specifications that are both formally stated and intelligible to users. The technique is based on reducing company forms to axioms. For this purpose, a grammar is defined to express a company's forms as formulae. A procedure then turns the conceptual schema into formulae employing this grammar. The transformed conceptual schema thus represents the calculus axioms. A set of inference rules are then applied to obtain the forms (stated as calculus theorems) to be employed by users. This allows users to validate the conceptual schema through the forms they work with whilst also achieving a formal specification of the system that programmers cannot misinterpret.Specific proposals in software engineering, ontological engineering, ontological design, conceptual modelling, normalisation of data bases, and formal system specification of methods were compared with the proposed approach. It is shown that the alternative approaches to the one put forward reveal different and occasionally contradictory concepts as to what constitutes information.A deeper grasp of the philosophical premises (frequently taken for granted) underlying the various methods will: (1) help make the right choices for tackling a given problem in IS development (2) foster understanding of the philosophical roots of the various development techniques.
|
212 |
Contribució al coneixement de variables geoambientals en l'àmbit de la Costa Brava (Girona)Geis Nielsen, Christian 28 June 2005 (has links)
La tesi doctoral desenvolupada, emmarcada dins del camp de les Ciències Ambientals, aplica la Geologia Ambiental orientada al coneixement dels processos i recursos geològics de cara a la planificació i a l'ordenació del territori. Com a zona d'estudi s'ha seleccionat la Costa Brava meridional, concretament tota l'àrea litoral compresa per les conques hidrogràfiques de l'Aubi, riera de Calonge, Ridaura, riera de Tossa i riera de Lloret (75 km de línia de costa i una extensió de 291 km2).Aquest treball, amb l'aptitud integradora dels conceptes i mètodes propis de les Ciències Geològiques i Ambientals, s'ha proposat com a objectius globals l'anàlisi de la qualitat i del comportament físic i químic dels materials terrestres en front les accions humanes i de la seva utilització com a recursos; l'estudi dels processos naturals i de la influència que puguin tenir sobre l'home o bé els efectes que aquest pot causar sobre aquells, i per últim, com a derivació dels anteriors, el disseny i aplicació d'instruments de tipus preventiu en la gestió del territori; és a dir, la planificació dels usos del territori.Amb la filosofia de recerca basada en que els factor geològics són uns elements d'ajuda per a la visió integral d'un territori, s'han estudiat diferents variables geoambientals procurant traduir el coneixement del medi en informació apta per a la presa de decisions sobre l'ús i preservació d'aquest àmbit litoral. Els Sistemes d'Informació Geogràfica (SIG) han estat clau per a la visió sistèmica del territori, per a la integració de les diferents variables geoambientals, així com per a la producció cartogràfica temàtica i final. Pel que fa als processos geològics, lligats a la dinàmica fluviotorrencial, s'han cartografiat les principals àrees d'actuació així com analitzat els factors que inicien, afavoreixen o magnifiquen la seva ocurrència. S'han estudiat les accions denudatives, els processos de transport-sedimentació i amb l'estudi integrat d'aquests processos i formes resultants s'han identificat unitats territorials caracteritzades per un comportament geomòrfic uniforme.En quant a l'anàlisi dels recursos geològics s'ha aprofundit en el coneixement dels recursos hídrics subterranis, les roques industrials i els georecursos litorals. Pel que fa als primers s'ha centrat en la delimitació de les principals unitats i subunitats aqüíferes, així com en acotar les geometries i principals característiques hidràuliques. Pel que fa als àrids i roques de construcció l'objectiu fonamental ha estat la delimitació cartogràfica d'aquells materials que per les seves propietats fisicoquímiques són potencialment aptes per als usos indicats. Finalment s'ha fet una recerca orientada a l'estudi de factors que limiten o condicionen el potencial geoturístic d'aquesta àrea litoral, concretament en els penya-segats i les platges.Les principals aportacions d'aquesta tesi doctoral es poden emmarcar en l'àmbit regional i fenomenològic, aspectes clau en la gestió i planificació territorial. Pel que fa al primer, destaquem l'aportació de dades geoambientals a nivell cartogràfic en relació a variables litoestructurals, de processos dinàmics com de recursos geològics. Des del punt de vista de l'àmbit fenomenològic destaquem la interacció de les variables estudiades a nivell de conca hidrogràfica, com són, entre d'altres, les relacions existents entre les diferents formacions aqüíferes; la possible participació de les aigües subterrànies en la resposta hidrològica del sistema fluviotorrencial, o la problemàtica derivada de l'antropització de la sorra de la platja com a conseqüència d'abocaments de terres i residus inerts als marges de les rieres. / La tesis doctoral desarrollada, enmarcada dentro del campo de las Ciencias Ambientales, aplica la Geología Ambiental orientada al conocimiento de los procesos y recursos geológicos para la planificación y ordenación del territorio. Como zona de estudio se ha seleccionado la Costa Brava meridional, concretamente toda el área litoral comprendida por las cuencas hidrográficas de la Aubi, riera de Calonge, Ridaura, riera de Tossa y riera de Lloret (75 km de línea de costa y una extensión de 291 km2).Este trabajo, con la aptitud integradora de los conceptos y métodos propios de las Ciencias Geológicas y Ambientales, se ha propuesto como objetivos globales el análisis de la calidad y del comportamiento físico y químico de los materiales terrestres en frente las acciones humanas y de su utilización como recursos; el estudio de los procesos naturales y de la influencia que puedan tener sobre el hombre o bien los efectos que este puede causar sobre aquellos, y por último, como derivación de los anteriores, el diseño y aplicación de instrumentos de tipo preventivo en la gestión del territorio; es decir, la planificación de los usos del territorio. Con la filosofía de investigación basada en que los factores geológicos son unos elementos de ayuda para la visión integral de un territorio, se han estudiado diferentes variables geoambientales procurando traducir el conocimiento del medio en información apta para la toma de decisiones sobre el uso y preservación de este ámbito litoral. Los Sistemas de Información Geográfica (SIG) han sido clave para la visión sistémica del territorio, para la integración de las diferentes variables geoambientales, así como para la producción cartográfica temática y final.Con respecto a los procesos geológicos, relacionados con la dinámica fluviotorrencial, se han cartografiado las principales áreas de actuación así como analizado los factores que inician, favorecen o magnifican su ocurrencia. Se han estudiado las acciones denudativas, los procesos de transporte-sedimentación y con el estudio integrado de estos procesos y formas resultantes se han identificado unidades territoriales caracterizadas por un comportamiento geomórfico uniforme.En cuanto al análisis de los recursos geológicos se ha profundizado en el conocimiento de los recursos hídricos subterráneos, las rocas industriales y los georecursos litorales. Con respecto a los primeros nos hemos centrado en la delimitación de las principales unidades y subunidades acuíferas, así como en acotar las geometrías y principales características hidráulicas. Con respecto a los áridos y rocas de construcción el objetivo fundamental ha sido la delimitación cartográfica de aquellos materiales que por sus propiedades fisicoquímicas son potencialmente aptas para los usos indicados. Finalmente se ha hecho un estudio orientado a los factores que limitan o condicionan el potencial geoturístico de esta área litoral, concretamente en los acantilados y las playas.Las principales aportaciones de esta tesis doctoral se pueden enmarcar en el ámbito regional y fenomenológico, aspectos clave en la gestión y planificación territorial. Con respecto al primero, destacamos la aportación de datos geoambientales a nivel cartográfico de variables litoestructurales, de procesos dinámicos i de recursos geológicos. Desde el punto de vista del ámbito fenomenológico destacamos la interacción de las variables estudiadas a nivel de cuenca hidrográfica, como son, entre otras, las relaciones existentes entre las diferentes formaciones acuíferas; la posible participación de las aguas subterráneas en la respuesta hidrológica del sistema fluviotorrencial, o la problemática derivada de la antropización de la arena de la playa como consecuencia de vertidos de tierras y residuos inertes a los márgenes de las rieras. / This thesis developed is framed within the scope of the Environmental Sciences. Environmental Geology is applied to understand the geological processes and resources that take place in the area, thus enhancing the management of the territory. All the littoral area within the hydrographical basins of the Aubi, riera de Calonge, Ridaura, riera de Tossa and riera de Lloret (75 km of coast line and an extension of 291 sq.km), a good part of the southern Costa Brava, has been selected as the study zone.This work, with its ability to integrate the concepts and methods of the Environmental and Geological Sciences, has three main objectives: the analysis of the quality and the physical and chemical behaviour of the terrestrial materials in front of human actions and its utilization as resources; the study of the natural processes and the influences that they have on the antropic activity, or the effects that this can cause on those; and as a derivation of the previous objectives, the design and application of preventive instruments for the management of the territory, that is to say, the planning of the uses of the territory.Considering geological factors as helping elements to achieve an integral vision of a territory, different geoenvironmental variables have been studied. It has been tried to translate the acquired knowledge into information which could be used by the planners of this coastal environment for their decision making process. The Geographical Information Systems (GIS) have been a key factor to keep a systemic vision of the territory. They have also made possible the integration of the different geoenvironmental variables, as well as the cartographic production.With regard to the geological processes related to the fluviotorrencial dynamics, the main areas of their action have been mapped. The factors that initiate, favor or increase their occurrence have been analysed as well. The denudation actions, processes of transportation and sedimentation have also been studied. With the integrated study of all these processes and resultant forms, several territorial units characterized by a uniform geomorphic behaviour have been identified.With the analysis of the geological resources, we have contributed to the knowledge of the subterranean water resources, the industrial rocks and the coastal georesources. With regard to the first item we have put most of our efforts in the delimitation of the main aquifer units and subunits, as well as in the study of their geometries and their main hydraulic characteristics. With regard to the mining activity, the fundamental objective has been the cartographic delimitation of those materials which, by their physiochemical properties, are potentially apt for the indicated uses. Finally a study oriented to the factors that limit or condition the geotouristic potential of this littoral area has been done, specifically at the cliffs and in the beaches.The main contributions of this thesis can be framed in regional and phenomenological fields, both of which are key aspects in management and territorial planning. With respect to the regional ones, we would like to emphasize the contribution of geoenvironmental cartographic data related to litostructural variables, dynamic processes or geological resources. Considering the phenomenological aspects we would like to highlight the interaction of the variables inside the hydrographical basins, like the existing relations among the different aquifer formations; the possible participation of groundwater in the hydrologic response of the fluviotorrencial system, or the quality losses of the sand of the beach as a result of the rubble dumping on the creek's margins.
|
213 |
Representació qualitativa asíncrona de senyals per a la supervisió de sistemes dinàmicsColomer, Joan (Colomer Llinàs) 28 July 1998 (has links)
L'objectiu general d'aquest treball és trobar i mostrar una eina que permeti obtenir unarepresentació dels senyals procedents de sistemes dinàmics adequada a les necessitatsdels sistemes de Supervisió Experta de processos. Aquest objectiu general es pot subdividir en diverses parts, que són tractades en els diferents capítols que composen el treball i que es poden resumir en els següents punts:En primer lloc, cal conèixer les necessitats dels sistemes de Supervisió: La gran quantitat de dades que provenen dels processos fa necessari el tractament d'aquestes dades per obtenir-ne d'altres, més elaborades, amb un nivell més elevat de representació.La utilització de raonament qualitatiu, pròpia dels éssers humans, comporta la necessitat de representar simbòlicament els senyals, de traduir les dades numèriques en símbols.La Supervisió de sistemes dinàmics comporta que el temps sigui una variable fonamental, la asincronia dels esdeveniments significatius per a la Supervisió fa que les representacions més adequades i útils dels senyals siguinasíncrones. Finalment,l'ús dels coneixements experimentals en la Supervisió dels processos comporta que les representacions més naturals siguin les més útils.Aquestes necessitats fan de la representació dels senyals mitjançant episodis l'eina amb més possibilitats per assolir els objectius que es volen assolir. Per això, es presenta un formalisme que permet descriure i incloure-hi la formalització i les diferents aproximacions a aquest tipus de representació ja existents i, al mateix temps, augmentar-ne la significació a través de característiques dels senyals que noes tenen en compte en les aproximacions ja existents.El següent pas és aprofitar el nou formalisme per obtenir una nova representació amb un grau més gran de significació, cosa que s'aconsegueix representant explícitament les discontinuïtats i els períodes estacionaris o d'estabilitat, moltsignificatius en Supervisió de processos.Un problema sempre present en el tractament de senyals és el soroll que els afecta. Per aquest motiu es presenta un mètode que permet filtrar el soroll de manera que les representacions resultants quedin afectades el mínim possible per aquest tractament.Finalment, es presenta l'aplicació en línia de les eines descrites. La representació en línia dels senyals comporta el tractament de la incertesa inherent al coneixement parcial del senyal (un episodi no pot ser determinat i caracteritzat completament fins que no s'acaba). L'obtenció de resultats amb determinats graus de certesa és perfectament coherent amb la seva utilització posterior mitjançant Sistemes Expertso altres eines de la IA. Totes les aportacions del treball vénen acompanyades d'exemples i/o aplicacions que permeten observar-ne la utilitat i les limitacions.
|
214 |
Desenvolupament de nous mètodes per a la resolució d'equacions i sistemes d'equacions no lineals i AplicacionsTeruel Ferragud, Carles 10 September 2018 (has links)
La necesidad de resolver ecuaciones y sistemas de ecuaciones no lineales surge de manera natural en discretizar las ecuaciones integro-diferenciales que modelan los problemas de los que se encargan las diferentes ramas de las ciencias y la ingeniería. Actualmente, se puede hacer uso de los ordenadores como herramientas para facilitar todas las tareas en torno a su resolución. Con la mejora de los dispositivos, el desarrollo de las técnicas de computación y la aritmética de precisión variable, se ha generalizado la demanda de métodos iterativos que resuelvan de forma rápida y eficiente las ecuaciones y sistemas de ecuaciones. El Análisis Numérico es la rama de las matemáticas que responde a estos requerimientos. En este trabajo trataremos algunos aspectos de interés de esta área. En concreto, mostraremos una aproximación de la derivada que nos permita modificar un resultado para obtener métodos de orden p+2 a partir de otras de orden p, de modo que se mantengan las propiedades de convergencia y estudiaremos la mejora de la eficiencia de esta técnica, debido al menor número de evaluaciones funcionales, aplicada a métodos de diferente orden. Otro resultado se ha alcanzado generalizando el método de Sharma, y generando así familias de métodos de orden 4 óptimos y de orden 6; con el estudio del número de operaciones obtendremos los dos métodos más eficientes de la familia de los que estudiaremos su dinámica. Otra línea de investigación consiste en el estudio de las diversas estrategias para aproximar el cálculo de las jacobiana, así los operadores de diferencias divididas han contribuido a estos objetivos. Nosotros hemos desarrollado un operador de diferencias divididas que, a pesar de ser más sencillo que otros ya conocidos, conserva las propiedades de convergencia de los métodos con derivadas. Posteriormente hemos adaptado las familias de métodos de orden 4 y 6 para ecuaciones con raíces múltiples obteniendo también métodos libres de derivadas aplicando el operador en diferencias divididas anteriores. A continuación hemos considerado hemos realizado el estudio del comportamiento dinámico de ciertos métodos aplicados sobre el problema de los N cuerpos. Finalmente hemos obtenido ciertos resultados referentes a la convergencia semilocal. Los resultados teóricos se han contrastado con diversas experiencias numéricas. / The need to solve equations and systems of nonlinear equations arises naturally in discretizing the integro-differential equations that model the problems that are responsible for the different branches of science and engineering. Currently, computers can be used as tools to facilitate all tasks related to their resolution. With the improvement of the devices, the development of computing techniques and variable accuracy arithmetic, the demand for iterative methods has been generalized to solve the equations and equation systems quickly and efficiently. Numerical Analysis is the branch of mathematics that meets these requirements. In this paper we will discuss some aspects of interest in this area. In particular, we will show an approximation of the derivative that allows us to modify a result to obtain methods of order p+2 from others of order p, so that the convergence properties are maintained and we will study the improvement of the efficiency of this technique, due to the smallest number of functional evaluations, applied to methods of different order. Another result has been achieved by generalizing the Sharma method, and thus constructing families of order 4 optimal and order methods 6; With the study of the number of operations, we will obtain the two most efficient methods of the family from which we will study its dynamics. Another line of research consists in the study of the various strategies to approximate the calculation of the Jacobins, thus the operators of divided differences have contributed to these objectives. We have developed a divided difference operator that, while being simpler than other ones already known, maintains the convergence properties of methods with derivatives. Later we have adapted families of order methods 4 and 6 for equations with multiple roots, also obtaining derivative free methods by applying the operator in previous divided differences. Below we have considered that we have done the study of the dynamic behavior of certain methods applied to the problem of the N-bodies. Finally we have obtained certain results referring to semilocal convergence. The theoretical results have been contrasted with several numerical experiences. / La necessitat de resoldre equacions i sistemes d'equacions no lineals sorgeix de manera natural en discretitzar les equacions integrodiferencials que modelen els problemes dels quals s'encarreguen les diferents branques de les ciències i l'enginyeria. Actualment, es pot fer ús dels ordinadors com a eines per facilitar totes les tasques entorn a la seua resolució. Amb la millora dels dispositius, el desenvolupament de les tècniques de computació i l'aritmètica de precisió variable, s'ha generalitzat la demanda de mètodes iteratius que resolguen de forma ràpida i eficient les equacions i sistemes d'equacions. L'Anàlisi Numèrica és la branca de les matemàtiques que respon a aquestos requeriments. En aquest treball tractarem alguns aspectes d'interés d'aquesta àrea. En concret, mostrarem una aproximació de la derivada que ens permeta modificar un resultat per obtenir mètodes d'ordre p+2 a partir d'altres d'ordre p, de manera que es mantinguen les propietats de convergència i estudiarem la millora de l'eficiència d'aquesta tècnica, degut al menor nombre d'avaluacions funcionals, aplicada a mètodes de diferent ordre. Un altre resultat s'ha assolit generalitzant el mètode de Sharma, i construint així famílies de mètodes d'ordre 4 òptims i d'ordre 6; amb l'estudi del nombre d'operacions obtindrem els dos mètodes més eficients de la família dels quals estudiarem la seua dinàmica. Una altra línia d'investigació consisteix en l'estudi de les diverses estratègies per aproximar el càlcul de les jacobianes, així els operadors de diferències dividides han contribuït a aquests objectius. Nosaltres hem desenvolupat un operador de diferències dividides que, tot i ser més senzill que d'altres ja coneguts, manté les propietats de convergència dels mètodes amb derivades . Posteriorment hem adaptat les famílies de mètodes d'ordre 4 i 6 per a equacions amb arrels múltiples obtenint també mètodes lliures de derivades aplicant l'operador en diferències dividides anteriors. A continuació hem considerat hem realitzat l'estudi del comportament dinàmic de certs mètodes aplicats sobre el problema dels N cossos. Finalment hem obtingut certs resultats referents a la convergència semilocal. Els resultats teòrics s'han contrastat amb diverses experiències numèriques. / Teruel Ferragud, C. (2018). Desenvolupament de nous mètodes per a la resolució d'equacions i sistemes d'equacions no lineals i Aplicacions [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/107325
|
215 |
Scalable Reinforcement Learning for Formation Control with Collision Avoidance : Localized policy gradient algorithm with continuous state and action space / Skalbar Förstärkande Inlärning för Formationskontroll med Kollisionsundvikande : Lokaliserad policygradientalgoritm med kontinuerligt tillstånds och handlingsutrymmeMatoses Gimenez, Andreu January 2023 (has links)
In the last decades, significant theoretical advances have been made on the field of distributed mulit-agent control theory. One of the most common systems that can be modelled as multi-agent systems are the so called formation control problems, in which a network of mobile agents is controlled to move towards a desired final formation. These problems additionally pose practical challenges, namely limited access to information about the global state of the system, which justify the use distributed and localized approaches for solving the control problem. The problem is further complicated if partial or no information is known about the dynamic model of the system. A widely used fundamental challenge of this approach in this setting is that the state-action space size scales exponentially with the number of agents, rendering the problem intractable for a large networks. This thesis presents a scalable and localized reinforcement learning approach to a traditional multi-agent formation control problem, with collision avoidance. A scalable reinforcement learning advantage actor critic algorithm is presented, based on previous work in the literature. Sub-optimal bounds are calculated for the accumulated reward and policy gradient localized approximations. The algorithm is tested on a two dimensional setting, with a network of mobile agents following simple integrator dynamics and stochastic localized policies. Neural networks are used to approximate the continuous value functions and policies. The formation control with collisions avoidance formulation and the algorithm presented show good scalability properties, with a polynomial increase in the number of function approximations parameters with number of agents. The reduced number of parameters decreases learning time for bigger networks, although the efficiency of computation is decreased compared to state of the art machine learning implementations. The policies obtained achieve probably safe trajectories although the lack of dynamic model makes it impossible to guarantee safety. / Under de senaste decennierna har betydande framsteg gjorts inom området för distribuerad mulit-agent reglerteori. Ett av de vanligaste systemen som kan modelleras som multiagentsystem är de så kallade formationskontrollproblemen, där ett nätverk av mobila agenter styrs för att röra sig mot en önskad slutlig formation. om systemets globala tillstånd, vilket motiverar användningen av distribuerade och lokaliserade tillvägagångssätt för att lösa det reglertekniska problemet. Problemet kompliceras ytterligare om delvis eller ingen information är känd om systemets dynamiska modell. Ett allmänt använt tillvägagångssätt för modellfri kontroll är reinforcement learning (RL). En grundläggande utmaning med detta tillvägagångssätt i den här miljön är att storleken på state-action utrymmet skalas exponentiellt med antalet agenter, vilket gör problemet svårlöst för ett stort nätverk. Detta examensarbete presenterar en skalbar och lokaliserad reinforcement learning metod på ett traditionellt reglertekniskt problem med flera agenter, med kollisionsundvikande. En reinforcement learning advantage actor critic algoritm presenteras, baserad på tidigare arbete i litteraturen. Suboptimala gränser beräknas för den ackumulerade belönings- och policygradientens lokaliserade approximationer. Algoritmen testas i en tvådimensionell miljö, med ett nätverk av mobila agenter som följer enkel integratordynamik och stokastiska lokaliserade policyer. Neurala nätverk används för att approximera de kontinuerliga värdefunktionerna och policyerna. Den presenterade formationsstyrningen med kollisionsundvikande formulering och algoritmen visar goda skalbarhetsegenskaper, med en polynomisk ökning av antalet funktionsapproximationsparametrar med antalet agenter. Det minskade antalet parametrar minskar inlärningstiden för större nätverk, även om effektiviteten i beräkningen minskar jämfört med avancerade maskininlärningsimplementeringar. De erhållna policyerna uppnår troligen säkra banor även om avsaknaden av dynamisk modell gör det omöjligt att garantera säkerheten. / En las últimas décadas, se han realizado importantes avances teóricos en el campo de la teoría del control multiagente distribuido. Uno de los sistemas más comunes que se pueden modelar como sistemas multiagente son los llamados problemas de control de formación, en los que se controla una red de agentes móviles para alcanzar una formación final deseada. Estos problemas plantean desafíos prácticos como el acceso limitado a la información del estado global del sistema, que justifican el uso de algoritmos distribuidos y locales para resolver el problema de control. El problema se complica aún más si solo se conoce información parcial o nada sobre el modelo dinámico del sistema. Un enfoque ampliamente utilizado para el control sin conocimiento del modelo dinámico es el reinforcement learning (RL). Un desafío fundamental de este método en este entorno es que el tamaño de la acción y el estado aumenta exponencialmente con la cantidad de agentes, lo que hace que el problema sea intratable para una red grande. Esta tesis presenta un algoritmo de RL escalable y local para un problema tradicional de control de formación con múltiples agentes, con prevención de colisiones. Se presenta un algoritmo “advantage actor-”critic, basado en trabajos previos en la literatura. Los límites subóptimos se calculan para las aproximaciones locales de la función Q y gradiente de la política. El algoritmo se prueba en un entorno bidimensional, con una red de agentes móviles que siguen una dinámica de integrador simple y políticas estocásticas localizadas. Redes neuronales se utilizan para aproximar las funciones y políticas de valor continuo. La formulación de del problema de formación con prevención de colisiones y el algoritmo presentado muestran buenas propiedades de escalabilidad, con un aumento polinómico en el número de parámetros con el número de agentes. El número reducido de parámetros disminuye el tiempo de aprendizaje para redes más grandes, aunque la eficiencia de la computación disminuye en comparación con las implementaciones de ML de última generación. Las politicas obtenidas alcanzan trayectorias probablemente seguras, aunque la falta de un modelo dinámico hace imposible garantizar la completa prevención de colisiones. / A les darreres dècades, s'han realitzat importants avenços teòrics en el camp de la teoria del control multiagent distribuït. Un dels sistemes més comuns que es poden modelar com a sistemes multiagent són els anomenats problemes de control de formació, en els què es controla una xarxa d'agents mòbils per assolir una formació final desitjada. Aquests problemes plantegen reptes pràctics com l'accés limitat a la informació de l'estat global del sistema, que justifiquen l'ús d'algorismes distribuïts i locals per resoldre el problema de control. El problema es complica encara més si només es coneix informació parcial sobre el model dinàmic del sistema. Un mètode àmpliament utilitzat per al control sense coneixement del model dinàmic és el reinforcement learning (RL). Un repte fonamental d'aquest mètode en aquest entorn és que la mida de l'acció i l'estat augmenta exponencialment amb la quantitat d'agents, cosa que fa que el problema sigui intractable per a una xarxa gran. Aquesta tesi presenta un algorisme de RL escalable i local per a un problema tradicional de control de formació amb múltiples agents, amb prevenció de col·lisions. Es presenta un algorisme “advantage actor-”critic, basat en treballs previs a la literatura. Els límits subòptims es calculen per a les aproximacions locals de la funció Q i gradient de la política.’ Lalgoritme es prova en un entorn bidimensional, amb una xarxa ’dagents mòbils que segueixen una dinàmica ’dintegrador simple i polítiques estocàstiques localitzades. Xarxes neuronals s'utilitzen per aproximar les funcions i les polítiques de valor continu. La formulació del problema de formació amb prevenció de col·lisions i l'algorisme presentat mostren bones propietats d'escalabilitat, amb un augment polinòmic en el nombre de paràmetres amb el nombre d'agents. El nombre reduït de paràmetres disminueix el temps d'aprenentatge per a les xarxes més grans, encara que l'eficiència de la computació disminueix en comparació amb les implementacions de ML d'última generació. Les polítiques obtingudes aconsegueixen trajectòries probablement segures, tot i que la manca d'un model dinàmic fa impossible garantir la prevenció completa de col·lisions.
|
216 |
Management of industrial wastewater discharges in river basins through agents'argumentationAulinas Masó, Montse 14 October 2009 (has links)
La gestió de l'aigua residual és una tasca complexa. Hi ha moltes substàncies contaminants conegudes però encara moltes per conèixer, i el seu efecte individual o col·lgectiu és difícil de predir. La identificació i avaluació dels impactes ambientals resultants de la interacció entre els sistemes naturals i socials és un assumpte multicriteri. Els gestors ambientals necessiten eines de suport pels seus diagnòstics per tal de solucionar problemes ambientals.Les contribucions d'aquest treball de recerca són dobles: primer, proposar l'ús d'un enfoc basat en la modelització amb agents per tal de conceptualitzar i integrar tots els elements que estan directament o indirectament involucrats en la gestió de l'aigua residual. Segon, proposar un marc basat en l'argumentació amb l'objectiu de permetre als agents raonar efectivament. La tesi conté alguns exemples reals per tal de mostrar com un marc basat amb agents que argumenten pot suportar diferents interessos i diferents perspectives. Conseqüentment, pot ajudar a construir un diàleg més informat i efectiu i per tant descriure millor les interaccions entre els agents. En aquest document es descriu primer el context estudiat, escalant el problema global de la gestió de la conca fluvial a la gestiódel sistema urbà d'aigües residuals, concretament l'escenari dels abocaments industrials. A continuació, s'analitza el sistema mitjançant la descripció d'agents que interaccionen. Finalment, es descriuen alguns prototips capaços de raonar i deliberar, basats en la lògica no monòtona i en un llenguatge declaratiu (answer set programming).És important remarcar que aquesta tesi enllaça dues disciplines: l'enginyeria ambiental (concretament l'àrea de la gestió de les aigües residuals) i les ciències de la computació (concretament l'àrea de la intel·ligència artificial), contribuint així a la multidisciplinarietat requerida per fer front al problema estudiat. L'enginyeria ambiental ens proporciona el coneixement del domini mentre que les ciències de la computació ens permeten estructurar i especificar aquest coneixement. / Wastewater management is a very complex task. There is a high number of known and an increasing number of unknown pollutants whose individual and collective effects are very difficult to predict. Identifying and evaluating the impacts of environmental problems resulting from the interactions between our social system and its natural environment is a multifaceted critical issue. Environmental managers require tools to support their diagnoses for solving these problems. The contributions of this research work are twofold: first, to propose the use of an agent-based modelling approach in order to conceptualize and integrate all elements that are directly or indirectly involved in wastewater management. Second, to propose a framework based on argumentation that allows to reason effectively. The thesis provide some real examples to show that an agent-based argumentation framework can deal with multiple interests and different agents' perspectives and goals. This help to build a more effective and informed dialog in order to better describe the interaction between agents. In this document we first describe the context under study, scaling down the global river basins system to the urban wastewater systems and giving some more details for the specific scenario of industrial wastewater discharges. Then, we analyze the system in describing intelligent agents that interact. Finally, we propose some reasoning and deliberation prototypes by using an argumentation framework founded on non-monotonic logics (i.e. permitting to learn things that were previously not known) and the answer set programming specification language (i.e. a declarative programming language). It is important to remark that this thesis links two disciplines: environmental engineering (specifically the area of wastewater management) and computer science (specifically the area of artificial intelligence), contributing to the required multidsciplinarity needed to confront the complexity of the problem under study. From environmental engineering we obtain the domain knowledge whereas the computer science field permits us to structure and specify this knowledge.
|
217 |
Nuevas metodologías para la asignación de tareas y formación de coaliciones en sistemas multi-robotGuerrero Sastre, José 31 March 2011 (has links)
Este trabajo analiza la idoneidad de dos de los principales métodos de asignación de tareas en entornos con restricciones temporales. Se pondrá de manifiesto que ambos tipos de mecanismos presentan carencias para tratar tareas con deadlines, especialmente cuando los robots han de formar coaliciones. Uno de los aspectos a los que esta tesis dedica mayor atención es la predicción del tiempo de ejecución, que depende, entre otros factores, de la interferencia física entre robots. Este fenómeno no se ha tenido en cuenta en los mecanismos actuales de asignación basados en subastas.
Así, esta tesis presenta el primer mecanismo de subastas para la creación de coaliciones que tiene en cuenta la interferencia entre robots. Para ello, se ha desarrollado un modelo de predicción del tiempo de ejecución y un nuevo paradigma llamado subasta doble. Además, se han propuesto nuevos mecanismos basados en swarm
|
218 |
A Computational Model for the Construction of Knowledge-based Collaborative Learning Distributed ApplicationsCaballé Llobet, Santi 17 September 2008 (has links)
en català:Un camp de recerca important dins del paradigma del Computer-Supported Collaborative Learning (CSCL) és la importància en la gestió eficaç de la informació d'esdeveniments generada durant l'activitat de l'aprenentatge col·laboratiu virtual, per a proporcionar coneixement sobre el comportament dels membres del grup. Aquesta visió és especialment pertinent en l'escenari educatiu actual que passa d'un paradigma tradicional - centrat en la figura d'un instructor magistral - a un paradigma emergent que considera els estudiants com actors centrals en el seu procés d'aprenentatge. En aquest nou escenari, els estudiants aprenen, amb l'ajuda de professors, la tecnologia i els altres estudiants, el que potencialment necessitaran per a desenvolupar les seves activitats acadèmiques o professionals futures.Els principals aspectes a tenir en compte en aquest context són, primer de tot, com dissenyar una plataforma sota el paradigma del CSCL, que es pugui utilitzar en situacions reals d'aprenentatge col·laboratiu complexe i a llarg termini, basades en el model d'aprenentatge de resolució de problemes. I que permet al professor una anàlisi del grup més eficaç així com donar el suport adequat als estudiants quan sigui necessari. En segon lloc, com extreure coneixement pertinent de la col·laboració per donar consciència i retorn als estudiants a nivell individual i de rendiment del grup, així com per a propòsits d'avaluació. L'assoliment d'aquests objectius impliquen el disseny d'un model conceptual d'interacció durant l'aprenentatge col·laboratiu que estructuri i classifiqui la informació generada en una aplicació col·laborativa en diferents nivells de descripció. A partir d'aquesta aproximació conceptual, els models computacionals hi donen resposta per a proporcionar una extracció eficaç del coneixement produït per l'individu i per l'activitat del grup, així com la possibilitat d'explotar aquest coneixement com una eina metacognitiva pel suport en temps real i regulat del procés d'aprenentatge col·laboratiu.A més a més, les necessitats dels entorns CSCL han evolucionat en gran mesura durant els darrers anys d'acord amb uns requisits pedagògics i tecnològics cada cop més exigents. Els entorns d'aprenentatge col·laboratius virtuals ara ja no depenen de grups d'estudiants homogenis, continguts i recursos d'aprenentatge estàtics, ni pedagogies úniques, sinó que exigeixen una forta personalització i un alt grau de flexibilitat. En aquest nou escenari, les organitzacions educatives actuals necessiten estendre's i moure's cap a paradigmes d'ensenyament altament personalitzats, amb immediatesa i constantment, on cada paradigma incorpora el seu propi model pedagògic, el seu propi objectiu d'aprenentatge i incorpora els seus propis recursos educatius específics. Les demandes de les organitzacions actuals també inclouen la integració efectiva, en termes de cost i temps, de sistemes d'aprenentatge llegats i externs, que pertanyen a altres institucions, departaments i cursos. Aquests sistemes llegats es troben implementats en llenguatges diferents, suportats per plataformes heterogènies i distribuïdes arreu, per anomenar alguns dels problemes més habituals. Tots aquests problemes representen certament un gran repte per la comunitat de recerca actual i futura. Per tant, els propers esforços han d'anar encarats a ajudar a desenvolupadors, recercaires, tecnòlegs i pedagogs a superar aquests exigents requeriments que es troben actualment en el domini del CSCL, així com proporcionar a les organitzacions educatives solucions ràpides i flexibles per a potenciar i millorar el rendiment i resultats de l'aprenentatge col·laboratiu. Aquesta tesi proposa un primer pas per aconseguir aquests objectius. / An important research topic in Computer Supported Collaborative Learning (CSCL) is to explore the importance of efficient management of event information generated from group activity in collaborative learning practices for its further use in extracting and providing knowledge on interaction behavior. The essential issue here is first how to design a CSCL platform that can be used for real, long-term, complex collaborative problem solving situations and which enables the instructor to both analyze group interaction effectively and provide an adequate support when needed. Secondly, how to extract relevant knowledge from collaboration in order to provide learners with efficient awareness and feedback as regards individual and group performance and assessment. The achievement of these tasks involve the design of a conceptual framework of collaborative learning interaction that structures and classifies the information generated in a collaborative application at several levels of description. Computational models are then to realize this conceptual approach for an efficient management of the knowledge produced by the individual and group activity as well as the possibility of exploiting this knowledge further as a metacognitive tool for real-time coaching and regulating the collaborative learning process.In addition, CSCL needs have been evolving over the last years accordingly with more and more demanding pedagogical and technological requirements. On-line collaborative learning environments no longer depend on homogeneous groups, static content and resources, and single pedagogies, but high customization and flexibility are a must in this context. As a result, current educational organizations' needs involve extending and moving to highly customized learning and teaching forms in timely fashion, each incorporating its own pedagogical approach, each targeting a specific learning goal, and each incorporating its specific resources. These entire issues certainly represent a great challenge for current and future research in this field. Therefore, further efforts need to be made that help developers, technologists and pedagogists overcome the demanding requirements currently found in the CSCL domain as well as provide modern educational organizations with fast, flexible and effective solutions for the enhancement and improvement of the collaborative learning performance and outcomes. This thesis proposes a first step toward these goals.Índex foliat:The main contribution in this thesis is the exploration of the importance of an efficient management of information generated from group activity in Computer-Supported Collaborative Learning (CSCL) practices for its further use in extracting and providing knowledge on interaction behavior. To this end, the first step is to investigate a conceptual model for data analysis and management so as to identify the many kinds of indicators that describe collaboration and learning and classify them into high-level potential categories of effective collaboration. Indeed, there are more evident key discourse elements and aspects than those shown by the literature, which play an important role both for promoting student participation and enhancing group and individual performance, such as, the impact and effectiveness of students' contributions, among others, that are explored in this work. By making these elements explicit, the discussion model proposed accomplishes high students' participation rates and contribution quality in a more natural and effective way. This approach goes beyond a mere interaction analysis of asynchronous discussion in the sense that it builds a multi-functional model that fosters knowledge sharing and construction, develops a strong sense of community among students, provides tutors with a powerful tool for students' monitoring, discussion regulation, while it allows for peer facilitation through self, peer and group awareness and assessment.The results of the research described so far motivates the development of a computational system as the translation from the conceptual model into a computer system that implements the management of the information and knowledge acquired from the group activity, so as to be efficiently fed back to the collaboration. The achievement of a generic, robust, flexible, interoperable, reusable computational model that meets the fundamental functional needs shared by any collaborative learning experience is largely investigated in this thesis. The systematic reuse of this computational model permits a fast adaptation to new learning and teaching requirements, such as learning by discussion, by relying on the most advanced software engineering processes and methodologies from the field of software reuse, and thus important benefits are expected in terms of productivity, quality, and cost.Therefore, another important contribution is to explore and extend suitable software reuse techniques, such as Generic Programming, so as to allow the computational model to be successfully particularized in as many as situations as possible without losing efficiency in the process. In particular, based on domain analysis techniques, a high-level computational description and formalization of the CSCL domain are identified and modeled. Then, different specific-platform developments that realize the conceptual description are provided. It is also explored a certain level of automation by means of advanced techniques based on Service-Oriented Architectures and Web-services while passing from the conceptual specification to the desired realization, which greatly facilitates the development of CSCL applications using this computational model.Based on the outcomes of these investigations, this thesis contributes with computational collaborative learning systems, which are capable of managing both qualitative and quantitative information and transforming it into useful knowledge for all the implicated parties in an efficient and clear way. This is achieved by both the specific assessment of each contribution by the tutor who supervises the discussion and by rich statistical information about student's participation. This statistical data is automatically provided by the system; for instance, statistical data sheds light on the students' engagement in the discussion forum or how much interest drew the student's intervention in the form of participation impact, level of passivity, proactivity, reactivity, and so on. The aim is to provide both a deeper understanding of the actual discussion process and a more objective assessment of individual and group activity.This information is then processed and analyzed by means of a multivariate statistical model in order to extract useful knowledge about the collaboration. The knowledge acquired is communicated back to the members of the learning group and their tutor in appropriate formats, thus providing valuable awareness and feedback of group interaction and performance as well as may help identify and assess the real skills and intentions of participants. The most important benefit expected from the conceptual model for interaction data analysis and management is a great improvement and enhancement of the learning and teaching collaborative experiences.Finally, the possibilities of using distributed and Grid technology to support real CSCL environments are also extensively explored in this thesis. The results of this investigation lead to conclude that the features provided by these technologies form an ideal context for supporting and meeting demanding requirements of collaborative learning applications. This approach is taken one step further for enhancing the possibilities of the computational model in the CSCL domain and it is successfully adopted on an empirical and application basis. From the results achieved, it is proved the feasibility of distributed technologies to considerably enhance and improve the collaborative learning experience. In particular, the use of Grid computing is successfully applied for the specific purpose of increasing the efficiency of processing a large amount of information from group activity log files.
|
219 |
New Challenges in Learning Classifier Systems: Mining Rarities and Evolving Fuzzy ModelsOrriols Puig, Albert 12 December 2008 (has links)
Durant l'última dècada, els sistemes classificadors (LCS) d'estil Michigan - sistemes d'aprenentatge automàtic que combinen tècniques de repartiment de crèdit i algorismes genètics (AG) per evolucionar una població de classificadors online- han renascut. Juntament amb la formulació dels sistemes de primera generació, s'han produït avenços importants en (1) el disseny sistemàtic de nous LCS competents, (2) la seva aplicació en dominis rellevants i (3) el desenvolupament d'anàlisis teòriques. Malgrat aquests dissenys i aplicacions importants, encara hi ha reptes complexos que cal abordar per comprendre millor el funcionament dels LCS i per solucionar problemes del món real eficientment i escalable.Aquesta tesi tracta dos reptes importants - compartits amb la comunitat d'aprenentatge automàtic - amb LCS d'estil Michigan: (1) aprenentatge en dominis que contenen classes estranyes i (2) evolució de models comprensibles on s'utilitzin mètodes de raonament similars als humans. L'aprenentatge de models precisos de classes estranyes és crític, doncs el coneixement clau sol quedar amagat en exemples d'aquestes, i la majoria de tècniques d'aprenentatge no són capaces de modelar la raresa amb precisió. La detecció de rareses sol ser complicat en aprenentatge online ja que el sistema d'aprenentatge rep un flux d'exemples i ha de detectar les rareses al vol. D'altra banda, l'evolució de models comprensibles és crucial en certs dominis com el mèdic, on l'expert acostuma a estar més interessat en obtenir una explicació intel·ligible de la predicció que en la predicció en si mateixa.El treball present considera dos LCS d'estil Michigan com a punt de partida: l'XCS i l 'UCS. Es pren l'XCS com a primera referència ja que és l'LCS que ha tingut més influencia fins al moment. L'UCS hereta els components principals de l'XCS i els especialitza per aprenentatge supervisat. Tenint en compte que aquesta tesi especialment se centra en problemes de classificació, l'UCS també es considera en aquest estudi. La inclusió de l'UCS marca el primer objectiu de la tesi, sota el qual es revisen un conjunt de punts que van restar oberts en el disseny del sistema. A més, per il·lustrar les diferències claus entre l'XCS i l'UCS, es comparen ambdós sistemes sobre una bateria de problemes artificials de complexitat acotada.L'estudi de com els LCS aprenen en dominis amb classes estranyes comença amb un estudi analític que descompon el problema en cinc elements crítics i deriva models per facetes per cadascun d'ells. Aquesta anàlisi s'usa com a eina per dissenyar guies de configuració que permeten que l'XCS i l'UCS solucionin problemes que prèviament no eren resolubles. A continuació, es comparen els dos LCS amb alguns dels sistemes d'aprenentatge amb més influencia en la comunitat d'aprenentatge automàtic sobre una col·lecció de problemes del món real que contenen classes estranyes. Els resultats indiquen que els dos LCS són els mètodes més robustos de la comparativa. Així mateix, es demostra experimentalment que remostrejar els conjunts d'entrenament amb l'objectiu d'eliminar la presencia de classes estranyes beneficia, en mitjana, el rendiment de les tècniques d'aprenentatge.El repte de crear models més comprensibles i d'usar mecanismes de raonament que siguin similars als humans s'aborda mitjançant el disseny d'un nou LCS per aprenentatge supervisat que combina les capacitats d'avaluació de regles online, la robustesa mostrada pels AG en problemes complexos i la representació comprensible i mètodes de raonament fonamentats proporcionats per la lògica difusa. El nou LCS, anomenat Fuzzy-UCS, s'estudia en detall i es compara amb una bateria de mètodes d'aprenentatge. Els resultats de la comparativa demostren la competitivitat del Fuzzy-UCS en termes de precisió i intel·ligibilitat dels models evolucionats. Addicionalment, s'usa Fuzzy-UCS per extreure models de classificació acurats de grans volums de dades, exemplificant els avantatges de l'arquitectura d'aprenentatge online del Fuzzy-UCS.En general, les observacions i avenços assolits en aquesta tesi contribueixen a augmentar la comprensió del funcionament dels LCS i en preparar aquests tipus de sistemes per afrontar problemes del món real de gran complexitat. Finalment, els resultats experimentals ressalten la robustesa i competitivitat dels LCS respecte a altres mètodes d'aprenentatge, encoratjant el seu ús per tractar nous problemes del món real. / Durante la última década, los sistemas clasificadores (LCS) de estilo Michigan - sistemas de aprendizaje automático que combinan técnicas de repartición de crédito y algoritmos genéticos (AG) para evolucionar una población de clasificadores online - han renacido. Juntamente con la formulación de los sistemas de primera generación, se han producido avances importantes en (1) el diseño sistemático de nuevos LCS competentes, (2) su aplicación en dominios relevantes y (3) el desarrollo de análisis teóricos. Pese a eso, aún existen retos complejos que deben ser abordados para comprender mejor el funcionamiento de los LCS y para solucionar problemas del mundo real escalable y eficientemente.Esta tesis trata dos retos importantes - compartidos por la comunidad de aprendizaje automático - con LCS de estilo Michigan: (1) aprendizaje en dominios con clases raras y (2) evolución de modelos comprensibles donde se utilicen métodos de razonamiento similares a los humanos. El aprendizaje de modelos precisos de clases raras es crítico pues el conocimiento clave suele estar escondido en ejemplos de estas clases, y la mayoría de técnicas de aprendizaje no son capaces de modelar la rareza con precisión. El modelado de las rarezas acostumbra a ser más complejo en entornos de aprendizaje online, pues el sistema de aprendizaje recibe un flujo de ejemplos y debe detectar las rarezas al vuelo. La evolución de modelos comprensibles es crucial en ciertos dominios como el médico, donde el experto está más interesado en obtener una explicación inteligible de la predicción que en la predicción en sí misma.El trabajo presente considera dos LCS de estilo Michigan como punto de partida: el XCS y el UCS. Se toma XCS como primera referencia debido a que es el LCS que ha tenido más influencia hasta el momento. UCS es un diseño reciente de LCS que hereda los componentes principales de XCS y los especializa para aprendizaje supervisado. Dado que esta tesis está especialmente centrada en problemas de clasificación automática, también se considera UCS en el estudio. La inclusión de UCS marca el primer objetivo de la tesis, bajo el cual se revisan un conjunto de aspectos que quedaron abiertos durante el diseño del sistema. Además, para ilustrar las diferencias claves entre XCS y UCS, se comparan ambos sistemas sobre una batería de problemas artificiales de complejidad acotada.El estudio de cómo los LCS aprenden en dominios con clases raras empieza con un estudio analítico que descompone el problema en cinco elementos críticos y deriva modelos por facetas para cada uno de ellos. Este análisis se usa como herramienta para diseñar guías de configuración que permiten que XCS y UCS solucionen problemas que previamente no eran resolubles. A continuación, se comparan los dos LCS con algunos de los sistemas de aprendizaje de mayor influencia en la comunidad de aprendizaje automático sobre una colección de problemas del mundo real que contienen clases raras.Los resultados indican que los dos LCS son los métodos más robustos de la comparativa. Además, se demuestra experimentalmente que remuestrear los conjuntos de entrenamiento con el objetivo de eliminar la presencia de clases raras beneficia, en promedio, el rendimiento de los métodos de aprendizaje automático incluidos en la comparativa.El reto de crear modelos más comprensibles y usar mecanismos de razonamiento que sean similares a los humanos se aborda mediante el diseño de un nuevo LCS para aprendizaje supervisado que combina las capacidades de evaluación de reglas online, la robustez mostrada por los AG en problemas complejos y la representación comprensible y métodos de razonamiento proporcionados por la lógica difusa. El sistema que resulta de la combinación de estas ideas, llamado Fuzzy-UCS, se estudia en detalle y se compara con una batería de métodos de aprendizaje altamente reconocidos en el campo de aprendizaje automático. Los resultados de la comparativa demuestran la competitividad de Fuzzy-UCS en referencia a la precisión e inteligibilidad de los modelos evolucionados. Adicionalmente, se usa Fuzzy-UCS para extraer modelos de clasificación precisos de grandes volúmenes de datos, ejemplificando las ventajas de la arquitectura de aprendizaje online de Fuzzy-UCS.En general, los avances y observaciones proporcionados en la tesis presente contribuyen a aumentar la comprensión del funcionamiento de los LCS y a preparar estos tipos de sistemas para afrontar problemas del mundo real de gran complejidad. Además, los resultados experimentales resaltan la robustez y competitividad de los LCS respecto a otros métodos de aprendizaje, alentando su uso para tratar nuevos problemas del mundo real. / During the last decade, Michigan-style learning classifier systems (LCSs) - genetic-based machine learning (GBML) methods that combine apportionment of credit techniques and genetic algorithms (GAs) to evolve a population of classifiers online - have been enjoying a renaissance. Together with the formulation of first generation systems, there have been crucial advances in (1) systematic design of new competent LCSs, (2) applications in important domains, and (3) theoretical analyses for design. Despite these successful designs and applications, there still remain difficult challenges that need to be addressed to increase our comprehension of how LCSs behave and to scalably and efficiently solve real-world problems.The purpose of this thesis is to address two important challenges - shared by the machine learning community - with Michigan-style LCSs: (1) learning from domains that contain rare classes and (2) evolving highly legible models in which human-like reasoning mechanisms are employed. Extracting accurate models from rare classes is critical since the key, unperceptive knowledge usually resides in the rarities, and many traditional learning techniques are not able to model rarity accurately. Besides, these difficulties are increased in online learning, where the learner receives a stream of examples and has to detect rare classes on the fly. Evolving highly legible models is crucial in some domains such as medical diagnosis, in which human experts may be more interested in the explanation of the prediction than in the prediction itself.The contributions of this thesis take two Michigan-style LCSs as starting point: the extended classifier system (XCS) and the supervised classifier system (UCS). XCS is taken as the first reference of this work since it is the most influential LCS. UCS is a recent LCS design that has inherited the main components of XCS and has specialized them for supervised learning. As this thesis is especially concerned with classification problems, UCS is also considered in this study. Since UCS is still a young system, for which there are several open issues that need further investigation, its learning architecture is first revised and updated. Moreover, to illustrate the key differences between XCS and UCS, the behavior of both systems is compared % and show that UCS converges quickly than XCS on a collection of boundedly difficult problems.The study of learning from rare classes with LCSs starts with an analytical approach in which the problem is decomposed in five critical elements, and facetwise models are derived for each element. The analysis is used as a tool for designing configuration guidelines that enable XCS and UCS to solve problems that previously eluded solution. Thereafter, the two LCSs are compared with several highly-influential learners on a collection of real-world problems with rare classes, appearing as the two best techniques of the comparison. Moreover, re-sampling the training data set to eliminate the presence of rare classes is demonstrated to benefit, on average, the performance of LCSs.The challenge of building more legible models and using human-like reasoning mechanisms is addressed with the design of a new LCS for supervised learning that combines the online evaluation capabilities of LCSs, the search robustness over complex spaces of GAs, and the legible knowledge representation and principled reasoning mechanisms of fuzzy logic. The system resulting from this crossbreeding of ideas, referred to as Fuzzy-UCS, is studied in detail and compared with several highly competent learning systems, demonstrating the competitiveness of the new architecture in terms of the accuracy and the interpretability of the evolved models. In addition, the benefits provided by the online architecture are exemplified by extracting accurate classification models from large data sets.Overall, the advances and key insights provided in this thesis help advance our understanding of how LCSs work and prepare these types of systems to face increasingly difficult problems, which abound in current industrial and scientific applications. Furthermore, experimental results highlight the robustness and competitiveness of LCSs with respect to other machine learning techniques, which encourages their use to face new challenging real-world applications.
|
220 |
Contributions to Formal Communication Elimination for System Models with Explicit ParallelismBabot Pagès, Francesc Xavier 09 October 2009 (has links)
Els mètodes de verificació formal s'estan usant cada vegada més en la indústria per establir la correctessa i trobar els errors en models de sistemes; per exemple la descripció de hardware, protocols, programes distribuïts, etc. En particular, els verificadors de models ho fan automàticament per sistemes d'estats finits, per-o estan limitats degut al problema de l'explosió d'estats; i la verificació formal interactiva, l'àrea d'aquesta tesi, es necessita.L'enfocament de la verificació automàtica treballa sobre el sistema de transicions del model, el qual defineix la seva semàntica. Aquest sistema de transicions té sovint molts estats, i sempre una mida gran comparada amb la mida del model del sistema, el qual és sempre infinit. Aquestes consideracions suggereixen un enfocament de verificació estàtica com els d'aquesta tesi, evitant els sistemes de transicions, treballant directament sobre el model del sistema, en principi, la complexitat computacional hauria de ser menor. L'enfocament estàtic d'aquest treball es fa sobre models de sistemes expressats en notació imperativa amb paral·lelisme explícit, sentències de comunicacions síncrones i variables d'emmagatzematge locals.Els raonaments d'equivalència són molt empleats per números, matrius i altres camps. Tanmateix, per programes imperatius amb paral·lelisme, comunicacions i variables, encara que potencialment sigui un mètode de verificació molt intuïtiu, no han estat massa explorats. La seqüencialització formal via l'eliminació de comunicacions internes, l'àrea d'aquesta tesi, és una demostració basada en el raonament estàtic d'equivalències que, donat que disminueix la magnitud del vector d'estats, pot complementar altres mètodes de demostració. Es basa en l'aplicació d'un conjunt de lleis , apropiades per tal propòsit, com reduccions de reescriptura del model del sistema. Aquestes depenen de la noció d'equivalència i de les suposicions de justícia.Aquesta tesi contribueix a la quasi inexplorada àrea de l'eliminació de comunicacions formal i seqüencialització de models de sistema. Les lleis estan definides sobre una equivalència feble: equivalència d'interfície. L'eliminació de comunicacions est-a limitada a models sense seleccions, per exemple models en els quals les comunicacions internes no estan dins de l'àmbit de sentències de selecció. Aplicacions interessants existeixen dins d'aquest marc. Les lleis són vàlides només per justícia feble o sense justícia. Aquesta ha estat desenvolupada seguint la semàntica proposada per Manna i Pnueli per a sistemes reactius [MP91, MP95]. S'han formulat les condicions d'aplicabilitat per les lleis de la pròpia eliminació de comunicacions. A més a més, es proposa un procediment de construcció de demostracions per l'eliminació de comunicacions, el qual intenta aplicar automàticament les lleis de la eliminació. També s'ha dissenyat un conjunt de procediments de transformació, els quals garanteixen que la transformació equivalent sempre correspon a l'aplicació d'una seqüència de lleis. Degut a que la construcció de les demostracions és impracticable, normalment impossible, sense l'ajuda d'una eina, s'ha desenvolupat un demostrador interactiu per la construcció semiautomàtica de la seqüencialització de models de sistemes i demostracions d'eliminació. Tant els procediments de transformació com els de l'eliminació de comunicacions estan integrats en l'eina. Amb l'ajuda del demostrador s'ha construït la demostració de seqüencialització d'un model, no trivial, de processador pipeline. Per aquest exemple s'ha assolit una reducció, respecte del model original, de la cota superior del nombre d'estats de 2−672.Malgrat l'enorme quantitat d'esforç dedicat a l'àrea, abans i durant la tesi, encara queda molt treball per a que l'eliminació de comunicacions i la seqüencialització sigui realment un mètode pràctic. No obstant els resultats d'aquesta tesi han establert els fonaments i han donat l'estímul necessari per continuar l'esforç. / Los métodos de verificación formal se están usando cada vez más en la industria para establecer la corrección y encontrar los errores en modelos de sistemas; por ejemplo, la descripción de hardware, protocolos, programas distribuidos, etc. En particular, los verificadores de modelos lo hacen automáticamente para sistemas de estados finitos, pero están limitados debido al problema de la explosión de estados; y la verificación formal interactiva, el área de esta tesis, es necesaria.El enfoque de la verificación automática trabaja sobre el sistema de transiciones del modelo, el cual define su semántica. Este sistema de transiciones tiene a menudo muchos estados, y siempre un tamaño grande comparado con el tamaño del modelo del sistema, el cual es siempre infinito. Estas consideraciones sugieren un enfoque de verificación estática como los de esta tesis, evitando los sistemas de transiciones, trabajando directamente sobre el modelo del sistema, en principio, la complejidad computacional tendría que ser menor. El enfoque estático de este trabajo se lleva a cabo sobre modelos de sistemas expresados en notación imperativa con paralelismo explícito, sentencias de comunicaciones síncronas y variables de almacenamiento locales.Los razonamientos de equivalencia son muy empleados para números, matrices y otros campos. Sin embargo, para programas imperativos con paralelismo, comunicaciones y variables, aún teniendo la potencialidad de ser un método de verificación muy intuitivo, no han sido muy explorados. La secuencialización formal vía la eliminación de comunicaciones internas, el área de esta tesis, es una demostración basada en el razonamiento estático de equivalencias que, ya que disminuye la magnitud del vector de estados, puede complementar otros métodos de demostración. Se basa en la aplicación de un conjunto de leyes, apropiadas para tal propósito, como reducciones de reescritura del modelo del sistema. Éstas dependen de la noción de equivalencia y de las suposiciones de justicia.Esta tesis contribuye a la casi inexplorada área de la eliminación de comunicaciones formal y secuencialización de modelos de sistema. Las leyes están definidas sobre una equivalencia débil: equivalencia de interfaz. La eliminación de comunicaciones está limitada a modelos sin selecciones, por ejemplo modelos en los cuales las comunicaciones internas no están dentro del ámbito de sentencias de selección. Aplicaciones interesantes existen dentro de este marco. Las leyes son válidas sólo para justicia débil o sin justicia. Ésta ha sido desarrollada siguiendo la semántica propuesta por Manna y Pnueli para sistemas reactivos [MP91, MP95]. Se han formulado las condiciones de aplicabilidad para las leyes de la propia eliminación de comunicaciones. Además, se propone un procedimiento de construcción de demostraciones para la eliminación de comunicaciones, el cual intenta aplicar automáticamente las leyes de la eliminación. También se ha diseñado un conjunto de procedimientos de transformación, los cuales garantizan que la transformación equivalente siempre corresponde a la aplicación de una secuencia de leyes. Debido a que la construcción de las demostraciones es impracticable, normalmente imposible, sin la ayuda de una herramienta, se ha desarrollado un demostrador interactivo para la construcción semiautomática de la secuencialización de modelos de sistemas y demostraciones de eliminación. Tanto los procedimientos de transformación como los de la eliminación de comunicaciones están integrados en la herramienta. Con la ayuda del demostrador se ha construido la demostración de secuencialización de un modelo, no trivial, de procesador pipeline. Para este ejemplo se ha logrado una reducción, respecto del modelo original, de la cota superior del número de estados de 2−672.A pesar de la enorme cantidad de esfuerzo dedicado al área, antes y durante esta tesis, todavía queda mucho trabajo para que la eliminación de comunicaciones y la secuencialización sea realmente un método práctico. Sin embargo los resultados de esta tesis han establecido los cimientos y han dado el estímulo necesario para continuar el esfuerzo. / Formal verification methods are increasingly being used in industry to establish the correctness of, and to find the flaws in, system models; for instance, descriptions of hardware, protocols, distributed programs, etc. In particular, model checking does that automatically for finite-state systems, but it is limited in scope due to the state explosion problem; and interactive formal verification, the broad area of this thesis, is needed.Automatic verification approaches work on the transition system of the model, which defines its semantics. This transition system has often infinitely many states, and always a large size compared to the size of the system model, which is always finite. These considerations suggest that static verification approaches such as those of this thesis, avoiding the transition system, working directly on the system model would have less computational complexity, in principle. The static approach of this work is carried out on system models expressed in imperative notations with explicit parallelism and synchronous communication statements, and with local storage variables.Equivalence reasoning is heavily used for numbers, matrices, and other fields. However, for imperative programs with parallelism, communications, and variables, although having the potentiality of being a very intuitive verification method, it has not been much explored. Formal sequentialization via internal communication elimination, the area of this thesis, is a static equivalence reasoning proof that, since it decreases the size of the state vector, could complement other proof methods. It is based on the application of a set of laws, suitable for that purpose, as rewriting reductions to a system model. These proofs need both proper communication elimination laws and auxiliary basic laws. These depend on the notion of equivalence and on the fairness assumptions.This thesis contributes to the almost unexplored area of formal communication elimination and system model sequentialization. The laws are defined over a weak equivalence: interface equivalence. Communication elimination is confined to selection-free models, i.e. models none of whose inner communications are within the scope of selection statements. Interesting applications already exist within this framework. The laws are valid only with weak fairness or no fairness. It has been developed following the same semantics as Manna and Pnueli for reactive systems [MP91, MP95]. Applicability conditions for the proper communication elimination laws are derived. In addition, a communication elimination proof construction procedure, which attempts to apply the elimination laws automatically is proposed. A set of transformation procedures, guaranteeing that the equivalence transformation always corresponds to the application of a sequence of laws have been designed as well. Since the construction of elimination proofs is impractical, even impossible, without a tool, an interactive prover for semi-automatic construction of system model sequentialization and elimination proofs has been developed. Both transformation and communication elimination procedures are integrated within the tool. As a non-trivial example, a sequentialization proof of a pipelined processor model, has been constructed with the help of the prover. Areduction, with respect to the original model, of 2−672 on the upper bound on the number of states has been achieved in this example.In spite of the huge amount of effort already devoted to the area, before and during this thesis, much work still needs to be done until communication elimination and sequentialization become a practical method. Nevertheless the results of this thesis have established its foundations and given the necessary encouragement for continuing the effort.
|
Page generated in 0.0945 seconds