Spelling suggestions: "subject:"aprediction systems"" "subject:"iprediction systems""
1 |
Exploiting network-based approaches for understanding gene regulation and functionJanga, Sarath Chandra January 2010 (has links)
It is increasingly becoming clear in the post-genomic era that proteins in a cell do not work in isolation but rather work in the context of other proteins and cellular entities during their life time. This has lead to the notion that cellular components can be visualized as wiring diagrams composed of different molecules like proteins, DNA, RNA and metabolites. These systems-approaches for quantitatively and qualitatively studying the dynamic biological systems have provided us unprecedented insights at varying levels of detail into the cellular organization and the interplay between different processes. The work in this thesis attempts to use these systems or network-based approaches to understand the design principles governing different cellular processes and to elucidate the functional and evolutionary consequences of the observed principles. Chapter 1 is an introduction to the concepts of networks and graph theory summarizing the various properties which are frequently studied in biological networks along with an overview of different kinds of cellular networks that are amenable for graph-theoretical analysis, emphasizing in particular on transcriptional, post-transcriptional and functional networks. In Chapter 2, I address the questions, how and why are genes organized on a particular fashion on bacterial genomes and what are the constraints bacterial transcriptional regulatory networks impose on their genomic organization. I then extend this one step further to unravel the constraints imposed on the network of TF-TF interactions and relate it to the numerous phenotypes they can impart to growing bacterial populations. Chapter 3 presents an overview of our current understanding of eukaryotic gene regulation at different levels and then shows evidence for the existence of a higher-order organization of genes across and within chromosomes that is constrained by transcriptional regulation. The results emphasize that specific organization of genes across and within chromosomes that allowed for efficient control of transcription within the nuclear space has been selected during evolution. Chapter 4 first summarizes different computational approaches for inferring the function of uncharacterized genes and then discusses network-based approaches currently employed for predicting function. I then present an overview of a recent high-throughput study performed to provide a 'systems-wide' functional blueprint of the bacterial model, Escherichia coli K-12, with insights into the biological and evolutionary significance of previously uncharacterized proteins. In Chapter 5, I focus on post-transcriptional regulatory networks formed by RBPs. I discuss the sequence attributes and functional processes associated with RBPs, methods used for the construction of the networks formed by them and finally examine the structure and dynamics of these networks based on recent publicly available data. The results obtained here show that RBPs exhibit distinct gene expression dynamics compared to other class of proteins in a eukaryotic cell. Chapter 6 provides a summary of the important aspects of the findings presented in this thesis and their practical implications. Overall, this dissertation presents a framework which can be exploited for the investigation of interactions between different cellular entities to understand biological processes at different levels of resolution.
|
2 |
Statistical Post-Processing Methods And Their Implementation On The Ensemble Prediction Systems For Forecasting Temperature In The Use Of The French Electric ConsumptionGogonel, Adriana Geanina 27 November 2012 (has links) (PDF)
The thesis has for objective to study new statistical methods to correct temperature predictionsthat may be implemented on the ensemble prediction system (EPS) of Meteo France so toimprove its use for the electric system management, at EDF France. The EPS of Meteo Francewe are working on contains 51 members (forecasts by time-step) and gives the temperaturepredictions for 14 days. The thesis contains three parts: in the first one we present the EPSand we implement two statistical methods improving the accuracy or the spread of the EPS andwe introduce criteria for comparing results. In the second part we introduce the extreme valuetheory and the mixture models we use to combine the model we build in the first part withmodels for fitting the distributions tails. In the third part we introduce the quantile regressionas another way of studying the tails of the distribution.
|
3 |
Development of Prediction Systems Using Artificial Neural Networks for Intelligent Spinning Machines / Entwicklung von Vorhersagesystemen für Intelligente Spinnmaschinen auf Basis Künstlicher Neuronaler NetzeFarooq, Assad 10 June 2010 (has links) (PDF)
The optimization of the spinning process and adjustment of the machine settings involve “Trial and Error” method resulting in the wasting of production time and material. This situation becomes worse in the spinning mills where the speed and material changes are frequent. This research includes the use of artificial neural networks to provide the thinking ability to the spinning machines to improve the yarn spinning process. Draw frame, being the central part of the spinning preparation chain and last machine to rectify the variations in the fed slivers is the main focus of the research work. Artificial neural network have been applied to the leveling action point at auto-leveler draw frame and search range of leveling action point has been considerably reduced. Moreover, the sliver and yarn characteristics have been predicted on the basis of draw frame settings using the artificial neural networks. The results of present research work can help the spinning industry in the direction of limiting of “Trial and Error” method, reduction of waste and cutting down the time losses associated with the optimizing of machines. As a vision for the future research work the concept of intelligent spinning machines has also been proposed. / Die Optimierung des Spinnprozesses und die Maschineneinstellung erfolgen häufig mittels „Trial und Error“-Methoden, die mit einem hohen Aufwand an Produktionszeit und Material einhergehen. Diese Situation ist für Spinnereien, in denen häufige Wechsel des eingesetzten Materials oder der Produktionsgeschwindigkeit nötig sind, besonders ungünstig. Die vorliegende Arbeit zeigt das Potenzial Neuronaler Netze, um die Spinnmaschine zum „Denken“ zu befähigen und damit die Garnherstellung effektiver zu machen. Die Strecke ist der zentrale Teil der Spinnereivorbereitungskette und bietet die letzte Möglichkeit, Inhomogenitäten im Faserband zu beseitigen. Der Fokus der Arbeit richtet sich deshalb auf diese Maschine. Künstlich Neuronale Netze werden an der Strecke zur Bestimmung des Regeleinsatzpunktes genutzt, womit eine beträchtliche Reduzierung des Aufwands für die korrekte Festlegung des Regeleinsatzpunkts erreicht wird. Darüber hinaus können mit Hilfe der Neuronalen Netze die Band- und Garneigenschaften auf Basis der Streckeneinstellungen vorausbestimmt werden. Die Resultate der vorliegenden Arbeit machen „Trial und Error“-Methoden überflüssig, reduzieren den Ausschuss und verringern die Zeitverluste bei der Maschinenoptimierung. Als Zukunftsvision wird eine Konzeption für intelligente Spinnmaschinen vorgestellt.
|
4 |
Development of Prediction Systems Using Artificial Neural Networks for Intelligent Spinning MachinesFarooq, Assad 06 May 2010 (has links)
The optimization of the spinning process and adjustment of the machine settings involve “Trial and Error” method resulting in the wasting of production time and material. This situation becomes worse in the spinning mills where the speed and material changes are frequent. This research includes the use of artificial neural networks to provide the thinking ability to the spinning machines to improve the yarn spinning process. Draw frame, being the central part of the spinning preparation chain and last machine to rectify the variations in the fed slivers is the main focus of the research work. Artificial neural network have been applied to the leveling action point at auto-leveler draw frame and search range of leveling action point has been considerably reduced. Moreover, the sliver and yarn characteristics have been predicted on the basis of draw frame settings using the artificial neural networks. The results of present research work can help the spinning industry in the direction of limiting of “Trial and Error” method, reduction of waste and cutting down the time losses associated with the optimizing of machines. As a vision for the future research work the concept of intelligent spinning machines has also been proposed. / Die Optimierung des Spinnprozesses und die Maschineneinstellung erfolgen häufig mittels „Trial und Error“-Methoden, die mit einem hohen Aufwand an Produktionszeit und Material einhergehen. Diese Situation ist für Spinnereien, in denen häufige Wechsel des eingesetzten Materials oder der Produktionsgeschwindigkeit nötig sind, besonders ungünstig. Die vorliegende Arbeit zeigt das Potenzial Neuronaler Netze, um die Spinnmaschine zum „Denken“ zu befähigen und damit die Garnherstellung effektiver zu machen. Die Strecke ist der zentrale Teil der Spinnereivorbereitungskette und bietet die letzte Möglichkeit, Inhomogenitäten im Faserband zu beseitigen. Der Fokus der Arbeit richtet sich deshalb auf diese Maschine. Künstlich Neuronale Netze werden an der Strecke zur Bestimmung des Regeleinsatzpunktes genutzt, womit eine beträchtliche Reduzierung des Aufwands für die korrekte Festlegung des Regeleinsatzpunkts erreicht wird. Darüber hinaus können mit Hilfe der Neuronalen Netze die Band- und Garneigenschaften auf Basis der Streckeneinstellungen vorausbestimmt werden. Die Resultate der vorliegenden Arbeit machen „Trial und Error“-Methoden überflüssig, reduzieren den Ausschuss und verringern die Zeitverluste bei der Maschinenoptimierung. Als Zukunftsvision wird eine Konzeption für intelligente Spinnmaschinen vorgestellt.
|
5 |
Temporary Variables for Predicting Electricity Consumption Through Data MiningSilva, Jesús, Senior Naveda, Alexa, Hernández Palma, Hugo, Niebles Núẽz, William, Niebles Núẽz, Leonardo 07 January 2020 (has links)
In the new global and local scenario, the advent of intelligent distribution networks or Smart Grids allows real-time collection of data on the operating status of the electricity grid. Based on this availability of data, it is feasible and convenient to predict consumption in the short term, from a few hours to a week. The hypothesis of the study is that the method used to present time variables to a prediction system of electricity consumption affects the results.
|
6 |
Statistical Post-Processing Methods And Their Implementation On The Ensemble Prediction Systems For Forecasting Temperature In The Use Of The French Electric Consumption / Les propriétés statistiques de correction des prévisions de température et leur application au système des prévisions d’ensemble (SPE) de Météo FranceGogonel, Adriana Geanina 27 November 2012 (has links)
L’objectif des travaux de la thèse est d’étudier les propriétés statistiques de correction des prévisionsde température et de les appliquer au système des prévisions d’ensemble (SPE) de MétéoFrance. Ce SPE est utilisé dans la gestion du système électrique, à EDF R&D, il contient 51membres (prévisions par pas de temps) et fournit des prévisions à 14 jours. La thèse comportetrois parties. Dans la première partie on présente les SPE, dont le principe est de faire tournerplusieurs scénarios du même modèle avec des données d’entrée légèrement différentes pour simulerl’incertitude. On propose après des méthodes statistiques (la méthode du meilleur membre etla méthode bayésienne) que l’on implémente pour améliorer la précision ou la fiabilité du SPEdont nous disposons et nous mettons en place des critères de comparaison des résultats. Dansla deuxième partie nous présentons la théorie des valeurs extrêmes et les modèles de mélange etnous proposons des modèles de mélange contenant le modèle présenté dans la première partieet des fonctions de distributions des extrêmes. Dans la troisième partie nous introduisons larégression quantile pour mieux estimer les queues de distribution. / The thesis has for objective to study new statistical methods to correct temperature predictionsthat may be implemented on the ensemble prediction system (EPS) of Meteo France so toimprove its use for the electric system management, at EDF France. The EPS of Meteo Francewe are working on contains 51 members (forecasts by time-step) and gives the temperaturepredictions for 14 days. The thesis contains three parts: in the first one we present the EPSand we implement two statistical methods improving the accuracy or the spread of the EPS andwe introduce criteria for comparing results. In the second part we introduce the extreme valuetheory and the mixture models we use to combine the model we build in the first part withmodels for fitting the distributions tails. In the third part we introduce the quantile regressionas another way of studying the tails of the distribution.
|
7 |
Characteristic errors in 120-H tropical cyclone track forecasts in the western North PacificKehoe, Ryan M. 03 1900 (has links)
Approved for public release, distribution is unlimited / occurring most frequently. For the 217 large-error cases due to midlatitude influences, the most frequent error mechanisms were E-DCI (midlatitude), excessive response to vertical wind shear, excessive midlatitude cyclogenesis (E-MCG), insufficient midlatitude cyclogenesis (I-MCG), excessive midlatitude cyclolysis (E-MCL) and excessive midlatitude anticyclogenesis (E-MAG), which accounted for 68% of all large errors occurring in both NOGAPS and GFDN. Characteristics and symptoms of the erroneous forecast tracks and model fields are documented and illustrative case studies are presented. Proper identification and removal of the track forecast displaying an error mechanism could form a selective consensus that will be more accurate than a non-selective consensus. / Captain, United States Air Force
|
8 |
Design of ensemble prediction systems based on potential vorticity perturbations and multiphysics. Test for western Mediterranean heavy precipitation eventsVich Ramis, Maria del Mar 18 May 2012 (has links)
L'objectiu principal d'aquesta tesi és millorar l'actual capacitat de predicció de fenòmens meteorològics de pluja intensa potencialment perillosos a la Mediterrània occidental. Es desenvolupen i verifiquen tres sistemes de predicció per conjunts (SPC) que tenen en compte incerteses presents en els models numèrics i en les condicions inicials. Per generar els SPC s'utilitza la connexió entre les estructures de vorticitat potencial (VP) i els ciclons, a més de diferents esquemes de parametrització física. Es mostra que els SPC proporcionen una predicció més hàbil que la determinista. Els SPC generats pertorbant les condicions inicials han obtingut millor puntuació en verificacions estadístiques. Els resultats d'aquesta tesi mostren la utilitat i la idoneïtat dels mètodes de predicció basats en la pertorbació d'estructures de VP de nivells alts, precursors de les situacions ciclòniques. Els resultats i estratègies presentats pretenen ser un punt de partida per a futurs estudis que facin ús d'aquests mètodes. / The main goal of this thesis is to improve the current prediction skill of potentially hazardous heavy precipitation weather events in the western Mediterranean region. We develop and test three different ensemble prediction systems (EPSs) that account for uncertainties present in both the numerical models and the initial conditions. To generate the EPSs we take advantage of the connection between potential vorticity (PV) structures and cyclones, and use different physical parameterization schemes. We obtain an improvement in forecast skill when using an EPS compared to a determinist forecast. The EPSs generated perturbing the initial conditions perform better in the statistical verification scores. The results of this Thesis show the utility and suitability of forecasting methods based on perturbing the upper-level precursor PV structures present in cyclonic situations. The results and strategies here discussed aim to be a basis for future studies making use of these methods.
|
9 |
Τεχνικές εξόρυξης δεδομένων και εφαρμογές σε προβλήματα διαχείρισης πληροφορίας και στην αξιολόγηση λογισμικού / Data mining techniques and their applications in data management problems and in software systems evaluationΤσιράκης, Νικόλαος 20 April 2011 (has links)
Τα τελευταία χρόνια όλο και πιο επιτακτική είναι η ανάγκη αξιοποίησης των ψηφιακών δεδομένων τα οποία συλλέγονται και αποθηκεύονται σε διάφορες βάσεις δεδομένων. Το γεγονός αυτό σε συνδυασμό με τη ραγδαία αύξηση του όγκου των δεδομένων αυτών επιβάλλει τη δημιουργία υπολογιστικών μεθόδων με απώτερο σκοπό τη βοήθεια του ανθρώπου στην εξόρυξη της χρήσιμης πληροφορίας και γνώσης από αυτά.
Οι τεχνικές εξόρυξης δεδομένων παρουσιάζουν τα τελευταία χρόνια ιδιαίτερο ενδιαφέρον στις περιπτώσεις όπου η πηγή των δεδομένων είναι οι ροές δεδομένων ή άλλες μορφές όπως τα XML έγγραφα. Σύγχρονα συστήματα και εφαρμογές όπως είναι αυτά των κοινοτήτων πρακτικής έχουν ανάγκη χρήσης τέτοιων τεχνικών εξόρυξης για να βοηθήσουν τα μέλη τους. Τέλος ενδιαφέρον υπάρχει και κατά την αξιολόγηση λογισμικού όπου η πηγή δεδομένων είναι τα αρχεία πηγαίου κώδικα για σκοπούς καλύτερης συντηρησιμότητας τους.
Από τη μια μεριά οι ροές δεδομένων είναι προσωρινά δεδομένα τα οποία περνούν από ένα σύστημα «παρατηρητή» συνεχώς και σε μεγάλο όγκο. Υπάρχουν πολλές εφαρμογές που χειρίζονται δεδομένα σε μορφή ροών, όπως δεδομένα αισθητήρων, ροές κίνησης δικτύων, χρηματιστηριακά δεδομένα και τηλεπικοινωνίες. Αντίθετα με τα στατικά δεδομένα σε βάσεις δεδομένων, οι ροές δεδομένων παρουσιάζουν μεγάλο όγκο και χαρακτηρίζονται από μια συνεχή ροή πληροφορίας που δεν έχει αρχή και τέλος. Αλλάζουν δυναμικά, και απαιτούν γρήγορες αντιδράσεις. Ίσως είναι η μοναδική πηγή γνώσης για εξόρυξη δεδομένων και ανάλυση στην περίπτωση όπου οι ανάγκες μιας εφαρμογής περιορίζονται από τον χρόνο απόκρισης και το χώρο αποθήκευσης. Αυτά τα μοναδικά χαρακτηριστικά κάνουν την ανάλυση των ροών δεδομένων πολύ ενδιαφέρουσα ιδιαίτερα στον Παγκόσμιο Ιστό.
Ένας άλλος τομέας ενδιαφέροντος για τη χρήση νέων τεχνικών εξόρυξης δεδομένων είναι οι κοινότητες πρακτικής. Οι κοινότητες πρακτικής (Communities of Practice) είναι ομάδες ανθρώπων που συμμετέχουν σε μια διαδικασία συλλογικής εκμάθησης. Μοιράζονται ένα ενδιαφέρον ή μια ιδέα που έχουν και αλληλεπιδρούν για να μάθουν καλύτερα για αυτό. Οι κοινότητες αυτές είναι μικρές ή μεγάλες, τοπικές ή παγκόσμιες, face to face ή on line, επίσημα αναγνωρίσιμες, ανεπίσημες ή και αόρατες. Υπάρχουν δηλαδή παντού και σχεδόν όλοι συμμετέχουμε σε δεκάδες από αυτές. Ένα παράδειγμα αυτών είναι τα γνωστά forum συζητήσεων. Σκοπός μας ήταν ο σχεδιασμός νέων αλγορίθμων εξόρυξης δεδομένων από τις κοινότητες πρακτικής με τελικό σκοπό να βρεθούν οι σχέσεις των μελών τους και να γίνει ανάλυση των εξαγόμενων δεδομένων με μετρικές κοινωνικών δικτύων ώστε συνολικά να αποτελέσει μια μεθοδολογία ανάλυσης τέτοιων κοινοτήτων.
Επίσης η eXtensible Markup Language (XML) είναι το πρότυπο για αναπαράσταση δεδομένων στον Παγκόσμιο Ιστό. Η ραγδαία αύξηση του όγκου των δεδομένων που αναπαρίστανται σε XML μορφή δημιούργησε την ανάγκη αναζήτησης μέσα στην δενδρική δομή ενός ΧΜL εγγράφου για κάποια συγκεκριμένη πληροφορία. Η ανάγκη αυτή ταυτόχρονα με την ανάγκη για γρήγορη πρόσβαση στους κόμβους του ΧΜL δέντρου, οδήγησε σε διάφορα εξειδικευμένα ευρετήρια. Για να μπορέσουν να ανταποκριθούν στη δυναμική αυτή των δεδομένων, τα ευρετήρια πρέπει να έχουν τη δυνατότητα να μεταβάλλονται δυναμικά. Ταυτόχρονα λόγο της απαίτησης για αναζήτηση συγκεκριμένης πληροφορίας πρέπει να γίνεται το φιλτράρισμα ενός συνόλου XML δεδομένων διαμέσου κάποιων προτύπων και κανόνων ώστε να βρεθούν εκείνα τα δεδομένα που ταιριάζουν με τα αποθηκευμένα πρότυπα και κανόνες.
Από την άλλη μεριά οι διαστάσεις της εσωτερικής και εξωτερικής ποιότητας στη χρήση ενός προϊόντος λογισμικού αλλάζουν κατά τη διάρκεια ζωής του. Για παράδειγμα η ποιότητα όπως ορίζεται στην αρχή του κύκλου ζωής του λογισμικού δίνει πιο πολύ έμφαση στην εξωτερική ποιότητα και διαφέρει από την εσωτερική, όπως για παράδειγμα στη σχεδίαση η οποία αναφέρεται στην εσωτερική ποιότητα και αφορά τους μηχανικούς λογισμικού. Οι τεχνικές εξόρυξης δεδομένων που μπορούν να χρησιμοποιηθούν για την επίτευξη του απαραίτητου επιπέδου ποιότητας, όπως είναι ο καθορισμός και η αξιολόγηση της ποιότητας πρέπει να λαμβάνουν υπόψη τους τις διαφορετικές αυτές διαστάσεις σε κάθε στάδιο του κύκλου ζωής του προϊόντος.
Στα πλαίσια αυτής της διδακτορικής διατριβής έγινε σε βάθος έρευνα σχετικά με τεχνικές εξόρυξης δεδομένων και εφαρμογές τόσο στο πρόβλημα διαχείρισης πληροφορίας όσο και στο πρόβλημα της αξιολόγησης λογισμικού. / The World Wide Web has gradually transformed into a large data repository consisting of vast amount of data in many different types. These data doubles about every year, but useful information seems to be decreasing. The area of data mining has arisen over the last decade to address this problem. It has become not only an important research area, but also one with large potential in the real world. Data mining has many directives and handles various types of data.
When the related data are for example data streams or XML data then the problems seem to be very crucial and interesting. Also contemporary systems and applications related to communities of practice seek appropriate data mining techniques and algorithms in order to help their members. Finally, great interest has the field of software evaluation when by using data mining in order to facilitate the comprehension and maintainability evaluation of a software system’s source code. Source code artifacts and measurement values can be used as input to data mining algorithms in order to provide insights into a system’s structure or to create groups of artifacts with similar software measurements.
First, data streams are large volumes of data arriving continuously. Data mining techniques have been proposed and studied to help users better understand and analyze the information. Clustering is a useful and ubiquitous tool in data analysis. With the rapid increase in web-traffic and e-commerce, understanding user behavior based on their interaction with a website is becoming more and more important for website owners and clustering in correlation with personalization techniques of this information space has become a necessity. The knowledge obtained by learning the users preferences can help improve web content, find usability issues related to this content and its structure, ensure the security of provided data, analyze the different groups of users that can be derived from the web access logs and extract patterns, profiles and trends. This thesis investigates the application of a new model for clustering and analyzing click-stream data in the World Wide Web with two different approaches.
The next part of the thesis deals with data mining techniques regarding communities of practice. These are groups of people taking part in a collaborative way of learning and exchanging ideas. Systems for supporting argumentative collaboration have become more and more popular in digital world. There are many research attempts regarding collaboration filtering and recommendation systems. Sometimes depending on the system and its needs there are different problems and developers have to deal with special cases in order to provide useful service to users. Data mining can play an important role in the area of collaboration systems that want to provide decision support functionality. Data mining in these systems can be defined as the effort to generate actionable models through automated analysis of their databases. Data mining can only be deployed successfully when it generates insights that are substantially deeper than what a simple view of data can give. This thesis introduces a framework that can be applied to a wide range of software platforms aiming at facilitating collaboration and learning among users. More precisely, an approach that integrates techniques from the Data Mining and Social Network Analysis disciplines is being presented.
The next part of the thesis deals with XML data and ways to handle huge volumes of data that they may hold. Lately data written in a more sophisticated markup language such as XML have made great strides in many domains. Processing and management of XML documents have already become popular research issues with the main problem in this area being the need to optimally index them for storage and retrieval purposes. This thesis first presents a unified clustering algorithm for both homogeneous and heterogeneous XML documents. Then using this algorithm presents an XML P2P system that efficiently distributes a set of clustered XML documents in a P2P network in order to speed-up user queries.
Ultimately, data mining and its ability to handle large amounts of data and uncover hidden patterns has the potential to facilitate the comprehension and maintainability evaluation of a software system. This thesis investigates the applicability and suitability of data mining techniques to facilitate the comprehension and maintainability evaluation of a software system’s source code. What is more, this thesis focuses on the ability of data mining to produce either overviews of a software system (thus supporting a top down approach) or to point out specific parts of this system that require further attention (thus supporting a bottom up approach) potential to facilitate the comprehension and maintainability evaluation of a software system.
|
Page generated in 0.1076 seconds