Spelling suggestions: "subject:"databases,"" "subject:"atabases,""
921 |
Ανάπτυξη παραθυρικής εφαρμογής εισαγωγής στοιχείων και διαχείρισης βάσης δεδομένων αρχέγονων αιμοποιητικών κυττάρωνΤσολάκος, Σταύρος 02 February 2011 (has links)
Οι βάσεις δεδομένων αποτελούν, πλέον, επιτακτική ανάγκη για την οργάνωση, αποθήκευση και γρήγορη ανάκτηση δεδομένων, αλλά και την εξαγωγή συμπερασμάτων μέσα από διαδικασίες στατιστικής επεξεργασίας, στα πλαίσια της αξιοποίησης του τεράστιου όγκου πληροφορίας που ήδη υπάρχει αλλά και εξακολουθεί να παράγεται με εξαιρετικά γρήγορους ρυθμούς στην ιατροβιολογική έρευνα και εν προκειμένω στο πεδίο των λήψεων και των μεταμοσχεύσεων αρχέγονων αιμοποιητικών κυττάρων. Ωστόσο, για την εύκολη πρόσβαση στις πληροφορίες αυτές, απαιτούνται εξειδικευμένες εφαρμογές οι οποίες κρατούν μακρυά την πολυπλοκότητα των βάσεων δεδομένων από τον τελικό χρήστη, προσφέροντας ένα απλό και φιλικό περιβάλλον διαχείρισης.
Το θέμα της εργασίας αυτής είναι η ανάπτυξη μιας τέτοιας εφαρμογής, με το όνομα “AutoStem”. Η εφαρμογή αναπτύχθηκε με τη γλώσσα προγραμματισμού Python, με τη βοήθεια των βιβλιοθηκών wxPython για την δημιουργία του διαδραστικού γραφικού περιβάλλοντος, storm για την επικοινωνία με τη βάση δεδομένων και matplotlib για τη δημιουργία υψηλής ποιότητας γραφημάτων. / Databases constitute nowadays imperative tool for the organization, storage, rapid data recovery and statistical analysis in the field of the modern managing and exploitation of the huge volume of information that already exists and continues to be produced extremely fast. The databases are extremely useful in the management of bioinformation of medicine and biology both in daily diagnostics as well as research. The present study is concentrated in the application of databases in the blood stem cells collections and transplantations. However, sophisticated and specialized applications are required in order to for them be easily accessed. Applications that hide their native complexity, offering an easy to use, intuitive and friendly management environment.
The subject of the present thesis is the development of such an application, named “AutoStem”. The application was developed using the Python programming language, using the wxPython GUI library, the storm library for communicating with the database and the matplotlib for creating high quality graphs.
|
922 |
Κατασκευή ηλεκτρονικού οδηγού και βάσης δεδομένων για την διάδοση της μουσικής παράδοσης "Δρόμοι της μουσικής παράδοσης"Νούλας, Γεώργιος 21 December 2011 (has links)
Η παρούσα διπλωματική έχει σκοπό τον σχεδιασμό και κατασκευή ηλεκτρονικού καταλόγου και βάσης δεδομένων για την οργάνωση και διαχείριση αρχείου μουσικής ελληνικής παράδοσης και σχετικού περιεχομένου και την έκδοσή του στον παγκόσμιο ιστό.
Μέσα από την διπλωματική αυτή προτείνεται ένας τρόπος για την αποθήκευση της μουσικής πληροφορίας στο διαδίκτυο, το σχετικό υλικό που θα πρέπει να συνοδεύει ένα τραγούδι, τον τρόπο παρουσίασης του υλικού αυτού στον χρήστη της εφαρμογής, τις λειτουργίες αναζήτησής της και τον τρόπο αναπαραγωγής της.
Για τις ανάγκες της διπλωματικής έγινε και προτείνεται κατηγοριοποίηση των τραγουδιών με βάσης το είδος τους , δηλαδή το θέμα τους, και με βάση τον ρυθμό τους, δηλαδή της μουσικής τους. Επίσης προτείνεται και κατηγοριοποίηση για τα άρθρα. Οι δύο παραπάνω κατηγοριοποιήσεις αφορούν αποκλειστικά το ελληνικό δημοτικό τραγούδι.
Επίσης προτείναμε δομή ιστοσελίδας του WWW για την διάδοση την μουσικής παράδοσης που θα είναι φιλική για τον μέσο χρήστη του internet και θα κρατάει το ενδιαφέρον του.
Στα πλαίσια της διπλωματικής αυτής εργασίας δημιουργήθηκε ο πληρέστερος στο διαδίκτυο οδηγός παραδοσιακής μουσικής της Πελοποννήσου και της Στερεάς Ελλάδας. Ωστόσο με ένα επιπλέον σύστημα που δημιουργήθηκε είναι δυνατή η προσθήκη επιπλέον υλικού από χρήστες που θα καλύψει όλες τις περιοχές της χώρας μας. / The current work is about a e-catalogue for the greek traditional music. It is a user centered WWW aplication and belongs to the Arcadia Project at C.E.I.D.
|
923 |
Ανάπτυξη ολοκληρωμένου συστήματος εξόρυξης και οπτικοποίησης γνώσης από βιολογικά δεδομέναΓκαντούνα, Βασιλική 25 January 2012 (has links)
Στα τέλη του 20ου αιώνα, οι παράλληλες εξελίξεις και η ανάπτυξη καινοτόμων μεθόδων και εργαλείων σε διαφορετικές ερευνητικές περιοχές είχε ως αποτέλεσμα την εμφάνιση των λεγόμενων "αναδυόμενων τεχνολογιών" (emerging technologies). Σε αυτό το πλαίσιο λοιπόν, των αναδυόμενων τεχνολογιών, εμφανίστηκε στο προσκήνιο η επιστήμη της Βιοπληροφορικής (Bioinformatics) η οποία αποτελεί την τομή των επιστημών της βιολογίας και της πληροφορικής. Η ραγδαία ανάπτυξη της τεχνολογίας έχει οδηγήσει στην εκρηκτική αύξηση του ρυθμού παραγωγής βιολογικών δεδομένων, γεγονός που καθιστά επιτακτική την ανάγκη της αποδοτικής και αποτελεσματικής διαχείρισης τους. Για την κάλυψη αυτής ακριβώς της ανάγκης δημιουργήθηκαν οι βιολογικές βάσεις δεδομένων που έχουν σήμερα εξαιρετική δυναμική και περιθώρια εφαρμογών.
Οι βασικοί τομείς έρευνας στο πλαίσιο των βιολογικών βάσεων δεδομένων μπορούν να ταξινομηθούν σε τρεις μεγάλες κατηγορίες. Η πρώτη κατηγορία αφορά στην όσο το δυνατόν πιο αποδοτική οργάνωση των βιολογικών δεδομένων ώστε να είναι δυνατή η αποτελεσματική αποθήκευση τους. Αυτός ακριβώς είναι και ο λόγος δημιουργίας των βιολογικών βάσεων δεδομένων. Η δεύτερη κατηγορία αφορά στην ανάπτυξη εργαλείων και μεθόδων που επιτρέπουν την ανάλυση και την επεξεργασία των βιολογικών δεδομένων έτσι ώστε να διευκολυνθεί η διαδικασία ανακάλυψης γνώσης από αυτά. Σε αυτή την κατηγορία, σημαντικό ρόλο παίζουν οι τεχνικές εξόρυξης γνώσης οι οποίες εφαρμόζονται πάνω σε μεγάλες συλλογές βιολογικών δεδομένων και συνήθως οδηγούν στην ανακάλυψη νέων σχέσεων και προτύπων που κρύβονται ανάμεσα στα δεδομένα. Τέλος, η τρίτη κατηγορία αφορά στην ανάπτυξη εργαλείων που διευκολύνουν την διαδικασία της βιολογικής ερμηνείας των αποτελεσμάτων της εξόρυξης. Εδώ, ουσιαστικό ρόλο κατέχουν οι τεχνικές οπτικοποίησης της παραγόμενης γνώσης για την όσο το δυνατόν πιο κατανοητή παρουσίαση των συμπερασμάτων στον άνθρωπο ο οποίος στην συνέχεια θα επιλέξει ποια από αυτά είναι πραγματικά χρήσιμα.
Η δημιουργία ενός ολοκληρωμένου συστήματος που θα αποτελεί τον απότοκο της τεχνολογικής σύζευξης των τεχνικών των τριών παραπάνω κατηγοριών σε συνδυασμό με την ανάγκη αξιοποίησης μιας μέχρι πρότινος ανεκμετάλλευτης μεγάλης συλλογής βιολογικών δεδομένων αποτέλεσαν το κίνητρο για την εκπόνηση της παρούσας διπλωματικής εργασίας.
Στόχος της εργασίας είναι η ανάπτυξη ενός ολοκληρωμένου συστήματος το οποίο χρησιμοποιώντας την τεχνολογία Microsoft PivotViewer θα απεικονίζει την παραπάνω συλλογή δεδομένων προσφέροντας ένα υψηλό επίπεδο αναπαράστασης και θα καταγράφει τις συχνότητες εμφάνισης των μεταλλάξεων και άλλων γενετικών παραλλαγών ανά πληθυσμιακές ομάδες σε παγκόσμια κλίμακα. Το σύστημα αυτό θα μπορεί να λειτουργήσει ως ένα σύγχρονο εκπαιδευτικό και διαγνωστικό εργαλείο για την πληθυσμιακή μελέτη της παθογένειας και της θεραπείας ασθενειών που οφείλονται σε κάποια γενετική διαταραχή.
Ο χρήστης διαμέσου ενός εύχρηστου και φιλικού περιβάλλοντος διεπαφής θα μπορεί να εστιάσει από μια μεγάλη συλλογή δεδομένων σε ένα εξειδικευμένο υποσύνολό της που ενδεχομένως σχετίζεται με μία συγκεκριμένη ασθένεια, μία συγκεκριμένη μελέτη ή έναν συγκεκριμένο πληθυσμό παρατηρώντας έτσι τα δεδομένα αυτά από μια διαφορετική οπτική γωνία που ενδεχομένως να τον βοηθήσει να ανακαλύψει νέα πρότυπα και σχέσεις ανάμεσα τους αξιόλογης βιολογικής σημασίας. / In the late 20th century, parallel advances and the development of innovative methods and tools in different research areas resulted in the appearance of the so-called "emerging technologies". In the framework of emerging technologies, the science of Bioinformatics came to the fore which is the intersection of the sciences of biology and informatics. The rapid growth of technology has led to the explosive increase in the rate of production of biological data, which dictates the need for efficient and effective data management. Biological databases have been created to satisfy exactly this need and they have extremely dynamic and potential applications today.
The main research areas in biological databases can be classified into three broad categories. The first category concerns the better organization of the biological data so as to enable efficient storage. This is the reason for the development of the biological databases. The second category concerns the development of tools and methods that allow analysis and processing of biological data to facilitate the process of discovering knowledge from them. In this category, data mining techniques play an important role. They are applied over large collections of biological data and often lead to the discovery of new relationships and patterns that lie between the data. Finally, the third category involves the development of tools that facilitate the process of understanding and visualizing the biological meaning of the data mining results. Here, the visualization techniques have an essential role in presenting the data mining results in a meaningful way to the scientists who will eventually decide which of these results are really useful and reliable.
The development of an integrated system which will be the result of the technological coupling of the three above categories in conjunction with the need of utilization a previously unexploited large collection of biological data was the motivation for the elaboration of this thesis.
This work aims to develop an integrated system which represents the above collection providing a high level visualization and records the frequencies of causative genetic variations worldwide by utilizing the Microsoft PivotViewer technology. This system can serve as a modern educational and diagnostic tool for the population-based study of the pathogenesis and treatment of diseases caused by a genetic disorder.
The user through a user-friendly interface can zoom in from the massive amounts of data to particular disease-specific, study-specific, or population-specific data so that he can begin observing the data from a different perspective that may enable him to discover new patterns and relationships between them of remarkable biological importance.
|
924 |
Σχεδιασμός και ανάπτυξη προσαρμοζόμενου συστήματος για την διδασκαλία του μαθήματος Βάσεις δεδομένωνΞηροτύρης, Νικόλαος 19 October 2012 (has links)
Ο στόχος της παρούσας διπλωματικής εργασίας είναι η παρουσίαση της χρησιμότητας του ηλεκτρονικού υπολογιστή στην εκπαιδευτική διαδικασία, η ευρεία χρήση των βάσεων δεδομένων στον σύγχρονο κόσμο καθώς και η μελέτη των λειτουργικών περιοχών μίας βάσης δεδομένων. Επίσης, παρουσιάζεται ο τρόπος με τον οποίο οργανώνονται τα δεδομένα μιας βάσης δεδομένων στο σκληρό δίσκο και η χρησιμότητα των ευρετηρίων.
Στο πρώτο κεφάλαιο, γίνεται μια εισαγωγή στην χρησιμότητα του ηλεκτρονικού υπολογιστή στην καθημερινότητα μας και κυρίως, στην εισβολή του στην εκπαιδευτική διαδικασία. Παρουσιάζονται κάποια κύρια στοιχεία που κάνουν τον Η/Υ απαραίτητο - πλέον - στην εκπαίδευση, οι τρόποι με τους οποίους μπορεί να χρησιμοποιηθεί στην εκπαίδευση και φυσικά η μεγάλη συμβολή της συνεργατικής μάθησης με την βοήθεια των ηλεκτρονικών υπολογιστών.
Στο δεύτερο κεφάλαιο, αναφέρεται η γενική ιδέα των Βάσεων Δεδομένων, η εξέλιξή τους και κάποια ιστορικά στοιχεία. Στη συνέχεια παρουσιάζονται τα βασικά στοιχεία της δομής των βάσεων δεδομένων και οι λειτουργικές περιοχές τους (αρχιτεκτονική, μοντέλα, γλώσσες, ασφάλεια).
Στο τρίτο κεφάλαιο, ασχολούμαστε με την αποθήκευση των βάσεων δεδομένων, κυρίως σε δευτερεύοντα αποθηκευτικά μέσα, όπως ο σκληρός δίσκος. Αναφέρονται τα επιμέρους στοιχεία ενός σκληρού δίσκου και τον τρόπο με τον οποίο αποθηκεύονται τα δεδομένα σε μορφή εγγραφών, τοντρόπο οργάνωσης και διάταξης των εγγραφών σε αρχεία καθώς και περιληπτικά η μέθοδος του κατακερματισμού.
Στο τέταρτο κεφάλαιο, παρουσιάζεται η δομή των ευρετηρίων για την διάταξη των εγγραφών σε ένα αρχείο. Αναφέρονται οι βασικοί τύποι ευρετηρίων (πρωτέυον, δευτερεύον, συστάδων και πολυεπίπεδο) καθώς και τα δυναμικά πολυεπίπεδα ευρετήρια με την χρήση Β-δένδρων και Β+-δένδρων.
Στο πέμπτο κεφάλαιο, παρουσιάζεται μία εφαρμογή των ευρετηρίων σε μία δειγματική βάση δεδομένων (Sakila), η οποία χρησιμοποιείται για εκπαιδευτικούς σκοπούς. Συντάσσονται ερωτήματα SQL με την βοήθεια εντολών δημιουργίας ευρετηρίων, ώστε να δειχθεί και πειραματικά ότι τα ευρετήρια είναι μία πολύ καλή μέθοδος μείωσης του χρόνου αναζήτησης, ειδικά σε μία βάση με πάνω από 1000-2000 εγγραφές. / The aim of the present thesis is to show the utility of computers in education, the widespread use of databases in the modern world and the study of the functional areas of a database. It is also presented the way the data are organized in a database on the hard disk and the structure of indexes.
The first chapter includes an introduction to the usefulness of the personal computer to our everyday life and especially, in its invasion in the educational process. There are presented some key elements that make the PC necessary in education, the ways in which it can be used in education and of course the great contribution of collaborative learning with the help of computers.
The second chapter refers to the concept of databases, their development and some historical data. Also, there are presented the basic elements of the structure of databases and their functional areas (architecture, models, languages, security).
The third chapter deals with the storage of databases, particularly in a secondary storage media, such as the hard disk. There are indicated the components of a hard disk and how the data is stored in records, the organization and provision of records in files and briefly the method of hashing.
The fourth chapter presents the structure of indexes for the order of the records in a file. The basic types of indexes are described (primary, secondary, clustering and multilevel), as well as, the dynamic multi-level indexes using B-trees and B+-trees.
The fifth chapter presents an application of indexes in a sample database (Sakila), which is used for educational purposes. SQL queries are drafted with the help of create indexes command, in order to show – experimentally - that the indexes are a great way to reduce search time, especially, in a database which contains over 1000-2000 records.
|
925 |
Συμπίεση βάσης δεδομένων σκακιστικών φινάλε με μεθόδους data miningΘάνου, Αναστάσιος 16 April 2013 (has links)
Η συγκεκριμένη διπλωματική εργασία διαπραγματεύεται τη συμπίεση των βάσεων του Nalimov με μεθόδους data mining. Είναι βάσεις σκακιστικών φινάλε, οι οποίες παρέχουν πληροφορίες, ανάλογα με την τοποθέτηση των κομματιών για το ποιος νικάει κάθε φορά σε ένα φινάλε τριών ή περισσοτέρων κομματιών συμπεριλαμβανομένων και των δύο βασιλιάδων. Η προσπάθεια γίνεται με το έτοιμο πρόγραμμα Weka, το οποίο διατίθεται δωρεάν στο internet και προσφέρεται για εφαρμογές του data mining.
Η συμπίεση προσφέρει ευελιξία στην αποθήκευση, ίσως και κατανόηση από τον άνθρωπο, όπως πάντα γίνεται στο data mining. Αρχικά, μελετήθηκε το φινάλε με βασιλιά και ένα πιόνι εναντίον του μαύρου βασιλιά. Έγινε μελέτη από διάφορες πλευρές και με διαφορετικά χαρακτηριστικά (attributes) που ορίζονται από το χρήστη και αποσκοπούν στην καλή εκπαίδευση ενός ταξινομητή, ο οποίος λέει ποιος νικάει ή αν έχουμε ισοπαλία. Ενδιαφέρουσα ήταν και η προσπάθεια για αύξηση της απόδοσης ώστε να πλησιάσει κατά το δυνατόν το 100% στο συγκεκριμένο φινάλε, άλλοτε με ανάθεση μεγαλύτερης προσπάθειας στον υπολογιστή και άλλοτε καθαρά από τον ανθρώπινο παράγοντα, με διόρθωση λαθών και επανεπισκόπηση των χαρακτηριστικών για τη δημιουργία καταλληλοτέρων δεδομένων. Ακολούθως, μελετήθηκαν τα φινάλε με βασίλισσα ή πύργο αντί για πιόνι και γίνονταν σχόλια σε καίρια σημεία.
Τέλος, η μελέτη επεκτάθηκε και σε φινάλε τεσσάρων κομματιών, όπου είχαμε την ευκαιρία να δούμε τα φινάλε KBBK και KRKN, τα οποία παρουσιάζουν ενδιαφέρον, καθώς αυξάνονται οι υπολογιστικές απαιτήσεις. / This diploma dissertation deals with the compression of the Nalimov bases using methods of data mining. They are chess endgame databases, which provide information, depending on the placement of the men, about who wins in an endgame of three or more pieces, including the two kings. The work was made by means of the open-software program Weka, which is available free on the internet and is ideal for applications of data mining.
This compression aims to provide flexibility in storage and perhaps understanding by the users, as is always the case in data mining. At first, the endgame with one king and a pawn vs the black king was studied. A study was done from different perspectives and with quite different characteristics (attributes), which are specified by the user and designed in order that a good classifier should be trained, a classifier that should finally say who wins or if it is a tie. Also, something interesting that was done was an attempt to increase efficiency to close as possible to 100% in this endgame, sometimes shifting the whole work to the computer and sometimes mainly by the human factor. Of course, the latter was managed by correcting errors and reconsidering the attributes for creating the most appropriate data possible. Then, we studied the endgames with a queen and then, with a rook instead of a pawn, with comments made at key points.
Finally, the study was expanded to endgames with four men, where we had the opportunity to see the endgames KBBK and KRKN, which are interesting as the computational requirements increase.
|
926 |
Identification de peptides antibactériens d'origine marine : Amélioration de la qualité et de la survie du naissain d'huître / Identification of marine antibacterial peptides : improving oyster spat quality and survivalHouyvet, Baptiste 13 April 2018 (has links)
Les premiers stades larvaires chez l’huitre creuse, nommée Magallana gigas, constituent une étape clé du bondéroulement du parcours zootechnique et également pour la pérennisation de la production en écloserie. Dans l’objectifde réduire les mortalités observées en écloserie, nous avons recherché de nouveaux peptides antimicrobiens. Larecherche de ces PAM a été réalisée à partir de deux organismes marins, le poisson-lion invasif en mer des caraïbes,Pterois volitans, et la seiche commune présente sur les zones ostréicoles, Sepia officinalis. La recherche de PAM a étéréalisée préférentiellement à partir de transcriptomes de novo obtenus chez ces deux animaux. Chez le poisson lion, àpartir de BLAST, 7 transcrits codant pour des PAM ont été identifiés. Quatre de ces PAM partagent de fortes homologiesde séquences (>90% d’identité) avec des PAM riches en cystéines proches de l’hepcidine, la LEAP-2, la NK-lysine et la bdéfensineidentifiées chez d’autres poissons. Les 3 autres transcrits annotés pteroicidines A, B et C codent pour despeptides apparentés aux piscidines. La présence de la b-défensine et de la pteroicidine a codée par la pteroicidine A a puêtre confirmée dans les extrait de peau du poisson lion par spectrométrie de masse. Une étude approfondie a été menéesur deux formes amidée et non amidée de la ptéroicidine a ainsi que sur plusieurs peptides de différentes tailles issusdes pteroicidines B et C. Les résultats ont permis de mettre en évidence une relation entre la structure, l’amidation et lesactivités antibactériennes et hémolytiques de ces différentes ptéroicidines. Sur le modèle Sepia officinalis, par lesapproches classiques couplant la purification et les tests antibactériens ou par des approches utilisant les BlAST, aucunPAM n’a été mis en évidence. Nous avons donc développé une approche plus originale qui repose sur le « design » depeptides à partir du transcriptome. A partir de 811 petits peptides sans cystéines issus de la base de données APD, nousavons déterminé des critères récurrents concernant la charge, l’hydrophobicité et la composition en acides aminés. Surla base de ces critères et en s’appuyant sur les outils de prédiction de CAMP, douze peptides ont fait l’objet d’une synthèse.Cinq de ces peptides ont révélé un large spectre d’activités antibactériennes. Les peptides antibactériens issus de la seicheayant une activité non hémolytique ont fait l’objet d’un transfert en écloserie. Ce transfert a été optimisé à partir d’uneétude préliminaire sur le peptide de novo K4, particulièrement actif sur les vibrios. Cette étude a mis en évidencel’importance de l’innocuité du peptide antibactérien sur les différents maillons de la chaine trophique, notamment del’huitre, et sur l’importance du stade de développement ciblé. Par ailleurs, nous nous sommes intéressés au devenir despeptides antibactériens de manière à s’assurer de leur biodégradabilité. L’ensemble de ces travaux a permis nonseulement d’identifier de nouveaux PAMs mais également d’apporter les premières données portant sur le potentiel del’utilisation de ces peptides comme alternative aux antibiotiques. / The first larval stages of oyster (Magallana gigas) are key steps in the smooth running of the zootechnical course and inthe sustainability of hatcheries, where mortality levels can be high. That is why we searched for new antimicrobialpeptides (AMPs) on two marine organisms, i.e. lionfish (Pterois volitans), which is invasive in the Caribbean Sea, and thecommon cuttlefish (Sepia officinalis), which is present in French oyster production areas. The search for AMPs wascarried out preferentially from de novo transcriptomes from these two animals. In lionfish, BLAST analyses allowed forthe identification of 7 transcripts encoding AMPs. Four of them shared strong sequence homology (> 90% identity) withAMPs rich in cysteines and close to hepcidin, LEAP-2, NK-lysin and b-defensin identified in other fish. The other 3transcripts, annotated pteroicidins A, B and C, coded for piscidin-related peptides. The presence of b-defensin andpteroicidin a encoded by pteroicidin A was confirmed in lionfish skin extracts by mass spectrometry. An in-depth studywas conducted on two amide and non-amide forms of pteroicidin a, as well as on several peptides of different sizesderived from pteroicidins B and C. The results highlighted a relationship between structure, amidation, and theantibacterial and hemolytic activities of these different pteroicidins. On the other hand, no AMP was highlighted in theSepia officinalis model using conventional approaches coupling purification and antibacterial tests or BLAST approaches.We therefore developed a more original approach that relies on the design of peptides starting from the transcriptome.Starting from 811 small cysteine-free peptides from the APD database, we determined recurring criteria for charge,hydrophobicity, and amino acid composition. Based on these criteria and on CAMP prediction tools, twelve peptides weresynthesized. Five of them revealed a broad spectrum of antibacterial activities. Non-hemolytic antibacterial peptidesderived from cuttlefish were transferred to the hatchery. This transfer was optimized thanks to a preliminary study onthe de novo K4 peptide, which is particularly active on vibrios. The study highlighted the importance of antibacterialpeptide safety on the various links of the trophic chain including oyster, and the importance of the targeted stage ofdevelopment. In addition, we addressed the fate of antibacterial peptides to ensure their biodegradability. Altogether,this work not only helped to identify new AMPs but also to provide the first data on the potential use of these peptidesas an alternative to antibiotics.
|
927 |
Méthodes statistiques pour la fouille de données dans les bases de données de génomique / Statistical methods for data mining in genomics databases (Gene Set En- richment Analysis)Charmpi, Konstantina 03 July 2015 (has links)
Cette thèse est consacrée aux tests statistiques, visant à comparer un vecteur de données numériques, indicées par l'ensemble des gènes du génome humain, à un certain ensemble de gènes, connus pour être associés par exemple à un type donné de cancer. Parmi les méthodes existantes, le test Gene Set Enrichment Analysis est le plus utilisé. Néanmoins, il a deux inconvénients. D'une part, le calcul des p-valeurs est coûteux et peu précis. D'autre part, il déclare de nombreux résultats significatifs, dont une majorité n'ont pas de sens biologique. Ces deux problèmes sont traités, par l'introduction de deux procédures statistiques nouvelles, les tests de Kolmogorov-Smirnov pondéré et doublement pondéré. Ces deux tests ont été appliqués à des données simulées et réelles, et leurs résultats comparés aux procédures existantes. Notre conclusion est que, au-delà leurs avantages mathématiques et algorithmiques, les tests proposés pourraient se révéler, dans de nombreux cas, plus informatifs que le test GSEA classique, et traiter efficacement les deux problèmes qui ont motivé leur construction. / Our focus is on statistical testing methods, that compare a given vector of numeric values, indexed by all genes in the human genome, to a given set of genes, known to be associated to a particular type of cancer for instance. Among existing methods, Gene Set Enrichment Analysis is the most widely used. However it has several drawbacks. Firstly, the calculation of p-values is very much time consuming, and insufficiently precise. Secondly, like most other methods, it outputs a large number of significant results, the majority of which are not biologically meaningful. The two issues are addressed here, by two new statistical procedures, the Weighted and Doubly Weighted Kolmogorov-Smirnov tests. The two tests have been applied both to simulated and real data, and compared with other existing procedures. Our conclusion is that, beyond their mathematical and algorithmic advantages, the WKS and DWKS tests could be more informative in many cases, than the classical GSEA test and efficiently address the issues that have led to their construction.
|
928 |
A critique of the implementation of crime and intelligence computing in three British Police forces 1976-1986Naylor, Alan S. R. January 2008 (has links)
The study will examine the introduction of the computerisation of crime and intelligence recording in three police forces in the United Kingdom in the decade 1976-1986. The thesis will critique the roles and actions of the main players in this decade, The Home Office in London England, three provincial police forces, Kent County Constabulary, Humberside Police and Lothian and Borders Police, and the computer supply industry. The study will consider the concept of ‘crime' from a jurisprudential viewpoint and will consider the legal imposition on chief officers of police to collect, store and distribute certain crime based data. The study will also examine and analyse in detail three computer projects in different police forces. The use of new, complex and expensive computer programs is highlighted with the introduction of free text searching of large data sources and the need for large scale mainframe computers to handle the analysis and storage of that data. The limited success of two police projects will question the requirement for central government control of publicly funded new technology. The study will examine strategic planning in the process, as well as the rush to be the first police force to embrace the new technology. Further the study will review central government control over public spending, in the first police force based computerisation projects. In conclusion, the thesis will suggest that new police systems should be scaled to local needs and guided by expert central advice. Additionally, chief police officers should be encouraged to use new technology in a strategic manner, sharing outcomes in open fora. Possible new research problems are listed and evaluated.
|
929 |
Podobnostní vyhledávání v databázích proteinových struktur / Similarity Search in Protein Structure DatabasesGalgonek, Jakub January 2012 (has links)
Proteins are one of the most important biopolymers having a wide range of functions in living organisms. Their huge functional diversity is achieved by their ability to fold into various 3D structures. Moreover, it has been shown that proteins sharing similar structure often share also other properties (e.g, a biological function, an evolutionary origin, etc.). Therefore, protein structures and methods to identify their similarities are so widely studied. In this thesis, we introduce a system allowing similarity search in pro- tein structure databases. The system retrieves, given a query structure, all database structures being similar to the query structure. It employs several key components. We have introduced a novel similarity measure assigning similarity scores to pairs of protein structures. We have designed specific access method based on LAESA metric indexing and using the proposed measure. The access method allows to search similar structures more effi- ciently than when a sequential scan of a database is employed. To achieve further speedup, the measure and the access method have been parallelized, resulting in almost linear speedup with the respect to the number of available cores. The last component is a web user interface that allows to accept a query structure and to present a list of...
|
930 |
Nasazení paralelních architektur v podrobnostním vyhledávání / Employing Parallel Architectures in Similarity SearchKruliš, Martin January 2013 (has links)
This work examines the possibilities of employing highly parallel architectures in database systems, which are based on the similarity search paradigm. The main objective of our research is utilizing the computational power of current GPU devices for similarity search in the databases of images. Despite leaping progress made in the past few years, the similarity search problems remain very expensive from a compu- tational point of view, which limits the scope of their applicability. GPU devices have a tremendous computational power at their disposal; however, the usability of this power for particular problems is often complicated due to the specific properties of this architecture. Therefore, the existing algorithms and data structures require extensive modifications if they are to be adapted for the GPUs. We have addressed all the aspects of this domain, such as efficient utilization of the GPU hardware for generic computations, parallelization of similarity search process, and acceleration of image indexing techniques. In most cases, employing the GPU devices brought a speedup of two orders of magnitude with respect to single-core CPUs and approximately one order of magnitude with respect to multiprocessor NUMA servers. This thesis summarizes our experience and discoveries from several years of research,...
|
Page generated in 0.0429 seconds