Global ETD Search

1	Κατασκευή εκπαιδευτικού μικροϋπολογιστικού συστήματος βασισμένο σε ARM Cortex-M3 Αμπντέλ-Καντέρ-Οικονόμου, Αλέξης 13 October 2013 (has links) Στην παρούσα διπλωματική εργασία ακολουθήθηκαν τα περισσότερα βήματα που απαιτεί η τεχνική διαδικασία για την δημιουργία ενός προϊόντος που έχει ως στόχο την εκμάθηση προγραμματισμού πάνω σε ARM πυρήνα. Το κομμάτι της εργασίας μου αφορούσε την δημιουργία της πλακέτας καθώς και την συγκόλληση των στοιχείων πάνω σε αυτή, δημιουργία τρόπου διεπαφής με τον υπολογιστή για τo φόρτωμα του κώδικα λειτουργίας του, την εύρεση πλατφόρμας προγραμματισμού, αλλά και την δημιουργία εκπαιδευτικών ασκήσεων πάνω στο συγκεκριμένο επεξεργαστή. Σκοπός των ασκήσεων είναι η εισαγωγή του αναγνώστη στην λογική και τον προγραμματισμού του ARM Cortex-M3. / Most of the steps required during the technical procedure of producing an Arm core based evaluation board were followed in the current diploma thesis. My personal assignment included the design of the printed circuit board, soldering of the components on the board, establishing a way of communication between a personal computer and the board for downloading the source code, finding a programming platform and the creation of exercises for the specific processor used on the board. The purpose of the exercises is the introduction of the reader in the programming logic of ARM Cortex-M3. Μικροεπεξεργαστές 005.265 Microprocessors Arm evalution board Arm Cortex M3
2	Σχεδίαση κατασκευή και υλοποίηση σύγχρονου μικροϋπολογιστικού συστήματος Βουγιούκας, Ηλίας 13 October 2013 (has links) Η εργασία αυτή ερευνά την σχεδίαση ενός σύγχρονου μικροϋπολογιστικού συστήματος βασισμένο σε επεξεργαστή ARM COrtex-M3. Στα πλαίσια αυτής της σχεδίασης έγινε μελέτη των συσκευών που είναι απαραίτητες για την λειτουργία ενός παλμογράφου, και σχεδιάστηκε λογισμικό προσέγγισης της λειτουργίας των βασικών περιφερειακών του. Επιπλέον, γίνεται μια ανάλυση ενός συστήματος απεικόνισης γραφικών, χωρίς την χρήση του μικροελεγκτή, και ποιοτικός σχεδιασμός του συστήματος αυτού. Τέλος, εξάγονται συμπεράσματα για πολυπλοκότητα του σχεδίου και σχολιάζονται οι συμβιβασμοί που είναι απαραίτητοι για την υλοποίηση ενός συστήματος πραγματικού χρόνου. / This thesis analyzes the design of a modern microprocessing system based on an ARM Cortex-M3 microcontroller. For the implemantation of the design thorough research on the necessary peripherals of an oscilloscope is presented and several applications simulating the behavior of its basic functions via its peripherals. Furthermore, a qualitative design is created on a potential graphical processing system, able to fulfill all of the tasks needed to depict on-screen, without burdening the central processor. Conclusions are drawn on the complexity of the design and the tradeoffs of designing a realtime system. Μικροεπεξεργαστές Παλμογράφοι Μικροελεγκτές 005.265 ARM processors Embedded systems Microcontrollers Oscilloscopes SAM3U4E
3	Αρχιτεκτονική προσομοίωση σε επεξεργαστικές μονάδες υψηλού βαθμού παραλληλίας Στρίκος, Νικόλαος 11 January 2011 (has links) Η πρόσφατη εξάπλωση που είδε το μοντέλο της παράλληλης επεξεργασίας στους μικροεπεξεργαστές γενικής χρήσης με την εισαγωγή περισσότερων από έναν πυρήνες εντός του ολοκληρωμένου κυκλώματος έφερε νέες απαιτήσεις στις μεθόδους προσομοίωσης που παραδοσιακά χρησιμοποιήθηκαν για την εξερεύνηση νέων αρχιτεκτονικών. Στην εργασία αυτή προτείνεται ένα πλαίσιο και ένα προγραμματιστικό μοντέλο που κάνει χρήση της αρχιτεκτονικής υψηλού βαθμού παραλληλίας CUDA για να επιτύχει επιτάχυνση στην αρχιτεκτονική προσομοίωση πρωτοκόλλων συνοχής κρυφής μνήμης. / The recent adoption of the parallel computing model in general-use microprocessors with the inclusion of more than one cores in the IC has raised new demands for the simulation methodologies that have been traditionally used. In this work, a framework and a programming model are proposed that make use of the highly parallel CUDA platform to accelerate architectural simulation of cache coherency protocols. Μικροεπεξεργαστές Κρυφή μνήμη 005.275 GPU CUDA Cache coherency protocols Parallel simulation
4	Παραμετρική σχεδίαση και βελτιστοποίηση δυναμικά επαναδιαμορφουμένων επεξεργαστών πρωτοκόλλων προσπέλασης μέσου Ηλιόπουλος, Μάριος Γ. 15 July 2010 (has links) - / - Τηλεπικοινωνία Πληροφορική Δεδομένα Συστήματα μετάδοσης Μικροεπεξεργαστές 384 Telecommunication Informatics Data Transmission systems Microprocessor
5	Σχεδίαση ενός 8-bit μικροεπεξεργαστή (του μP 8085) σε VHDL και υλοποίηση σε FPGAs Πρίσκας, Θεόδωρος 15 October 2012 (has links) Ο σκοπός της παρούσας Διπλωματικής Εργασίας είναι η μελέτη και η υλοποίηση ενός 8085 προσομοιωτή σε FPGAs με τη χρήση VHDL. H υλοποίηση έγινε με την βοήθεια του περιβάλλοντος εξομοίωσης του Quartus v7.2 της ALTERA, με την χρήση της γλώσσας VHDL [8],[10].Η εργασία αυτή χωρίζεται σε 12 κεφάλαια: Στο πρώτο κεφάλαιο γίνεται αναφορά στο μικροεπεξεργαστή και στα τεχνικά του γνωρίσματα [1], [2], [4]. Στο δεύτερο κεφάλαιο γίνεται μια εκτενής αναφορά στη γλώσσα VHDL [3], [10]. Στο τρίτο κεφάλαιο παρουσιάζεται η αναπτυξιακή πλατφόρμα DE2 της εταιρίας ALTERA. Παρουσιάζονται αναλυτικά οι δυνατότητες και τα σχεδιαστικά χαρακτηριστικά της αναπτυξιακής κάρτας DE2 της ALTERA καθώς και τεχνική απεικόνισης video με τη χρήση FPGA [3], [9], [14]. Στο τέταρτο κεφάλαιο αναλύεται η λειτουργία του πρώτου μεγάλου τμήματος του μικροεπεξεργαστή, της ALU. Παρουσιάζεται η αρχιτεκτονική υλοποίησης του κυκλώματος, η λειτουργία κάθε επιμέρους τμήματος καθώς και ο αναλυτικός κώδικας εξομοίωσης του. Η πιστοποίηση της ορθής λειτουργίας του κυκλώματος γίνεται με την βοήθεια του waveform editor του προγράμματος [5], [6], [12], [13]. Στο πέμπτο κεφάλαιο αναλύεται η λειτουργία του register file. Πρόκειται για το τμήμα των καταχωρητών, το οποίο είναι υπεύθυνο για την μεταφορά δεδομένων και την λειτουργία των διαύλων διευθύνσεων. Παρουσιάζεται η αρχιτεκτονική υλοποίησης του κυκλώματος, η λειτουργία κάθε επιμέρους τμήματος καθώς και ο αναλυτικός κώδικας εξομοίωσης του. Η πιστοποίηση της ορθής λειτουργίας του κυκλώματος γίνεται με την βοήθεια του waveform editor του προγράμματος [5], [7], [11], [13], [14]. Στο έκτο κεφάλαιο αναλύεται η λειτουργία του τμήματος ελέγχου διακοπών. Πρόκειται για το τμήμα το οποίο εξυπηρετεί οποιαδήποτε αίτηση για διακοπή και το οποίο έχει οριστεί να είναι υπεύθυνο και για την σειριακή επικοινωνία. Παρουσιάζεται η αρχιτεκτονική υλοποίησης του κυκλώματος, η λειτουργία κάθε επιμέρους τμήματος καθώς και ο αναλυτικός κώδικας εξομοίωσης του. Η πιστοποίηση της ορθής λειτουργίας του κυκλώματος γίνεται με την βοήθεια του waveform editor του προγράμματος [1], [12], [13]. Στο έβδομο κεφάλαιο γίνεται μια πρώτη απόπειρα σύνδεσης των τριών πρώτων μεγάλων τμημάτων του μικροεπεξεργαστή [12], [13]. Στο όγδοο κεφάλαιο αναλύεται η λειτουργία της control unit ως μονάδα ελέγχου και διαχείρισης των σημάτων ελέγχου του όλου κυκλώματος του μικροεπεξεργαστή. Παρουσιάζεται η αρχιτεκτονική υλοποίησης του κυκλώματος, η λειτουργία κάθε επιμέρους τμήματος καθώς και ο αναλυτικός κώδικας εξομοίωσης του. Η πιστοποίηση της ορθής λειτουργίας του κυκλώματος γίνεται με την βοήθεια του waveform editor του προγράμματος [5], [7], [12], [13]. Στο ένατο κεφάλαιο παρουσιάζεται το κύκλωμα του μικροεπεξεργαστή μέσα από την σύνδεση των επιμέρους τμημάτων του. Παρουσιάζεται η αρχιτεκτονική υλοποίησης του και ο αναλυτικός κώδικας εξομοίωσης του. Η πιστοποίηση της ορθής λειτουργίας του κυκλώματος γίνεται με την βοήθεια του waveform editor του προγράμματος [7], [12], [13]. Στο δέκατο κεφάλαιο παρουσιάζεται ο μικροπρογραμματισμός της microprogram ROM της control unit. Αναλύεται διεξοδικά η λειτουργία των σημάτων ελέγχου των τμημάτων του μικροεπεξεργαστή για την εκτέλεση κάθε μιας εντολής του 8085 [7], [12], [13]. Στο ενδέκατο κεφάλαιο γίνεται εξομοίωση ορισμένων προγραμμάτων για τον έλεγχο της ορθής λειτουργίας των εντολών και των σημάτων ελέγχου και εξόδου του μικροεπεξεργαστή 8085 [1], [12], [13]. Στο δωδέκατο κεφάλαιο παρουσιάζεται η υλοποίηση του μικροεπεξεργαστή στην αναπτυξιακή πλατφόρμα DE2 της εταιρείας ALTERA [3], [14]. Τελειώνοντας θα ήθελα να ευχαριστήσω τον επιβλέποντα της προσπάθειας αυτής Αναπληρωτή Καθηγητή κ. Ευάγγελο Ζυγούρη, η καθοδήγηση του οποίου υπήρξε καθοριστική. / The purpose of this thesis is the design of an 8085 emulator in FPGAs using VHDL. The implementation was done with the simulation environment of ALTERA Quartus v7.2, using VHDL. The project is divided into 12 chapters: The first chapter refers to the 8085 microprocessor and it’s technical features [1], [2], [4]. The second chapter is a detailed presentation of the VHDL language [3], [10]. The third chapter presents DE2 development board of Altera. Capabilities and design features of DE2 board are presented and vga video display generation using FPGAs is explained [3], [9], [14]. The fourth chapter analyzes the operation of the first large section of the microprocessor, ALU. The architecture of the circuit, the function and the detailed code is presented. The verification of the circuit is done by using the Quartus waveform editor program [5], [6], [12], [13]. The fifth chapter presents the operation of the register file. Register File is responsible for data transfer and operation of the address bus. The architecture of the circuit, the function and the detailed code is presented. The verification of the circuit is done by using the Quartus waveform editor program [5], [7], [11], [13], [14]. The sixth chapter presents microprocessor 's interrupts. The architecture of the circuit, the function and the detailed code is presented. The verification of the circuit is done by using the Quartus waveform editor program [1], [12], [13]. The seventh chapter is a first attempt to link the first three major sections of the microprocessor [12], [13]. The eighth chapter presents the operation of the control unit. The architecture of the circuit, the function and the detailed code is presented. The verification of the circuit is done by using the Quartus waveform editor program [5], [7], [12], [13]. The ninth chapter presents the circuit of the microprocessor through the connection of all individual parts. The architecture of the circuit, the function and the detailed code is presented. The verification of the circuit is done by using the Quartus waveform editor program [7], [12], [13]. The tenth chapter presents the microprogramming of microprogram ROM of the control unit. It analyzes in detail the operation of the control signals of the parts of the microprocessor to perform each of 8085 command [7], [12], [13]. The eleventh chapter presents the simulation of microprocessor through assembly programs written in RAM memory of 8085 microprocessor [1], [12], [13]. The twelfth chapter presents the implementation of microprocessor in FPGAs using DE2 development board of Altera [3], [14]. Προσομοιωτής 8085 Μικροεπεξεργαστές 004.16 8085 emulator Microprocessors Quartus
6	Ανάπτυξη αυτοματοποιημένου μετρητικού συστήματος για διάταξη διασύνδεσης φ/β γεννητριών με το δίκτυο χαμηλής τάσης Αντωνίου, Χρήστος 16 June 2011 (has links) Η παρούσα διπλωματική εργασία πραγματεύεται την μελέτη και κατασκευή μιας διάταξης μετρήσεων για φωτοβολταϊκά συστήματα. Η εργασία αυτή εκπονήθηκε στο Εργαστήριο Ηλεκτρομηχανικής Μετατροπής Ενέργειας του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών. Σκοπός είναι η υλοποίηση ενός εργαλείου με το οποίο ο χρήστης θα μπορεί να έχει την επίβλεψη των μεγεθών της ηλεκτρικής ενέργειας που διακινούνται από το σύστημα του. Για παράδειγμα να γνωρίζει τα ποσά ισχύος που παράγονται, τα επίπεδα της τάσης και του ρεύματος ακόμα και τα ποσά ισχύος με τα οποία μπορεί να τροφοδοτήσει το δίκτυο της ΔΕΗ αν σκοπεύει να χρησιμοποιεί μέρος της παραγόμενης ενέργειας για της ανάγκες του και να πουλά το περίσσευμα. Αρχικά έγινε η μελέτη και κατασκευή μιας πλακέτας για την προσαρμογή του πραγματικού σήματος του ρεύματος και της τάσης. Ο επεξεργαστής ο οποίος χρησιμοποιείται σε τέτοιου είδους εφαρμογές δεν μπορεί να «διαβάσει» σήματα των οποίων το πλάτος ξεπερνά τα 5 V. Οπότε πρέπει εμείς να φέρουμε τα μεγάλα σήματα σε τέτοια κλίμακα ώστε να είναι διαχειρίσιμα. Ακόμα πρέπει να μετατρέψουμε το σήμα ρεύματος σε σήμα τάσης ανάλογης κλίμακας για να είναι διαχειρίσιμο και αυτό από το υπολογιστικό σύστημα. Στη συνέχεια έγινε μελέτη της διαδικασίας της δειγματοληψίας και αφού υπολογίστηκαν και το SNR, η το ελάχιστο σφάλμα δειγματοληψίας σχεδίασα ένα κατωδιαβατό φίλτρο τύπου Butterworth 4ης τάξης για να περιορίσω τα φαινόμενα aliasing που δημιουργούνται λόγω αλλοίωσης. Το επόμενο βήμα, το οποίο ήταν και το πιο δύσκολο και απαιτητικό, ήταν να σχεδιαστεί ο κώδικας με τον οποίο θα γινόταν η δειγματοληψία και ο υπολογισμός των μεγεθών που μας ενδιέφεραν σε πραγματικό χρόνο (real time). Έγινε πολλαπλασιασμός σε γλώσσα μηχανής (assembly) και χρήση μόνο ακεραίων τιμών για να γίνει ο κώδικας όσο γίνεται πιο γρήγορος μιας και σε ένα τέτοιο σύστημα το βασικότερο που μας απασχολεί είναι η ταχύτητα των πράξεων. Ακόμα χρειάστηκε να συντονιστούν με σήματα interrupt διάφορα περιφερειακά του μικροελεγκτή για να δουλέψει σωστά το σύστημα. Τέλος έγινε προσπάθεια διασύνδεσης του υπάρχοντος προγράμματος με Η/Υ μέσω σειριακής για να γίνει απεικόνιση των αποτελεσμάτων μέσω μιας γραφικής διεπαφής (GUI). / This thesis is about a measuring system for a Photo voltaic Array connected to the grid. In the first chapter there is a survey for the importance of sustainable power sources. Next the project is presented. After that there is a chapter about the sensors that are used. The method of sampling and and filtering the signal is described in the next 3 chapters. Last but not least in the last chapter the user interface is presented Φαινόμενα αλλοίωσης Δειγματοληψία Κβάντιση Μικροεπεξεργαστές Φίλτρα 621.312 44 Photovoltaic systems Renewable energy sources Aliasing Filters Microprocessors PIC18f452 Anti-aliasing
7	Σχεδίαση και κατασκευή ηλεκτρονικών κυκλωμάτων και συστημάτων Προδρομάκης, Αντώνιος, Καλουδιώτης, Ευάγγελος 24 October 2012 (has links) Στην παρούσα διπλωματική εργασία, σχεδιάζονται και υλοποιούνται συστήματα με βάση τη πλατφόρμα του Arduino. Το πρώτο σύστημα αφορά ένα Wireless Persistence of Vision Display, ουσιαστικά μία οθόνη, σχήματος δίσκου, που αποτελείται από μία περιστρεφόμενη στήλη LEDs. Συνεχίζουμε με το σχεδιασμό ενός συστήματος ικανού για γρήγορη πρόβλεψη και ανακατασκευή σημάτων, με σκοπό τη μελλοντική χρήση του στο συγχρονισμό ενεργειακών δικτύων. Ύστερα προχωράμε στην υλοποίηση ενός συστήματος εντοπισμού διεύθυνσης πηγής ήχου, μέσα από την ψηφιακή επεξεργασία ηχητικών σημάτων. Τέλος, η εμπειρία που αποκομίσθηκε με βάση το Arduino μας οδήγησε στη μελέτη μιας εκπαιδευτικής πλατφόρμας βασισμένη σε FPGA, το «F-Penguino», που ως στόχο έχει να αναδείξει την ευελιξία και ταχύτητα συστημάτων βασισμένα σε υλοποίηση με περιγραφή υλικού / In this thesis, we design and implement various systems based on the Arduino platform. The first system is a Wireless Persistence of Vision Display, which is actually a round screen, made of a rotating column of LEDs. We also design a system capable of fast prediction and reconstruction of signals, with an utter goal, its future use in effectively connecting different power networks. Furthermore, we implement a sound source localization system, using DSP techniques and fundamental robotics. Finally, the experience obtained using the Arduino, led us to involve with an FPGA based platform, the “F-Penguino”, the goal of which is to indicate the versatility and speed of systems based on hardware-description implementations. Μικροϋπολογιστές Μικροελεγκτές Μικροεπεξεργαστές 621.39 F-Penguino Arduino wireless POV display Embedded systems Microcomputers Microcontrollers Microprocessors
8	Μονάδες επεξεργασίας δεδομένων για μικροεπεξεργαστές υψηλών αποδόσεων Δημητρακόπουλος, Γεώργιος 16 March 2009 (has links) Οι μονάδες επεξεργασίας δεδομένων αποτελούν τις βασικές δομικές μονάδες όλων των μικροεπεξεργαστών. Κάποια από τα κυκλώματα αυτής της κατηγορίας υλοποιούν τις βασικές αριθμητικές πράξεις πάνω σε δεδομένα τόσο σταθερής όσο και κινητής υποδιαστολής, ενώ κάποια άλλα αναλαμβάνουν την αναδιοργάνωση των δεδομένων αυτών για την επιτάχυνση του υπολογισμού. Σε επεξεργαστές ειδικού σκοπού, όπως οι επεξεργαστές πολυμέσων και γραφικών, οι μονάδες επεξεργασίας δεδομένων καταλαμβάνουν περισσότερο από το 30% του ολοκληρωμένου και η αποτελεσματική σχεδίαση τους έχει άμεσο αντίκτυπο στην απόδοση ολόκληρου του συστήματος. Στο μέλλον, αναμένεται πως ακόμα και οι επεξεργαστές γενικού σκοπού, θα είναι εξοπλισμένοι από εξειδικευμένους επιταχυντές, οι οποίοι θα εκτελούν απ’ ευθείας σε υλικό σύνθετους αλγορίθμους με μεγάλες υπολογιστικές απαιτήσεις. Η βάση όλων των προτεινόμενων λύσεων σ’ αυτή τη διατριβή είναι η αναλυτική εύρεση ενός εγγενώς απλούστερου αλγορίθμου, ο οποίος θα επιτρέπει την αποτελεσματική υλοποίηση των αντίστοιχων κυκλωμάτων ανεξάρτητα από την τεχνολογία που θα χρησιμοποιηθεί και από τους επιπλέον περιορισμούς που τυχόν θα επιβληθούν στο μέλλον κατά την κατασκευή των κυκλωμάτων αυτών. Η ανάλυση και τα πειραματικά αποτελέσματα που συλλέξαμε βασίζονται τόσο σε υλοποιήσεις σε επίπεδο τρανζίστορ, που είναι η κύρια μέχρι τώρα πρακτική σχεδίασης των μικροεπεξεργαστών υψηλών επιδόσεων, όσο και σε πλήρως αυτοματοποιημένες υλοποιήσεις. Φυσικά, στη δεύτερη περίπτωση η απόδοση των κυκλωμάτων επιβαρύνεται, τόσο σε καθυστέρηση όσο και σε ενέργεια, εξαιτίας των περιορισμών των αυτοματοποιημένων εργαλείων και την αναγκαστική χρήση των προσχεδιασμένων βιβλιοθηκών βασικών πυλών. Η μελέτη που πραγματοποιήσαμε στοχεύει στην πλήρη εξερεύνηση του χώρου λύσεων των κυκλωμάτων αυτών. Η ανάλυση της συμπεριφοράς τους πραγματοποιήθηκε χρησιμοποιώντας τις βέλτιστες καμπύλες της ενέργειας ως προς την καθυστέρηση, οι οποίες αποτελούν τον πιο έγκυρο τρόπο περιγραφής της απόδοσης ενός κυκλώματος. Τα κυκλώματα που παρουσιάζονται ανήκουν σε τρεις βασικές κατηγορίες. Στην πρώτη ανήκουν οι αθροιστές παράλληλου προθέματος, που χρησιμοποιούν τα κρατούμενα του Ling για την υλοποίηση της δυαδικής πρόσθεσης. Τα κρατούμενα που προτάθηκαν από τον Ling αποτελούν απλοποιημένες μορφές των κλασικών σχέσεων πρόβλεψης κρατουμένου και χρησιμοποιούνται αυτή τη στιγμή στην πλειοψηφία των εμπορικών επεξεργαστών. Το νέο κύκλωμα, που προτείναμε, αποτελεί ουσιαστικά τη γενίκευση των σχέσεων αυτών, επιτρέποντας την υλοποίηση τους με απλοποιημένες δομές παράλληλου προθέματος, με αποτέλεσμα τη μείωση τόσο της καθυστέρησης όσο και της απαιτούμενης ενέργειας. Η νέα τεχνική οδηγεί σε γρηγορότερα κυκλώματα ανεξάρτητα από τη λογική οικογένεια που θα χρησιμοποιηθεί (στατική ή δυναμική CMOS λογική) και το δένδρο παράλληλου προθέματος που θα επιλεγεί. Η δεύτερη κατηγορία αναφέρεται σε κυκλώματα αναδιάταξης των δεδομένων που είναι αποθηκευμένα μέσα στους καταχωρητές του επεξεργαστή. Η αποδοτική αναδιάταξη των δεδομένων καταλήγει να είναι σε πολλούς αλγορίθμους (κρυπτογραφία, ψηφιακή επεξεργασία σήματος, πολυμέσα) τόσο αναγκαία όσο και η γρήγορη υλοποίηση των βασικών αριθμητικών πράξεων, αλλά και η ταχεία επικοινωνία με τη μνήμη. H προσπάθεια μας εστιάστηκε στην αποδοτική υλοποίηση μιας γενικής εντολής αναδιάταξης δεδομένων, στοχεύοντας σε όσο το δυνατόν ταχύτερες υλοποιήσεις. Όλες οι εκδοχές που προτείναμε στηρίζονται σε μια νέα μορφή δικτύων ταξινόμησης, η οποία μας επιτρέπει να παρέχουμε λύσεις που είναι σημαντικά πιο αποδοτικές σε σχέση με τις ήδη υπάρχουσες. Τα κυκλώματα που προτείνουμε κατασκευάζονται με τη χρήση ενός μόνο κελιού υπολογισμού (διαφορετικό για κάθε δίκτυο ταξινόμησης) και διατηρούν μια πλήρως κανονική δομή. Το στοιχείο αυτό, συμβάλλει, πέρα από τη βελτίωση της απόδοσης, στην αποτελεσματικότερη χωροθέτηση του κυκλώματος και στη μείωση των αρνητικών επιδράσεων των γραμμών διασύνδεσης. Η τελευταία κατηγορία κυκλωμάτων αναφέρεται σε κυκλώματα που χρησιμοποιούνται για την υλοποίηση της πρόσθεσης αριθμών κινητής υποδιαστολής. Τα κυκλώματα που προτείνουμε χρησιμοποιούνται στα πιο κρίσιμα στάδια, από πλευράς καθυστέρησης, του υπολογισμού του αθροίσματος και αφορούν στην πρόσθεση των μεγεθών και στην κανονικοποίηση του αποτελέσματος. Αρχικά, περιγράφουμε μια εναλλακτική προσέγγιση για την υλοποίηση των αθροιστών μεγέθους των αριθμών κινητής υποδιαστολής. Οι νέες μονάδες εκμεταλλεύονται την αναπαράσταση συμπληρώματος ως προς ένα και τις γρήγορες μονάδες υπολογισμού του κρατουμένου, που βασίζονται στην τεχνική παράλληλου προθέματος. Προτείνουμε μια ενοποιημένη μεθοδολογία για το πως μπορούμε να παράγουμε δομές παράλληλου προθέματος ανεξάρτητα από το μέγεθος της λέξης εισόδου, ενώ καταφέρνουμε να ενώσουμε για πρώτη φορά τις απλοποιημένες σχέσεις κρατουμένου του Ling με την πρόσθεση αριθμών που ακολουθούν την αναπαράσταση συμπληρώματος ως προς ένα. Στη συνέχεια, περιγράφεται ένας νέος απλός τρόπος για την υλοποίηση της πρόβλεψης και της μέτρησης των προπορευόμενων μηδενικών που εμφανίζονται στα αποτελέσματα των πράξεων αριθμών κινητής υποδιαστολής. Με τη χρήση των νέων κυκλωμάτων η κανονικοποίηση του αποτελέσματος μπορεί να πραγματοποιηθεί σε λιγότερο χρόνο και με σημαντικά μικρότερη ενέργεια. / Data processing units (or simply datapath) constitute a major part of all microprocessors. They take over the execution of all arithmetic operations either of fixed point or floating-point data, while they are also responsible for the execution of the needed data rearrangements in order to speed up the computation. In application-specific processors used for media and graphics applications, datapath circuits occupy more than one third of the processor’s core area and their efficient design directly affects the energy-delay behavior of the whole circuit. In the near future, it is expected that even general-purpose processors will be equipped we specialized accelerators that will execute directly in hardware complex algorithms with large computational demands. The basis of all circuits presented in this thesis is the derivation of an inherently simpler algorithm that would allow their efficient implementation irrespective the technology used and the constraints that would be imposed in the future, concerning the reliable and more predictable circuit fabrication in very deep submicron technologies. Our analysis relies on full-custom transistor-level designs that is the most common technique employed in high-performance microprocessor design. The performance of some of the presented circuits has also been investigated using an automated design flow. It is expected that, in these cases, the performance of the presented circuits will be aggravated due to the limitations imposed by the design automation tools and the available standard cell library. In this study, we aim at fully exploring the design space of our circuits. For this reason, we derived an optimal energy-delay curve for each one of the examined circuits in order to analyze its behavior. An energy-delay curve is the most reliable metric for presenting the performance of a circuit and allows the designer to perform a fair comparison among various design alternatives and circuit topologies. The new circuits presented in this thesis belong to three categories. In the first class, we find the parallel prefix adders that adopt the carries proposed by Ling. These carries are a simplified form of the classic carry lookahead equations and they are used at the moment in the majority of commercial high-speed microprocessors. The newly proposed circuits are based on a transformation of the Ling carries that leads to more efficient parallel prefix structures, which are better suited for Ling-carry computation. This new technique offers faster implementations irrespective the logic family used (either static or dynamic CMOS) and the prefix structure selected for the implementation. The second class refers to circuits that rearrange the data stored inside one or more of the processor’s registers. Efficient data rearrangement ends up being, in many cases, such as cryptography, digital signal processing, and multimedia applications, as essential as the fast implementation of basic arithmetic operations and the high bandwidth processor-memory communication. Our effort has focused on the efficient implementation of one of the most versatile permutation instruction, aiming to the reduction of the delay of the corresponding circuit. The design of the proposed permutation units is put under a common framework and their functionality resembles that of sorting networks. All the presented variants are designed using a single processing element (different for each sorting network) and have a very regular structure. This fact significantly contributes to the delay reduction because of the regular placement of the circuits’ cells that also alleviates the interconnect delay overhead. The last class of circuits is used for the implementation of high-speed floating-point units. The proposed circuits participate in two of the most time critical parts of any floating-point adder that is the significand (or fraction) adder and the result normalization unit. At first, we describe an alternative implementation of the significant adder that employs the one’s complement representation in order to reduce the delay of the circuit. The proposed parallel-prefix structures are derived using a general design methodology that leads to efficient designs irrespective the wordlength of the input operands. Also, we managed for the first time to produce simplified parallel-prefix carry computation units for the case of one’s complement addition that rely on the definition of Ling carries. Secondly, we describe a simple and practical algorithm for counting the number of leading zeros that may appear in the result of floating-point addition. New circuits are also presented that simplify the design of the corresponding leading zero anticipation logic. Using the proposed structures, normalization can be performed with less delay and significantly reduced power dissipation compared to already known implementations. Μικροεπεξεργαστές 621.39 Very large scale integration (VLSI) Datapath design Floating point units

Search results