Tietokannat ovat tärkeä osa nyky-yhteiskuntaa. Niitä tarvitaan lähes kaikessa päivittäisessä liiketoiminnassa. Tietokantojen rivimäärät ovat kasvaneet niin suuriksi, että niitä pyörittävien levyjärjestelmien suorituskyky ei sellaisenaan riitä hakemaan tietoa riittävän nopeasti. Tietokannan huolellisella suunnittelulla ja suorituskyvyn virittämisellä on merkittävä rooli niiden tehokkaan toimintakyvyn kannalta.
Tämän diplomityön tavoitteena on tutkia ja valita sopivin tietokannan hallintajärjestelmä, sekä suunnitella tietokantarakenne joukkoistamispohjaiselle innovointipalvelulle. Tietokannan sisältö päivittyy jatkuvasti, ja päätöksiä varten tiedon haku tietokannasta tulee tapahtua mahdollisimman nopeasti.
Kirjallisuustutkimuksen perusteella sopivimmaksi tietokannan hallintajärjestelmäksi valikoitui avoimeen lähdekoodiin perustuva PostgreSQL. Tietokantarakenteen suunnittelun jälkeen indeksoinnin vaikutusta suorituskykyyn testattiin avoimen lähdekoodin ohjelmistokehyksellä joka tukee Python-ohjelmointikieltä. Ohjelmistokehys liitettiin Internetissä toimivaan kehitysympäristöön, jolloin testit voitiin suorittaa oikeassa verkkoympäristössä. Testiympäristöön ladattiin Python-komentosarjoilla eri kokoluokan tauluita, joiden satunnaisesti luotu data vastasi käytännön sisältöä. Testeillä todettiin indeksoinnin vaikutus hakunopeuksiin.
Tulosten perusteella tietokannan indeksoinnilla on merkittävä vaikutus tietokannan suorituskyvyn kannalta. Lisäksi voidaan todeta, että avoimen lähdekoodin tietokannan hallintajärjestelmät ovat yhtä päteviä päivittäisen liiketoiminnan ylläpitämiseen kuin kaupalliset tietokannan hallintajärjestelmät. / Databases are an important part of modern society. Most businesses utilize databases to maintain their daily operations. Databases have grown significantly large in size. Computer systems running these databases encounter performance issues regardless of their computing capacity. Careful planning of database structure and its indexing has tremendous impact on database performance.
The aim of this Master’s thesis is to research and choose the most suitable database management system for a crowd sourcing based innovation service and design its database structure. Data stored in database is highly volatile, and database queries must perform as quickly as possible to make further decisions.
PostgreSQL was chosen as the database management system. Open source database management systems have grown their popularity over the years. After the database was designed, the impact of indexing was tested using an open source web framework that is developed with Python. The framework was attached to a Web based development environment, which enabled testing in a live network. Test tables were filled with random data generated with Python scripts. Despite randomness the data corresponds to actual data used in the innovation service. Test tables were used to verify the impact of indexing.
Test results show that indexing has a significant role in database performance. Moreover, open source database management systems are equally competitive to leading commercial database management systems.
Identifer | oai:union.ndltd.org:oulo.fi/oai:oulu.fi:nbnfioulu-201404271313 |
Date | 08 May 2014 |
Creators | Huhtala, A. (Arto) |
Publisher | University of Oulu |
Source Sets | University of Oulu |
Language | Finnish |
Detected Language | Finnish |
Type | info:eu-repo/semantics/masterThesis, info:eu-repo/semantics/publishedVersion |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess, © Arto Huhtala, 2014 |
Page generated in 0.0308 seconds