<p>Formålet med denne oppgaven var å se på muligheten for samling av flere annoterings- og interaksjonsdatabaser, for dermed å kunne forbedre identifiseringen av protein-/genforekomster og -interaksjoner i biomedisinske artikkel-sammendrag. For å underbygge vurderingene foretatt i oppgaven er en prototype implementert. Den viser hvordan man kan hente ut aktuell informasjon fra forskjellige annoterings- og interaksjonsdatabaser, og lagre dem i en felles relasjonsdatabase. I prototypen blir relasjonsdatabasen indeksert og det er implementert muligheter for tekstsøk mot indeksen. Resultatet av søk viser protein-/gennavn og/eller -synonymer fra relasjons-databasen, samt tilleggsinformasjon som symbol/id, interaksjoner med andre protein/gen og kryssreferanser mellom annoteringsdatabasene. For å teste om prototypen fungere som ønsket og at relasjonsdatabasen lagrer informasjon på en tilfredsstillende måte, er det hentet ut testsett fra annoterings- og interaksjonsdatabasene.Testresultatene viser at informasjon blir lagret, indeksert og kan gjenfinnes på en måte som oppfyller de stilte kravene. Vurderingene som er foretatt, sammen med prototypen, viser at en felles relasjonsdatabase vil være mulig og kan fungere bra for identifisering av protein-/genforekomster i artikkelsammendrag. Til tross for dette er det mange utfordringer som gjenstår før en slik samling vil fungere optimalt. Blant annet er mange av annoterings- og interaksjonsdatabasene forskjellige både i struktur og innhold, samt at det av forskjellige grunner kan være vanskelig å hente ut data fra dem. Dette er også mye av grunnen til at lite forskning er utført innenfor dette området og at det må vurderes hvorvidt det er hensiktsmessig og forsette arbeidet med å utvikle en slik samling, med tanke på ressursbruk og hva man kan få igjen for det.</p>
Identifer | oai:union.ndltd.org:UPSALLA/oai:DiVA.org:ntnu-10361 |
Date | January 2007 |
Creators | Hæreid, Mari Lie |
Publisher | Norwegian University of Science and Technology, Department of Computer and Information Science, Institutt for datateknikk og informasjonsvitenskap |
Source Sets | DiVA Archive at Upsalla University |
Language | Norwegian |
Detected Language | Norwegian |
Type | Student thesis, text |
Page generated in 0.0023 seconds