Global ETD Search

Return to search

Felles ordbok for identifisering av protein-/genforekomster og interaksjoner i biomedisinske artikkelsammendrag. : muligheter og utfordringer / Dictionary for identification of protein-/gen occurrences and interactions in biomedical abstracts. : possibilities and challenges

<p>Formålet med denne oppgaven var å se på muligheten for samling av flere annoterings- og interaksjonsdatabaser, for dermed å kunne forbedre identifiseringen av protein-/genforekomster og -interaksjoner i biomedisinske artikkel-sammendrag. For å underbygge vurderingene foretatt i oppgaven er en prototype implementert. Den viser hvordan man kan hente ut aktuell informasjon fra forskjellige annoterings- og interaksjonsdatabaser, og lagre dem i en felles relasjonsdatabase. I prototypen blir relasjonsdatabasen indeksert og det er implementert muligheter for tekstsøk mot indeksen. Resultatet av søk viser protein-/gennavn og/eller -synonymer fra relasjons-databasen, samt tilleggsinformasjon som symbol/id, interaksjoner med andre protein/gen og kryssreferanser mellom annoteringsdatabasene. For å teste om prototypen fungere som ønsket og at relasjonsdatabasen lagrer informasjon på en tilfredsstillende måte, er det hentet ut testsett fra annoterings- og interaksjonsdatabasene.Testresultatene viser at informasjon blir lagret, indeksert og kan gjenfinnes på en måte som oppfyller de stilte kravene. Vurderingene som er foretatt, sammen med prototypen, viser at en felles relasjonsdatabase vil være mulig og kan fungere bra for identifisering av protein-/genforekomster i artikkelsammendrag. Til tross for dette er det mange utfordringer som gjenstår før en slik samling vil fungere optimalt. Blant annet er mange av annoterings- og interaksjonsdatabasene forskjellige både i struktur og innhold, samt at det av forskjellige grunner kan være vanskelig å hente ut data fra dem. Dette er også mye av grunnen til at lite forskning er utført innenfor dette området og at det må vurderes hvorvidt det er hensiktsmessig og forsette arbeidet med å utvikle en slik samling, med tanke på ressursbruk og hva man kan få igjen for det.</p>

ntnudaim

MIT informatikk

Informasjonsforvaltning

Identifer	oai:union.ndltd.org:UPSALLA/oai:DiVA.org:ntnu-10361
Date	January 2007
Creators	Hæreid, Mari Lie
Publisher	Norwegian University of Science and Technology, Department of Computer and Information Science, Institutt for datateknikk og informasjonsvitenskap
Source Sets	DiVA Archive at Upsalla University
Language	Norwegian
Detected Language	Norwegian
Type	Student thesis, text

Page generated in 0.0017 seconds

Felles ordbok for identifisering av protein-/genforekomster og interaksjoner i biomedisinske artikkelsammendrag. : muligheter og utfordringer / Dictionary for identification of protein-/gen occurrences and interactions in biomedical abstracts. : possibilities and challenges

Description

Links & Downloads

Tags

Additional Fields