Return to search

Å finne gammelt nytt : Bruk av NewsML i dagspressen / Finding old news : the use of NewsML in the daily press

Sentralt i hovedfagsoppgaven står det klassiske problemet; der innføring av ny teknologi krever utvikling av nye metoder og arbeidsrutiner, samtidig som de gamle rutinene får bestå tilnærmet uendret. Dette gjør at kompleksiteten i organisasjonenes systemer øker, da både gamle og nye metoder samt arbeidsrutiner må vedlikeholdes. Dette har skjedd hos Adresseavisen. Ved innføring av ny teknologi, og nye arbeidsmetoder, har man ikke hatt en helhetlig tenkning på arbeidsflyten og organisasjonsstrukturen. Dette ser man ved valg av løsning på analoge vs. digitale bilder, og på papiravis vs. nettutgaven av avisen.Konkret tar denne hovedoppgaven for seg gjenfinningen av dokumenter i dagsaviser, der hvordan NewsML-formatet kan brukes til dette formålet står sentralt. NewsML ble lansert av International Press and Telecommunications Council (IPTC), i samarbeid med nyhetsbyråene Reuters og AFP, i 2000. Målet med NewsML er å få et helhetlig format som dekker alle ledd i nyhetsobjektets livssyklus, der samme artikkel kan lagres med ulikt språk og med støtte for alle formater og visningsmedier.Informasjonsgjenfinning er viktig både for journalistene som skal lage en god avis, og for leserne som ønsker å søke etter artikler, for eksempel på internett. Gode søkesystemer kan være avgjørende om en avis skal greie å holde på en leser. I hovedoppgaven er søkeprosessen i seg selv beskrevet, i tillegg til ulike kriterier som et søkesystem kan vurderes etter. Som eksempel på hvordan systemet er i en dagsavis, beskrives Adresseavisens sitt system for lagring og gjenfinning av data. Adresseavisen skiller klart mellom ulike nyhetsobjekt som for eksempel tekst, lyd, bilder eller film. Disse ulike nyhetsobjektene til papiravisen lagres i ulike databaser, mens nyhetsobjekter til internettavisen lagres i en annen database. Disse ulike nyhetsobjektene beskrives med ulikt metadataformat. Dette gjør at når man ønsker å finne igjen alle delene av en nyhetsartikkel i Adresseavisen må man søke i ulike databaser som har ulike metadataformat. Formatet Adresseavisen bruker gjør at søkeprosessen kan bli noe tungvint. Med mindre personen som utfører søket har god kjennskap til oppbyggingen av databasene og metadataformata, risikerer man å gå glipp av verdifull informasjon.Det er laget mange ulike standarder og formater som skal støtte både gjenfinning, utveksling og lagring av nyheter. Noen av de mest brukte blir kort beskrevet, før NewsML beskrives i detalj. NewsML gir en elegant løsning på problemet Adresseavisen har, med ulike databasser og ulike metadataformater, ved å definere alle nyhetsobjektene som et element uansett hva slags medietype det er av og hva det skal brukes til. Et NewsML-dokument inneholder en kompleks XML struktur. I denne strukturen blir en hele artikkel representert ved hjelp av et element som innholder metadata som er felles for hele nyhetsartikkelen. Inne i dette elementet kan man ha ulike nyhetskomponenter, som igjen kan innholde nye nyhetskomponenter, eller innholdselementer. De ulike nyhetskomponentene kan for eksempel skille mellom samme artikkel på ulike språk. NewsML-standarden har enkelte obligatoriske metadatafelt, men er likevel åpen nok til at ulike mediekonsern med ulike interesser og fokus kan tilpasse et NewsML-system slik at det passer til deres behov. For å illustrere praktisk hvordan NewsML kan bli brukt i Adresseavisen er det laget konverteringstabeller mellom ulike metadataposter i Adresseavisen, opp i mot et NewsML-dokument. Videre er det implementert en prototyp som benytter NewsML, for å vise fordeler og utfordringer ved bruk av NewsML som format. Prototypen implementerer alle NewsML-elementene. Grensesnittet i prototypen viser utfordringene med den komplekse XML-strukturen som NewsML inneholder. Adresseavisen sitt system har en stadig økende kompleksitet, og bør på sikt endres. Ved en slik endring har Adresseavisen flere valg. Et alternativ er å ta i bruk prinsippet NewsML har med å lagre ulike nyhetselementer som like objekter. Disse objektene kan lagres ved hjelp av relasjonsdatabase, slik Adresseavisen har det i dag. Dette vil gjøre at avisen får et enhetlig og oversiktlig system der alle nyhetsobjekter har felles metadataformat, men systemet mister NewsML sin fordel ved at man kan lagre ulike versjoner av en artikkel med samme metadata. En annen løsning er å innføre NewsML med sin komplekse struktur. Man trenger ikke nødvendigvis implementere alle NewsML-elementene med engang, men forenkle strukturen noe og heller utvide ved behov.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:ntnu-15828
Date January 2006
CreatorsIngeberg, Marit
PublisherNorges teknisk-naturvitenskapelige universitet, Institutt for datateknikk og informasjonsvitenskap, Institutt for datateknikk og informasjonsvitenskap
Source SetsDiVA Archive at Upsalla University
LanguageNorwegian
Detected LanguageNorwegian
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds