Return to search

Tolkning av fotballreferater / Interpretation of soccer summaries

<p>”Tolkning av fotballreferater” er en Diplomoppgave utarbeidet ved NTNU og Institutt for Datateknikk og Informasjonsvitenskap. Oppgaven er gitt av Jon Atle Gulla som også fungerer som veileder. Vi har i dette prosjektet utviklet et system, SoccerFinder, som analyserer setninger fra et fotballreferat. Vi tar utgangspunkt i referater som publiseres på nett av VG, mer spesifikt et referat fra kampen Skottland - Norge. Slike fotballreferater er skrevet av en som følger kampen direkte, og de inneholder derfor en del dårlig norsk samt ufullstendige setninger. Dette kompliserer arbeidet vårt, og vi er blant annet vært nødt til å skrive om en del setninger. Informasjonen vi ønsker å ta vare på er hendelser som for eksempel dueller, utdeling av kort, tidspunkt for eventuelle bytter samt hvor mange cornere og frispark en kamp hadde. For å analysere setninger bruker vi i prosjektet vårt et lingvistisk søkeverktøy, HoG, som er plassert på Dragvoll. Vi sender setninger til HoG ved å bruke XML-RPC, og får tilbake resultater i form av RMRS representasjoner på XML format. RMRS er en teknikk for å representere semantiske strukturer der elementære predikasjoner knyttes til begivenheter. RMRS er komplekse representasjoner, og det har vært en tidkrevende prosess å sette seg inn og forså disse. Vi filtrerer ut ifra en RMRS, informasjon som for oss er interessant å ta vare på. Dette gjør vi ved å bruke XSLT, et stilsett som henter ut data fra XML dokumenter. Den filtrerte informasjonen legger vi så inn i en databasetabell, og kan seinere kjøre spørringer mot denne for å hente fram informasjonen. Systemet vårt er en Java-Servlet som kjøres fra en Tomcat webserver. Vi har her enkle websider der vi velger om vi vil sende en setning til analysering, eller om vi ønsker å kjøre en spørring mot informasjon i en database. Ved å utvikle et system som SoccerFinder vil vi være i stand til å hente fram aggregert informasjon fra et eller flere referater. Dette er det som hovedsakelig skiller oss fra dagens søkeverktøy, som for eksempel Google, der vi hovedsakelig vil kunne søke oss fram til forekomster av ord. Arbeidet med denne oppgaven er utført våren 2005 og er en avslutning på Masterutdanningen i Datateknikk.</p>

Identiferoai:union.ndltd.org:UPSALLA/oai:DiVA.org:ntnu-10215
Date January 2005
CreatorsStrand, Stian Junge
PublisherNorwegian University of Science and Technology, Department of Computer and Information Science, Institutt for datateknikk og informasjonsvitenskap
Source SetsDiVA Archive at Upsalla University
LanguageNorwegian
Detected LanguageNorwegian
TypeStudent thesis, text

Page generated in 0.0018 seconds