Global ETD Search

Return to search

CogFLUX : Grunden till ett automatiskt textförenklingssystem för svenska

En stor del av den svenska befolkningen har svårigheter att läsa en hel del texter på svenska, t ex myndighetstexter, nyheter men även skönlitteratur. Detta innebär att många inte har samma tillgång till information via det skrivna mediet som övrig allmänhet erbjuds. Komplicerade texter har visat sig besitta en avancerad syntax som försämrar läsbarheten. Manuell bearbetning av texter vid syntaxförenkling är en tidskrävande process och ett automatiserat tillvägagångssätt är önskvärt. I syfte att undersöka huruvida ett verktyg som automatiserar förenklingsprocessen är möjlig med dagens teknik togs verktyget CogFLUX fram. CogFLUX kan ses som en verktygslåda för vidare utveckling, som i dagsläget framförallt analyserar texter syntaktiskt och applicerar syntaktiska omskrivningsregler på frasnivå. Omskrivningsreglerna är sedan tidigare framtagna av Anna Decker vid Stockholms universitet. Utvärderingstexternas läsbarhet utvärderades med tre olika mått på läsbarhet; LIX, Nominalkvot och Lexikal variation, före och efter den syntaktiska förenklingen. Resultaten jämfördes sedan med manuellt förenklade texter inom samma genre. Resultaten av utvärderingen visar att vissa värden hos texterna kan förknippas med bättre läsbarhet efter CogFLUX:s bearbetning. Huruvida resultaten av förenklingen och utvärderingsmåtten visar på att texten blir mer lättläst diskuteras, då dessa ytliga mått har sina begränsningar och texterna ofta visade sig bli fragmentariska. Det kan konstateras att det med dagens resurser är möjligt att automatiskt applicera syntaktiska textomskrivningsregler på frasnivå. Tillsammans med ytterligare metoder för bearbetning av en texts syntax och dess semantik ses möjligheter för ett framtida robust verktyg som automatiskt gör texter lättlästa.

http://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-58878

Cognitive science

Kognitionsforskning

Identifer	oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:liu-58878
Date	January 2009
Creators	Rybing, Jonas, Smith, Christian
Publisher	Linköpings universitet, Institutionen för datavetenskap, Linköpings universitet, Institutionen för datavetenskap
Source Sets	DiVA Archive at Upsalla University
Language	Swedish
Detected Language	Swedish
Type	Student thesis, info:eu-repo/semantics/bachelorThesis, text
Format	application/pdf
Rights	info:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds

CogFLUX : Grunden till ett automatiskt textförenklingssystem för svenska

Description

Links & Downloads

Tags

Additional Fields