Return to search

CogFLUX : Grunden till ett automatiskt textförenklingssystem för svenska

En stor del av den svenska befolkningen har svårigheter att läsa en hel del texter på svenska, t ex myndighetstexter, nyheter men även skönlitteratur. Detta innebär att många inte har samma tillgång till information via det skrivna mediet som övrig allmänhet erbjuds. Komplicerade texter har visat sig besitta en avancerad syntax som försämrar läsbarheten. Manuell bearbetning av texter vid syntaxförenkling är en tidskrävande process och ett automatiserat tillvägagångssätt är önskvärt. I syfte att undersöka huruvida ett verktyg som automatiserar förenklingsprocessen är möjlig med dagens teknik togs verktyget CogFLUX fram. CogFLUX kan ses som en verktygslåda för vidare utveckling, som i dagsläget framförallt analyserar texter syntaktiskt och applicerar syntaktiska omskrivningsregler på frasnivå. Omskrivningsreglerna är sedan tidigare framtagna av Anna Decker vid Stockholms universitet. Utvärderingstexternas läsbarhet utvärderades med tre olika mått på läsbarhet; LIX, Nominalkvot och Lexikal variation, före och efter den syntaktiska förenklingen. Resultaten jämfördes sedan med manuellt förenklade texter inom samma genre. Resultaten av utvärderingen visar att vissa värden hos texterna kan förknippas med bättre läsbarhet efter CogFLUX:s bearbetning. Huruvida resultaten av förenklingen och utvärderingsmåtten visar på att texten blir mer lättläst diskuteras, då dessa ytliga mått har sina begränsningar och texterna ofta visade sig bli fragmentariska. Det kan konstateras att det med dagens resurser är möjligt att automatiskt applicera syntaktiska textomskrivningsregler på frasnivå. Tillsammans med ytterligare metoder för bearbetning av en texts syntax och dess semantik ses möjligheter för ett framtida robust verktyg som automatiskt gör texter lättlästa.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:liu-58878
Date January 2009
CreatorsRybing, Jonas, Smith, Christian
PublisherLinköpings universitet, Institutionen för datavetenskap, Linköpings universitet, Institutionen för datavetenskap
Source SetsDiVA Archive at Upsalla University
LanguageSwedish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds