Return to search

Digui: a flexibe dialogue system for guiding the user interaction to guiding the user interaction to acces web services

Current dialogue systems can handle friendly and collaborative communication that supports diverse types
of interactions, such as menus in which the user is asked to choose an option, form filling in which the user
is asked for specific information, commands for expressing users' orders, and complex questions that can
even reference previously evoked entities. Consequently, dialogue systems seem to be useful for
accessing different types of applications. In particular, spoken dialogue systems are appropriate for
devices that do not allow web browsing, such as telephones, or the use of hands, such as vehicle GPS.
Practical dialogue systems are mostly adapted to the functionality of the specific application they access,
specially those incorporating speech, since voice technology still presents recognition problems in open
domains. Because the adaptation of those DS to new applications is expensive and has to be done by
experts, many studies have focused on the problem of developing dialogue systems that can be used for
different applications and languages. Most relevant of those systems use domain and dialogue models,
and have reusable domain-independent components. However the cost of adapting those systems to other
types of applications is still high, specially in mixed-initiative systems, in which the dialogue initiative can be
taken either by the user or the system.
The work in this thesis is particularly concerned with dialogue systems for guiding the user to access web
services. The huge amount of web information increase the need of communication systems adaptable to
different types of users, languages, services and channels. For this reason, dialogue systems can improve
the usability and accessibility of web contents.
We have developed a multilingual mixed-initiative dialogue system for guiding the user when accessing
web contents. To facilitate the adaptation of the dialogue system to new services and languages, the main
functions of the system (language processing, dialogue control and task management) is performed by
independent modules). The dialogue system developed consist of four independent general modules
(Language Understanding, Language Generator, Dialogue Manager and Task Manager) as well as two
knowledge structure accessible by all these modules (dialogue context and domain description).
Application and language-dependent resources are incorporated in separated data structures. In order to
minimize the need for application and language-restricted data we propose the use of separated general
bases for representing linguistic, application and domain knowledge.
In order to achieve a friendly communication, the dialogue management module follows a formal dialogue
model, based on the information state model, that uses of a rich representation of the dialogue context.
The dialogue manager modules also incorporates an independent submodule to adapt the dialogue
strategies, according to how well the communication is progressing. This component uses a conversation
model (obtained from a previously analysed corpus of dialogues) to determine the degree of the system
initiative in the next intervention considering several features on how well the conversation is doing. / Els sistemes de diàleg permeten establir una conversa agradable i participativa, en la que es poden donar
diferents tipus d'iteracions, com ara menús amb els que es presenta a l'usuari un conjunt d'opcions per a
que n'esculli una, comandaments per expressar ordres, preguntes molt concretes i també preguntes
complexes que poden fer referència a entitats prèviament evocades. Precisament perquè els sistemes de
diàleg permeten diversos tipus d'iteracions, són adequats per facilitar l'accés de l'usuari a aplicacions
diferents. A més, els sistemes de diàleg accessibles mitjançant la veu són molt apropiats per accessoris
ens els que no es poden utilitzar les mans, com ara el telèfon o els aparells de GPS instal·lats als vehicles.
La majoria de sistemes de diàleg que s'han desenvolupat s'han adaptat a una aplicació concreta, ja que el
seu funcionament millora molt quan la cobertura del llenguatge es limita al necessari per expressar un
conjunt de tasques determinades. El problema dels sistemes de diàleg desenvolupats per una aplicació
concreta és que no són fàcilment adaptables a d'altres, el treball a realitzar és costòs i l'han de realitzar
experts. Per a superar aquesta limitació s'han realitzats molts treballs de recerca centrats en el
desenvolupament de sistemes de diàleg fàcilment adaptables a diverses aplicacions i llengües. Els treballs
més rellevants en aquesta línia proposen l'ús de models de diàleg i del domini i la organització del sistema
de diàleg en mòduls generals independents, reutilitzables per diferents aplicacions. Tot i que aquestes
propostes redueixen el cost l'adaptació dels sistemes de diàleg a noves aplicacions, no s'elimina, menys
quan es tracta de sistemes on la iniciativa de la comunicació és mixta, pot ser tant del sistema com de
l'usuari.
El treball d'aquesta tesi està centrat en els sistemes de diàleg per guiar als usuaris quan accedeixen a la
serveis i continguts disponibles a la web. Hem desenvolupat un sistema de diàleg multilingüe d'iniciativa
mixta per guiar a l'usuari quan accedeix als continguts de la web. Per facilitar la adaptació del sistema a
nou serveis i noves llengües, les diferents tasques del sistema (processament del llenguatge, gestió del
diàleg i accés a l'aplicació) són realitzades per mòduls independents. El sistema de diàleg desenvolupat
consisteix en quatre mòduls independents que controlen les quatre tasques principals ( comprensió de la
intervenció de l'usuari, generació de resposta, gestió del diàleg i gestió de tasques de l'aplicació) i dues
estructures de dades accessibles per aquests mòduls (context del diàleg i descripció del domini). Els
quatre mòduls generals del sistema utilitzen estructures dades dependents de l'aplicació (servei) i de la
llengua. Amb la finalitat de facilitar la incorporació d'aquestes estructures de dades necessàries per cada
nova aplicació proposem la utilització d'estructures de dades generals per representar el coneixement
conceptual de l'aplicació i el seu domini, així com el coneixement lingüístic.
Per tal de poder assolir una conversa agradable el gestor de diàleg incorpora un model de diàleg formal,
basat en el model de l'estat de la informació, que es caracteritza per utilitzar una representació rica del
context. El gestor de diàleg també incorpora un submòdul independent per adaptar les estratègies de
diàleg considerant els possibles problemes que apareixen a la conversa. Aquest component utilitza un
model de conversa ( desenvolupat a partir de l'anàlisi d'un corpus de diàlegs obtinguts en interaccions
prèvies amb el sistema) per determinar el nivell d'iniciativa que ha de mostrar el sistema per respondre. En
aquest model es consideren diferents dades relacionades amb la comunicació (per exemple, si s'ha entès
perfectament la última intervenció de l'usuari, si ha demanat ajuda,...).

Identiferoai:union.ndltd.org:TDX_UPC/oai:www.tdx.cat:10803/51664
Date22 October 2010
CreatorsGonzález Bermúdez, Meritxell
ContributorsGatius, Marta, Universitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics
PublisherUniversitat Politècnica de Catalunya
Source SetsUniversitat Politècnica de Catalunya
LanguageEnglish
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/doctoralThesis, info:eu-repo/semantics/publishedVersion
Format185 p., application/pdf
SourceTDX (Tesis Doctorals en Xarxa)
Rightsinfo:eu-repo/semantics/openAccess, ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

Page generated in 0.0032 seconds