Digui: a flexibe dialogue system for guiding the user interaction to guiding the user interaction to acces web services

Author

González Bermúdez, Meritxell

Director

Gatius, Marta

Date of defense

2010-10-22

ISBN

9788469523018

Legal Deposit

B. 41829-2011

Pages

185 p.



Department/Institute

Universitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics

Abstract

Current dialogue systems can handle friendly and collaborative communication that supports diverse types of interactions, such as menus in which the user is asked to choose an option, form filling in which the user is asked for specific information, commands for expressing users' orders, and complex questions that can even reference previously evoked entities. Consequently, dialogue systems seem to be useful for accessing different types of applications. In particular, spoken dialogue systems are appropriate for devices that do not allow web browsing, such as telephones, or the use of hands, such as vehicle GPS. Practical dialogue systems are mostly adapted to the functionality of the specific application they access, specially those incorporating speech, since voice technology still presents recognition problems in open domains. Because the adaptation of those DS to new applications is expensive and has to be done by experts, many studies have focused on the problem of developing dialogue systems that can be used for different applications and languages. Most relevant of those systems use domain and dialogue models, and have reusable domain-independent components. However the cost of adapting those systems to other types of applications is still high, specially in mixed-initiative systems, in which the dialogue initiative can be taken either by the user or the system. The work in this thesis is particularly concerned with dialogue systems for guiding the user to access web services. The huge amount of web information increase the need of communication systems adaptable to different types of users, languages, services and channels. For this reason, dialogue systems can improve the usability and accessibility of web contents. We have developed a multilingual mixed-initiative dialogue system for guiding the user when accessing web contents. To facilitate the adaptation of the dialogue system to new services and languages, the main functions of the system (language processing, dialogue control and task management) is performed by independent modules). The dialogue system developed consist of four independent general modules (Language Understanding, Language Generator, Dialogue Manager and Task Manager) as well as two knowledge structure accessible by all these modules (dialogue context and domain description). Application and language-dependent resources are incorporated in separated data structures. In order to minimize the need for application and language-restricted data we propose the use of separated general bases for representing linguistic, application and domain knowledge. In order to achieve a friendly communication, the dialogue management module follows a formal dialogue model, based on the information state model, that uses of a rich representation of the dialogue context. The dialogue manager modules also incorporates an independent submodule to adapt the dialogue strategies, according to how well the communication is progressing. This component uses a conversation model (obtained from a previously analysed corpus of dialogues) to determine the degree of the system initiative in the next intervention considering several features on how well the conversation is doing.


Els sistemes de diàleg permeten establir una conversa agradable i participativa, en la que es poden donar diferents tipus d'iteracions, com ara menús amb els que es presenta a l'usuari un conjunt d'opcions per a que n'esculli una, comandaments per expressar ordres, preguntes molt concretes i també preguntes complexes que poden fer referència a entitats prèviament evocades. Precisament perquè els sistemes de diàleg permeten diversos tipus d'iteracions, són adequats per facilitar l'accés de l'usuari a aplicacions diferents. A més, els sistemes de diàleg accessibles mitjançant la veu són molt apropiats per accessoris ens els que no es poden utilitzar les mans, com ara el telèfon o els aparells de GPS instal·lats als vehicles. La majoria de sistemes de diàleg que s'han desenvolupat s'han adaptat a una aplicació concreta, ja que el seu funcionament millora molt quan la cobertura del llenguatge es limita al necessari per expressar un conjunt de tasques determinades. El problema dels sistemes de diàleg desenvolupats per una aplicació concreta és que no són fàcilment adaptables a d'altres, el treball a realitzar és costòs i l'han de realitzar experts. Per a superar aquesta limitació s'han realitzats molts treballs de recerca centrats en el desenvolupament de sistemes de diàleg fàcilment adaptables a diverses aplicacions i llengües. Els treballs més rellevants en aquesta línia proposen l'ús de models de diàleg i del domini i la organització del sistema de diàleg en mòduls generals independents, reutilitzables per diferents aplicacions. Tot i que aquestes propostes redueixen el cost l'adaptació dels sistemes de diàleg a noves aplicacions, no s'elimina, menys quan es tracta de sistemes on la iniciativa de la comunicació és mixta, pot ser tant del sistema com de l'usuari. El treball d'aquesta tesi està centrat en els sistemes de diàleg per guiar als usuaris quan accedeixen a la serveis i continguts disponibles a la web. Hem desenvolupat un sistema de diàleg multilingüe d'iniciativa mixta per guiar a l'usuari quan accedeix als continguts de la web. Per facilitar la adaptació del sistema a nou serveis i noves llengües, les diferents tasques del sistema (processament del llenguatge, gestió del diàleg i accés a l'aplicació) són realitzades per mòduls independents. El sistema de diàleg desenvolupat consisteix en quatre mòduls independents que controlen les quatre tasques principals ( comprensió de la intervenció de l'usuari, generació de resposta, gestió del diàleg i gestió de tasques de l'aplicació) i dues estructures de dades accessibles per aquests mòduls (context del diàleg i descripció del domini). Els quatre mòduls generals del sistema utilitzen estructures dades dependents de l'aplicació (servei) i de la llengua. Amb la finalitat de facilitar la incorporació d'aquestes estructures de dades necessàries per cada nova aplicació proposem la utilització d'estructures de dades generals per representar el coneixement conceptual de l'aplicació i el seu domini, així com el coneixement lingüístic. Per tal de poder assolir una conversa agradable el gestor de diàleg incorpora un model de diàleg formal, basat en el model de l'estat de la informació, que es caracteritza per utilitzar una representació rica del context. El gestor de diàleg també incorpora un submòdul independent per adaptar les estratègies de diàleg considerant els possibles problemes que apareixen a la conversa. Aquest component utilitza un model de conversa ( desenvolupat a partir de l'anàlisi d'un corpus de diàlegs obtinguts en interaccions prèvies amb el sistema) per determinar el nivell d'iniciativa que ha de mostrar el sistema per respondre. En aquest model es consideren diferents dades relacionades amb la comunicació (per exemple, si s'ha entès perfectament la última intervenció de l'usuari, si ha demanat ajuda,...).

Keywords

Sistemes de diàleg; Gestor de diàleg; Generació de resposta; Gestió de tasques; Anàlisis de resposta; Representació de web services; Interacció home-màquina; Interfície de llenguatge natural

Subjects

004 - Computer science and technology. Computing. Data processing

Documents

TMGB1de1.pdf

1.502Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)