Return to search

Analysis of the Dirichlet Process Mixture Model with Application to Dialogue Act Classification

La reconnaissance des intentions de l’utilisateur est l’un des problèmes les plus difficiles
dans la conception des systèmes de dialogues. Ces intentions sont généralement codés
en termes d’actes de dialogue, où un rôle fonctionnel est attribué à chaque énoncé d’une
conversation. L’annotation manuelle des actes de dialogue est généralement coûteuse
et prends du temps, il y a donc un grand intérêt à plutôt annoter automatiquement des
corpus de dialogue.
Dans ce mémoire, nous proposons une approche non paramétrique bayésienne pour
la classification automatique des actes de dialogue. Nous utilisons les mélanges par
processus de Dirichlet (DPMM), dans lesquels chacune des composantes est déterminée
par une distribution de Dirichlet-multinomial. Deux nouvelles approches pour
l’estimation des hyperparamètres dans ces distributions sont introduites. Les résultats
de l’application de ce modèle au corpus DIHANA montre que la DPMM peut récupérer
le nombre réel d’étiquettes en haute précision. / Recognition of user intentions is one of the most challenging problems in the design
of dialogue systems. These intentions are usually coded in terms of Dialogue Acts
(Following Austin’s work on speech act theory), where a functional role is assigned
to each utterance of a conversation. Manual annotation of dialogue acts is both time
consuming and expensive, therefore there is a huge interest in systems which are able
to automatically annotate dialogue corpora.
In this thesis, we propose a nonparametric Bayesian approach for the automatic classification
of dialogue acts. We make use of the Dirichlet Process Mixture Model (DPMM),
within which each of the components is governed by a Dirichlet-Multinomial distribution.
Two novel approaches for hyperparameter estimation in these distributions
are also introduced. Results of the application of this model to the DIHANA corpus
shows that the DPMM can successfully recover the true number of DA labels with high
precision

Identiferoai:union.ndltd.org:LACETR/oai:collectionscanada.gc.ca:QQLA.2011/28503
Date07 1900
CreatorsBakhtiari Koohsorkhi, Alireza
ContributorsChaib-draa, Brahim
PublisherUniversité Laval
Source SetsLibrary and Archives Canada ETDs Repository / Centre d'archives des thèses électroniques de Bibliothèque et Archives Canada
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation
Formatapplication/pdf
Rights© Alireza Bakhtiari Koohsorkhi, 2011

Page generated in 0.0107 seconds