1 |
[en] AGE ESTIMATION FROM FACIALS IMAGES / [pt] ESTIMATIVA DA IDADE A PARTIR DE IMAGENS FACIAISJOSE DAVID BERMUDEZ CASTRO 12 February 2016 (has links)
[pt] Esta dissertação tem por objetivo investigar métodos de estimação da idade a partir de imagens faciais. Avalia-se o impacto de distintos fatores sobre a acurácia da estimativa, especificamente, a acurácia da localização de pontos fiduciais, métodos de extração de atributos, de redução de dimensionalidade, e técnicas de regressão. Adicionalmente, foi estudada a influência da raça e do sexo na acurácia da estimação da idade desenvolvido. Consideraram-se cinco métricas de desempenho do sistema, especificamente, o erro médio absoluto (MAE), o erro médio absoluto por década (MAE/D), o erro médio absoluto por idade (MAE/A), o escore acumulado (CS), e os intervalos de confiança (IC). Os experimentos foram realizados empregando dois bancos de dados públicos, cujas imagens estão rotuladas com a idade da face. Os resultados indicaram que o método automático para detecção de pontos fiduciais da face tem uma repercussão moderada sobre a acurácia das estimativas. Entre as variantes analisadas, a que apresentou a melhor acurácia foi o sistema que emprega os AAMs (Active Appearance Models) como método de extração de atributos, o PCA (Principal Components Analysis) como método para reduzir dimensionalidade, e as SVRs (Support Vector Regression) como técnica para fazer regressão. / [en] This thesis aims to investigate methods for age estimation from facial images. The impact of distinct factors over the estimate’s accuracy is assessed, specifically the accuracy in the location of face fiducial points, feature extraction and dimensionality reduction methods, and regression techniques. Additionally, the dependence on race and gender in the accuracy of age estimation is assessed. Five performance metrics have been considered: the mean absolute error (MAE), the mean absolute error per decade (MAE / D), the mean absolute error for age (MAE / A), the cumulative score (CS) and confidence intervals (CI). The experiments were performed using two public databases, whose images are labeled with the age of the face. The results showed the impact of the automatic method for detection of fiducial points of the face has a moderate impact on the accuracy of the estimates. Among the analyzed variants, the one with the best accuracy was the system that employs the Active Appearance Models (AAMs) as feature extraction method, the Principal Components Analysis (PCA) as dimensionality reduction method, and Support Vector Regression (SVRs) as a technique to do regression.
|
2 |
[en] ADJUSTING LOAD SERIES BY THE CALENDAR AND TEMPERATURE EFFECTS / [pt] AJUSTE DAS SÉRIES DE CARGA DE ENERGIA ELÉTRICA INFLUENCIADAS PELOS OFENSORES CALENDÁRIO E TEMPERATURATHIAGO GOMES DE ARAUJO 08 January 2015 (has links)
[pt] O objetivo do presente trabalho é a geração de uma série mensal de carga
elétrica livre das variações de calendário e de temperatura. Para tal, foram
comparadas duas abordagens, uma totalmente empírica e outra híbrida com
métodos empíricos e modelagens de regressão dinâmica, para identificar a mais
adequada para a retirada desses ofensores. Os dados utilizados são provenientes
de observações diárias de cada um dos quatro subsistemas que integram o Sistema
Interligado Nacional (SIN), porém a ideia é produzir séries mensais do SIN e não
apenas de cada um dos subsistemas. A série trimestral do PIB foi utilizada para
decidir qual abordagem melhor ajustou os dados de Carga. A série mensal de
carga ajustada do SIN será utilizada para subsidiar decisões, de compra e venda de
energia nos leilões, das empresas distribuidoras de energia elétrica. / [en] This thesis proposes a method to generate monthly load series free of
variations coming from two sources: calendar and temperature. Two approaches
were considered, one totally empirical and another one called hybrid, as it use
empirical procedure to remove the calendar effect and a dynamic regression type
of model to remove the temperature effects. The data set used comes found to
daily observations from each one of the four subsystems that form the SIN
(Brazilian Integrated Grid). However the final task is to obtain a unique monthly
series for the SIN and not only the four subsystems monthly series. The quarterly
PIB series was used to check the performance of the two proposed methods. Such
adjusted series are quite important tools to hold on the decision of acquisitions
and dailes of energy in the energy audits.
|
3 |
[en] QUI-SQUARE CONTROL CHART WITH VARIABLE SAMPLE SIZE TO MONITOR LINEAR PROFILES / [pt] GRÁFICO DE CONTROLE QUI-QUADRADO COM TAMANHO DE AMOSTRA VARIÁVEL PARA MONITORAMENTO DE PERFIS LINEARESRODRIGO OTAVIO SANTOS VON DOELLINGER 03 April 2019 (has links)
[pt] O monitoramento de perfis é utilizado para verificar a estabilidade de uma relação funcional envolvendo uma variável resposta e uma ou mais variáveis explicativas ao longo do tempo. Kang e Albin (2000) fizeram uso do gráfico de controle qui-quadrado com parâmetros de projeto fixos para monitorar perfis lineares representados por um modelo de regressão linear simples. Nessa dissertação, com base nos estudos de Kang e Albin (2000), desenvolvemos o gráfico de controle qui-quadrado com tamanho de amostra variável para o monitoramento de um perfil linear. O gráfico proposto monitora o intercepto e o coeficiente de inclinação de um modelo de regressão linear simples, com o uso de amostras com dois tamanhos. O desempenho do gráfico proposto é comparado com o desenvolvido por Kang e Albin (2000). A medida de desempenho utilizada na comparação é o número médio de amostras até um sinal, obtida através de uma análise baseada em cadeias de Markov. Concluímos que é vantajoso utilizar o gráfico de controle qui-quadrado com tamanho de amostra variável. / [en] The monitoring of profiles is used to verify the stability of a functional relationship involving a response variable and one or more explanatory variables over time. Kang and Albin (2000) employed the chi-square control chart with fixed design parameters for monitoring linear profiles represented by a simple linear regression model. Based on the studies of Kang and Albin (2000), we developed the chi-square control chart with variable sample size for monitoring a linear profile. The proposed chart monitors the intercept and slope coefficient of a simple linear regression model, using two different sample sizes. The performance of the graph developed by Kang and Albin (2000) and the one presented here is compared. The average run length, obtained through a Markov chain, was used as performance measure to compare the two charts. We
conclude that it is advantageous to use the chi-square control chart with variable sample size.
|
4 |
[en] MODELING IN MIXTURE-PROCESS EXPERIMENTS FOR OPTIMIZATION OF INDUSTRIAL PROCESSES / [pt] MODELAGEM EM EXPERIMENTOS MISTURA-PROCESSO PARA OTIMIZAÇÃO DE PROCESSOS INDUSTRIAISLUIZ HENRIQUE ABREU DAL BELLO 30 January 2018 (has links)
[pt] Nesta tese é apresentada uma metodologia de seleção de modelos em experimentos mistura-processo e reunidas as técnicas estatísticas necessárias ao planejamento e análise de experimentos com mistura com ou sem variáveis de processo. Na pesquisa de seleção de modelos foi utilizado um experimento para
determinar as proporções ótimas de um misto químico do mecanismo de retardo para ignição de um motor foguete. O misto químico consiste de uma mistura de três componentes. Além das proporções dos componentes da mistura, são consideradas duas variáveis de processo. O objetivo do estudo é investigar as
proporções dos componentes da mistura e os níveis das variáveis de processo que colocam o valor esperado do tempo de retardo (resposta) o mais próximo possível do valor alvo e, ao mesmo tempo, minimizam o tamanho do intervalo de previsão de uma futura resposta. Foi ajustado um modelo de regressão linear com respostas normais. Com o modelo desenvolvido foram determinadas as proporções ótimas dos componentes da mistura e os níveis ótimos das variáveis de processo. Para a seleção do modelo foi utilizada uma metodologia de duas etapas, que provou ser eficiente no caso estudado. / [en] This thesis presents a methodology for model selection in mixture-process experiments and puts together the statistical techniques for the design and analysis of mixture experiments with or without process variables. An experiment of a three-component mixture of a delay mechanism to start a rocket engine was used in the research. Besides the mix components proportions, two process variables are considered. The aim of the study is to investigate the proportions of the mix components and the levels of the process variables that set the expected delay time (response) as close as possible to the target value and, at the same time, minimize the width of the prediction interval for the response. A linear regression model with normal responses was fitted. Through the developed model, the optimal proportions of the mix components and the levels of the process variables were determined. A two-stage methodology was used to select the model. This methodology for model selection proved to be efficient in the studied case.
|
5 |
[en] ELECTRICITY INDICATORS FOR THE ELECTRICAL ENERGY GENERATION VIA MUSCLE EFFORTSRATION / [pt] INDICADORES DE ELETRICIDADE PARA GERAÇÃO DE ENERGIA ELÉTRICA POR MEIO DE ESFORÇO MUSCULARRODRIGO HALFELD ROSADAS DE ANDRADE 25 April 2022 (has links)
[pt] Esta dissertação teve como objetivo desenvolver um modelo de previsão de
geração de energia elétrica por meio de esforço muscular de seres humanos,
utilizando uma bicicleta geradora, conectada à rede elétrica comum. A motivação
resultou da experiência do autor na área de geração distribuída, que identificou uma
dificuldade em instalar sistemas de geração solar fotovoltaica em topo de edifícios.
Como metodologia de pesquisa, o trabalho, utilizou a regressão linear múltipla, com
o software IBM SPSS servindo como executor das tarefas. As regressões
apresentaram resultados promissores, apresentando um R(2) ajustado elevado,
respeitando todas as premissas de uma regressão linear múltipla, e confirmando
algumas suspeitas. As simulações feitas com base no modelo criado mostram um
potencial de geração de energia considerável para o Brasil. Como conclusão, apesar
do modelo criado ser de boa capacidade preditiva, recomenda-se mais estudos antes
de uma extrapolação populacional ou um investimento financeiro. / [en] This dissertation aimed to develop a model for predicting the generation of
electrical energy through human muscular effort, using a generator bicycle,
connected to the common electrical grid. The motivation resulted from the author s
experience in distributed generation, which identified a difficulty in installing
photovoltaic solar generation systems on top of buildings. As a research
methodology, the work used multiple linear regression, with the IBM SPSS
software serving as the executor of the tasks. The regressions showed promising
results, presenting a high ajusted R(2), considering all the premises of a multiple linear
regression, and confirming some suspicions. The simulations made based on the
model created show a considerable energy generation potential for Brazil. In
conclusion, despite the model created being of good predictive capacity, further
studies are recommended before a population extrapolation or a financial
investment.
|
6 |
[en] SPEECH RECOGNITION IN NOISE ENVIRONMENT / [es] RECONOCIMIENTO DE VOZ EN PRESCENCIA DE RUIDO / [pt] RECONHECIMENTO DE VOZ EM PRESENÇA DE RUÍDODEBORA ANDREA DE OLIVEIRA SANTOS 02 October 2001 (has links)
[pt] Este trabalho apresenta um estudo comparativo de três
técnicas de melhoria das taxas de reconhecimento de voz em
ambiente adverso, a saber: Normalização da Média Cepestral
(CMN), Subtração Espectral e Regressão Linear no Sentido da
Máxima Verossimilhança (MLLR), aplicadas isoladamente e em
concomitância, duas a duas. Os testes são realizados usando
um sistema simples: reconhecimento de palavras isoladas
(dígitos de zero a nove, e meia), modo dependente do
locutor, modelos ocultos de Markov do tipo contínuo, e
vetores de atributos com doze coeficientes cepestrais
derivados da análise de predição linear. São adotados três
tipos de ruído (gaussiano branco, falatório e de fábrica)
em nove razões sinal-ruído diferentes. Os resultados
experimentais demonstram que o emprego isolado das técnicas
de reconhecimento robusto é, em geral, vantajoso, pois nas
diversas razões sinal-ruído para as quais os testes são
efetuados, quando as taxas de reconhecimento não sofrem um
acréscimo, mantém-se as mesmas obtidas quando não se aplica
nenhum método de aumento da robustez. Analisando-se
comparativamente as implementações isoladas e simultânea
das técnicas, constata-se que a simultânea nem sempre é
atraente, dependendo da dupla empregada. Apresentam-se,
ainda, os resultados decorrentes do uso de modelos
ruidosos, observando-se que, embora sejam inegavelmente
melhores, sua utilização é inviável na prática. Das
técnicas implementadas, a que representa resultados mais
próximos ao emprego de modelos ruidosos é a MLLR, seguida
pela CMN, e por último pela Subtração Espectral. Estas
últimas, embora percam em desempenho para a primeira,
apresentam como vantagem a simplicidade e a generalidade.
No que concerne as técnicas usadas concomitantemente, a
dupla Subtração Espectral e MLLR é a considerada de melhor
performance, pois mostra-se conveniente em relação ao
emprego isolado de ambos os métodos, o que nem sempre
ocorre com o uso de outras combinações das técnicas
individuais. / [en] This work presents a comparative study of three techniques
for improving the speech recognition rates in adverse
environment, namely: Cepstral Mean Normalization (CMN),
Spectral Subtraction and Maximum Likelihood Linear
Regression (MLLR). They are implemented in two ways:
separately and in pairs. The tests are carried out on a
simple system: recognition of isolated words (digits from
zero to nine, and the word half), speaker-dependent mode,
continuous hidden Markov models, and speech feature vectors
with twelve cepstral coefficients derived from linear
predictive analysis. Three types of noise are considered
(the white one, voice babble and from factory) at nine
different signal-to-noise ratios. Experimental result
demonstrate that it is worth using separately the
techniques of robust recognition. This is because for all
signal-to-noise conditions when the recognition accuracy is
not improved it is the same one obtained when no method for
increasing the robustness is applied. Analyzing
comparatively the isolated and simultaneous applications of
the techniques, it is verified that the later is not always
more attractive than the former one. This depends on the
pair of techniques. The use of noisy models is also
considered. Although it presents better results, it is not
feasible to implement in pratical situations. Among the
implemented techniques, MLLR presents closer results to the
ones obtaneid with noisy models, followed by CMN, and, at
last, by Spectral Subtraction. Although the two later ones
are beaten by the first, in terms of recognition accuracy,
their advantages are the simplicity and the generality. The
use of simultaneous techniques reveals that the pair
Spectral Subtraction and MLLR is the one with the best
performance because it is superior in comparison with the
individual use of both methods. This does not happen with
other combination of techniques. / [es] Este trabajo presenta un estudio comparativo de tres
técnicas de mejoría de las tasas de reconocimiento de voz
en ambiente adverso, a saber: Normalización de la Media
Cepextral (CMN), Substracción Espectral y Regresión Lineal
en el Sentido de la Máxima Verosimilitud (MLLR), aplicadas
separada y conjuntamente, dos a dos. Las pruebas son
realizados usando un sistema simple: reconocimiento de
palabras aisladas (dígitos de cero al nueve, y media), de
modo dependiente del locutor, modelos ocultos de Markov de
tipo contínuo, y vectores de atributos con doce
coeficientes cepextrales derivados del análisis de
predicción lineal. Se adoptan tres tipos de ruido (gausiano
blanco, parlatorio y de fábrica) en nueve razones señal-
ruido diferentes. Los resultados experimentales demuestran
que el empleo aislado de las técnicas de reconocimiento
robusto es, en general, ventajoso, pues en las diversas
relaciones señal ruido para las cuales las pruebas son
efetuadas, cuando la tasa de reconocimiento no aumenta,
manteniendo las mismas tasas cuando no se aplica ningún
método de aumento de robustez. Analizando comparativamente
las implementaciones aisladas y simultáneas de las
técnicas, se constata que no siempre la simultánea resulta
atractiva, dependiendo de la dupla utilizada. Se presentan
además los resultados al utilizar modelos ruidosos,
observando que, aunque resultan mejores, su utilización em
la práctica resulta inviable. De las técnicas
implementadas, la que presenta resultados más próximos al
empleo de modelos ruidosos es la MLLR, seguida por la CMN,
y por último por la Substracción Espectral. Estas últimas,
aunque tienen desempeño peor que la primera, tienen como
ventaja la simplicidad y la generalidad. En lo que se
refiere a las técnicas usadas concomitantemente, la dupla
Substracción Espectral y MLLR es la de mejor performance,
pues se muestra conveniente en relación al empleo aislado
de ambos métodos, lo que no siempre ocurre con el uso de
otras combinaciones de las técnicas individuales.
|
7 |
[en] ESTIMATING THE DAILY ELECTRIC SHOWER LOAD CURVE THROUGH MEASUREMENTS AND END USERS OWNERSHIP AND USAGE SURVEYS / [pt] ESTIMATIVAS DA CURVA DE CARGA DIÁRIA DE CHUVEIROS ELÉTRICOS ATRAVÉS DE MEDIÇÕES E DECLARAÇÕES DA PESQUISA DE POSSES E HÁBITOS DE CONSUMOSILVANA VIEIRA DAS CHAGAS 16 December 2015 (has links)
[pt] O objetivo desta dissertação é desenvolver modelos matemáticos que permitam
estimar o tempo médio dos banhos com a utilização de chuveiros elétricos e a curva
de carga desses aparelhos, considerando as informações das Pesquisas de Posses e
Hábitos de Consumo (PPH) e medições realizadas com o auxílio de medidores
eletrônicos com memória de massa, em residências com chuveiros elétricos. A
motivação do estudo advém de uma exigência da ANEEL que determina que as
distribuidoras de energia elétrica realizem a cada 2 (dois) ciclos de revisão tarifária a
PPH em suas unidades consumidoras. Os métodos empregados foram: estatística
descritiva (para a obtenção do tempo médio de banho); aplicação da regressão linear e
de redes neurais (para corrigir a curva de carga horária obtida com a PPH, com base
nos dados das medições). Os resultados foram promissores, pois o tempo médio de
banho se encontra próximo às estimativas do PROCEL (que são de 8 (oito) a 10 (dez)
minutos) e a curva de carga estimada se encontra próxima à da medição, sendo esta
última o consumo real. Conclui-se que a abordagem desta dissertação resultou em
melhorias na estimativa dos coeficientes de ajustes e que o método de redes neurais
foi relativamente melhor que o método de regressão linear simples. / [en] The aim of this dissertation is to develop mathematical models that would
allow the estimation of the average time of baths using electric showers and the
load shape curves for these devices, obtained from two sources: the information of
Electrical Appliances Ownership Survey and measurements of electric shower
usage in households carried out with electronic meters with storage capacity. The
motivation stems from a requirement of ANEEL that determines that the electric
energy distributors periodically should hold a PPH in their consumer units.
Concerning the average time of shower baths, the last PPH survey conducted by
PROCEL in 2005 estimated this time between 8 (eight) and 10 (ten) minutes. The
methods employed in this work were: descriptive statistics (for obtaining the
average bath time); application of linear regression and neural networks (to
estimate the correction factors to approximate the load shape curves obtained by
PPH to those obtained by measurements). The obtained results are rather
promising due to the following reasons: the average time of bath is next to the
estimates of PROCEL and the corrected load shape curve estimated is quite close
to the measured curve, the latter being the actual consumption. This approach has
resulted in improvements in the estimation of the coefficients of adjustments and
the method of neural networks was relatively better than the simple linear
regression method.
|
8 |
[pt] EFEITO DAS INTERVENÇÕES DO BCB NA CURVA DE CUPOM CAMBIAL / [en] THE EFFECT OF BRAZIL CENTRAL BANK S INTERVENTIONS ON THE CUPOM CAMBIAL CURVEVICTOR AUGUSTO MESQUITA CRAVEIRO 05 February 2020 (has links)
[pt] Neste estudo, tentamos estimar o impacto da medida intervencionista mais recente e amplamente adotada pelo Banco Central do Brasil no mercado de câmbio sobre a Curva de Cupom Cambial: a emissão de Swaps Cambiais. O objetivo do BCB com essa intervenção era prover o setor privado de proteção contra a volatilidade cambial à época. O trabalho foca no efeito dessas medidas na curva de Cupom Cambial por conta da importância do funcionamento dessa curva para a correta precificação do mercado de dólar futuro, já que, no Brasil, a formação da taxa de câmbio se dá no preço futuro de dólar e não no preço à vista, como é comum nos outros países. Através de Análise de Componentes Principais sobre a Curva de Cupom Cambial, encontramos seus três primeiros componentes (nível, inclinação e curvatura) e os utilizamos para regredi-los em variáveis independentes que representam a série de emissões de Swap por parte do BC. Os resultados indicam que os Swaps Cambiais geram mudanças significativas no nível geral da Curva de Cupom Cambial. Já os Swaps Reversos não apresentam impacto estatisticamente significante no nível, mas sim na inclinação da curva. / [en] In this study, we try to estimate the impact of the most recent currency intervention measure widely adopted by the Central Bank of Brazil and how it affects the Cupom Cambial Curve: the issue of Foreign Exchange Swaps. The BCB s objective with this intervention was to provide the private sector with hedge against exchange rate volatility. This paper focus on the effect of these measures on the Cupom Curve due to the importance of the comprehension of this curve for the correct pricing of the future dollar market, given that, in Brazil, the formation of the foreign exchange rate occurs with the future dollar price and not in the spot price, as is more common in other countries. Through Principal Component Analysis on the Foreign Exchange Coupon Curve, we find its three components (level, slope and curvature) and use it as an explained variable to regress it with independent variables that represent the series of Swap issued by the Central Bank. The results indicate that the Foreign Exchange Swaps generate significant changes in the overall level of the Cupom Cambial Curve. Otherwise, Reverse Swaps don t represent a statistically significant impact on the level but do impact the slope of the curve.
|
9 |
[pt] DESENVOLVIMENTO DE MODELOS PARA PREVISÃO DE QUALIDADE DE SISTEMAS DE RECONHECIMENTO DE VOZ / [en] DEVELOPMENT OF PREDICTION MODELS FOR THE QUALITY OF SPOKEN DIALOGUE SYSTEMSBERNARDO LINS DE ALBUQUERQUE COMPAGNONI 12 November 2021 (has links)
[pt] Spoken Dialogue Systems (SDS s) são sistemas baseados em computadores desenvolvidos para fornecerem informações e realizar tarefas utilizando o diálogo como forma de interação. Eles são capazes de reconhecimento de voz, interpretação, gerenciamento de diálogo e são capazes de ter uma voz como saída de dados, tentando reproduzir uma interação natural falada entre um usuário humano e um sistema. SDS s provém diferentes serviços, todos através de linguagem falada com um sistema. Mesmo com todo o
desenvolvimento nesta área, há escassez de informações sobre como avaliar a qualidade de tais sistemas com o propósito de otimização do mesmo. Com dois destes sistemas, BoRIS e INSPIRE, usados para reservas de restaurantes e gerenciamento de casas inteligentes, diversos experimentos foram conduzidos
no passado, onde tais sistemas foram utilizados para resolver tarefas específicas. Os participantes avaliaram a qualidade do sistema em uma série de questões. Além disso, todas as interações foram gravadas e anotadas por um especialista.O desenvolvimento de métodos para avaliação de performance é um tópico aberto de pesquisa na área de SDS s. Seguindo a idéia do modelo PARADISE (PARAdigm
for DIalogue System Evaluation – desenvolvido pro Walker e colaboradores na AT&T em 1998), diversos experimentos foram conduzidos para desenvolver modelos de previsão de performance de sistemas de reconhecimento de voz e linguagem falada. O objetivo desta dissertação de mestrado é desenvolver
modelos que permitam a previsão de dimensões de qualidade percebidas por um usuário humano, baseado em parâmetros instrumentalmente mensuráveis utilizando dados coletados nos experimentos realizados com os sistemas BoRIS e INSPIRE , dois sistemas de reconhecimento de voz (o primeiro para busca de
restaurantes e o segundo para Smart Homes). Diferentes algoritmos serão utilizados para análise (Regressão linear, Árvores de Regressão, Árvores de Classificação e Redes Neurais) e para cada um dos algoritmos, uma ferramenta diferente será programada em MATLAB, para poder servir de base para análise de experimentos futuros, sendo facilmente modificado para sistemas e parâmetros novos em estudos subsequentes.A idéia principal é desenvolver ferramentas que possam ajudar na otimização de um SDS sem o envolvimento direto de um usuário humano ou servir de ferramenta para estudos futuros na área. / [en] Spoken Dialogue Systems (SDS s) are computer-based systems developed to provide information and carry out tasks using speech as the interaction mode. They are capable of speech recognition, interpretation, management of dialogue and have speech output capabilities, trying to reproduce a more or less natural
spoken interaction between a human user and the system. SDS s provide several different services, all through spoken language. Even with all this development, there is scarcity of information on ways to assess and evaluate the quality of such systems with the purpose of optimization. With two of these SDS s ,BoRIS and INSPIRE, (used for Restaurant Booking Services and Smart Home Systems), extensive experiments were conducted in the past, where the systems were used to resolve specific tasks. The evaluators rated the quality of the system on a multitude of scales. In addition to that, the interactions were recorded and annotated by an expert. The development of methods for performance evaluation
is an open research issue in this area of SDS s. Following the idea of the PARADISE model (PARAdigm for DIalogue System Evaluation model, the most well-known model for this purpose (developed by Walker and co-workers at AT&T in 1998), several experiments were conducted to develop predictive
models of spoken dialogue performance. The objective of this dissertation is to develop and assess models which allow the prediction of quality dimensions as perceived by the human user, based on instrumentally measurable variables using all the collected data from the BoRIS and INSPIRE systems. Different types of
algorithms will be compared to their prediction performance and to how generic they are. Four different approaches will be used for these analyses: Linear regression, Regression Trees, Classification Trees and Neural Networks. For each of these methods, a different tool will be programmed using MATLAB, that can
carry out all experiments from this work and be easily modified for new experiments with data from new systems or new variables on future studies. All the used MATLAB programs will be made available on the attached CD with an operation manual for future users as well as a guide to modify the existing
programs to work on new data. The main idea is to develop tools that would help on the optimization of a spoken dialogue system without a direct involvement of the human user or serve as tools for future studies in this area.
|
Page generated in 0.4288 seconds