21 |
[en] THE CONSTITUTIONAL NORMS OF RESOURCES DESTINATIONS AS A WARRANTY TO THE EFFECTIVENESS OF EDUCATION RIGHT / [pt] AS NORMAS CONSTITUCIONAIS DE VINCULAÇÕES DE RECURSOS COMO GARANTIA PARA A EFETIVIDADE DO DIREITO À EDUCAÇÃOPAULO ABRAO PIRES JUNIOR 01 March 2011 (has links)
[pt] Esta tese versa sobre o direito à educação e o seu financiamento público.
Mais especificamente as normas constitucionais de vinculações de recursos para a
educação. O estudo explicita a estrutura e o modo de funcionamento das
vinculações de recursos para a educação, previstas na Constituição da República
de 1988 e problematiza seus resultados e críticas. Em seguida faz uma análise
sobre papel que a educação exerce para o cumprimento das promessas da
modernidade a partir da teoria do reconhecimento para verificar as razões
justificadoras da inserção de um mecanismo de proteção jurídica prioritária para o
direito à educação. Por último, defende as normas constitucionais de vinculações
de recursos para a educação como uma garantia para efetividade do direito à
educação e explora quais as interfaces que esta leitura acarreta aos sistemas dos
direitos sociais, da separação de poderes e da federação. / [en] This thesis is about the right to education e its public financing. More
specifically the constitutional norms of ties resources to education. The study
explicits the structure and the functioning of the resources destination to education
previewed in Brazilian’s Constitution of 1998 and problematizes its results and
critics. Right after it is made an analysis on the role that education has to the reach
of modernity’s promises taking recognition’s theory as starting premises so to
verify the justifying reasons for the inclusion of a differentiated juridical
protection mechanism of education’s right. At the end, the thesis defends the
constitutional norms that establishes resources with specific destination to
education as a warranty to the right of education and explores the interfaces that
this interpretation implies into the social rights systems, to the principle of power
separation and federalism.
|
22 |
[en] A STUDY OF CLASSIFIERS FOR AUTOMATIC FACE RECOGNITION / [pt] ESTUDO DE CLASSIFICADORES PARA O RECONHECIMENTO AUTOMÁTICO DE FACES04 November 2005 (has links)
[pt] Identificar um indivíduo a partir de uma imagem de face é
uma tarefa simples para seres humanos e extremamente
difícil para a Visão Computacional. Esta questão tem
motivado diversos grupos de pesquisa em todo o mundo,
especialmente a partir de 1993. Inúmeros trabalhos
realizados até o momento encaram uma imagem digital de n
pixels como um vetor num espaço n-dimensional, onde n é em
geral muito grande. Imagens de rostos humanos possuem,
contudo, grande redundância: todas contém dois olhos, um
nariz, uma boca, e etc. É possível, portanto, trabalhar em
uma base deste espaço em que faces possam ser
adequadamente caracterizadas a partir de um conjunto de p
componentes, onde p é muito menor quen. É com este enfoque
que o presente trabalho estuda sistemas de reconhecimento
de faces que consistem de um estágio de redução de
dimensionalidade, realizado pela técnica de Análise de
Componentes Principais (PCA), seguido de um modelo
classificador. No estágio da PCA, as imagens de n pixels
são transformadas em vetores de p características a partir
de um conjunto de treinamento. Três classificadores
conhecidos na literatura são estudados: os classificadores
de distância (EUclideana e de Mahalanobis), a rede neural
de Funções Base Radiais (RBF), e o classificador de
Fisher. Este trabalho propõe, ainda, um novo classificador
que introduz o conceito de Matrizes de Covariança
Misturadas (MPM) no classificador gaussiano de Máxima
Probabilidade. Os quatros classificadores são avaliados
através da variação de seus respectivos parâmetros e
utilizam como imagens o banco de faces da Olivetti. Nos
experimentos realizados para comparar tais abordagens, o
novo classificador proposto atingiu as maiores taxas de
reconhecimento e apresentou menorsensibilidade à escolha
do conjunto de faces de treinamento. / [en] Identifying an individual based on a face image is a
simple task for humans to perform and a very difficult one
for Vision Computing. Since 1993, several research groups
in all over the world have been studied this problem. Most
of the methods proposed for recognizing the identity of an
individual represent a n intensity pixel image as a n-
dimensional vector, when, in general, n is a very large
number value. Face images are highly redundant, since
every individual has two eyes, one nose, one mouth and so
on. Then, instead of using n intensity values, it is
generally possible to characterize an image instance by a
set of p features, for p < < n. This work studies face
recognition systems consisting of a PCA stage for
dimensionality reduction followed by a classifier. The PCA
stage takes the n-pixels face images and produces the
corresponding p most expensive features, based on the
whole available training set. Three classifiers proposed
in the literature are studied: the Euclidean and
Mahalanobis distances, the RBF neural network, and the
Fisher classifier. This work also proposes a new
classifier, which introduces the concept of Mixture
Covariance Matrices (MPM) in the Minimum Total Probality
of Misclassification rule for normal populations. The four
classifiers are evaluated using the Olivetti Face Database
varying their parameters in a wide range. In the
experiments carried out to compare those approaches the
new proposed classifier reached the best recognition rates
and showed to be less sensitive to the choice of the
training set.
|
23 |
[en] A STUDY OF NAVIGATION AND SELECTION TECHNIQUES IN VIRTUAL ENVIRONMENTS USING MICROSOFT KINECT / [pt] UM ESTUDO SOBRE TÉCNICAS DE NAVEGAÇÃO E SELEÇÃO EM AMBIENTES VIRTUAIS USANDO O MICROSOFT KINECTPETER FURTADO DAM 25 February 2014 (has links)
[pt] O avanço das tecnologias de realidade virtual tem viabilizado melhor acesso a essas tecnologias e a menores custos, desonerando os estudos nesta linha. Este trabalho propõe e estuda diversas técnicas de navegação e seleção em ambientes virtuais usando o Microsoft Kinect. Este dispositivo foi escolhido pois, além de ter custo acessível, permite que o usuário interaja com o sistema sem precisar estar com um dispositivo em mãos ou acoplado ao corpo. Com isto procura-se aumentar o grau de imersão e, possivelmente, criar formas de interação mais familiares aos usuários, ou seja, diminuir a distância do mundo virtual para o real. Através dessas técnicas busca-se que o usuário possa se locomover e interagir com objetos em um ambiente virtual de forma mais próxima ao que faria em um ambiente físico real. Para este trabalho foram implementadas três técnicas de navegação e três de seleção. Uma série de testes foram feitos avaliando pontos como facilidade de uso, esforço cognitivo, tempo de realização de tarefas, fluidez da navegação, entre outros fatores, para cada técnica proposta e para a combinação delas. / [en] The improvement of virtual reality technologies has enabled increased access to these technologies and at lower prices, allowing more studies in this line. This work proposes and studies several navigation and selection techniques in virtual environments using Microsoft Kinect. This device was chosen because, besides having an accessible price, it allows the user to interact with the system without need of hand-held devices or having a device attached to the body. This way we intend to increase the degree of virtual presence and, possibly, create more familiar interactions, in other words, reduce the distance between the virtual world and the real world. Through these techniques we strive to allow the user to move and interact with objects in the virtual world in a way similar to how he would do so in the real physical world. For this work three navigation and three selection techniques were implemented. A series of tests were undertaken to evaluate aspects such as ease of use, mental effort, time spent to complete tasks, fluidity of navigation, amongst other factors for each proposed technique and the combination of them.
|
24 |
[pt] AS POTENCIALIDADES DO MICROCRÉDITO NA BUSCA DO DESENVOLVIMENTO COMO LIBERDADE / [en] THE POTENTIALITIES OF MICROCREDIT IN THE PERSUIT OF DEVELOPMENT AS FREEDOMSTELLY GOMES LEAL DA CRUZ PACHECO 19 October 2011 (has links)
[pt] Partindo do delineamento conceitual de microcrédito, o presente trabalho
identifica suas principais contribuições metodológicas e sua relação direta com a
prática, sem descurar do panorama legislativo brasileiro, através de uma análise
crítica e propositiva das pessoas jurídicas que podem atuar nessa área.
Utilizando como marco teórico as noções de desenvolvimento e de pobreza
colhidas da perspectiva de Amartya Sen, o trabalho analisa a proposta de
estruturação do Grameen Bank e busca investigar o papel que o microcrédito
pode desempenhar no Brasil, seja pela sua potencial contribuição no resgate da
autoestima social (nas demandas de justiça distributiva / reconhecimento; no
reforço das práticas de economia solidária e na coesão / engajamento social),
seja a partir da proposta de seu fomento não apenas no sentido dos bens de
capital e capital de giro, mas da produtividade social e microfinanças num
enfoque integrativo. A proposta fundamental está na configuração de políticas de
sinergia com os programas assistenciais, como potencial instrumento na luta de
combate à pobreza, no reforço da coesão / engajamento social e na busca do
desenvolvimento econômico visto como liberdade, a partir do incremento das
liberdades substantivas e da condição de agente livre e sustentável do homem,
como motor fundamental do desenvolvimento. Nessa esteira, pretende-se propor
uma visão de sociedade calcada no pleno desenvolvimento humano em
substituição à referência pura e simples ao Estado Social, através do enfoque na
emancipação do indivíduo, mas principalmente na visão da liberdade individual
como comprometimento social, reconhecendo-se, assim, a interdependência
entre liberdade e responsabilidade. / [en] Based on the concept of microcredit, this study identifies its main
methodological contributions and its direct relation with the practice, without
neglecting the regulatory picture in Brazil, through a proactive critical analysis of
the legal entities that can perform in this area. Using the definitions of
development and poverty by Amartya Sen, the paper analyzes the Grameen
Bank structuring process and investigates the role that microcredit can play in
Brazil, due to its potential contribution to the promotion of social self-esteem (on
the demands of distributive justice / recognition; on the improvement of solidarity
economic practice and cohesion / social engagement). Additionally, the study
analyzes its potentiality to promote the social productivity, not only in terms of
capital goods and capital itself, but also in an integrative perspective with the
microfinance approach. The main proposal is to shape synergical policies with
the welfare programs as a potential tool in the fight against poverty, in the
strengthening of the cohesion / social engagement and in the pursuit of the
economic development as freedom. This means that we consider the increase of
the substantive freedoms and the condition of free agent as the key of the
development. Thus, we intend to propose a vision of society based on the full
human development replacing the outright reference to the welfare state, by
focusing on empowerment of the individual, but mainly in the vision of individual
freedom as social commitment, recognizing the interdependence between
freedom and responsibility.
|
25 |
[pt] A FUNÇÃO DO RECONHECIMENTO NA CLÍNICA PSICANALÍTICA / [en] THE ROLE OF RECOGNITION IN THE PSYCHOANALYTIC CLÍNICSTEPHANIE SOARES BRUM 19 May 2023 (has links)
[pt] A presente tese busca promover um estudo sobre a questão do reconhecimento na clínica psicanalítica. Para tal, serão traçadas as linhas a partir das quais o reconhecimento atua no movimento de constituição subjetiva do indivíduo na saúde, tornando possível para este a expressão de seu potencial espontâneo. Será apresentada a ideia segundo a qual o modelo do trauma pode ser identificado enquanto o negativo do reconhecimento, implicando em um movimento de rearranjo da própria organização e funcionamento do psiquismo. A partir destes dois pontos traçaremos uma delimitação clínica da questão do reconhecimento a partir dos casos limite. Este enfoque nos possibilitará findar nossas ponderações sobre a temática do reconhecimento articulando nossa temática central a posição do analista e seu manejo. Com isso nos veremos diante da importância da presença e de uma ética psicanalítica pautada no cuidado para que, a partir de uma dinâmica de reconhecimento de dupla hélice em comunhão aum movimento regressivo, novas formas de ser, estar e se relacionar no mundo possam ser criadas pelo paciente. / [en] The present thesis seeks to promote a study of the recognition in the psychoanalytic clinic. To make it possible we will draw the lines to defend that the recognition is an important part in thenatural movement of the individual s subjective constitution, and make possible for the subjectto express himself spontaneously according with his own potential. That idea will be present in parallel with the trauma model that we identified as the negative of recognition. This consideration imply a movement of rearrangement of psychic organization and functioning itself. To discuss these two point we will present a clinical delimitation on the limit cases. With that, we will discuss the importance of presence and a psychoanalytic ethics based on care. With that, we will present to the reader a dynamic of the recognition of a double helix that in communion with a regressive movement makes possible the emergence of new ways of being relating in the world.
|
26 |
[en] A ROBUST WORKFLOW FOR PERSON TRACKING AND META-DATA GENERATION IN VIDEOS / [pt] UMA METODOLOGIA ROBUSTA PARA RASTREAMENTO DE PESSOAS E GERAÇÃO DE META-DADOS EM VÍDEOSRAFAEL ANTONIO PINTO PENA 23 June 2021 (has links)
[pt] A quantidade de vídeos gravados no mundo cresce muito, não somente devido aos interesses e hábitos humanos em relação a esse tipo de mídia, mas também pela diversidade de dispositivos utilizados para criação de vídeos. No entanto, faltam informações sobre conteúdos em vídeo porque a geração de
metadados é complexa e requer muito tempo para ser executado por humanos. Do ponto de vista da tecnologia, não é fácil superar os obstáculos relacionados à grande quantidade e diversidade de frames de vídeo. O trabalho propõe um sistema automatizado de reconhecimento facial para detectar personagens em vídeos. Ele foi desenvolvido para reconhecer personagens, a fim de aumentar os metadados de vídeo. Ele combina técnicas padrão de visão computacional para melhorar a precisão, processando os dados de saída dos modelos existentes de maneira complementar. O modelo teve um desempenho satisfatório usando um
conjunto de dados da vida real de uma grande empresa de mídia. / [en] The amount of recorded video in the world is increasing a lot due not only to the humans interests and habits regarding this kind of media, but also the diversity of devices used to create them. However, there is a lack of information about video content because generating video meta-data is complex. It demands too much time to be performed by humans, and from the technology perspective, it is not easy to overcome obstacles regarding the huge amount and diversity of video frames. In this work we propose an automated face recognition system to detect and recognize humans within videos. It was developed to recognize characters,in order to increase video meta-data. It combines standard computer vision techniques to improved accuracy by processing existing models output data in a complementary manner. We evaluated the performance of the system in a real data set from a large media company.
|
27 |
[pt] RECONHECIMENTO FACIAL EM VÍDEO COM UMA AMOSTRA POR PESSOA UTILIZANDO STACKED SUPERVISED AUTO-ENCODER / [en] SINGLE SAMPLE FACE RECOGNITION FROM VIDEO VIA SATCKED SUPERVISED AUTO-ENCODERPEDRO JUAN SOTO VEGA 23 November 2016 (has links)
[pt] Esta dissertação propõe e avalia estratégias baseadas nos Stacked Supervised Auto-encoders (SSAE) para representação de imagens faciais em aplicações de vídeo vigilância. O estudo foca na identificação de faces a partir de uma amostra por pessoa na galeria (single sample per person - SSPP). Variações em termos de pose, expressão facial, iluminação e oclusão são abordadas de duas formas. Primeiro, o SSAE extrai atributos das imagens de faces que são robustos contra tais variações. Segundo, exploram-se as múltiplas amostras que podem ser coletadas nas sequências de vídeo de uma pessoa (multiple samples per person probe - MSPPP). Os métodos propostos foram avaliados e comparados usando os bancos de vídeos Honda/UCSD e VIDTIMIT. Adicionalmente, foi estudada a influência de parâmetros relacionados com a arquitetura do SSAE utilizando o banco de imagens estáticas Extended Yale B. Os resultados demonstraram que as estratégias que exploram as MSPPP em combinação com o SSAE podem superar o desempenho de outros métodos SSPP, como os Padrões Binários Locais (LBP), para reconhecimento de faces em vídeos. / [en] This work proposes and evaluates strategies based on Stacked Supervised Auto-encoders (SSAE) for face representation in video surveillance applications. The study focuses on the identification task with a single sample per person (SSPP) in the gallery. Variations in terms of pose, facial expression, illumination and occlusion are approached in two ways. First, the SSAE extracts features from face images, which are robust to such variations. Second, multiple samples per persons probes (MSPPP) that can be extracted from video sequences are exploited to improve recognition accuracy. The proposed methods were compared upon Honda/UCSD and VIDTIMIT video datasets. Additionally, the influence of the parameters related to SSAE architecture was studied using the Extended Yale B dataset. The experimental results demonstrated that strategies combining SSAE and MSPPP are able to outperform other SSPP methods, such as local binary patterns, in face recognition from video.
|
28 |
[en] BETTER JUSTICE THROUGH BETTER SCIENCE-TECHNOLOGY?: THE ENTANGLEMENTS OF ALGORITHMS AND SECURITY AND LEGAL PROFESSIONALS / [pt] MELHOR JUSTIÇA ATRAVÉS DE MELHOR CIÊNCIA E TECNOLOGIA?: OS EMARANHADOS DE ALGORITMOS E PROFISSIONAIS SEGURANÇA E DIREITOTHALLITA GABRIELE LOPES LIMA 21 October 2024 (has links)
[pt] Na segurança e Justiça Criminal, os algoritmos tornaram-se prevalentes, utilizados
por instituições como agências de inteligência, polícia e tribunais. Essas
tecnologias, incluindo software de reconhecimento facial, são empregadas em
várias práticas de segurança e vigilância em todo o mundo. Esse uso generalizado
levanta questões sobre a autoridade epistêmica e a credibilidade dos algoritmos,
particularmente na produção de práticas de (in)segurança e na contestação de
evidências dentro do sistema de justiça criminal. Neste contexto, essa tese explora
os complexos emaranhados das práticas de profissionais de segurança e do direito
e algoritmos, enfatizando como essas tecnologias digitais se materializam,
estabilizam e circulam em diversas práticas mesmo em meio a erros e contestações.
Primeiro, a tese examina as implicações da razão algorítmica, abordando como
essas tecnologias prometem simultaneamente eficiência e objetividade, enquanto
recorrentemente erram. Seguidamente, explora como os algoritmos moldam
percepções, identificam alvos e influenciam ações de segurança, focando
especialmente em dados biométricos e algoritmos de reconhecimento facial, como
o uso Clearview AI nos Estados Unidos. Ao analisar esses sistemas, a pesquisa visa
entender como os algoritmos criam e legitimam imaginários de melhor
justiça/segurança e suas consequências sociais e políticas mais amplas. A tese se
situa dentro dos Estudos Críticos de Segurança, Estudos de Ciência e Tecnologia e
críticas feministas da tecnociência, compondo com diferentes campos para entender
a característica operativa da razão algorítmica na política internacional. Por fim, a
pesquisa demonstra como os algoritmos criam condições de possibilidade para
práticas de segurança e justiça, organizando uma multitude de elementos e
produzindo uma ordem que impacta esses campos e destaca a importância de
entender a força política dos discursos em torno dos algoritmos e seu papel na
reformulação das condições de possibilidade para pensar e fazer segurança. / [en] In security, algorithms have become prevalent and used by institutions such as
intelligence agencies, police, and courts. These technologies, including facial
recognition software, are employed in various security and surveillance practices
worldwide. This widespread use raises questions about algorithms epistemic
authority and credibility, particularly in producing (in)security practices and
contesting evidence within the criminal justice system. In this context, this thesis
explores the complex entanglements of the practices of security and legal
professionals and algorithms, emphasizing how these digital technologies
materialize, stabilize, and circulate in diverse practices even amid errors and
contestations. First, the thesis examines the implications of algorithmic reason,
addressing how these technologies simultaneously promise efficiency and
objectivity while repeatedly getting it wrong. It then explores how algorithms shape
perceptions, identify targets, and influence security actions, focusing primarily on
biometric data and facial recognition algorithms, such as the use of Clearview AI
in the United States. By analyzing these systems, the research aims to understand
how algorithms create and legitimize better justice/security imaginaries and their
broader social and political consequences. The thesis is located within Critical
Security Studies, Science and Technology Studies, and feminist critiques of
technoscience, crossing different fields to understand the operative characteristic of
algorithmic reason in international politics. Finally, the research demonstrates how
algorithms create conditions of possibility for security and justice practices,
organizing a multitude of elements and producing an order that impacts these fields
and highlights the importance of understanding the political force of the discourses
surrounding algorithms and their role in reformulating the conditions of possibility
for thinking and doing security.
|
29 |
[en] AN EVALUATION OF AUTOMATIC FACE RECOGNITION METHODS FOR SURVEILLANCE / [pt] ESTUDO DE MÉTODOS AUTOMÁTICOS DE RECONHECIMENTO FACIAL PARA VÍDEO MONITORAMENTOVICTOR HUGO AYMA QUIRITA 26 March 2015 (has links)
[pt] Esta dissertação teve por objetivo comparar o desempenho de diversos algoritmos que representam o estado da arte em reconhecimento facial a imagens de sequências de vídeo. Três objetivos específicos foram perseguidos: desenvolver um método para determinar quando uma face está em posição frontal com respeito à câmera (detector de face frontal); avaliar a acurácia dos algoritmos de reconhecimento com base nas imagens faciais obtidas com ajuda do detector de face frontal; e, finalmente, identificar o algoritmo com melhor desempenho quando aplicado a tarefas de verificação e identificação. A comparação dos métodos de reconhecimento foi realizada adotando a seguinte metodologia: primeiro, foi criado um detector de face frontal que permitiu o captura das imagens faciais frontais; segundo, os algoritmos foram treinados e testados com a ajuda do facereclib, uma biblioteca desenvolvida pelo Grupo de Biometria no Instituto de Pesquisa IDIAP; terceiro, baseando-se nas curvas ROC e CMC como métricas, compararam-se os algoritmos de reconhecimento; e por ultimo, as análises dos resultados foram realizadas e as conclusões estão relatadas neste trabalho. Experimentos realizados sobre os bancos de vídeo: MOBIO, ChokePOINT, VidTIMIT, HONDA, e quatro fragmentos de diversos filmes, indicam que o Inter Session Variability Modeling e Gaussian Mixture Model são os algoritmos que fornecem a melhor acurácia quando são usados em tarefas tanto de verificação quanto de identificação, o que os indica como técnicas de reconhecimento viáveis para o vídeo monitoramento automático em vídeo. / [en] This dissertation aimed to compare the performance of state-of-the-arte face recognition algorithms in facial images captured from multiple video sequences. Three specific objectives were pursued: to develop a method for determining when a face is in frontal position with respect to the camera (frontal face detector); to evaluate the accuracy for recognition algorithms based on the facial images obtained with the help of the frontal face detector; and finally, to identify the algorithm with better performance when applied to verification and identification tasks in video surveillance systems. The comparison of the recognition methods was performed adopting the following approach: first, a frontal face detector, which allowed the capture of facial images was created; second, the algorithms were trained and tested with the help of facereclib, a library developed by the Biometrics Group at the IDIAP Research Institute; third, ROC and CMC curves were used as metrics to compare the recognition algorithms; and finally, the results were analyzed and the conclusions were reported in this manuscript. Experiments conducted on the video datasets: MOBIO, ChokePOINT, VidTIMIT, HONDA, and four fragments of several films, indicate that the Inter-Session Variability Modelling and Gaussian Mixture Model algorithms provide the best accuracy on classification when the algorithms are used in verification and identification tasks, which indicates them as a good automatic recognition techniques for video surveillance applications.
|
30 |
[en] DISTRIBUTED RECOGNITION FOR CONTINUOUS SPEECH IN LARGE VOCABULARY BRAZILIAN PORTUGUESE / [pt] RECONHECIMENTO DISTRIBUÍDO DE VOZ CONTÍNUA COM AMPLO VOCABULÁRIO PARA O PORTUGUÊS BRASILEIROVLADIMIR FABREGAS SURIGUE DE ALENCAR 05 October 2009 (has links)
[pt] Esta Tese visa explorar as oportunidades de melhoria do desempenho dos Sistemas
Automáticos de Reconhecimento de voz com amplo vocabulário para o Português Brasileiro
quando aplicados em um cenário distribuído (Reconhecimento de Voz Distribuído). Com esta
finalidade, foi construída uma base de vozes para reconhecimento de voz contínua para o
Português Brasileiro com 100 locutores, cada um falando 1000 frases foneticamente balanceadas.
A gravação foi realizada em estúdio, ambiente sem ruído, com uma especificação de gravação que
pudesse abranger a entrada dos diversos codificadores de voz utilizados em Telefonia Móvel
Celular e IP, em particular os codecs ITU-T G.723.1, AMR-NB e AMR-WB. Para um bom
funcionamento dos Sistemas Automáticos de Reconhecimento de voz é necessário que os atributos
de reconhecimento sejam obtidos a uma taxa elevada, porém os codificadores de Voz para
Telefonia IP e Móvel Celular normalmente geram seus parâmetros a taxas mais baixas, o que
degrada o desempenho do reconhecedor. Usualmente é utilizada a interpolação linear no domínio
das LSFs (Line Spectral Frequencies) para resolver este problema. Nesta Tese foi proposta a
realização da interpolação com a utilização de um Filtro Digital Interpolador que demonstrou ter
um desempenho de reconhecimento muito superior ao da interpolação linear. Foi avaliado também
o uso das ISFs (Immittance Spectral Frequencies) interpoladas como atributo de reconhecimento,
as quais se mostraram inadequadas para esta finalidade, assim como as LSFs. Outro aspecto de
fundamental importância para os reconhecedores de voz distribuídos é a recuperação de perda de
pacotes, que tem impacto direto no desempenho de reconhecimento. Normalmente os
codificadores inserem zeros nos pacotes perdidos ou interpolam linearmente os pacotes recebidos
visando restaurar estes pacotes. Foi proposta nesta tese uma nova técnica baseada em Redes
Neurais que se mostrou mais eficiente na restauração destes pacotes com a finalidade da realização
do reconhecimento. / [en] This Thesis aims at exploring several approaches for performance improvement of the
Automatic Speech Recognition System with large vocabulary for the Brazilian Portuguese when
applied in a distributed scenario (Distributed Speech Recognition). With this purpose, a speech
database for continuous speech recognition for the Brazilian Portuguese with 100 speakers was
constructed, each one uttering 1000 phonetic balanced sentences. The recording was carried out in
a studio (environment without noise) with a specification of recording that would be able to allow
the input of several speech codecs in Cellular Mobile Telephony and IP Networks, in particular the
ITU-T G.723.1, AMR-NB and AMR-WB. In order to work properly, Automatic Speech
Recognition Systems require that the recognition features be extracted at a high rate. However, the
Speech codecs for Cellular Mobile Telephony and IP Networks normally generate its parameters at
lower rates, which degrades the performance of the recognition system. Usually the linear
interpolation in the LSF (Line Spectral Frequencies) domain is used to solve this problem. In this
Thesis the accomplishment of the interpolation with the use of a Digital Filter Interpolator was
proposed and demonstrated to have a higher performance than the linear interpolation in
recognition systems. The use of the interpolated ISFs (Immittance Spectral Frequencies) was also
evaluated as recognition feature, which had shown to be inadequate for this purpose, as well as the
LSFs. Another very important aspect for the distributed speech recognizers is the recovery of lost
packets, that has direct impact in the recognition performance. Normally the coders insert zeros in
the lost packets or interpolate linearly the received packets aiming to restore them. A new
technique based on Neural Networks was proposed in this thesis that showed to be more efficient
in the restoration of these lost packets with the purpose of speech recognition.
|
Page generated in 0.0781 seconds