• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 17
  • 3
  • 1
  • Tagged with
  • 21
  • 10
  • 10
  • 9
  • 7
  • 5
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Sistemas de adaptação ao locutor utilizando autovozes. / Speaker adaptation system using eigenvoices.

Liselene de Abreu Borges 20 December 2001 (has links)
O presente trabalho descreve duas técnicas de adaptação ao locutor para sistemas de reconhecimento de voz utilizando um volume de dados de adaptação reduzido. Regressão Linear de Máxima Verossimilhança (MLLR) e Autovozes são as técnicas trabalhadas. Ambas atualizam as médias das Gaussianas dos modelos ocultos de Markov (HMM). A técnica MLLR estima um grupo de transformações lineares para os parâmetros das medias das Gaussianas do sistema. A técnica de Autovozes baseia-se no conhecimento prévio das variações entre locutores. Para obtermos o conhecimento prévio, que está contido nas autovozes, utiliza-se a análise em componentes principais (PCA). Fizemos os testes de adaptação das médias em um sistema de reconhecimento de voz de palavras isoladas e de vocabulário restrito. Contando com um volume grande de dados de adaptação (mais de 70% das palavras do vocabulário) a técnica de autovozes não apresentou resultados expressivos com relação aos que a técnica MLLR apresentou. Agora, quando o volume de dados reduzido (menos de 15% das palavras do vocabulário) a técnica de Autovozes apresentou-se superior à MLLR. / This present work describe two speaker adaptation technique, using a small amount of adaptation data, for a speech recognition system. These techniques are Maximum Likelihood Linear Regression (MLLR) and Eigenvoices. Both re-estimates the mean of a continuous density Hidden Markov Model system. MLLR technique estimates a set of linear transformations for mean parameters of a Gaussian system. The eigenvoice technique is based on a previous knowledge about speaker variation. For obtaining this previous knowledge, that are retained in eigenvoices, it necessary to apply principal component analysis (PCA). We make adaptation tests over an isolated word recognition system, restrict vocabulary. If a large amount of adaptation data is available (up to 70% of all vocabulary) Eigenvoices technique does not appear to be a good implementation if compared with the MLLR technique. Now, when just a small amount of adaptation data is available (less than 15 % of all vocabulary), Eigenvoices technique get better results than MLLR technique.
12

Análise das concentrações energéticas no limiar entre fonemas vozeados e não-vozeados e suas implicações para fins de reconhecimento de locutores dependente do discurso / Analysis of energy cocentrations in the threshold between voiced and unvoiced phonemes and their implications for text-dependent speaker recognition

William Habaro Ishizawa 19 February 2015 (has links)
Atualmente, diversos trabalhos e aplicações são desenvolvidos com foco na área de reconhecimento computacional de locutores. À medida que o interesse por diversas aplicações reais dentro dessa área emerge, principalmente em biometria, na qual a segurança e a eficácia são de extrema importância, torna-se cada vez mais necessário que estudos sejam feitos, na mesma proporção, visando avaliá-las. Desse modo, a proposta do presente trabalho é a de mensurar a acurácia de um sistema de reconhecimento de locutores baseado em características elementares, isto é, energias de sub-bandas de frequências, em associação com um classificador probabilístico, estudando a viabilidade de extraí-las das transições entre trechos vozeados e não-vozeados (TTVNV) dos sinais. Testes são realizados com diferentes quantidades de locutores e discurso fixado. A acurácia obtida nos testes variam de 20.18% a 92.53%. Os resultados obtidos são comparados e relatados, complementando as afirmações existentes na literatura sobre o uso das TTVNV com dados quantitativos. / Nowadays, many works and applications are developed focusing on computational speaker recognition. As the interest for several real applications within this area emerges, especially in biometrics, where the safety and the efficacy of the applications are extremely important, studies need to be developed in the same proportion, to evaluate the effectiveness of such approaches. Based on that, this work intends to measure the accuracy of a speaker recognition system that uses elementar features, i.e., sub-band frequency energies, associated with a probabilistic classifier, studying the viability of extracting them from the transition between voiced and unvoiced speech tags (TTVNV). Tests are carried out with different numbers of speakers and a text-dependent approach. The accuracy of the tests varies from 20.18% to 92.53%. The results are compared and reported, complementing the existent information on the use of TTVNV with quantitative data.
13

A comparative analysis of gaussian mixture models and i-vector for speaker verification under mismatched conditions

Avila, Anderson Raymundo January 2014 (has links)
Orientador: Prof. Dr. Francisco J. Fraga / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Engenharia da Informação, 2014. / Most speaker verifcation systems are based on Gaussian mixture models and more recently on the so-called i-vector. These two methods are affected in mismatched testtrain conditions, which might be caused by vocal-efort variability, different speakingstyles or channel efects. In this work, we compared the impact of speech rate variation and room reverberation on both methods. We found that performance degradation due to variation on speech rate can be mitigated by adding fast speech samples into the training set, which decreased equal error rates for Gaussian mixture models and i-vector, respectively. Regarding reverberation, we investigated the achievements of both methods when three diferent reverberation compensation techniques are applied in order to overcome performance degradation. The results showed that having reverberant background models separated by diferent levels of reverberation can bene t both methods, with the i-vector providing the best performance in that scenario. Finally, the performance of two auditory-inspired features, mel-frequency cepstral coe ficients and the so-called modulation spectrum features, are compared in presence of room reverberation. For the speaker verifcation system considered in this work, modulation spectrum features are equally afected by reverberation time and have their performance degraded as the level of reverberation increases.
14

Arcabouço para reconhecimento de locutor baseado em aprendizado não supervisionado / Speaker recognition framework based on unsupervised learning

Campos, Victor de Abreu [UNESP] 31 August 2017 (has links)
Submitted by Victor de Abreu Campos null (victorde.ac@gmail.com) on 2017-09-27T02:41:28Z No. of bitstreams: 1 dissertacao.pdf: 5473435 bytes, checksum: 1e76ecc15a4499dc141983740cc79e5a (MD5) / Approved for entry into archive by Monique Sasaki (sayumi_sasaki@hotmail.com) on 2017-09-28T13:43:21Z (GMT) No. of bitstreams: 1 campos_va_me_sjrp.pdf: 5473435 bytes, checksum: 1e76ecc15a4499dc141983740cc79e5a (MD5) / Made available in DSpace on 2017-09-28T13:43:21Z (GMT). No. of bitstreams: 1 campos_va_me_sjrp.pdf: 5473435 bytes, checksum: 1e76ecc15a4499dc141983740cc79e5a (MD5) Previous issue date: 2017-08-31 / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / A quantidade vertiginosa de conteúdo multimídia acumulada diariamente tem demandado o desenvolvimento de abordagens eficazes de recuperação. Nesse contexto, ferramentas de reconhecimento de locutor capazes de identificar automaticamente um indivíduo pela sua voz são de grande relevância. Este trabalho apresenta uma nova abordagem de reconhecimento de locutor modelado como um cenário de recuperação e usando algoritmos de aprendizado não supervisionado recentes. A abordagem proposta considera Coeficientes Cepstrais de Frequência Mel (MFCCs) e Coeficientes de Predição Linear Perceptual (PLPs) como características de locutor, em combinação com múltiplas abordagens de modelagem probabilística, especificamente Quantização Vetorial, Modelos por Mistura de Gaussianas e i-vectors, para calcular distâncias entre gravações de áudio. Em seguida, métodos de aprendizado não supervisionado baseados em ranqueamento são utilizados para aperfeiçoar a eficácia dos resultados de recuperação e, com a aplicação de um classificador de K-Vizinhos Mais Próximos, toma-se uma decisão quanto a identidade do locutor. Experimentos foram conduzidos considerando três conjuntos de dados públicos de diferentes cenários e carregando ruídos de diversas origens. Resultados da avaliação experimental demonstram que a abordagem proposta pode atingir resultados de eficácia altos. Adicionalmente, ganhos de eficácia relativos de até +318% foram obtidos pelo procedimento de aprendizado não supervisionado na tarefa de recuperação de locutor e ganhos de acurácia relativos de até +7,05% na tarefa de identificação entre gravações de domínios diferentes. / The huge amount of multimedia content accumulated daily has demanded the development of effective retrieval approaches. In this context, speaker recognition tools capable of automatically identifying a person through their voice are of great relevance. This work presents a novel speaker recognition approach modelled as a retrieval scenario and using recent unsupervised learning methods. The proposed approach considers Mel-Frequency Cepstral Coefficients (MFCCs) and Perceptual Linear Prediction Coefficients (PLPs) as features along with multiple modelling approaches, namely Vector Quantization, Gaussian Mixture Models and i-vector to compute distances among audio objects. Next, rank-based unsupervised learning methods are used for improving the effectiveness of retrieval results and, based on a K-Nearest Neighbors classifier, an identity decision is taken. Several experiments were conducted considering three public datasets from different scenarios, carrying noise from various sources. Experimental results demonstrate that the proposed approach can achieve very high effectiveness results. In addition, effectiveness gains up to +318% were obtained by the unsupervised learning procedure in a speaker retrieval task. Also, accuracy gains up to +7,05% were obtained by the unsupervised learning procedure in a speaker identification task considering recordings from different domains. / FAPESP: 2015/07934-4
15

Reconhecimento automático de locutor em modo independente de texto por Self-Organizing Maps. / Text independent automatic speaker recognition using Self-Organizing Maps.

Mafra, Alexandre Teixeira 18 December 2002 (has links)
Projetar máquinas capazes identificar pessoas é um problema cuja solução encontra uma grande quantidade de aplicações. Implementações em software de sistemas baseados em medições de características físicas pessoais (biométricos), estão começando a ser produzidos em escala comercial. Nesta categoria estão os sistemas de Reconhecimento Automático de Locutor, que se usam da voz como característica identificadora. No presente momento, os métodos mais populares são baseados na extração de coeficientes mel-cepstrais (MFCCs) das locuções, seguidos da identificação do locutor através de Hidden Markov Models (HMMs), Gaussian Mixture Models (GMMs) ou quantização vetorial. Esta preferência se justifica pela qualidade dos resultados obtidos. Fazer com que estes sistemas sejam robustos, mantendo sua eficiência em ambientes ruidosos, é uma das grandes questões atuais. Igualmente relevantes são os problemas relativos à degradação de performance em aplicações envolvendo um grande número de locutores, e a possibilidade de fraude baseada em vozes gravadas. Outro ponto importante é embarcar estes sistemas como sub-sistemas de equipamentos já existentes, tornando-os capazes de funcionar de acordo com o seu operador. Este trabalho expõe os conceitos e algoritmos envolvidos na implementação de um software de Reconhecimento Automático de Locutor independente de texto. Inicialmente é tratado o processamento dos sinais de voz e a extração dos atributos essenciais deste sinal para o reconhecimento. Após isto, é descrita a forma pela qual a voz de cada locutor é modelada através de uma rede neural de arquitetura Self-Organizing Map (SOM) e o método de comparação entre as respostas dos modelos quando apresentada uma locução de um locutor desconhecido. Por fim, são apresentados o processo de construção do corpus de vozes usado para o treinamento e teste dos modelos, as arquiteturas de redes testadas e os resultados experimentais obtidos numa tarefa de identificação de locutor. / The design of machines that can identify people is a problem whose solution has a wide range of applications. Software systems, based on personal phisical attributes measurements (biometrics), are in the beginning of commercial scale production. Automatic Speaker Recognition systems fall into this cathegory, using voice as the identifying attribute. At present, the most popular methods are based on the extraction of mel-frequency cepstral coefficients (MFCCs), followed by speaker identification by Hidden Markov Models (HMMs), Gaussian Mixture Models (GMMs) or vector quantization. This preference is motivated by the quality of the results obtained by the use of these methods. Making these systems robust, able to keep themselves efficient in noisy environments, is now a major concern. Just as relevant are the problems related to performance degradation in applications with a large number of speakers involved, and the issues related to the possibility of fraud by the use of recorded voices. Another important subject is to embed these systems as sub-systems of existing devices, enabling them to work according to the operator. This work presents the relevant concepts and algorithms concerning the implementation of a text-independent Automatic Speaker Recognition software system. First, the voice signal processing and the extraction of its essential features for recognition are treated. After this, it is described the way each speaker\'s voice is represented by a Self-Organizing Map (SOM) neural network, and the comparison method of the models responses when a new utterance from an unknown speaker is presented. At last, it is described the construction of the speech corpus used for training and testing the models, the neural network architectures tested, and the experimental results obtained in a speaker identification task.
16

Implicações da enunciação e da ergologia: dispositivo para produzir saberes sobre a inscrição da experiência humana em reuniões multidisciplinares em uma UTI neonatal

Kissmann, Silvana 30 March 2015 (has links)
Submitted by Maicon Juliano Schmidt (maicons) on 2015-07-16T14:34:32Z No. of bitstreams: 1 Silvana Kissmann.pdf: 1192300 bytes, checksum: b0de6f28860629f0eeadae1e8076328e (MD5) / Made available in DSpace on 2015-07-16T14:34:32Z (GMT). No. of bitstreams: 1 Silvana Kissmann.pdf: 1192300 bytes, checksum: b0de6f28860629f0eeadae1e8076328e (MD5) Previous issue date: 2015-03-30 / UNISINOS - Universidade do Vale do Rio dos Sinos / Cette thèse présente, basée sur la théorie de l'énonciation d'Émile Benveniste et l'approche ergologique d'Yves Schwartz, la construction d'un dispositif théorique-méthodologique pour produire des connaissances sur l'activité de travail. Établir un espace qualifié pour énoncé linguistique dans benvenistiana implication avec d'autres domaines de la connaissance lors de l'exécution d'une analyse qui cherche à dialoguer avec l'appelant d'un autre domaine d'étude. Notre objectif est de construire un dispositif théorique pour comprendre l'activité de travail des professionnels de la santé dans une équipe multidisciplinaire qui travaille dans une unité de soins intensifs néonatals d'un hôpital public. À cette fin, nous faisons usage de la langue de la théorie de conception benvenistienne d'énonciation et du concept de l'activité de travail et de la notion de corps-si développé par ergologie; En outre, nous nous tournons vers Georges Canguilhem des études sur la santé et la lecture que Dany-Robert Dufour a fait des travaux de Benveniste. La recherche est de nature qualitative et a été menée à deux moments différents. Dans la première étape de la recherche, nous présentons le compte de l'observation participante; dans la deuxième étape, après nous avons enregistré en deux tours audio de l'appareil théorique et méthodologique construit, nous avons fait l'analyse de trois coupes. L'analyse a révélé que, dans la ronde, la connaissance diversifiée de différentes spécialités sont mobilisés à l'appui des soins aux patients. En outre, le tour est configuré comme un espace dans lequel, collectivement, le groupe prend des décisions et des actions les inquiétudes découlant de l'inscription humaine au travail. L'analyse a également révélé que l'équipe dans le tour, crée un sentiment de soins résultant de la conception élargie de la santé qui va au-delà du corps biologique, pour atteindre la subjectivité du patient, une conduite qui est en ligne avec les orientations de la politique nationale de l'humanisation et avec les directives du Système unifié de santé. / Esta tese apresenta, com base na Teoria da Enunciação de Émile Benveniste e na abordagem ergológica de Yves Schwartz, a construção de um dispositivo teórico-metodológico para produzir saberes sobre a atividade de trabalho. Institui-se um espaço qualificado para a linguística da enunciação benvenistiana na implicação com outros campos do saber ao se realizar uma análise que busca dialogar com o interlocutor de outra área de estudo. Nosso objetivo é construir um dispositivo teórico para compreender a atividade de trabalho de profissionais de saúde de uma equipe multidisciplinar que atua em uma UTI neonatal de um hospital público. Para tanto, valemo-nos da concepção de linguagem da teoria da enunciação benvenistiana, do conceito de atividade de trabalho e da noção de corpo-si desenvolvidos pela ergologia; além disso, recorremos aos estudos de Georges Canguilhem sobre saúde e à leitura que Dany-Robert Dufour fez da obra de Benveniste. A pesquisa é de natureza qualitativa e foi realizada em dois momentos distintos. Na primeira etapa da investigação, apresentamos o relato da observação participante; na segunda etapa, após termos registrado em áudio dois rounds, a partir do dispositivo teórico-metodológico construído, efetuamos a análise de três recortes. A análise revelou que, no round, os diversos saberes das diferentes especialidades são mobilizados em prol do cuidado do paciente. Além disso, o round configura-se como um espaço em que, coletivamente, o grupo toma decisões e compartilha as angústias advindas da inscrição humana no trabalho. A análise também revelou que a equipe, no round, constrói uma noção de cuidado resultante do conceito ampliado de saúde, que vai além do corpo biológico, alcançando a subjetividade do paciente, conduta que está em consonância com as diretrizes da Política Nacional de Humanização e com as orientações do Sistema Único de Saúde.
17

Reconhecimento automático de locutor em modo independente de texto por Self-Organizing Maps. / Text independent automatic speaker recognition using Self-Organizing Maps.

Alexandre Teixeira Mafra 18 December 2002 (has links)
Projetar máquinas capazes identificar pessoas é um problema cuja solução encontra uma grande quantidade de aplicações. Implementações em software de sistemas baseados em medições de características físicas pessoais (biométricos), estão começando a ser produzidos em escala comercial. Nesta categoria estão os sistemas de Reconhecimento Automático de Locutor, que se usam da voz como característica identificadora. No presente momento, os métodos mais populares são baseados na extração de coeficientes mel-cepstrais (MFCCs) das locuções, seguidos da identificação do locutor através de Hidden Markov Models (HMMs), Gaussian Mixture Models (GMMs) ou quantização vetorial. Esta preferência se justifica pela qualidade dos resultados obtidos. Fazer com que estes sistemas sejam robustos, mantendo sua eficiência em ambientes ruidosos, é uma das grandes questões atuais. Igualmente relevantes são os problemas relativos à degradação de performance em aplicações envolvendo um grande número de locutores, e a possibilidade de fraude baseada em vozes gravadas. Outro ponto importante é embarcar estes sistemas como sub-sistemas de equipamentos já existentes, tornando-os capazes de funcionar de acordo com o seu operador. Este trabalho expõe os conceitos e algoritmos envolvidos na implementação de um software de Reconhecimento Automático de Locutor independente de texto. Inicialmente é tratado o processamento dos sinais de voz e a extração dos atributos essenciais deste sinal para o reconhecimento. Após isto, é descrita a forma pela qual a voz de cada locutor é modelada através de uma rede neural de arquitetura Self-Organizing Map (SOM) e o método de comparação entre as respostas dos modelos quando apresentada uma locução de um locutor desconhecido. Por fim, são apresentados o processo de construção do corpus de vozes usado para o treinamento e teste dos modelos, as arquiteturas de redes testadas e os resultados experimentais obtidos numa tarefa de identificação de locutor. / The design of machines that can identify people is a problem whose solution has a wide range of applications. Software systems, based on personal phisical attributes measurements (biometrics), are in the beginning of commercial scale production. Automatic Speaker Recognition systems fall into this cathegory, using voice as the identifying attribute. At present, the most popular methods are based on the extraction of mel-frequency cepstral coefficients (MFCCs), followed by speaker identification by Hidden Markov Models (HMMs), Gaussian Mixture Models (GMMs) or vector quantization. This preference is motivated by the quality of the results obtained by the use of these methods. Making these systems robust, able to keep themselves efficient in noisy environments, is now a major concern. Just as relevant are the problems related to performance degradation in applications with a large number of speakers involved, and the issues related to the possibility of fraud by the use of recorded voices. Another important subject is to embed these systems as sub-systems of existing devices, enabling them to work according to the operator. This work presents the relevant concepts and algorithms concerning the implementation of a text-independent Automatic Speaker Recognition software system. First, the voice signal processing and the extraction of its essential features for recognition are treated. After this, it is described the way each speaker\'s voice is represented by a Self-Organizing Map (SOM) neural network, and the comparison method of the models responses when a new utterance from an unknown speaker is presented. At last, it is described the construction of the speech corpus used for training and testing the models, the neural network architectures tested, and the experimental results obtained in a speaker identification task.
18

Autoria da aula de língua portuguesa: o papel do professor como voz didática, locutor e instância de escuta do aluno

MORAES, Francineide Paiva 12 August 2014 (has links)
Submitted by Irvana Coutinho (irvana@ufpa.br) on 2017-04-06T12:45:47Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_AutoriaAulaLingua.pdf: 1482970 bytes, checksum: 3de4a43cf9903786acaebbd968f7747c (MD5) / Approved for entry into archive by Irvana Coutinho (irvana@ufpa.br) on 2017-04-06T12:46:15Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_AutoriaAulaLingua.pdf: 1482970 bytes, checksum: 3de4a43cf9903786acaebbd968f7747c (MD5) / Made available in DSpace on 2017-04-06T12:46:15Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertacao_AutoriaAulaLingua.pdf: 1482970 bytes, checksum: 3de4a43cf9903786acaebbd968f7747c (MD5) Previous issue date: 2014-08-12 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / O presente trabalho tem como objetivo investigar como se constitui a função-autor assumida pelo professor de Língua Portuguesa (doravante LP) ao produzir suas aulas. Para tanto, a pesquisa, de natureza documental e etnográfica, foi desenvolvida durante um bimestre em uma escola da rede pública de ensino do município de Belém-PA, onde observamos as aulas de LP de uma turma de 5ª série (6º ano) do Ensino Fundamental. Adotamos como corpus materiais de ensino mobilizados pela professora colaboradora, atividades realizadas pelos alunos e anotações registradas em diário de campo, dos quais selecionamos 33 recortes discursivos que foram analisados na perspectiva da Análise do Discurso de linha francesa. A discussão dos dados está ancorada em pressupostos de Foucault (2001/1969), que defende que a função-autor pode dar lugar simultaneamente a várias posições-sujeito; de Orlandi (2007), que afirma que a autoria pressupõe um gesto de produzir um discurso interpretável; de Maingueneau (2008), que postula as noções de “competência discursiva” e dos planos discursivos “estatuto do enunciador e do destinatário” e “vocabulário”, que contribuíram para a compreensão dos discursos inscritos nos posicionamentos assumidos pela professora; além de outros autores que colaboraram para a reflexão ora proposta. Com base nesses postulados, analisamos como a professora da turma pesquisada assume na aula as posições enunciativas de voz didática, enquanto mediadora entre o conhecimento e o aluno; de locutor, na interlocução com os alunos, criando condições para que os saberes sejam desenvolvidos na aula; e de escuta da aprendizagem do aluno, buscando identificar suas dificuldades e agir sobre elas. Os resultados das análises indicam que a professora, embora tenha ocupado um lugar de escuta que, em alguns momentos, não se realizou plenamente, assume a função-autor, ao executar um trabalho de produzir, filtrar ou selecionar o que poderá fazer parte de suas aulas e de traduzir o enunciado do outro para dentro de seu discurso, produzindo, assim, aulas com uma lógica própria, a fim de promover o processo de ensino-aprendizagem do aluno. / The present dissertation aims to investigate how the authorship-function assumed by Portuguese Language (PL) teachers as they produce their classes is constituted. To that end, this documental and ethnographic research was developedduring a bimester‟s time in a public school located in the city of Belém, Brazil, where we observed Portuguese classes taught to the sixth year of „Ensino Fundamental‟. Our corpus was assembled from teaching materials utilized by the teacher that collaborated to the research, activities solved by students and field log notes. Among those, we selected 33 discursive segments that were analyzed under the light of french Discourse Analysis. The discussion is based on Foucault (2001/1969), to whom the author-function may lead to the emergence of various subject-positions; on Orlandi (2007), to whom authorship implies a gesture by which an interpretable discourse is produced; and on Maingueneau (2008), who postulates the concepts of “discursive competence” and of “status of the enunciator and of the addressee” and “vocabulary” as discursive plans. These concepts, among some others, have contributed to interpret the discourses imprinted in the positions assumed by the collaborating teacher during her classes. Based on them, we analyze how the teacher plays the roles of didactic voice, acting as a mediator between students and knowledge; of speaker, in the interactions with the students, creating the necessary conditions for knowledge to be developed in class; and of a listening stance, trying to probe their difficulties and act upon them. The results indicate that the teacher, although listening to students in such a way that sometimes, is not realized completely, assumes the authorship-function by filtering or selecting what may or may not become part of her classes and by translating the enunciate of the other into her discourse, thus producing classes that have their own logic, in order to promote the teaching-learning process of the students.
19

[en] INDEPENDENT TEXT ROBUST SPEAKER RECOGNITION IN THE PRESENCE OF NOISE USING PAC-MFCC AND SUB BAND CLASSIFIERS / [pt] RECONHECIMENTO DE LOCUTOR INDEPENDENTE DO TEXTO EM PRESENÇA DE RUÍDO USANDO PAC-MFCC E CLASSIFICADORES EM SUB-BANDAS

HARRY ARNOLD ANACLETO SILVA 06 September 2011 (has links)
[pt] O presente trabalho é proposto o atributo PAC-MFCC operando com Classificadores em Sub-Bandas para a tarefa de identificação de locutor independente do texto em ruído. O sistema proposto é comparado com os atributos MFCC (Coeficientes Cepestrais de Frequência Mel), PAC- MFCC (Fase Autocorrelação-MFCC ) sem uso de classificadores em sub-bandas, SSCH(Histogramas de Centróides de Sub-Bandas Espectrais) e TECC (Coeficientes Cepestrais da Energia Teager). Nesta tarefa de reconhecimento, utilizou-se a base TIMIT a qual é composta de 630 locutores onde cada um deles falam 10 frases de aproximadamente 3 segundos cada frase, das quais 8 frases foram utilizadas para treinamento e 2 para teste, obtendo-se um total de 1260 locuções para o reconhecimento. Investigou-se o desempenho dos diversos sistemas utilizando diferentes tipos de ruídos da base Noisex 92 com diferentes relação sinal ruído. Verificou-se que a taxa de acerto da técnica PAC-MFCC com classificador em Sub-Bandas apresenta o melhor desempenho em comparação com as outras técnicas quando se tem uma relação sinal ruído menor que 10dB. / [en] In this work is proposed the use of the PAC-MFCC feature with Sub-band Classifiers for the task of text-independent speaker identification in noise. The proposed scheme is compared with the features MFCC (Mel-Frequency Cepstral Coefficients ), PAC-MFCC (Phase Autocorrelation MFCC) without subband classifiers, SSCH (Subband Spectral Centroid Histograms) and TECC (Teager Energy Cepstrum Coefficients). In this recognition task, we used the TIMIT database which consists of 630 speakers, where every one of them speak 10 utterances of 3 seconds each one approximately, of which eight utterance were used for training and two for testing, thus obtaining a total of 1260 test utterance for the recognition. We investigated the performance of these techniques using differents types of noise from the base Noisex 92 with different signal to noise ratios. It was found that the accuracy rate of the PAC-MFCC feature with Sub-band Classifiers performs better in comparison with other techniques at a lower signal noise(less than 10dB).
20

O SUJEITO ENTRELÍNGUAS: UM CASO DE FUNCIONAMENTO SEMÂNTICO-SINTÁTICO EM PRODUÇÕES ESCRITAS DE ESTUDANTES HISPANOFALANTES DE PLE / THE SUBJECT BETWEEN LANGUES: A CASE OF SEMANTIC-SYNTATICAL FUNCTION IN WRITTEN PRODUCTIONS OF SPANISH-SPEAKING STUDENTS OF PORTUGUESE AS A FOREIGN LANGUE

Santos, Grazielle da Silva dos 06 February 2015 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / In accordance with the theoretical assumptions of the Semantics of the Event (Guimarães, 2005), this study aims to analyze the enunciative operation in the organizational plan of utterances produced by exchange students of Portuguese courses for Foreigners offered by Entrelínguas, searching for the effects of meaning produced by syntactic arrangements from the written production of these learners.Specifically, we aimed to analyze the effects of some less frequent constructions, from the point of view of Brazilian Portuguese speaker, for the inclusion of the subject in collectivity, in the constitution of the senses of langue - Spanish and Brazilian Portuguese -, releasing a look at the semantic-syntactical function of enunciative cuttings. To do so, first, we selected ten (10) productions of ten (10) students, cutting the utterances that reveal the inclusion of the subject in the collectivity. Subsequently, we divided the utterances into two groups that represent two distinct syntactic organizations.And finally, we have built a comparative table in relation to syntactic aspects of both languages - Spanish and Brazilian Portuguese referring: to the apparent discrepancy between the third person plural and the first person plural and the use of first person plural in the place of first person singular, in order to proceed the analysis: descriptive (the plan of saying) and enunciative (the plan of said).In the descriptive analysis, we performed acceptance tests (Guimarães, 2002a) - considering the standard of Brazilian Portuguese. In the enunciative analysis, we conducted our study from two enunciative scenes that reveal different ways of including the subject in collectivity, mobilizing the categories of locutor and enunciator diffused by Guimarães (2005). The results showed that, in terms of forms of langue, such formulations may be considered "mistakes" by the learner, given that the descriptive analysis shows that the syntactic arrangements are at least less frequent in Brazilian Portuguese.In the enunciative plan one can see the subject being signified by that division between langue. This division is the place of resistance in the langue. This place of resistance is what will mark the political position of this subject in the langage as it is marked in the langue by the form (we) and the way it organizes its enunciation (syntax). With it we could demonstrate that the internal organization of utterances is constituted as a mark in the langue that, in turn, will reveal the subjectivity and produce senses. / De acordo com os pressupostos teóricos da Semântica do Acontecimento (GUIMARÃES, 2005), o presente estudo objetiva analisar o funcionamento enunciativo no plano da organização dos enunciados produzidos por alunos intercambistas dos cursos de Português para Estrangeiros oferecidos pelo Entrelínguas, buscando analisar os efeitos de sentido produzidos pelos arranjos sintáticos provenientes das produções escritas desses aprendizes. Em específico, objetivamos analisar os efeitos de construções pouco recorrentes, do ponto de vista do falante de Português Brasileiro (PB), relativas à inclusão do sujeito na coletividade, na constituição dos sentidos das línguas Espanhol e Português Brasileiro -, lançando um olhar voltado ao funcionamento semântico-sintático dos recortes enunciativos. Para tanto, primeiramente, selecionamos dez (10) produções de dez (10) alunos, recortando os enunciados que revelam a inclusão do sujeito na coletividade. Posteriormente, dividimos os enunciados em dois grupos que representam duas organizações sintáticas distintas. E, por último, construímos um quadro comparativo em relação aos aspectos sintáticos das duas línguas Espanhol e Português Brasileiro , referentes: à aparente discordância entre a 3ª pessoa do plural e a 1ª pessoa do plural e ao uso da 1ª pessoa do plural em lugar da 1ª pessoa do singular, para, então, proceder às análises: descritiva (plano do dizer) e enunciativa (plano do dito). Na análise descritiva, realizamos testes de aceitabilidade (GUIMARÃES, 2002a), considerando a norma do PB. Já, na análise enunciativa, realizamos nosso estudo a partir de duas cenas enunciativas que revelam modos distintos de inclusão do sujeito na coletividade, mobilizando, assim, as categorias de locutor e enunciador, difundidas por Guimarães (2005). Os resultados mostraram que, no plano das formas das línguas, tais formulações podem ser consideradas erros por parte do sujeito aprendiz, tendo em vista que a análise descritiva mostra que os arranjos sintáticos são, no mínimo, pouco recorrentes no Português Brasileiro. Já, no plano enunciativo, percebe-se o sujeito sendo significado por essa divisão entre as línguas. Esta divisão constitui o lugar de resistência na língua. E este lugar de resistência é o que vai marcar o posicionamento político desse sujeito na linguagem, pois ele se marca na língua pela forma (nós) e pela maneira como organiza sua enunciação (sintaxe). Com isso, pudemos evidenciar que a organização interna dos enunciados se constitui como uma marca na língua que, por sua vez, vai revelar a subjetividade e produzir sentidos.

Page generated in 0.0402 seconds