1 |
Transformada seno discreta com rotação de eixos bidimensional (DSTr -2D): aplicações na codificação e interpolação de imagens para redução de efeito de blocosPELAES, Evaldo Gonçalves 29 October 1998 (has links)
Submitted by Edisangela Bastos (edisangela@ufpa.br) on 2018-03-22T18:03:53Z
No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Tese_TransformadaSenoDiscreta.pdf: 4480063 bytes, checksum: ef2a76185d778a5dce795b3d5b03163c (MD5) / Approved for entry into archive by Edisangela Bastos (edisangela@ufpa.br) on 2018-03-22T18:29:11Z (GMT) No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Tese_TransformadaSenoDiscreta.pdf: 4480063 bytes, checksum: ef2a76185d778a5dce795b3d5b03163c (MD5) / Made available in DSpace on 2018-03-22T18:29:11Z (GMT). No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Tese_TransformadaSenoDiscreta.pdf: 4480063 bytes, checksum: ef2a76185d778a5dce795b3d5b03163c (MD5)
Previous issue date: 1998-10-29 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / FAPESP - Fundação de Amparo à Pesquisa do Estado de São Paulo / Este trabalho apresenta uma nova ferramenta para codificação e/ou interpolação de imagens, que é a transformada seno discreta com rotação de eixos bidimensional (DSTr-2D), cuja principal característica é reduzir o efeito de bloqueamento, apresentando ainda uma baixa complexidade computacional. A DSTr-2D é aplicada para interpolação de imagem e seu desempenho é comparado com o obtido pela DCT. Ë ainda apresentado um outro método de interpolação usando DCT com eliminação de extrapolações. A DSTr-2D apresenta um melhor desempenho com relação aos outros métodos de interpolação, e essa melhoria cresce com o aumento da taxa de amostragem. A DSTr-2D é também aplicada na codificação de imagens, apresentando uma característica especial : a de reduzir o efeito de bloqueamento. Os resultados da codificação com a DSTr-2D são comparados com os obtidos pelos métodos de codificação por transformada como DCT e LOT. Nos processos de codificação são utilizadas quantização escalar uniforme, gaussiana e laplaciana de Lloid-Max. A DSTr-2D é também utilizada para realização simultânea de codificação e interpolação de imagens com reduzido efeito de bloco. / This work presents a new tool for image coding and image interpolation based on the two-dimensional discrete sine transform with axis rotation (DSTr-2D). The main characteristics of this transform are the few blocking effects found in the reconstructed image and its computational simplicity. In this work, the DSTr-2D is applied to image interpolation and its performance is compared with results obtained from DCT. A method of interpolation using DCT without extrapolation is also presented. The DSTr-2D achieves a performance better than the other interpolation methods used for comparison purposes. Indeed the better performance is obtained when the sample rate is increased. The DSTr-2D is also applied to the image coding, and it was verified that its advantage relative to DCT in terms of blocking effects in the reconstructed image. The results obtained in image coding using DSTr-2D are compared with results obtained from DCT and LOT. The images were coded using scalar, gaussian, laplacian and Lloid-Max quantization Finally, the DSTr-2D is applied to performs the image coding and the image interpolation, simultaneously.
|
2 |
Geradores Quanto-Ãpticos de NÃmeros AleatÃrios / Generators-Optical Random NumberEmanoela de Jesus Lopes Soares 22 February 2013 (has links)
nÃo hà / Geradores quÃnticos de nÃmeros aleatÃrios (GQNA) tÃm importantes aplicaÃÃes em protocolos criptogrÃficos, jogos e loterias, entre outros. Em contraste com geradores de nÃmeros pseudoaleatÃrios baseados em software, a sequÃncia de nÃmeros gerada à verdadeiramente aleatÃria. A maioria dos GQNA encontrados na literatura à baseado em dispositivos optoeletrÃnicos, como fontes de fÃtons Ãnicos e detectores de fÃtons. Nesta direÃÃo, a presente dissertaÃÃo trata da teoria e experimento de GQNAs baseados em sistemas fotÃnicos, considerando geradores com variÃveis discretas e contÃnuas. Em particular, trÃs problemas foram considerados: 1) um novo modelo de GQNA de variÃvel contÃnua utilizando a polarizaÃÃo da luz foi proposto. 2) a anÃlise de desempenho de um GQNA usando apenas um detector de fÃtons, levando em consideraÃÃo o afterpulsing e o tipo de estado quÃntico da luz utilizado, coerente ou tÃrmico, foi realizada. 3) um GQNA com distribuiÃÃo binomial foi construÃdo. / Quantum random number generators (QRNG) have important applications in cryptographic protocols, gaming and lotteries, among others. In contrast to pseudo-random number generators based on software, the sequence of random numbers generated is truly random. Most QRNG found in the literature are based on optoelectronic devices like single-photon sources and single-photon detectors. In this direction, the present dissertation deals with the theory and experiment QRNG based photonic systems, taking into account QRNG using discrete and continuous variables. In particular, three issues were considered: 1) a new model of continuous variable QRNG based on light polarization was proposed. 2) The performance of a QRNG employing only one single-photon detector, taking into account the afterpulsing and the quantum light state used, coherent or thermal, was realized. 3) A QRNG with binomial distribution was built.
|
3 |
Estudo da estabilidade tÃrmica da liga Ca(Nb1/2Bi1/2)xTi1-xO3:(B2O3)y para uso em antena ressoadora dielÃtrica (DRA) / Study of thermal stability of alloy Ca(Nb1/2Bi1/2)xTi1-xO3:(B2O3)y for use in dielectric ressonator antenna (DRA)Tatiana Sainara Maia Fernandes 04 April 2012 (has links)
FundaÃÃo Cearense de Apoio ao Desenvolvimento Cientifico e TecnolÃgico / O campo da comunicaÃÃo sem fio vem passando por um crescimento revolucionÃrio nas Ãltimas dÃcadas. Isto à atribuÃdo à invenÃÃo de telefones celulares portÃteis. O sucesso da segunda geraÃÃo (2G) dos serviÃos de comunicaÃÃo de telefonia celular, motiva o desenvolvimento de banda larga de terceira geraÃÃo (3G) de telefones celulares e outros produtos e serviÃos sem fio, como por exemplo, o Bluetooth.
Este trabalho consiste no desenvolvimento e caracterizaÃÃo de dois sistemas cerÃmicos tendo como base uma matriz de titanato de cÃlcio (CaTiO3) com substituiÃÃo de Ãons titÃnio por Ãons de niÃbio associados com bismuto (Ca (Nb1/2Bi1/2)xTi1-xO3; x=0.7 e 0.8), visando a adiÃÃo de B2O3 para diminuiÃÃo da temperatura de sinterizaÃÃo e melhorar a densificaÃÃo, e posteriormente, verificar as modificaÃÃes ocorridas nas propriedades do material, como por exemplo, o coeficiente de temperatura da frequÃncia ressonante (τf).
As sÃries cerÃmicas foram produzidas a partir da reaÃÃo no estado sÃlido, com a utilizaÃÃo de moagem mecÃnica de alta energia e tratamento tÃrmico. A caracterizaÃÃo estrutural foi feita atravÃs de Microscopia EletrÃnica de Varredura (MEV) e Picnometria. Foram realizados experimentos para avaliaÃÃo do comportamento elÃtrico e dielÃtrico das amostras, na faixa de Microondas e RÃdio-FrequÃncia (temperatura ambiente e com variaÃÃo de temperatura). Por fim, o material foi testado como uma antena ressoadora dielÃtrica, e posteriormente os resultados obtidos foram simulados atravÃs do programa HFSS (Ansoft High Frequency Structure Simulator).
Os materiais cerÃmicos produzidos tiveram suas propriedades elÃtricas, dielÃtricas e como antena bastante afetadas com a adiÃÃo do B2O3. / The field of wireless communication has undergone a revolutionary growth in recent decades. This is attributed to the invention of wireless mobile phones. The success of second generation (2G) services of cellular communication, motivates the development of broadband third generation (3G) mobile phones and other wireless products and services, such as Bluetooth.
This work describes the development and characterization of two ceramic systems based on a matrix of calcium titanate (CaTiO3) with substitution of titanium ions by niobium ions associated with bismuth (Ca (Nb1/2Bi1/2) xTi1-xO3, x = 0.7 and 0.8), aiming the addition of B2O3 to reduce the sintering temperature and to improve densification, and thus verify the modifications on material properties, such as the temperature coefficient τf.
The ceramic series are produced from solid state reaction with the use of high energy mechanical milling and heat treatment. The structural characterization was performed by Scanning Electron Microscopy (SEM) and Pycnometry. Experiments were done to evaluate the dielectric behavior of samples in the range of Microwave and Radio Frequency (room temperature and with temperature variation). Finally the material was tested as a dielectric resonator antenna, and posteriorly the results were simulated using HFSS program (Ansoft High Frequency Structure Simulator).
The produced ceramics have had their electrical, dielectric and antenna properties quite affected with the addition of B2O3.
|
4 |
Método de otimização não-linear para impor PSDs arbitrárias em modems DSL: análise estatística e práticaABRAHIM, Harney Edison Pereira 25 January 2011 (has links)
Submitted by Samira Prince (prince@ufpa.br) on 2012-05-11T15:03:02Z
No. of bitstreams: 1
Dissertacao_MetodoOtimizacaoNao-Linear.pdf: 913840 bytes, checksum: 617864f107ca5df3896d1e16920169c1 (MD5) / Approved for entry into archive by Samira Prince(prince@ufpa.br) on 2012-05-14T13:57:25Z (GMT) No. of bitstreams: 1
Dissertacao_MetodoOtimizacaoNao-Linear.pdf: 913840 bytes, checksum: 617864f107ca5df3896d1e16920169c1 (MD5) / Made available in DSpace on 2012-05-14T13:57:25Z (GMT). No. of bitstreams: 1
Dissertacao_MetodoOtimizacaoNao-Linear.pdf: 913840 bytes, checksum: 617864f107ca5df3896d1e16920169c1 (MD5)
Previous issue date: 2011 / FAPESPA - Fundação Amazônia de Amparo a Estudos e Pesquisas / Este trabalho tem como objetivo apresentar um método para solucionar o problema de mapeamento entre as soluções teóricas de gerenciamento dinâmico de espectro (DSM) e os parâmetros de controle das densidades espectrais de potência (PSDs) de transmissão dos modems comerciais. O método utiliza algoritmos genéticos (AG) codificado em inteiros para solucionar o problema. O AG é responsável por achar os melhores parâmetros para representar uma PSD arbitrária, considerando as restrições impostas pelos equipamentos e padrões atuais DSL. O trabalho apresenta ainda um estudo comparativo do método proposto com um concorrente, além de estudo estatístico do método proposto, considerando média, desvio padrão e intervalo de confiança. Adicionalmente, são apresentados dois setups para uso em laboratório, sendo um para medição de PSDs e o outro para funções de transferência, os quais podem ser reaproveitados em outros trabalhos. / This work aims to present a method to solve the mapping problem between the
theoretical dynamic spectrum management (DSM) solutions and the commercial DSL modems
transmitting power spectrum densities (PSDs) parameters. The method uses an integer
codi ed genetic algorithm (GA) to solve the problem. The GA is responsible for nding
the ttest parameters that represents an arbitrary PSD, under the restrictions imposed by the actual DSL equipments and standards. This work shows a comparative study of the proposed method with another concurrent. A statistics study of the proposed method considering the
average, standard deviation and con dence interval is done. Finally, two di erent laboratory setups are presented. One of them to PSD measurement and other to use in transfer function measurements. Both setups can be reused in other works.
|
5 |
Ferramentas e recursos livres para reconhecimento e síntese de voz em português brasileiroSAMPAIO NETO, Nelson Cruz 17 June 2011 (has links)
Submitted by Samira Prince (prince@ufpa.br) on 2012-06-06T14:12:29Z
No. of bitstreams: 2
Tese_FerramentasRecursosLivres.pdf: 1397799 bytes, checksum: d17f058a4d4705205300467cd7b7a59a (MD5)
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) / Approved for entry into archive by Samira Prince(prince@ufpa.br) on 2012-06-06T14:13:13Z (GMT) No. of bitstreams: 2
Tese_FerramentasRecursosLivres.pdf: 1397799 bytes, checksum: d17f058a4d4705205300467cd7b7a59a (MD5)
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) / Made available in DSpace on 2012-06-06T14:13:13Z (GMT). No. of bitstreams: 2
Tese_FerramentasRecursosLivres.pdf: 1397799 bytes, checksum: d17f058a4d4705205300467cd7b7a59a (MD5)
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Previous issue date: 2011 / FAPESPA - Fundação Amazônia de Amparo a Estudos e Pesquisas / Sistemas de reconhecimento e síntese de voz são constituídos por módulos que dependem
da língua e, enquanto existem muitos recursos públicos para alguns idiomas (p.e. Inglês e Japonês), os recursos para Português Brasileiro (PB) ainda são escassos. Outro aspecto é que, para um grande número de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda é elevada, quando comparada à obtida por seres humanos. Assim, apesar do
sucesso das cadeias escondidas de Markov (HMM), é necessária a pesquisa por novos métodos. Este trabalho tem como motivação esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e síntese de voz em PB, consistindo de bases de dados de áudio e texto, um dicionário fonético, um
conversor grafema-fone, um separador silábico e modelos acústico e de linguagem. Todos os recursos construídos encontram-se publicamente disponíveis e, junto com uma interface de programação proposta, têm sido usados para o desenvolvimento de várias novas aplicações em tempo-real, incluindo um módulo de reconhecimento de voz para a suíte de aplicativos para escritório OpenOffice.org. São apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a adoção da tecnologia de voz para
PB por outros grupos de pesquisa, desenvolvedores e pela indústria. A segunda parte do trabalho apresenta um novo método para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual é organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confusão entre pares de fones. Para cada um desses problemas binários, são usadas técnicas de seleção automática de parâmetros para escolher a representaçãao paramétrica mais adequada
para o problema em questão. / Automatic speech recognition and text-to-speech systems have modules that depend on the language and, while there are many public resources for some languages (e.g. English and Japanese), the resources for Brazilian Portuguese (BP) are still limited. Another aspect is that for many tasks the current speech recognition system error rate is still high, when compared
to that obtained by humans. Thus, despite the success of hidden Markov models (HMM), it
is necessary to investigate new methods. This work has these two facts as motivation and is divided into two parts. The first part describes the resources and free tools developed for BP speech recognition and synthesis, consisting of text and audio databases, phonetic dictionary, grapheme-to-phone converter, syllabification module, language and acoustic models. All of them are publicly available and, together with a proposed application programming interface,
have been used for the development of several new real-time applications, including a speech module for the OpenOffice suite. Performance tests are presented for evaluating the developed systems. The resources make easier the adoption of BP speech technologies by other academic
groups, developers and industry. The second part of this work presents a new method for
rescoring the recognition result obtained via HMMs, with the result being organized as a lattice. More specifically, the system uses discriminative classifiers that aim at reducing the confusability between pairs of phones. For each of these binary problems, automatic feature selection techniques are used to choose the proper parametric representation for the specific problem.
|
6 |
Planejamento de redes de comunicação sem fio para ambiente indoor considerando os efeitos da polarização das antenas: abordagem baseada em mediçõesRODRIGUES, Josiane do Couto 02 May 2011 (has links)
Submitted by Samira Prince (prince@ufpa.br) on 2012-06-08T16:06:44Z
No. of bitstreams: 2
Tese_PlanejamentoRedesComunicacao.pdf: 898416 bytes, checksum: e0eec95c0d7992dd7c223116fb75b460 (MD5)
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) / Approved for entry into archive by Samira Prince(prince@ufpa.br) on 2012-06-08T16:07:15Z (GMT) No. of bitstreams: 2
Tese_PlanejamentoRedesComunicacao.pdf: 898416 bytes, checksum: e0eec95c0d7992dd7c223116fb75b460 (MD5)
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) / Made available in DSpace on 2012-06-08T16:07:15Z (GMT). No. of bitstreams: 2
Tese_PlanejamentoRedesComunicacao.pdf: 898416 bytes, checksum: e0eec95c0d7992dd7c223116fb75b460 (MD5)
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Previous issue date: 2011 / Uma das principais aplicações de ondas eletromagnéticas, na atualidade, na área de
telecomunicações trata dos enlaces em sistemas móveis sem fio. Sejam estes terrestres (indoor/outdoor) ou via satélites, o projetista do sistema de telecomunicações tem que ser capaz de determinar os sistemas irradiantes, as potências envolvidas, a frequência de operação do sistema, a área de cobertura e os parâmetros de qualidade do serviço. O planejamento das novas redes de comunicações sem fio representa um grande desafio ao incluir serviços cada vez mais avançados com diferentes requisitos de qualidade, suporte a mobilidade, altas taxas de transmissão e capacidades elevadas de tráfego. Os diversos ambientes nos quais essas redes operam, os fenômenos associados produzem diversos efeitos no comportamento do sinal recebido e, consequentemente, uma variação no
desempenho do enlace de comunicação entre os pontos de acesso, a rede e os usuários. Por
conseguinte, esses efeitos devem ser avaliados corretamente, de tal forma que o
dimensionamento da rede atenda aos requisitos de qualidade regulamentados.
O presente trabalho objetiva estabelecer uma metodologia para o planejamento de redes de comunicação sem fio para ambientes indoor, considerando os parâmetros de qualidade de serviços e os efeitos da polarização das antenas. Foi proposto um modelo empírico para determinar a área de cobertura desse ambiente a partir de uma abordagem baseada em medições. Como resultado de campanhas de medições, foram identificados os principais
parâmetros que interferem nas perdas no enlace de propagação, destacando-se os materiais envolvidos no ambiente bem como os efeitos da polarização das antenas transmissora, entre outros. Tais efeitos, avaliados corretamente, permitirão ao projetista da rede, de uma forma crítica e com base em dados obtidos em campo, definir a melhor configuração de parâmetros e critérios de projeto para a implantação de uma rede móvel de acesso sem fio. As medições
para determinação dos parâmetros de cobertura e de qualidade de serviços foram realizadas no prédio do Laboratório de Engenharia Elétrica e de Computação e no prédio de aulas do Instituto de Tecnologia da Universidade Federal do Pará. Nas campanhas de medição foram utilizadas algumas frequências, escolhidas devido à importância dos serviços disponibilizados: 2,4 GHz - redes locais sem fio (WLAN’s); 3,5 GHz - Wimax licenciado; 5,85 GHz - Wimax livre e 10 GHz (a faixa de 9,8 a 10 GHz não está ainda regulamentada, de 10 - 10,15 GHz-radioamador (Resolução Anatel, Nº 452/2006 - D.O.U. de 20.12.2006) ou serviços de comunicações multimídias (SCM) para sistemas em banda larga). Os principais resultados obtidos com o modelo proposto foram avaliados e comparados com os principais
modelos da literatura e mostraram que a metodologia adotada para o planejamento de redes de comunicação sem fio em ambientes indoor teve um bom desempenho. / A major application of electromagnetic waves, presently, in the area of telecommunications concern to links of wireless mobile systems. Be these terrestrial ones (indoor/outdoor) or via satellite, the designer of the telecommunications system must be able
to determine the irradiate systems, the powers involved, the operation frequency of the system, the coverage area and the quality of service parameters. The planning of new wireless communications networks represents a great challenge to include advanced services with different quality requirements, the mobility support, high
transmission rates and high traffic capacity. The several environments in which those networks operate and the associated phenomena produce several effects on the behavior of the received sign and, consequently, a variation in the performance of the communication link among the points of access to net and the users. Consequently, those effects should be
appraised correctly, in such a way that the network dimensioning assists to the quality
requirements regulated. The present work aims to establish a methodology for the planning of wireless networks for environments indoor, considering the parameters of the quality of services and
the effects of the polarization of the antennas. An empiric model is proposed to determine the coverage area of that environment from an approach based in measurements. As a result of measurement campaigns, they were identified the main parameters that interfere in the losses in the propagation link. Standing out the materials involved in the environment as well as the polarization effects of the transmitter’s antennas, among others. Such effects, if evaluated correctly, they will allow to the planner’s net, in a critical way and with base in data obtained in field, to define the best parameters of configuration and project criteria for the implantation of a wireless mobile network. The measurements for determination of the covering parameters and of quality of services they were accomplished at the building of the Laboratório de Engenharia Elétrica e de Computação and in the classes
building of the Instituto de Tecnologia da Universidade Federal do Pará. The measurement
campaigns were used some frequencies, chosen due to the importance of the services
available: 2,4 GHz - local nets without thread (WLAN's); 3,5 GHz - licensed WiMAX; 5,85 GHz - free WiMAX and 10 GHz (9,8 to 10 GHz band is not yet regulated, 10 - 10,15 GHz
Amateur radio band (Anatel resolution, No. 452/2006 - D.O.U. from 20.12.2006) or
multimedia communications services (SCM) for broadband systems). The main results obtained with the proposed model were evaluated and compared with the main models of the literature and showed that the methodology adopted for the networks planning of wireless communications in indoor environment had a good performance.
|
7 |
Desenvolvimento de aplicativos usando reconhecimento e síntese de vozSAMPAIO NETO, Nelson Cruz 30 August 2006 (has links)
Submitted by Edisangela Bastos (edisangela@ufpa.br) on 2013-01-08T18:29:15Z
No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_DesenvolvimentoAplicativosReconhecimento.pdf: 383779 bytes, checksum: 1bbfef9c6a7a070ce4816598bc9f3462 (MD5) / Approved for entry into archive by Ana Rosa Silva(arosa@ufpa.br) on 2013-01-17T14:10:48Z (GMT) No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_DesenvolvimentoAplicativosReconhecimento.pdf: 383779 bytes, checksum: 1bbfef9c6a7a070ce4816598bc9f3462 (MD5) / Made available in DSpace on 2013-01-17T14:10:49Z (GMT). No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Dissertacao_DesenvolvimentoAplicativosReconhecimento.pdf: 383779 bytes, checksum: 1bbfef9c6a7a070ce4816598bc9f3462 (MD5)
Previous issue date: 2006 / A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java. / Speech is a natural mechanism for human-machine interaction. Speech (or voice) technology is a well-developed field when one considers the international community. There is a wide variety of academic and industrial software. The majority of them assumes a recognizer or synthesizer is available, and can be programmed through an
API. In contrast, there are no such resources in public domain for Brazilian Portuguese.
This work discusses some of these issues and compares SAPI and JSAPI, which are
APIs promoted by Microsoft and Sun, respectively. We also present two examples:
a CALL application using SAPI-based speech synthesis in English and Portuguese,
recognition in English, and visual agents; and a JSAPI-based software that incorporates
speech synthesis and recognition to IRC through Java APIs.
|
8 |
Estratégias baseadas em análise multicritério para seleção de tecnologia de acesso de primeira milha em padrão ISDB-TSERUFFO, Marcos César da Rocha 23 November 2012 (has links)
Submitted by Edisangela Bastos (edisangela@ufpa.br) on 2013-04-24T22:23:42Z
No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Tese_EstrategiasBaseadasAnalise.pdf: 5895216 bytes, checksum: cd76d3466424c1f68691abd959fb36b4 (MD5) / Approved for entry into archive by Ana Rosa Silva(arosa@ufpa.br) on 2013-04-29T16:26:18Z (GMT) No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Tese_EstrategiasBaseadasAnalise.pdf: 5895216 bytes, checksum: cd76d3466424c1f68691abd959fb36b4 (MD5) / Made available in DSpace on 2013-04-29T16:26:18Z (GMT). No. of bitstreams: 2
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Tese_EstrategiasBaseadasAnalise.pdf: 5895216 bytes, checksum: cd76d3466424c1f68691abd959fb36b4 (MD5)
Previous issue date: 2012 / CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / FAPESPA - Fundação Amazônia de Amparo a Estudos e Pesquisas / CVRD - Companhia Vale do Rio Doce / Esta Tese propõe o desenvolvimento de uma estratégia de planejamento que combina: caracterização de carga de uma aplicação típica de TV Digital, extração de vetor peso por meio de redes de crença e tomada de decisão multicriterio a partir da aplicação de métodos analíticos (TOPSIS e ELECTRE III), para fornecer suporte a decisão junto a provedores de serviços, objetivando-se permitir optar-se por uma tecnologia para canal de retorno (ADSL2+, PLC, WiMAX e 3G), considerando a carga típica de um cenário de TV Digital interativo, padrão ISDB-T. A estratégia proposta apresenta cinco etapas, sendo estas: definição dos canais de retorno e das métricas de desempenho, realização de medições das tecnologias de acesso em cenários reais, simulação dos dados em ambientes simulados, aplicação de técnicas de correlação de dados para geração do vetor peso e aplicação de métodos analíticos de tomada de decisão para escolha da melhor tecnologia a ser implantada em determinado cenário. Como resultado principal se obteve um modelo genérico e flexível que foi validado através de um estudo de caso que ordenou a preferência das tecnologias avaliadas. / This thesis proposes the development of a planning strategy that combines: load characterization of a typical Digital TV, extraction of a weight vector from belief networks, and multicriteria decision making with analytical methods (TOPSIS and ELECTRE III), providing decision support at the service providers; in order to enable the optimal choice for the return channel technology (ADSL2 +, PLC, WiMAX and 3G), considering the typical load of an interactive Digital TV scenario, standard ISDB-T. The proposed strategy has five steps: definition of return channels and performance metrics; performance measurements of access technologies in real scenarios; scenario simulation; apply correlation techniques to generate the weight vector; and application of analytical decision making for choosing the best technology to be implemented in a given scenario. As main result a generic and flexible model is presented, validated with a case study for ordering the preference of the evaluated technologies.
|
9 |
Classificação fonética utilizando Boosting e SVMTEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz 17 February 2006 (has links)
Submitted by Irvana Coutinho (irvana@ufpa.br) on 2012-03-07T12:35:04Z
No. of bitstreams: 2
Dissertacao_Talisman_Teixeira_Junior ClassificacaoFoneticaBoosting.pdf: 1955727 bytes, checksum: 2174e57105a6d0135a85cb9c47e05a7a (MD5)
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) / Approved for entry into archive by Irvana Coutinho(irvana@ufpa.br) on 2012-03-07T12:40:11Z (GMT) No. of bitstreams: 2
Dissertacao_Talisman_Teixeira_Junior ClassificacaoFoneticaBoosting.pdf: 1955727 bytes, checksum: 2174e57105a6d0135a85cb9c47e05a7a (MD5)
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) / Made available in DSpace on 2012-03-07T12:40:11Z (GMT). No. of bitstreams: 2
Dissertacao_Talisman_Teixeira_Junior ClassificacaoFoneticaBoosting.pdf: 1955727 bytes, checksum: 2174e57105a6d0135a85cb9c47e05a7a (MD5)
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Previous issue date: 2006 / Para compor um sistema de Reconhecimento Automático de Voz, pode ser utilizada uma tarefa chamada Classificação Fonética, onde a partir de uma amostra de voz decide-se qual fonema foi emitido por um interlocutor. Para facilitar a classificação e realçar as características mais marcantes dos fonemas, normalmente, as amostras de voz são pré- processadas através de um fronl-en'L Um fron:-end, geralmente, extrai um conjunto de parâmetros para cada amostra de voz. Após este processamento, estes parâmetros são insendos em um algoritmo classificador que (já devidamente treinado) procurará decidir qual o fonema emitido. Existe uma tendência de que quanto maior a quantidade de parâmetros utilizados no sistema, melhor será a taxa de acertos na classificação. A contrapartida para esta tendência é o maior custo computacional envolvido. A técnica de Seleção de Parâmetros tem como função mostrar quais os parâmetros mais relevantes (ou mais utilizados) em uma tarefa de classificação, possibilitando, assim, descobrir quais os parâmetros redundantes, que trazem pouca (ou nenhuma) contribuição à tarefa de classificação. A proposta deste trabalho é aplicar o classificador SVM à classificação fonética, utilizando a base de dados TIMIT, e descobrir os parâmetros mais relevantes na classificação, aplicando a técnica Boosting de Seleção de Parâmetros. / With the aim of setting up a Automatic Speech Recognition (ASR) system, a task named Phonetic Classification can be used. That task consists in, from a speech sample, deciding which phoneme was pronounced by a speaker. To ease the classification task and to enhance the most marked characteristics of the phonemes, the speech samples are usually pre-processed by a front-end. A front-end, as a general rule, extracts a set of features to each speech sample. After that, these features are inserted in a classification algorithm, that (already properly trained) will try to decide which phoneme was pronounced. There is a rule of thumb which says that the more features the system uses, the smaller the classification error rate will be. The disadvantage to that is the larger computational cost. Feature Selection task aims to show which are the most relevant (or more used) features in a classification task. Therefore, it is possible to discover which are the redundant features, that make little (or no) contribution to the classification task. The aim of this work is to apply SVM classificator in Phonetic Classification task, using TIMIT database, and discover the most relevant features in this classification using Boosting approach to implement Feature Selection.
|
10 |
Um método para determinação de pontos de operação com diversidade em linha digital de assinante usando balanceamento de espectro e algoritmo evolucionárioBEZERRA, Johelden Campos 17 February 2011 (has links)
Submitted by Samira Prince (prince@ufpa.br) on 2012-05-08T13:08:21Z
No. of bitstreams: 2
Tese_MetodoDeterminacaoPontos.pdf: 650213 bytes, checksum: 32d05afe62a4a147ceaf368c9838222b (MD5)
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) / Approved for entry into archive by Samira Prince(prince@ufpa.br) on 2012-05-08T13:10:29Z (GMT) No. of bitstreams: 2
Tese_MetodoDeterminacaoPontos.pdf: 650213 bytes, checksum: 32d05afe62a4a147ceaf368c9838222b (MD5)
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) / Made available in DSpace on 2012-05-08T13:10:29Z (GMT). No. of bitstreams: 2
Tese_MetodoDeterminacaoPontos.pdf: 650213 bytes, checksum: 32d05afe62a4a147ceaf368c9838222b (MD5)
license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)
Previous issue date: 2011 / ERICSSON Telecomunicações S.A. / Este trabalho apresenta um método para encontrar um conjunto de pontos de operação, os quais são ótimos de Pareto com diversidade, para linhas digitais de assinante (DSL - digital subscriber line). Em diversos trabalhos encontrados na literatura, têm sido propostos algoritmos para otimização da transmissão de dados em linhas DSL, que fornecem como resultado apenas um ponto de operação para os modems. Esses trabalhos utilizam, em geral, algoritmos de balanceamento de espectro para resolver um problema de alocação de potência, o que difere da abordagem apresentada neste trabalho. O método proposto, chamado de diverseSB , utiliza um processo híbrido composto de um algoritmo evolucionário multiobjetivo (MOEA - multi-objective evolutionary algorithm), mais precisamente, um algoritmo genético com ordenamento por não-dominância (NSGA-II
- Non-Dominated Sorting Genetic Algorithm II), e usando ainda, um algoritmo de balanceamento de espectro. Os resultados obtidos por simulações mostram que, para uma dada diversidade, o custo computacional para determinar os pontos de operação com diversidade usando o algoritmo diverseSB proposto é muito menor que métodos de busca de “força bruta”. No método proposto,
o NSGA-II executa chamadas ao algoritmo de balanceamento de espectro adotado, por isso, diversos testes envolvendo o mesmo número de chamadas ao algoritmo foram realizadas com o método diverseSB proposto e o método de busca por força bruta, onde os resultados obtidos pelo método diverseSB proposto foram bem superiores do que os resultados do método de busca por força bruta. Por exemplo, o método de força bruta realizando 1600 chamadas ao algoritmo de balanceamento
de espectro, obtém um conjunto de pontos de operação com diversidade semelhante ao do método diverseSB proposto com 535 chamadas. / This work presents a method for finding diversity set operating points, which are Pareto optimal and diverse, to digital subscriber lines (DSL). Several works presented in the literature have proposed algorithms for optimizing data transmission in DSL lines, which results in a unique operating point for the modems. These works use spectrum balancing algorithms to solve the power allocation
problem, which differs from the approach presented in this work. The proposed method, called diverseSB, uses a hybrid solution that consists of the non-dominated sorting genetic algorithm-II(NSGA-II), based on a multi-objective optimization, and a spectrum balancing algorithm. The simulation
results showed that, for a given diversity, the computational cost for find the operating points with diversity using the diverseSB proposed algorithm is much smaller than “brute-force” search methods. In the proposed method, NSGA-II perform calls to the spectrum balancing algorithm adopted, so many tests involving the same number of calls to the algorithm were performed with the diverseSB proposed and with the brute-force search method, and the results of diverseSB proposed were better than brute-force search method. For example, to obtain a diverse set operating points the brute-force method performs 1,600 calls to the spectrum balancing algorithm and the diverseSB proposed performed 535 calls.
|
Page generated in 0.0226 seconds