• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 242
  • 16
  • 4
  • 1
  • Tagged with
  • 264
  • 264
  • 212
  • 196
  • 61
  • 57
  • 56
  • 44
  • 43
  • 37
  • 37
  • 33
  • 33
  • 30
  • 30
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Fusão de descritores de histogramas de gradientes para a detecção de faces baseado em uma cascata de classificadores.

Ramírez Cerna, Lourdes January 2014 (has links)
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. / Submitted by Oliveira Flávia (flavia@sisbin.ufop.br) on 2015-01-06T19:20:42Z No. of bitstreams: 2 license_rdf: 22190 bytes, checksum: 19e8a2b57ef43c09f4d7071d2153c97d (MD5) DISSERTAÇÃO_FusãoDescritoresHistogramas.pdf: 5665825 bytes, checksum: f39862c7497c8adf0a683ef324097143 (MD5) / Approved for entry into archive by Gracilene Carvalho (gracilene@sisbin.ufop.br) on 2015-01-16T15:31:14Z (GMT) No. of bitstreams: 2 license_rdf: 22190 bytes, checksum: 19e8a2b57ef43c09f4d7071d2153c97d (MD5) DISSERTAÇÃO_FusãoDescritoresHistogramas.pdf: 5665825 bytes, checksum: f39862c7497c8adf0a683ef324097143 (MD5) / Made available in DSpace on 2015-01-16T15:31:14Z (GMT). No. of bitstreams: 2 license_rdf: 22190 bytes, checksum: 19e8a2b57ef43c09f4d7071d2153c97d (MD5) DISSERTAÇÃO_FusãoDescritoresHistogramas.pdf: 5665825 bytes, checksum: f39862c7497c8adf0a683ef324097143 (MD5) Previous issue date: 2014 / O problema de detecção de faces em imagens ou vídeos tem sido amplamente estudado pela comunidade científica. Muitas pesquisas foram desenvolvidas durante décadas desde as mais simples até as mais complexas com a finalidade de superar alguns problemas existentes nas imagens ou vídeos, por exemplo: oclusão, mudanças de iluminação, variações de pose e escala, entre outros. Neste trabalho é proposto um método de detecção de faces que concatena o Histograma de Gradientes Orientados (HOG) e o Histograma de Gradientes Orientados Médios (HAOG) para finalmente classificá-los dados através de uma cascata de classificadores de “uma classe" baseados no modelo convexo mais próximo. A cascata de classificadores de “uma classe" permite gerar classificadores mais simples com uma rejeição de falsos positivos mais rápida. Além de reduzir a região de busca é utilizado um algoritmo de detecção de pele, o que também permite diminuir o número de falsos positivos, sendo está característica a principal contribuição deste trabalho. Logo, é gerada uma pirâmide de imagens com o intuito de detectar faces de diferentes tamanhos nas regiões configuradas como pele. O método proposto conseguiu uma melhor acurácia e o menor número de falsos positivos quando foi comparado com os métodos HOG, HAOG, HOG-LBP (Cevikalp et al. 2013) e (Viola and Jones 2004). Mostrou-se resultados promissores quando comparados com os métodos do estado da arte considerados no benchmark da base FDDB (Jain and Learned Miller 2010). ______________________________________________________________________________________________ / ABSTRACT: Face detection problem in images or videos has been widely studied by scientific community. Many researches have been developed in the last decades, from the most simple to the most complex to overcome some problems related in images or videos, i.e. occlusion, illuminations changes, pose and scale variations, among others. This thesis proposes a method for face detection problem, which concatenates Histogram of Oriented Gradients and Histogram of Averaged Oriented Gradients to classify them through a cascade of “one class" classifiers based on the nearest convex model. A cascade of “one class" classifiers generate simple classifiers to reject false positives quickly. To reduce the search region and the false positives number is used a skin detection algorithm, which is the principal contribution of this work. Then, we generate a pyramid image to detect faces with different size in the skin regions. The proposed method achieved the best accuracy and the fewest false positives number when we compare with HOG, HAOG, HOG-LBP (Cevikalp et al. 2013) and (Viola and Jones 2004) methods. We reached promising results when we compared with state-of-the-art methods considered in the FDDB benchmark (Jain and Learned Miller 2010).
2

A robust technique for detecting custom patterns of roundish features

PESSOA, Saulo Andrade 10 March 2017 (has links)
Submitted by Pedro Barros (pedro.silvabarros@ufpe.br) on 2018-07-27T17:52:23Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Saulo Andrade Pessoa.pdf: 13702473 bytes, checksum: fb19820230bd6d159a5f8955f442c524 (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-08-01T22:38:09Z (GMT) No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Saulo Andrade Pessoa.pdf: 13702473 bytes, checksum: fb19820230bd6d159a5f8955f442c524 (MD5) / Made available in DSpace on 2018-08-01T22:38:10Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Saulo Andrade Pessoa.pdf: 13702473 bytes, checksum: fb19820230bd6d159a5f8955f442c524 (MD5) Previous issue date: 2017-03-10 / FACEPE / A fundamental task in computer vision is extracting low-level features from the image. Since this is one of the first tasks executed by most vision-based systems, imprecisions and errors committed during its execution are propagated to the next stages thus affecting the system overall performance. Therefore, robust and precise feature extractors are mandatory in computer vision. In the literature, two kinds of low-level features are commonly used: natural features, and artificial patterns of features. Natural features are extractable only from scenarios rich in textured elements. On the other hand, artificial patterns of features can be easily crafted by using commodity printers, which permits its application in a diversity of scenarios. Moreover, since the real dimensions of the pattern are known beforehand, the usage of artificial patterns allows the construction of metric systems. This thesis presents a new detection technique for patterns formed by roundish features. The new technique is composed of two stages: the extraction of candidates for features of the pattern; and the searching for the elements (among the candidates) that actually constitute the pattern. Differently from the techniques found in the related literature, the proposed one does not restrict the patterns to be rectangular grids of regularly-spaced features, but it allows the creation of a variety of patterns through the use of graphs (the pattern template). Experimental results collected from two case studies evidence that the new technique is robust to uneven and low-lighting conditions. / Em visão computacional, uma tarefa fundamental é a extração de características da imagem. Por essa ser uma das primeiras etapas a serem realizadas na maioria dos sistemas computacionais baseados em visão, imprecisões e erros cometidos durante sua realização são propagados para as demais etapas afetando o resultado final obtido pelo sistema. Dessa forma, extratores de características que sejam robustos e precisos são uma necessidade em visão computacional. Na literatura, dois tipos de características são amplamente utilizados: características naturais; e padrões artificiais de características. Características naturais são extraíveis apenas de cenários ricos em elementos texturizados. Já padrões artificiais de características podem ser facilmente confeccionados com impressoras domésticas, permitindo sua aplicação em diversos cenários. Além disso, o uso de padrões artificiais possibilita que as medidas reais entre as características sejam previamente conhecidas (informação essencial à construção de sistemas métricos). Esta tese apresenta uma nova técnica para detecção de padrões artificiais formados por características arredondadas, sendo composta de dois estágios: a extração de elementos candidatos a característica do padrão; e a busca para encontrar quais elementos (dentre os candidatos) constituem o padrão de interesse. Diferentemente das técnicas encontradas na literatura, a técnica proposta não é restrita a detectar padrões retangulares formados por características uniformemente espaçadas; o usuário é livre para criar o padrão da sua escolha através da construção de um grafo (o gabarito do padrão). Experimentos realizados com imagens reais comprovam que a técnica proposta é robusta a iluminação não uniforme e a baixo contraste.
3

Design de informação aplicado ao desenvolvimento de interface de realidade aumentada para interação humano-robô remota

LEDEBOUR, Carolina Cani Dias 21 February 2017 (has links)
Submitted by Pedro Barros (pedro.silvabarros@ufpe.br) on 2018-09-14T21:04:41Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Carolina Cani Dias Ledebour.pdf: 14370850 bytes, checksum: 9624a62f6776a4b34c25cce36e59ca48 (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-09-18T15:34:17Z (GMT) No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Carolina Cani Dias Ledebour.pdf: 14370850 bytes, checksum: 9624a62f6776a4b34c25cce36e59ca48 (MD5) / Made available in DSpace on 2018-09-18T15:34:17Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Carolina Cani Dias Ledebour.pdf: 14370850 bytes, checksum: 9624a62f6776a4b34c25cce36e59ca48 (MD5) Previous issue date: 2017-02-21 / CAPES / Atividades em ambientes que apresentem risco aos humanos podem ser realizadas através da teleoperação de robôs. Entretanto, a ausência de consciência situacional durante o controle remoto de robôs pode ocasionar no aumento da dificuldade na execução de tarefas.Com o objetivo de identificar as necessidades de auxílio de interface, o uso de realidade aumentada, associado ao design da informação para criação de uma interface mista é investigado nesta dissertação como alternativa para auxiliar neste problema de visualização para tarefas de manipulação. O levantamento do estado da arte foi feito através de uma revisão da literatura, onde 36 artigos foram selecionados a partir de 893 artigos analisados. Com o objetivo de identificar as necessidades do usuário de auxílio de interface, a tarefa de manipulação robótica foi analisada e descrita em seis etapas: Identificação, Manejo, Localização, Intervenção, Ajuste e Inspeção. Elementos visuais em realidade aumentada foram desenvolvidos para cada etapa da tarefa. Foi elaborado um protótipo de interface para teleoperação de robôs com o objetivo de avaliar os elementos em testes com usuários. Os testes aconteceram em um cenário controlado onde os usuários executaram três tarefas de grau de complexidade crescente. Participaram dos testes 31 voluntários para avaliar a usabilidade através de questionários validados pela literatura. Os resultados alcançados demonstraram resultados positivos nos quesitos de clareza, facilidade de visualização, e facilidade de encontrar as informações necessárias, com índices de 90,3% de aprovação no formulário de avaliação de satisfação de usabilidade. As soluções visuais utilizadas na criação dos elementos gráficos desta dissertação podem ser adaptados para tarefas robóticas de outras naturezas. / Activities in hazardous environments can be accomplished through the teleoperation of robots. However, the absence of situational awareness during the remote control of robots can lead to an increase in the difficulty in performing tasks. In order to identify the interface assistance needs, the use of augmented reality, associated to information design to create a mixed reality interface is investigated in this dissertation as an alternative to assist in visualization problem for manipulation tasks. The survey of the state of the art was done through a literature review, in wich, 36 articles were selected from 893 articles analyzed. Aiming the identification of the user needs for interface aids, the robot manipulation task was analyzed and described in six steps: Identification, Handling, Localization, Intervention, Adjustment, and Inspection. Visual elements in augmented reality were developed for each step of the task. An interface prototype was developed for robots' teleoperation with the purpose of evaluating the elements in user tests. The tests took place in a controlled scenario where users performed three tasks of increasing complexity. 31 volunteers participated in the tests to evaluate usability through questionnaires validated in the literature. The results indicated positive results in terms of clarity, ease of visualization, and ease of finding the necessary information, with 90.3% approval ratings. The visual solutions used in the creation of the graphic elements of this dissertation can be adapted for other robotic tasks.
4

Design guidelines for generating augmented reality instructions

SILVA, Cledja Karina Rolim da 04 March 2016 (has links)
Submitted by Pedro Barros (pedro.silvabarros@ufpe.br) on 2018-07-11T20:37:26Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Cledja Karina Rolim da Silva.pdf: 4417000 bytes, checksum: 9649b9a2c3b86f1c7a2ce85556b2cc63 (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-07-17T20:32:07Z (GMT) No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Cledja Karina Rolim da Silva.pdf: 4417000 bytes, checksum: 9649b9a2c3b86f1c7a2ce85556b2cc63 (MD5) / Made available in DSpace on 2018-07-17T20:32:08Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Cledja Karina Rolim da Silva.pdf: 4417000 bytes, checksum: 9649b9a2c3b86f1c7a2ce85556b2cc63 (MD5) Previous issue date: 2016-03-04 / CNPQ / Most work about instructions in Augmented Reality do not follow established patterns or design rules – each approach defines its own method for conveying instructions. This work describes our results and experiences towards defining design guidelines for Augmented Reality instructions. From these guidelines, we propose a set of instructions and empirically validate them. The guidelines were derived from a survey of the most common visualization techniques and instruction types applied in Augmented and Mixed Reality. Moreover, we studied how instructions were done in 2D and 3D and how they can be applied in the Augmented Reality context. We observed that most work is related to object instructions and less work to body movement instructions. However, our proposal can be used in both cases. To validate our proposal we implemented a C⁺⁺ system, which -can be seen as a library to be used in different kinds of environments where the instructions of body and objects movements are important. A RGB-D sensor was applied to capture the movements. As result, we had visualization techniques applied together with typical AR instructions and indications of what kind of instruction could be used to: emphasize parts, indication of direction of the movement, management of occlusion, management of depth and feedback. / Grande parte de trabalhos relacionados a instruções em Realidade Aumentada não segue padrões ou guias de desenvolvimento – cada abordagem define seu modo próprio de transmitir instruções. Este trabalho descreve nossos resultados e experiência na direção de definir guias de desenvolvimento ou projeto para aplicações que utilizem Realidade Aumentada. A partir dessas guias de desenvolvimento, propomos um conjunto de instruções e empiricamente validamos as mesmas. Essas guias foram derivadas de uma pesquisa extensiva sobre as técnicas de visualização e instruções relacionadas à Realidade Aumentada e Mista. Além disso, verificamos trabalhos sobre instruções 2D e 3D para entender o funcionamento desta área para checar como e que tipo de informação poderia ser adaptada e usada no contexto de aplicações para Realidade Aumentada. Observamos que a maioria dos trabalhos é relacionada a instruções com objetos e há poucos trabalhos relacionados a instruções de movimentos do corpo. Para validar nossa proposta, implementamos um sistema em C⁺⁺, o qual tem o objetivo de ser uma biblioteca para ser usada em diferentes tipos de ambientes ou contextos onde instruções de movimento do corpo sejam importantes. Para capturar o movimento do corpo, um sensor RGB-D foi utilizado. Como resultado, apresentamos técnicas de visualização aplicadas com instruções comuns em Realidade Aumentada e indicação de que tipo de instrução pode ser usada para: realçar partes, indicação da direção do movimento, gerenciamento de oclusão, gerenciamento de profundidade e retorno para o usuário.
5

A gesture recognition library for the therapy domain and its applications

CHAVES, Thiago de Menezes 11 March 2016 (has links)
Submitted by Pedro Barros (pedro.silvabarros@ufpe.br) on 2018-09-24T22:38:54Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Thiago de Menezes Chaves.pdf: 8950056 bytes, checksum: d71486339c8fdddafbd8f55d482f1d70 (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-09-27T21:36:19Z (GMT) No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Thiago de Menezes Chaves.pdf: 8950056 bytes, checksum: d71486339c8fdddafbd8f55d482f1d70 (MD5) / Made available in DSpace on 2018-09-27T21:36:20Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Thiago de Menezes Chaves.pdf: 8950056 bytes, checksum: d71486339c8fdddafbd8f55d482f1d70 (MD5) Previous issue date: 2016-03-11 / The computational implementation of human body gestures recognition has been a challenge for several years. Nowadays, thanks to the development of RGB-D cameras it is possible to acquire a set of data that represents a human position in space. Despite that, these cameras provide raw data, still being a problem to identify in real-time a specific pre-defined user movement continuously which can then be applied in applications as, for example, the tracking of physiotherapeutic movements or exercises. This work presents two new techniques to identify gestures, both having physiotherapeutic concerns about the performed exercise; one is based on physiotherapeutic standards, the biomechanical planes, while the other aims to recognize the functional exercises and is based on a concept called checkpoints. Both these techniques were tested and validated by physiotherapists from the Physiotherapy Department at the Federal University of Pernambuco. The techniques were also integrated in a library which was then used in two case studies and two general applications where their applicability was tested in physiotherapeutic and non-physiotherapeutic domains obtaining good results and showing that they can be used on general applications as well. / Implementar um algoritmo computacional de reconhecimento de gesto tem sido um desafio por muitos anos. Hoje em dia, com o desenvolvimento das câmeras RGB-D, é possível adquirir um conjunto de dados que representa a posição de uma pessoa no espaço. Apesar disso, os dados adquiridos por estas câmeras ainda não são suficientes para identificar, em tempo real e de forma contínua, movimentos predefinidos dos usuários, os quais podem ser usados em aplicações como, por exemplo, a análise de movimentos ou exercícios fisioterapêuticos. Este trabalho apresenta duas novas técnicas de reconhecimento de gestos, ambas voltadas ao domínio de fisioterapia; a primeira é baseada em padrões da fisioterapia, chamados de planos biomecânicos, e a segunda tem como propósito reconhecer os gestos realizados durante os exercícios funcionais e é baseada num conceito chamado de checkpoints. Ambas técnicas foram testadas e validadas por fisioterapeutas do Departamento de Fisioterapia da Universidade Federal de Pernambuco. Essas técnicas foram integradas em uma biblioteca, a qual então foi utilizada para desenvolver dois estudos de caso e duas aplicações de propósito gerais, onde suas aplicabilidades foram testadas tanto no domínio fisioterapêutico como fora dele, obtendo bons resultados e mostrando que tais técnicas também podem ser usadas em aplicações gerais.
6

Uma proposta de sistema para tradução entre linguagens de sinais

NEIVA, Davi Hirafuji 28 August 2015 (has links)
Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2016-04-22T19:16:44Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) DISSERTAÇÃO Davi Hirafuji Neiva.pdf: 3977130 bytes, checksum: 14ac8dc4d1aa0a77593793c86b5e14c6 (MD5) / Made available in DSpace on 2016-04-22T19:16:44Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) DISSERTAÇÃO Davi Hirafuji Neiva.pdf: 3977130 bytes, checksum: 14ac8dc4d1aa0a77593793c86b5e14c6 (MD5) Previous issue date: 2015-08-28 / Na sociedade contemporânea existe uma forte campanha pela acessibilidade e pela inclusão de pessoas com deficiências. No Brasil há em torno de 9 milhões de surdos que usam a Linguagem Brasileira de Sinais (LIBRAS) e enfrentam diversas barreiras de comunicação. Várias iniciativas de aplicativos móveis proveem tradução entre LIBRAS e Português, porém a comunicação entre surdos de diferentes nacionalidades permanece um desafio. Este trabalho tem como objetivo propor um sistema que permita a pessoas surdas de diferentes nacionalidades se comunicarem através de sinais. Para isso, um aplicativo móvel captura gestos pela câmera e se comunica com um servidor web, que identifica o sinal através de uma rede neural artificial ELM (Extreme Learning Machine). O pré-processamento das imagens, para permitir que o sinal realizado pela mão seja isolado, combina técnicas de visão computacional como detecção de bordas, algoritmo de balde e uso de máscara para remoção do plano de fundo. O sistema também provê uma interface web para cadastro de sinais pelos usuários, permitindo a construção colaborativa da base de sinais internacional. Assim, o presente trabalho propõe uma abordagem inovadora para comunicação entre surdos de diferentes nacionalidades, aliada a uma plataforma colaborativa para construção da base de sinais, que pode também ajudar os surdos a aprenderem outras linguagens de sinais diferentes da sua. / Nowadays much has been done for accessibility and inclusion of people with disabilities using technology. In Brazil, there are approximately 9 million of deaf people that uses the Brazilian Sign Language (LIBRAS) e go through various communication barriers. There are some applications that provide a translation between LIBRAS and Portuguese, but communication between deaf people among different nationalities, using different sign languages, is still a great challenge. This research aims to provide a system that allows deaf people from different nationalities communicate with each other using their own sign language. In order to accomplish this, a mobile application captures gestures through the use of its camera and communicates with a web server, who identifies o sign using an artificial neural network ELM – Extreme Learning Machine. Images are processed in order to isolate the hand by combining computer vision technics like edge detection, bucket fill algorithm and masks to remove the background information. The system also provides a web interface to register new gestures as well as upload new images for a specific gesture, thus creating a collaborative gesture database. The present work purposes a novel approach for communication between deaf people with different nationalities combined with a collaborative platform to create the gestures database that can not only translate between different sign languages, but motivate deaf people to learn a different sign language.
7

Rastreamento e identificação de movimentos de cabeça para sistema de comunicação alternativa / Tracking and identification of head movement for augmentative and alternative communication

Gonçalves, Carlos Wellington Passos 11 July 2014 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2014. / Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2014-11-28T13:24:34Z No. of bitstreams: 1 2014_CarlosWellingtonPassosGoncalves.pdf: 8230732 bytes, checksum: 486fc9bbbdf77001ee75580ea741a0e4 (MD5) / Approved for entry into archive by Patrícia Nunes da Silva(patricia@bce.unb.br) on 2014-12-01T15:40:10Z (GMT) No. of bitstreams: 1 2014_CarlosWellingtonPassosGoncalves.pdf: 8230732 bytes, checksum: 486fc9bbbdf77001ee75580ea741a0e4 (MD5) / Made available in DSpace on 2014-12-01T15:40:10Z (GMT). No. of bitstreams: 1 2014_CarlosWellingtonPassosGoncalves.pdf: 8230732 bytes, checksum: 486fc9bbbdf77001ee75580ea741a0e4 (MD5) / As interfaces de controle de computadores são concebidas desde suas origens para, aproveitando o controle motor altamente preciso e rápido de mãos, braços e dedos, permitir uma taxa de comandos muito rápida, e aumentar a eficiência da interação homem-máquina. Contudo, estima-se que no Brasil 7% da população tem algum tipo de deficiência motora, sendo que diversas destas podem comprometer ou inviabilizar o uso do computador por uma pessoa. O uso de tecnologias assistivas permite mitigar ou até anular as dificuldades inerentes às condições do usuário, empoderando-o a realizar atividades em que sua condição clínica é desfavorável. Sistemas de acesso ao computador e equipamentos para comunicação aumentativa e alternativa são empregados nesta tarefa ajudando pessoas em todo o mundo. Entretanto, pessoas com movimentação involuntária possuem um número reduzido de soluções à sua disposição para uso do computador, principalmente devido a poucos movimentos funcionais. Até o momento não existe um sistema de visão computacional que permita a interpretação de movimentos funcionais de cabeça de uma pessoa com movimentação involuntária. Este trabalho propõe uma aplicação que consegue reconhecer o rosto do usuário, rastrear seu movimento, modelar o movimento funcional desejado, e reconhecê-lo com o uso de imagens coletadas por uma webcam convencional. Nosso classificador é flexível e capaz de se ajustar aos diferentes movimentos testados, obtendo uma boa precisão e número pequeno de falso positivos. O sistema desenvolvido ainda pode ser integrado com vários softwares que implementam pranchas de comunicação dinâmicas, permitindo o uso do computador e comunicação através da escrita ou voz sintetizada. Resultados para candidatos hígidos comprovam que o os classificadores HMM produzem resultados superiores ou equivalentes a um classificador que utiliza apenas um limiar de posição. O melhor destes apresenta uma área abaixo da curva ROC de 0,997. Contudo, os módulos de segmentação e interpretação do movimento foram sensíveis a movimentação involuntária apresentada nos dois candidatos com deficiência motora da pesquisa, diagnosticados respectivamente com movimentação coreodistônica e coreoatetótica. _______________________________________________________________________________ ABSTRACT / The control interfaces for computers are designed since its origins to take advantage of the fast and fine motor control of hands, arms and fingers, and allow a great rate of commands, increasing the efficiency of the human-machine interaction. However, it is estimated that 7% of the population of Brazil has some motor impairment, which can prevent the computer use by a subject. The use of assistive technologies can mitigate or reduce the difficulties related to the user’s physical condition, empowering him to accomplish activities that are unfavorable to his condition. Computer access systems and augmentative and alternative communication equipment are employed in this task, helping people around the world. Even though, persons with involuntary movements have fewer solutions at hand to use a computer, especially because of few functional movements. So far there is no computer vision system that allows the interpretation of functional head movements of a person with involuntary movements. This work proposes an application that can recognize the user face, track its motion, model the desired function movement and recognize it with images collect via a conventional webcam. Our classifier has a flexible structure and is capable of dealing with the different movements that were tested, accomplishing good precision and a reduced false positive rate. The developed system can be integrated with softwares that implement dynamic communication boards, allow keyboard and mouse emulation, and communication by writing or synthesized voice. Results for healthy candidates show that the HMM classifiers have equal or better performance than an classifier that uses only a position threshold. The best of them presents an area below the ROC curve of 0,997. However, the motion segmentation and motion interpretation modules were sensitive to involuntary movements presented on the two candidates with motion impairment, diagnosticated respectively with choreodystonic and choreoathetotic movements.
8

Image-Based Mapping and Localization using VG-RAM Weightless Neural Networks

LYRIO JUNIOR, L. J. 25 August 2014 (has links)
Made available in DSpace on 2016-08-29T15:33:19Z (GMT). No. of bitstreams: 1 tese_7983_dissertation_v19_revisada.pdf: 2779348 bytes, checksum: 03cd204a381a08129d46ee5fef88917c (MD5) Previous issue date: 2014-08-25 / Localização e Mapeamento são problemas fundamentais da robótica autônoma. Robôs autônomos necessitam saber onde se encontram em sua área de operação para navegar pelo ambiente e realizar suas atividades de interesse. Neste trabalho, apresentamos um sistema para mapeamento e localização baseado em imagens que emprega Redes Neurais Sem Peso do Tipo VG-RAM (RNSP VG-RAM) para um carro autônomo. No nosso sistema, uma RNSP VG-RAM aprende posições globais associadas à imagens e marcos tridimensionais capturados ao longo de uma trajetória, e constrói um mapa baseado nessas informações. Durante a localização, o sistema usa um Filtro Estendido de Kalman para integrar dados de sensores e do mapa ao longo do tempo, através de passos consecutivos de predição e correção do estado do sistema. O passo de predição é calculado por meio do modelo de movimento do nosso robô, que utiliza informações de velocidade e ângulo do volante, calculados a partir de imagens utilizando-se odometria visual. O passo de correção é realizado através da integração das posições globais que a RNSP VG-RAM com a correspondência dos marcos tridimensional previamente armazenados no mapa do robô. Realizamos experimentos com o nosso sistema usando conjuntos de dados do mundo real. Estes conjuntos de dados consistem em dados provenientes de vários sensores de um carro autônomo, que foram sistematicamente adquiridos durante voltas ao redor do campus principal da UFES (um circuito de 3,57 km). Nossos resultados experimentais mostram que nosso sistema é capaz de aprender grandes mapas (vários quilômetros de comprimento) e realizar a localização global e rastreamento de posição de carros autônomos, com uma precisão de 0,2 metros quando comparado à abordagem de Localização de Monte Carlo utilizado no nosso veículo autônomo.
9

Detecção de pedestres com oclusão

SANTOS, Silvio Gustavo de Oliveira 19 August 2013 (has links)
Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-12T17:00:14Z No. of bitstreams: 2 Dissertação Silvio Gustavo Santos.pdf: 9199452 bytes, checksum: b5419072e1f355a27b215065026b7823 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Approved for entry into archive by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-13T13:23:50Z (GMT) No. of bitstreams: 2 Dissertação Silvio Gustavo Santos.pdf: 9199452 bytes, checksum: b5419072e1f355a27b215065026b7823 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-13T13:23:50Z (GMT). No. of bitstreams: 2 Dissertação Silvio Gustavo Santos.pdf: 9199452 bytes, checksum: b5419072e1f355a27b215065026b7823 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-08-19 / A detecção de pedestres é uma área muito promissora no ramo da visão computacional, pois possibilita aplicações importantes em sistemas de auxílio à direção de veículos, sistemas de vigilância e na área da robótica. Muitas técnicas novas surgiram com grandes melhorias nas taxas de detecção, mas ainda assim, seus desempenhos caem consideravelmente quando os pedestres estão sofrendo oclusão. Este trabalho analisa como características baseadas no HOG são construídas e como elas são afetadas quando os pedestres estão parcialmente ocluídos. Como o HOG é aplicado em muitos sistemas de detecção de pedestres, entender como a oclusão afeta a sua performance é importante para prever como extratores de características derivados dele se comportarão na mesma situação. Mais especificamente, o HOG, HOG-LBP e duas novas combinações de características, HOG-LTP e HOG-LMEBP foram analisados. Para tal, oclusões foram geradas sinteticamente mesclando tamanhos diferentes de imagens de não pedestres, em diferentes direções, com a base de dados INRIA. O resultado foi uma nova base de dados composta por oclusões nas direções ascendente, descendente e lateral (da esquerda para direita). Os quatro extratores de características foram usados para treinar classificadores SVM na base de dados INRIA e foram testados com a nova base de dados com oclusão. Os resultados confirmam que o desempenho dos classificadores decai estritamente à medida que a oclusão aumenta, porém o impacto depende de que área do pedestre está escondida. Nós também mostramos que é possível melhorar as taxas de detecção em condições de oclusão simplesmente combinando classificadores.
10

Retificação de imagens de documentos capturados por dispositivos móveis utilizando transformada de hough e histogramas de gradientes orientados

MONTENEGRO, Robson David 12 June 2015 (has links)
Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2015-10-21T17:41:28Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) ROBSON_MONTENEGRO.pdf: 58981994 bytes, checksum: e45d214c496ec66b4a7f5a16803daf59 (MD5) / Made available in DSpace on 2015-10-21T17:41:28Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) ROBSON_MONTENEGRO.pdf: 58981994 bytes, checksum: e45d214c496ec66b4a7f5a16803daf59 (MD5) Previous issue date: 2015-06-12 / Diversas maneiras de armazenamento e transmissão de informação em meio digital estão disponíveis devido ao contínuo crescimento tecnológico. Porém, grande parte das informações relevantes permanece armazenada em meio físico, como: livros, certidões, contratos e documentos pessoais. Existe um grande esforço para realizar a transposição dessas informações para meios digitais de forma a facilitar o acesso e utilização de meios de comunicação mais modernos. Os scanners fornecem a maneira mais popular de se obter esta transposição, porém, estes dispositivos muitas vezes não oferecem portabilidade e custo adequados. A utilização de dispositivos móveis, tais como celulares, para captura de imagens de documento tem se mostrado uma alternativa viável aos tradicionais scanners de mesa. Isto se deve a sua facilidade de uso, portabilidade e barateamento de seu hardware que facilitou sua popularização. Porém, por se tratar de captura em um ambiente menos controlado, documentos digitalizados desta forma apresentam distorções que comprometem a sua legibilidade tais como: perspectiva, embassamento, baixa resolução, interação do conteúdo com o background e curvatura das linhas de texto. Trabalhos recentes tratam este problema utilizando diferentes abordagens, muitos destes, de maneira eficaz. Entretanto, estas técnicas são fortemente dependentes do conteúdo textual presente nos documentos. Esta dissertação apresenta uma nova abordagem para realizar correção de imagens capturadas por dispositivos móveis baseado-se apenas em características morfológicas do documento. O método é dividido em três etapas. A primeira é o pré-processamento responsável por ajustar o contraste da imagem. Depois, as bordas do documento são definidas utilizando uma abordagem híbrida do descritor de Gradiente de Histogramas Orientados com a Transformada de Hough. Por último, a superfície deformada do documento é mapeada para uma superfície retangular corrigida. O algoritmo foi experimentado em diversas configurações de seus parâmetros livres em uma base de documentos pessoais coletada para este trabalho. O menor erro obtido foi de 4,08% e, além disto, as imagens corrigidas foram processadas por sistemas de OCRs e os resultados quantitativos mostram que o algoritmo proposto melhorou substancialmente a legibilidade das imagens. / Several ways of information storage and transmission in digital media emerged due to technological progress. However, much of the relevant information remains stored on physical media, such as books, certificates, contracts and personal documents. Much effort has been made to carry out the transposition of this information to digital media in order to facilitate access and use modern communication channels. The scanners provide the most popular way to obtain this transposition, however, these devices often do not offer adequate portability and are usually expensive. The use of mobile devices such as cell phones, for document imaging has proven to be a suitable alternative to traditional table scanners. This is due to its ease of use, portability and cheapness of their hardware which facilitated its popularization. However, documents acquired in a less controlled environment, have distortions that muddle its readability such as perspective, blur, low resolution, interaction of the content and the background and curled text lines. Recent works address this problems using different approaches, many of these, efficiently. However, these techniques are strongly dependent on the textual content in the document images. This dissertation presents a new algorithm to rectify images acquired by mobile devices based only on morphological features of the document image. The method is divided into three steps. First is the preprocessing when the image contrast is adjusted. Then, the document edges are determined using a hybrid approach of Hough Transform and Histogram of Oriented Gradients descriptor. Finally, the warped surface of the document is mapped to a rectangular surface. The algorithm has been tested in several configurations in a personal document image base collected for this work. The best error rate was 4.08 % and, moreover, the corrected images were processed by OCR systems and quantitative results shows that the proposed algorithm has significantly improved readability of the images.

Page generated in 0.2002 seconds