Global ETD Search

241	Projeto de um servidor de vídeo sob demanda paralelo e distribuído. Lara, Carla Rodrigues Figueiredo 30 May 2003 (has links) Made available in DSpace on 2016-06-02T19:05:14Z (GMT). No. of bitstreams: 1 DissCRFL.pdf: 648230 bytes, checksum: a343ed1fae316081651385f830f464fb (MD5) Previous issue date: 2003-05-30 / Financiadora de Estudos e Projetos / This work presents an architecture for the development of a Video on Demand (Vod) Server using a Parallel Distributed File System. In the development of this work several aspects related to the project of VoD Servers are considered, including: optimized storing and retrieval of videos using appropriate striping unit and request sizes, and the monitoring of disk and network operation for the performance evaluation of the proposed system. The characteristics of the MPEG standard used for video compression are also studied and considered in the video transfers. We also discuss aspects related to the implementation of prefetching mechanisms in the VoD Server. The concept of cluster computing is also considered for efficient data distribution aiming at appropriate response time for satisfying the Quality of Service (QoS) require by the VoD users. / Este trabalho apresenta uma arquitetura para o desenvolvimento de um Servidor de Vídeo Sob Demanda (VoD) utilizando um Sistema de Arquivos Paralelos Distribuídos. No desenvolvimento deste trabalho vários tópicos relacionados à construção de servidores de VoD são considerados, entre eles: armazenamento e recuperação otimizados dos vídeos através da determinação de tamanhos apropriados para a unidade de distribuição e requisições de leitura e a coleta de informações dos discos e da rede para avaliação de desempenho do sistema proposto. As características do padrão utilizado para compressão dos vídeos, o MPEG, são estudadas e consideradas. Também são apresentadas discussões de como devem ser implementados mecanismos de prefetching em servidores de VoD. O conceito de paralelismo em aglomerados de computadores é explorado para que a distribuição eficiente dos dados forneça um tempo de resposta adequado e condizente com as exigências de QoS impostas pelos usuários da aplicação de VoD. Sistemas distribuídos Servidor de vídeo Vídeo sob demanda Arquivos paralelos MPEG
242	Projeto de um modelador 3D colaborativo baseado no padrão emergente MPEG-4 MU. Duarte, Fernando Vieira 19 August 2003 (has links) Made available in DSpace on 2016-06-02T19:05:17Z (GMT). No. of bitstreams: 1 DissFVD.pdf: 2351672 bytes, checksum: caf5290232d2d3e84071c13c80625d48 (MD5) Previous issue date: 2003-08-19 / In the last years we have been experiencing advances in networking technologies as well as computer graphics and display technology. As a consequence, a lot of Collaborative Virtual Environments have emerged thanks to the increasing computation capabilities of desktop computers as well as the enormous growth in network bandwidth and the ubiquity of the Internet. Collaborative virtual environments for 3D modeling can be characterized by the interaction among multiple users for the creation and/or modification of shared 3D objects. These environments can be used, for instance, in the modeling and visualization of virtual prototypes in order to reduce costs in the process of products design. The challenges of building collaborative 3D modeling environments are mainly related to real-time rendering of the modified objects, as well as to users interaction with the virtual environment, and to consistency maintenance of the shared virtual environment. Only a few collaborative 3D modeling environments are found in the literature and usually their projects result in complex non standardized solutions for the collaboration among users. This work presents the implementation of a collaborative environment for 3D modeling based on the emerging MPEG-4MU (multi-user) standard. With this environment, 3D graphic scenes can be created in real-time, by multiple participants, in synchronous collaborative sessions. These scenes can be visualized in any MPEG-4 terminal, including cellulars and personal digital assistants (PDAs). Sessions control, consistency maintenance, concurrency control and 3D object locking are realized by the MSC (MUTech Session Controller) and MBK (MUTech Bookkeeper) components, through the Pilot/drone mechanism and the BIFS-Command protocol. All these components were defined by the MPEG-4 MU emerging standard and implemented by the Networked Virtual Reality Lab (LRVNet) at Federal University of São Carlos. / Nos últimos anos temos experimentado avanços nas tecnologias de rede como também na computação gráfica e tecnologia de exibição. Como uma conseqüência, muitos Ambientes Virtuais Colaborativos emergiram graças às capacidades crescentes da computação dos computadores de mesa (desktop), como também o crescimento enorme na largura de banda da rede e a onipresença da Internet. Ambientes virtuais colaborativos para modelagem 3D podem ser caracterizados pela interação entre múltiplos usuários para a modificação e/ou criação de objetos 3D compartilhados. Por exemplo, estes ambientes podem ser usados na modelagem e visualização de protótipos virtuais para reduzir custos no processo de projeto de produtos. Os desafios da construção de ambientes de modelagem 3D colaborativos estão relacionados principalmente com a renderização em tempo-real dos objetos modificados, como também para a interação de usuários com o ambiente virtual e a manutenção da consistência do ambiente virtual compartilhado. São encontrados na literatura somente alguns ambientes de modelagem 3D colaborativos e normalmente os projetos resultam em soluções não padronizadas e complexas para a colaboração entre os usuários. Este trabalho apresenta a implementação de um ambiente colaborativo para modelagem 3D baseado no padrão emergente MPEG-4 MU (MultiUser). Com este ambiente, cenas gráficas 3D podem ser criadas em tempo-real, por participantes múltiplos, em sessões colaborativas síncronas. Estas cenas podem ser visualizadas em qualquer terminal MPEG-4, inclusive celulares e PDAs (Personal Digital Assistants). Controle de Sessão, manutenção de consistência, controle da concorrência e trancamento (locking) dos objetos 3D são realizados pelos componentes MSC (MUTech Session Controller) e MBK (MUTech Bookkeeper), pelo mecanismo de Pilot/Drone e o protocolo de BIFS-Command. Todos estes componentes são definidos pelo padrão emergente MPEG-4 MU e implementados pelo Laboratório de Realidade Virtual em Rede (LRVNet) da Universidade Federal de São Carlos. Realidade virtual Ambientes virtuais colaborativos Modelagem 3D MPEG-4
243	Componentes para manipulação de objetos multimídia utilizando o padrão MPEG-7. Figueira, Leandro Donaires 18 June 2007 (has links) Made available in DSpace on 2016-06-02T19:05:25Z (GMT). No. of bitstreams: 1 DissLDF.pdf: 1886677 bytes, checksum: dc37e62087bd48b0ae6005924f0c8b99 (MD5) Previous issue date: 2007-06-18 / Financiadora de Estudos e Projetos / This work presents a layer for the manipulation of media based on the multimedia content description interface, MPEG-7. This layer realizes some parts of the MPEG-7 MDS (Multimedia Description Schemes), and being built by components, makes a base for the implementation of any application that has media manipulation requisites that range from the simplest ones to a database multimedia system. In this last case, it can be a system that have many operations being executed in a database, like multimedia data mining and indexing by low level features, all supported by MPEG-7. This layer was built to unify the necessities on manipulating media of many applications, integrating them and acting as a mediator. It provides interfaces so that the insertion of media together with their semantic annotation is possible, along with queries based on these semantic metadata derived from these annotations. A simplified model for the semantic annotation and queries for the ease of use of these interfaces was proposed, being the annotations and queries made in a similar manner. Finally, this layer allows the exporting of the query metadata on the format used by MPEG-7 for interchange between systems. / Este trabalho apresenta uma camada de manipulação de mídias baseada no padrão de descrição de dados multimídia MPEG-7. Esta camada realiza algumas partes dos MDS (Multimedia Description Schemes) do padrão MPEG-7, e através de sua construção por componentes, forma uma base para a implementação de quaisquer aplicações que tenham requisitos de manipulação de mídias, desde as mais simples até um sistema de banco de dados multimídia. Nesse último caso, pode ser um sistema que execute as várias operações possíveis em um banco de dados, como mineração de dados multimídia e indexação por características de baixo-nível, tudo apoiado sobre o padrão. Esta camada foi feita com a intenção de unificar as necessidades de manipulação de mídias por várias aplicações, integrando-as e agindo dessa forma como mediadora. Ela provê interfaces para que sejam feitas inserções de mídias junto com as anotações semânticas, além de consultas sobre elas através desses metadados semânticos provindos das anotações. Foi proposto um modelo simplificado de anotação e consulta semântica para a fácil utilização dessas interfaces, sendo que tanto as anotações como as consultas são feitas de maneira semelhante. Finalmente, essa camada possibilita que seja feita a exportação dos metadados da consulta no formato usado pelo padrão MPEG-7, para intercâmbio de dados com outros sistemas. Banco de dados multimídia MPEG-7 Componentes de software
244	Uma estrutura de suporte para adaptação em jogos 3D multiusuário Silva, Alessandro Rodrigues e 26 August 2003 (has links) Made available in DSpace on 2016-06-02T19:05:33Z (GMT). No. of bitstreams: 1 2468.pdf: 1070073 bytes, checksum: 2534ccfe53038c0363829026d8a20941 (MD5) Previous issue date: 2003-08-26 / With the growing dissemination and reliability of wireless networks and the emergence of devices with more and more processing and communication power, applications up to now restricted to PCs are being envisaged to run on devices as heterogeneous as wrist clocks with GPS locators, refrigerators with internet access, up to mobile phones, PDAs, settop- boxes and game consoles. The integration of this myriad of devices and network technologies, with different capabilities, demand special attention from the software programmers and designers specially when these applications are shared among multiple users from different devices, each one producing and consuming information according to each device capacity. In this sense, application adaptation, which allows a software to react upon the resources variations used, is an important process towards fitting the application to a certain device configuration. This adaptation is being considered as an important part of the systems that act upon heterogeneous processing and communication environment. Therefore, a large amount of work has been done in the traditional multimedia adaptation, such as text, images, audio and video, less attention has been focused on 3D digital content first because of the complexity involved in the 3D applications adaptation issues, and also because true marketing opportunities for 3D graphics in heterogeneous devices have just began to emerge. Moreover, initiatives that promote adaptation standardization must be considered, so that interoperability among adaptation mechanisms can become a reality. This work investigated the MPEG-4 standard and its extension MPEG-J to handle adaptation issues, and proposes an adaptation framework for 3D multi-user game applications, entitle MMGAME. With this framework, elements composing a game application can be adapted according to devices resources variations where the application is running as well as in the network where is connected. / Com a maior disseminação e confiabilidade das redes de comunicação sem fio, e a emergência de dispositivos com o potencial de processamento e de comunicação cada vez maior, aplicações antes restritas aos computadores pessoais estão sendo vislumbradas em dispositivos tão heterogêneos quanto relógios com localizadores, geladeiras que acessam a Internet, celulares, PDAs (computador digital pessoal), set-top-boxes e consoles de jogos. A integração dessa miríade de dispositivos e de tecnologias de redes, com capabilidades variadas, exige, hoje, dos programadores e projetistas de software, atenção especial na construção de aplicações - especialmente quando essas aplicações são compartilhadas por usuários em diferentes dispositivos, cada um produzindo e consumindo informações de acordo com a capacidade do dispositivo. Neste sentido, a adaptação da aplicação, que permite a um software reagir a variações nos recursos utilizados por ele, permitindo melhor adequação de suas funções e dados para uma determinada configuração, é um processo importante e está sendo, cada vez mais, considerada como parte importante de sistemas que atuam em ambientes heterogêneos de computação e de rede. Uma grande quantidade de trabalhos tem sido devotada à adaptação da entrega de formatos tradicionais de multimídia, como texto, imagens, áudio e vídeo, entretanto, pouca atenção tem sido dada ao conteúdo digital 3D, primeiro por causa da complexidade das questões envolvidas na adaptação de aplicações 3D, maior do que as de outras mídias, e também pelo fato que oportunidades verdadeiras de marketing para conteúdo 3D estão apenas começando a surgir. Mais ainda, iniciativas que promovem a padronização da adaptação devem ser consideradas, para que seja promovida a interoperabilidade em futuros mecanismos de adaptação. Este trabalho investigou o padrão MPEG-4 e sua extensão MPEG-J que tratam, de forma superficial ainda, da questão da adaptação, e propôs um framework de adaptação de aplicações 3D, denominado MMGAME, mais especificamente de jogos multiusuário em que, elementos que compõem uma aplicação de jogos possam ser adaptados em função de flutuações nos recursos do dispositivo que executa a aplicação e da rede onde este dispositivo está conectado. Ambientes virtuais colaborativos Ambientes 3D Adaptação de conteúdo MPEG-4 Multiusuário
245	Arquitetura de um decodificador de áudio para o Sistema Brasileiro de Televisão Digital e sua implementação em FPGA Renner, Adriano January 2011 (has links) O Sistema Brasileiro de Televisão Digital estabeleceu como padrão de codificação de áudio o algoritmo MPEG-4 Advanced Audio Coding, mais precisamente nos perfis Low Complexity, High Efficiency versão 1 e High Efficiency versão 2. O trabalho apresenta um estudo detalhado sobre o padrão, contendo desde alguns conceitos da psicoacústica como o mascaramento até a metodologia de decodificação do stream codificado, sempre voltado para o mercado do SBTVD. É proposta uma arquitetura em hardware para um decodificador compatível com o padrão MPEG-4 AAC LC. O decodificador é separado em dois grandes blocos mantendo em um deles o banco de filtros, considerado a parte mais custosa em termos de processamento. No bloco restante é realizada a decodificação do espectro, onde ocorre a decodificação dos códigos de Huffman, o segundo ponto crítico do algoritmo em termos de demandas computacionais. Por fim é descrita a implementação da arquitetura proposta em VHDL para prototipação em um FPGA da família Cyclone II da Altera. / MPEG-4 Advanced Audio Coding is the chosen algorithm for the Brazilian Digital Television System (SBTVD), supporting the Low Complexity, High Efficiency version 1 and High Efficiency version 2 profiles. A detailed study of the algorithm is presented, ranging from psychoacoustics concepts like masking to a review of the AAC bitstream decoding process, always keeping in mind the SBTVD. A digital hardware architecture is proposed, in which the algorithm is split in two separate blocks, one of them containing the Filter Bank, considered the most demanding task. The other block is responsible for decoding the coded spectrum, which contains the second most demanding task of the system: the Huffman decoding. In the final part of this work the conversion of the proposed architecture into VHDL modules meant to be prototyped with an Altera Cyclone II FPGA is described. Microeletrônica Áudio digital Fpga MPEG-4 AAC SBTVD Digital audio AAC LC Audio decoding FPGA
246	Arquitetura de um decodificador de áudio para o Sistema Brasileiro de Televisão Digital e sua implementação em FPGA Renner, Adriano January 2011 (has links) O Sistema Brasileiro de Televisão Digital estabeleceu como padrão de codificação de áudio o algoritmo MPEG-4 Advanced Audio Coding, mais precisamente nos perfis Low Complexity, High Efficiency versão 1 e High Efficiency versão 2. O trabalho apresenta um estudo detalhado sobre o padrão, contendo desde alguns conceitos da psicoacústica como o mascaramento até a metodologia de decodificação do stream codificado, sempre voltado para o mercado do SBTVD. É proposta uma arquitetura em hardware para um decodificador compatível com o padrão MPEG-4 AAC LC. O decodificador é separado em dois grandes blocos mantendo em um deles o banco de filtros, considerado a parte mais custosa em termos de processamento. No bloco restante é realizada a decodificação do espectro, onde ocorre a decodificação dos códigos de Huffman, o segundo ponto crítico do algoritmo em termos de demandas computacionais. Por fim é descrita a implementação da arquitetura proposta em VHDL para prototipação em um FPGA da família Cyclone II da Altera. / MPEG-4 Advanced Audio Coding is the chosen algorithm for the Brazilian Digital Television System (SBTVD), supporting the Low Complexity, High Efficiency version 1 and High Efficiency version 2 profiles. A detailed study of the algorithm is presented, ranging from psychoacoustics concepts like masking to a review of the AAC bitstream decoding process, always keeping in mind the SBTVD. A digital hardware architecture is proposed, in which the algorithm is split in two separate blocks, one of them containing the Filter Bank, considered the most demanding task. The other block is responsible for decoding the coded spectrum, which contains the second most demanding task of the system: the Huffman decoding. In the final part of this work the conversion of the proposed architecture into VHDL modules meant to be prototyped with an Altera Cyclone II FPGA is described. Microeletrônica Áudio digital Fpga MPEG-4 AAC SBTVD Digital audio AAC LC Audio decoding FPGA
247	Correção o de PCR em processadores de fluxos de transporte MPEG-2 Avino, Heitor Judiss 25 September 2012 (has links) Submitted by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-02-18T18:50:03Z No. of bitstreams: 1 Dissertação - Heitor Judiss Savino.pdf: 12604505 bytes, checksum: fb1bcd22abe6766240e85da3ba2e5109 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-02-18T19:37:30Z (GMT) No. of bitstreams: 1 Dissertação - Heitor Judiss Savino.pdf: 12604505 bytes, checksum: fb1bcd22abe6766240e85da3ba2e5109 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-02-18T19:37:54Z (GMT) No. of bitstreams: 1 Dissertação - Heitor Judiss Savino.pdf: 12604505 bytes, checksum: fb1bcd22abe6766240e85da3ba2e5109 (MD5) / Made available in DSpace on 2016-02-18T19:37:54Z (GMT). No. of bitstreams: 1 Dissertação - Heitor Judiss Savino.pdf: 12604505 bytes, checksum: fb1bcd22abe6766240e85da3ba2e5109 (MD5) Previous issue date: 2012-09-25 / Não informada / Currently, the MPEG-2 transport stream is widely used as multiplexing system for sending audio, video, and data, in digital television networks. The transmitted infor- mation is divided into xed-length pa kets, whi h are multiplexed in time and then sent to the re eiver. In order to ensure the orre t presentation of data related to a given program (e.g., audio and video), the transport stream an provide time bases, whi h are used for syn hronizing the re eption system. However, that information, whi h is known as Program Clo k Referen e (PCR) and is also periodi ally embedded in the multiplexed data stream, may su er from ina ura ies, due to the pro essing hain between transmitter and re eiver, whi h an be per eived in the form of jitter. In order to prevent that errors aused by the transport stream pro essing hain, whi h ompromises the proper presentation of the transmitted information, PCR orre tion methods are normally employed. This work presents a review of the PCR orre - tion methods ommonly used in the literature and introdu es two new ontributions. The rst one onsists of a shared a ess stru ture for the orre tion blo k, whi h has the potential to provide a redu ed omputational omplexity (in terms of arithmeti operations) and hardware requirements, when used with traditional PCR orre tion methods. The se ond one devises an intelligent method for PCR orre tion, whose main feature lies on the redu tion of the jitter aused by the orre tion pro ess. Its ar hite ture is based on the ooperative operation of the main modules involved in this pro ess: the rate adapter and the PCR orre tor. In spite of presenting a higher om- plexity, its superior performan e favors the syn hronization pro ess, performed by the re eiver, whi h makes it suitable for pre ise time-bases demanding systems. The pro- posed methodologies are ombined, whi h provides a omplete and e ient framework for pro essing MPEG-2 transport streams. / Atualmente, o fluxo de transporte MPEG-2 é amplamente utilizado como chamada de transporte para a multiplexação de programas que arregam áudio, vídeo e dados, em redes de televisão digital. As informações transmitidas são divididas em pa otes de tamanho xo, multiplexadas no tempo e então enviadas ao re eptor. Para que os da- dos de um mesmo programa sejam apresentados orretamente e em sin ronismo (e.g. áudio e vídeo), o uxo de transporte permite a in orporação de bases de tempo, que são utilizadas na sin ronização do sistema de re epção. Entretanto, essa informação, onhe ida omo Program Clo k Referen e (PCR) e inserida periodi amente no feixe multiplexado, pode sofrer erros, observados na forma de jitter, devido à adeia de pro- essamento entre transmissor e re eptor. Dessa forma, para se evitar que o erro inserido pelo pro essamento do uxo de transporte prejudique a apresentação da informação enviada, métodos de orreção de PCR são geralmente utilizados. Este trabalho apre- senta um estudo sobre os métodos de orreção de PCR mais utilizados na literatura e introduz duas novas ontribuições. A primeira onsiste em uma estrutura de a esso ompartilhado para o blo o de orreção, que tem o poten ial de propor ionar ara terís- ti as reduzidas de omplexidade omputa ional (quantidade de operações aritméti as) e requisitos de hardware, quando utilizada em onjunto om métodos tradi ionais de orreção de PCR. A segunda onsiste em um método inteligente para a orreção de PCR, uja prin ipal ara terísti a é a redução do erro inserido pelo pro esso de orre- ção. A sua arquitetura é baseada na operação ooperativa dos dois prin ipais agentes envolvidos nesse pro esso: os módulos de adaptação de taxa e de orreção de PCR. Apesar de apresentar maior omplexidade omputa ional, o seu desempenho superior fa ilita o pro esso de sin ronização, exe utado pelo re eptor, o que o torna bastante adequado a sistemas que exigem bases de tempo pre isas. As metodologias propostas são utilizadas em onjunto, propor ionando um esquema integrado e e iente para o pro essamento de uxos de transporte MPEG-2. Correção de PCR TV Digital MPEG-2 Multiplexação de Sinais Fluxos Elementares Empa otados - PES ENGENHARIAS: ENGENHARIA ELÉTRICA
248	Efficient content distribution in IPTV environments Galijasevic, Mirza, Liedgren, Carl January 2008 (has links) Existing VoD solutions often rely on unicast to distribute content, which leads to a higher load on the VoD server as more nodes become interested in the content. In such case, P2P is an alternative way of distributing content since it makes better use of available resources in the network. In this report, several P2P structures are evaluated from an operators point of view. We believe BitTorrent is the most adequate protocol for a P2P solution in IPTV environments. Two BitTorrent clients have been implemented on an IP-STB as proof of concept to find out whether P2P is suited for IPTV environments. Several tests were conducted to evaluate the performance of both clients and to see if they were able to reach a sufficient throughput on the IP-STB. Based upon the tests and the overall impressions, we are convinced that this particular P2P protocol is well suited for IPTV environments. Hopefully, a client developed from scratch for the IP-STB will offer even greater characteristics. Further, we have studied how to share recorded content among IP-STBs. Such a design would probably have many similarities to BitTorrent since a central node needs to keep track of content; the IP-STBs take care of the rest. The report also brings up whether BitTorrent is suitable for streaming. We believe that the necessary changes required to obtain such functionality will disrupt the strengths of BitTorrent. Some alternative solutions are presented where BitTorrent has been extended with additional modules, such as a server. IPTV IP-STB P2P MPEG BitTorrent Network coding Other Computer and Information Science Annan data- och informationsvetenskap
249	Scalable Services over DAB and DVB-T from a Receiver Point of View Almgren, Hanna, Vestin, Johanna January 2002 (has links) TV and radio services have always been distributed over analogue broadcasting networks and been received on a TV -set or a radio receiver. Today this situation is changing due to digitalization and convergence between broadcasting, telecommunications and data communications. Other terminals, such as a PC, can also receive TV and radio services. Digital TV and radio can offer additional services such as e-commerce, electronic program guides and content synchronized to the TV and radio shows. If these services are to be received by several receiving terminals with different properties, the services must be adapted to the terminals. This can be done by scaling the services, meaning that the appearances and functionality of the services vary depending on the terminals’ properties. In this thesis scalable services are examined from a terminal point of view. Present and future receivers, platforms and possible methods to achieve scalability are presented, and their effects on scalable services are discussed. / TV- och radiosändningar har fram till nyligen endast distribuerats över analoga TV- och radionät och tagits emot av traditionella TV- och radioapparater, men detta håller på att ändras i och med att sändningarna digitaliseras och konvergens sker mellan broadcasting, telekom och datakom. Nu kan även andra terminaler fungera som mottagare, t.ex. en PC med ett digital-TVkort eller ett digital-radiokort. Digital TV och radio erbjuder tilläggstjänster som t.ex. ehandel, tjänster kopplade till radio- eller TV-program och elektroniska programguider. Om samma tjänst ska kunna tas emot på flera olika mottagarterminaler med olika egenskaper, måste tjänsten anpassas efter terminalerna. Detta kan göras genom att skala tjänsten, dvs. utseendet och funktionerna varierar beroende på bl.a. terminalens kapacitet. I detta arbete har terminalaspekterna på skalbara tjänster undersökts. Aktuella och framtida terminaler, plattformar och eventuella skalbarhetslösningar presenteras, och deras påverkan på skalbara tjänster diskuteras. Datorteknik DAB DVB-T konvergens skalbarhet Java API MPEG Datorteknik Computer Engineering Datorteknik
250	Indexation et recherche de contenus par objet visuel / Object-based visual content indexing and retrieval Bursuc, Andrei 21 December 2012 (has links) La question de recherche des objets vidéo basés sur le contenu lui-même, est de plus en plus difficile et devient un élément obligatoire pour les moteurs de recherche vidéo. Cette thèse présente un cadre pour la recherche des objets vidéo définis par l'utilisateur et apporte deux grandes contributions. La première contribution, intitulée DOOR (Dynamic Object Oriented Retrieval), est un cadre méthodologique pour la recherche et récupération des instances d'objets vidéo sélectionnés par un utilisateur, tandis que la seconde contribution concerne le support offert pour la recherche des vidéos, à savoir la navigation dans les vidéo, le système de récupération de vidéos et l'interface avec son architecture sous-jacente.Dans le cadre DOOR, l’objet comporte une représentation hybride obtenues par une sur-segmentation des images, consolidé avec la construction des graphs d’adjacence et avec l’agrégation des points d'intérêt. L'identification des instances d'objets à travers plusieurs vidéos est formulée comme un problème d’optimisation de l'énergie qui peut approximer un tache NP-difficile. Les objets candidats sont des sous-graphes qui rendent une énergie optimale vers la requête définie par l'utilisateur. Quatre stratégies d'optimisation sont proposées: Greedy, Greedy relâché, recuit simulé et GraphCut. La représentation de l'objet est encore améliorée par l'agrégation des points d'intérêt dans la représentation hybride, où la mesure de similarité repose sur une technique spectrale intégrant plusieurs types des descripteurs. Le cadre DOOR est capable de s’adapter à des archives vidéo a grande échelle grâce à l'utilisation de représentation sac-de-mots, enrichi avec un algorithme de définition et d’expansion de la requête basée sur une approche multimodale, texte, image et vidéo. Les techniques proposées sont évaluées sur plusieurs corpora de test TRECVID et qui prouvent leur efficacité.La deuxième contribution, OVIDIUS (On-line VIDeo Indexing Universal System) est une plate-forme en ligne pour la navigation et récupération des vidéos, intégrant le cadre DOOR. Les contributions de cette plat-forme portent sur le support assuré aux utilisateurs pour la recherche vidéo - navigation et récupération des vidéos, interface graphique. La plate-forme OVIDIUS dispose des fonctionnalités de navigation hiérarchique qui exploite la norme MPEG-7 pour la description structurelle du contenu vidéo. L'avantage majeur de l'architecture propose c’est sa structure modulaire qui permet de déployer le système sur terminaux différents (fixes et mobiles), indépendamment des systèmes d'exploitation impliqués. Le choix des technologies employées pour chacun des modules composant de la plate-forme est argumentée par rapport aux d'autres options technologiques. / With the ever increasing amount of available video content on video repositories the issue of content-based video objects retrieval is growing in difficulty and becomes a mandatory feature for video search engines.The present thesis advances a user defined video object retrieval framework and brings two major contributions. The first contribution is a methodological framework for user selected video object instances retrieval, entitled DOOR (Dynamic Object Oriented Retrieval), while the second one concerns the support offered for video retrieval, namely the video navigation and retrieval system and interface and its underlying architecture.Under the DOOR framework, the user defined video object comports a hybrid representation obtained by over-segmenting the frames, constructing region adjacency graphs and aggregating interest points. The identification of object instances across multiple videos is formulated as an energy optimization problem approximating an NP-hard problem. Object candidates are sub-graphs that yield an optimum energy towards the user defined query. In order to obtain the optimum energy four optimization strategies are proposed: Greedy, Relaxed Greedy, Simulated Annealing and GraphCut. The region-based object representation is further improved by the aggregation of interest points into a hybrid object representation. The similarity between an object and a frame is achieved with the help of a spectral matching technique integrating both colorimetric and interest points descriptors.The DOOR framework is suitable to large scale video archives through the use of a Bag-of-Words representation enriched with a query definition and expansion mechanism based on a multi-modal, text-image-video principle.The performances of the proposed techniques are evaluated on multiple TRECVID video datasets prooving their effectiveness.The second contribution is related to the user support for video retrieval - video navigation, video retrieval, graphical interface - and consists in the OVIDIUS (On-line VIDeo Indexing Universal System) on-line video browsing and retrieval platform. The OVIDIUS platform features hierarchical video navigation functionalities that exploit the MPEG-7 approach for structural description of video content. The DOOR framework is integrated in the OVIDIUS platform, ensuring the search functionalities of the system. The major advantage of the proposed system concerns its modular architecture which makes it possible to deploy the system on various terminals (both fixed and mobile), independently of the exploitation systems involved. The choice of the technologies employed for each composing module of the platform is argumented in comparison with other technological options. Finally different scenarios and use cases for the OVIDIUS platform are presented. Indexation basée sur le contenu Récupération d'objets Services web Contenu multimédia Mpeg-7 Descripteurs locaux Indexation multimédia Représentation d'objet Minimization d'énergie Greedy Recuit simulé MPEG-7 GraphCut Sac de mots Extension de requête Appariement de graphes Recherche multimodale TRECVID Plateforme d'indexation multimédia Navigation de vidéos HTML5 Accès multi-terminal Content-based indexing Object retrieval Web services Multimedia content Mpeg-7 Local descriptors Greedy MPEG-7 GraphCut TRECVID HTML5

Search results