Spelling suggestions: "subject:"vídeo."" "subject:"ídeo.""
191 |
Proposta da métrica eVSQM para avaliação de QoE no serviço de streaming de vídeo sobre TCP. / The proposed eVSQM metric for assessing QoE in video streaming over TCP.Zegarra Rodríguez, Demóstenes 12 December 2013 (has links)
Atualmente existem inúmeros serviços multimídia que são transportados através da rede IP, dos quais, o tráfego dos serviços de vídeo experimentou um maior crescimento nos últimos anos. O sucesso de aplicações de streaming de vídeo é um dos fatores pelo qual, este tráfego se incrementou. Alguns recentes estudos projetam que este tipo de serviços no ano 2016, alcançará aproximadamente o 55% do tráfego total da Internet. Considerando a importância que os serviços de vídeo alcançarão nos próximos anos, este trabalho foca-se na avaliação da qualidade de experiência (QoE) dos usuários ao utilizar estes serviços. Assim, nesta tese é proposta uma métrica de avaliação de vídeo denominada eVsQM, do inglês enhanced Video streaming Quality Metric, a qual é baseada principalmente no número, duração e localização temporal dos congelamentos de imagens (pausas) durante uma transmissão de vídeo, considerando também o tipo de conteúdo do vídeo transmitido. Esta métrica foi determinada a partir de um modelo matemático que utilizou os resultados de testes subjetivos de avaliação de vídeo, pois, este tipo de testes são os que melhor se aproximam da QoE real do usuário. Cabe destacar, que na realização dos testes subjetivos foi utilizada uma metodologia concordante com o tipo de degradação que o vídeo possui, ou seja, a pausa. No streaming de vídeo novas soluções são criadas com a finalidade de melhorar a QoE do usuário. O DASH, do inglês Dynamic Adaptive Streaming over HTTP, muda a resolução do vídeo transmitido de acordo com as características da rede. Porém, se a rede é muito flutuante existirão muitas variações de resolução e a QoE do usuário será degradada. Neste trabalho é proposto um parâmetro a ser utilizado no algoritmo DASH que funciona como um limiar para controlar a frequência destas comutações de resolução. Este parâmetro é denominado como SDF (do inglês Switching Degradation Factor) e permite que a QoE mantida em níveis aceitáveis, inclusive em situações onde a rede é muito flutuante. Adicionalmente, neste trabalho é proposto um novo modelo de faturamento nos serviços de telecomunicações, que inclua no processo de tarifação um parâmetro relacionado com a QoE, visando ter uma tarifação de serviços de comunicações mais justa do ponto de vista dos usuários. Desta forma, usuários que recebem uma menor qualidade no serviço devem pagar menos em relação aos usuários que recebem uma melhor qualidade do mesmo serviço. / Nowadays, there are several multimedia services, which are carried via IP networks. From these all services; the traffic regarding video applications had the greatest growth in the last years. The success of video streaming applications is one of the major contributors to video traffic growth. Some recent studies project that video services, will reach approximately 55% of the total Internet traffic in 2016. Considering the relevance that video services will achieve in the coming years, this work focuses on the users Quality of Experience (QoE) when using these services. Thus, this thesis proposes an evaluation metric named enhanced Video streaming Quality Metric (eVsQM), which is based primarily on the number, duration and temporal location of the image freezes (pauses) during a video transmission. Also, this metric considers the video content type and was determined from a mathematical model that used as inputs, the video quality assessment results from subjective tests due, these types of test are the most correlated with real users QoE. It is worth noting that to perform these subjective tests was used a methodology consistent with the kind of video degradation (pause). For another hand, new video streaming solutions are created for the purpose of improving the users QoE of the user. Dynamic Adaptive Streaming over HTTP (DASH) changes the video resolution according to the network characteristics. However, if the network is very fluctuant, many video resolution switching events will be performed and users QoE will be degraded. This thesis proposes a parameter to be used in DASH algorithms that works as a threshold to control the resolution switching frequency. This parameter is named Switching Degradation Factor (SDF) and is responsible to maintain the QoE in acceptable levels, inclusive in scenarios in which the network capacity is very fluctuating.
|
192 |
A produção audiovisual como mediação na prática científica / Video-Recording production as a mediation in scientific practice.Gonçalves, Denise Ramos 25 November 2013 (has links)
De março de 2010 a dezembro de 2012, o Observatório de Comunicação, Liberdade de Expressão e Censura (OBCOM) da Universidade de São Paulo (USP) desenvolveu a pesquisa Opinião Pública e Censura no Mundo Contemporâneo. Para abarcar a complexidade e a diversidade de pontos de vista, diferentes instrumentos de investigação foram empregados, dentre eles, a produção de vídeo-entrevistas. Consideramos relevante avivar o debate a incorporação da linguagem audiovisual ao trabalho de pesquisa empírica no âmbito das Ciências Humanas e Sociais tanto para ressaltar quanto justificar possibilidades renovadas de postura, abordagem, interação e divulgação de nossa produção científica. O processo desta proposta audiovisual em seus aspectos epistemológicos, teóricos e técnicos foi o objeto deste trabalho. Partindo da experiência de produção, a metodologia que adotamos converge com experiências contemporâneas da Antropologia, Ciências Sociais, Cinema e Documentário. Sendo assim, a construção da pesquisa colocou em relevo as questões: a) O debate sobre a incorporação das imagens ao trabalho científico e a validade de uma metodologia na pesquisa empírica com audiovisual; b) O questionamento do uso de mídias a partir das Ciências da Comunicação; c) Como o audiovisual foi incorporado em uma pesquisa sobre Opinião Pública e suas possibilidades de análises; d) As renovadas posturas de abordagem, interação e divulgação da produção científica contemporânea. / From March 2010 to December 2012, the Universitys of São Paulo Observatório de Comunicação, Liberdade de Expressão e Censura (OBCOM), developed the research Public Opinion and Censorship in Contemporary World (Opinião Pública e Censura no Mundo Contemporâneo). To arrest the complexity and the diversity of different points of view, multiple investigations apparatus were used, such as the video-recording production. We considered relevant, to enliven the debate, the implantation of audiovisual language in the empiric research work inside Humanities studies. This would justify the renewed possibilities of stance, approach, interaction and disclosing of scientific production and also, would highlight them. The process of this audiovisual proposal in its epistemological, technical and theoretical aspects is the object of this paper. Based on the production experience, we adopt a methodology that converges with contemporary experiences in Anthropology, Social Sciences, Cinema and Documentary. In light of this evidence, the main questions that the research points at are: a-) the debate about the images incorporation in scientific work and the validation of a methodology in empiric research with audiovisual resources; b-) the questioning of media uses in Communication Sciences; c-) how audiovisual resources were used in a research about public opinion and how we can analyze them; d-) the renewed stances of approach, interaction and divulgation of contemporary scientific production.
|
193 |
Object tracking from compressed video using Kalman Filter and a novel spatiotemporal motion-vector filter.Ronaldo Carvalho Moura Júnior 25 October 2010 (has links)
Video Object Tracking plays a crucial role on several Computer Vision applications, such as Video Surveillance, Intelligent Transportation System (ITS), Human Machine Interface (HMI), Video Indexing and Shopping Behavior Analysis. Nevertheless, the processing power demanded by object tracking techniques still consists in a bottleneck to their wider adoption. To reduce this computational power demand, some techniques that extract object motion information from compressed video domain, instead of the raw video, have been developed. This work addresses the problem of efficiently tracking objects from compressed video. The focus is on algorithms that track objects using motion estimation informationfrom MPEG-2 and MPEG-4 family of video compressors. Two complementary solutions are presented. At first, a novel Spatiotemporal Motion-Vector Consistency Filter is proposed and evaluated. The filter is applied on the initial stage of tracking algorithm and significantly reduces the noisy motion vectors which do not represent a real object movement. Then, a Kalman Filter is used to provide improved estimations of objects position and size. A novel model for Kalman Filter application on the context of motion-vector based object tracking is proposed and evaluated, with determination of measures and noise patterns. Qualitative and quantitative experiments, with standard metrics, are performed displaying that the proposed Spatiotemporal Filter outperforms the currently widely used Vector Median Filter. The results obtained with the Spatiotemporal Filter make it suitable as a first step of any system that aims to detect and track objects from compressed video using its motion vectors. Both filters are jointly used in a complete object tracker system denominated moveTRAKS - motion-vector based object Tracker with Kalman filter and Spatiotemporal filter. The moveTRAKS is also qualitative and quantitative tested, demonstrating its efficiency and limitations for compressed video object tracking.
|
194 |
Compressão de vídeo com estimação global de movimento baseado no padrão H.264.Paulo Henrique Fonseca Torres Soares 27 October 2014 (has links)
A compressão de vídeos é amplamente utilizada em Blu-rays, por fontes de streaming de vídeos na internet e também por vários serviços de transmissão de HDTV. É um processo onde se reduz a quantidade de dados necessários para representar um stream de vídeo, com a restrição de possuir uma qualidade mínima aceitável. Obviamente, esta qualidade mínima dependerá da aplicação, que pode ser um vídeo conferência ou uma transmissão de HDTV, por exemplo. A maioria dos padrões de compressão de vídeo como o H.264/AVC possui um codificador de alta complexidade e um decodificador de baixa complexidade, mas em aplicações de Veículos Aéreos Não Tripulados (VANT) geralmente o hardware embarcado apresenta capacidade de processamento inferior. Em geral, quando estes VANTs são capazes de comprimir vídeos, a mídia resultante apresenta qualidade reduzida. Com base nos conceitos propostos por Bhaskaranand e Gibson, esta dissertação apresenta um algoritmo de estimação de movimento que pode ser implementado diretamente em qualquer codificador H.264 para produzir vídeos decodificáveis por qualquer decodificador deste padrão. Como resultado, obtém-se uma redução significativa na complexidade da codificação do padrão e um pequeno aumento na taxa de bits.
|
195 |
Corpo-imagemBarata, Danillo Silva 12 December 2012 (has links)
Made available in DSpace on 2016-04-26T18:12:42Z (GMT). No. of bitstreams: 1
Danillo Silva Barata.pdf: 3872077 bytes, checksum: 51b21bbc810c8d172a0a4c316751c0ce (MD5)
Previous issue date: 2012-12-12 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The research aims to analyze the discursive modes, procedures influenced by production conditions , interpreting conditions and speech conditions, on the relationship between the body and the videographic expression. This way we will discuss a path built by poetics of the body, using as languages video, performance, and video installations. Motivated by this trend, we seek a broadening of these concepts and of artistic means of expression to conduct a survey on media analysis. The following questions guide our program of research and study: 1. The relationship between poetics and politics of the bodies; 2. The dialogue between body and camera; 3. Electronic art as preferred field to enhance the body's speech; 4. The "on screen" search of an episteme of the body. The corpus consists of a set of videos of the Brazilian video artists from Bahia, Ayrson Heráclito, Marcondes Dourado and Danillo Barata, produced between 1980 and 2010, who have as poetics the icons of religious syncretism, mass culture and the myth of baianidade (Bahia´s way of being). The methodology used in this research is based on dialectical contact between researcher and research content within an approach of analysis and synthesis, having as procedure the experimental method combined with the experimental search of cultural signs and symbols similar to the content of research and means of artistic expression. The interaction of the researcher with the techniques dealt with and the language of expression should occur both in the sense of theoretical study as well as aiming intersubjectivity, when trying a reappraisal of concepts and means of artistic expression in a contemporary look. The constant work with bibliographic sources and iconographic research sources will allow the confrontation with the limits of the new interactive environment between body and media art. This way, our theoretical framework is based on the theory of the case, especially on the contributions of Arlindo Machado, Philippe Dubois and Edgar Morin, Social History and geography in Katia de Queiroz Mattoso, Milton Santos and Antonio Risério, studies of art body in Battcock, Henri Pierre Jeudy, Renato Cohen, Richard Schechner, Jorge Glusberg, anthropology, cultural studies and history and sociology of art. The very definition of our field in the area of object creation and experimentation of art and technology makes us cross methodological procedures of language and narrative and also research of technical processes / A pesquisa visa a analisar os modos discursivos, procedimentos influenciados
por condições de produção, condições de interpretação e condições do discurso,
na relação entre o corpo e a expressão videográfica. Dessa maneira,
abordaremos trabalhos desenvolvidos que apontam para um caminho construído
pela poética do corpo, utilizando como linguagens o vídeo, a performance e as
videoinstalações. Motivados por esta tendência, buscamos uma ampliação
desses conceitos e dos meios artísticos de expressão para a realização de uma
pesquisa em análise das mídias. As seguintes questões norteiam nosso
programa de pesquisa e estudo: 1. A relação entre poéticas e políticas dos
corpos; 2. O diálogo entre o corpo e a câmera; 3. A arte eletrônica como campo
preferencial para potencializar o discurso do corpo; 4. A busca na tela de uma
episteme do corpo. O corpus é constituído por um conjunto de vídeos dos
videoartistas baianos Ayrson Heráclito, Marcondes Dourado e Danillo Barata,
produzidos entre a década de 1980 e 2010, que tem como poética os ícones do
sincretismo religioso, a cultura de massa e o mito de baianidade. A metodologia
utilizada nesta pesquisa baseia-se no contato dialético entre pesquisador e
conteúdos de pesquisa, dentro de uma abordagem de análise e síntese, tendo
como procedimento o método experimental aliado à busca de símbolos e signos
culturais análogos ao conteúdo da pesquisa e aos meios de expressão artística.
A interação do pesquisador com as técnicas trabalhadas e as linguagens de
expressão deverá ocorrer tanto no sentido de estudo teórico, como também
visando à intersubjetividade, ao pretender uma reavaliação dos conceitos e dos
meios de expressão artística sob um olhar contemporâneo. O trabalho constante
com as fontes bibliográficas e de pesquisa iconográfica permitirá o confronto
com os limites do novo ambiente interativo, entre o corpo e a artemídia. Dessa
maneira, nosso aporte teórico tem como base a teoria do processo, sobretudo,
nas contribuições de Arlindo Machado, Philippe Dubois e Edgar Morin, da
História Social e da geografia em Katia de Queirós Mattoso, Milton Santos e
Antônio Risério, dos estudos da arte do corpo em Battcock, Henri Pierre Jeudy,
Renato Cohen, Richard Schechner, Jorge Glusberg, da antropologia, dos
estudos culturais e de uma história e sociologia da arte. O próprio campo de
definição do nosso objeto na área da criação e experimentação da arte e da
tecnologia nos faz cruzar metodologicamente procedimentos da linguagem e da
narrativa e também da investigação dos processos técnicos
|
196 |
Eu já me tornei imagem : a relação do vídeo e a fotografia com o xamanismo, canibalismo e feitiçariaDAMAS, Vandimar Marques 23 February 2011 (has links)
Made available in DSpace on 2014-07-29T16:27:51Z (GMT). No. of bitstreams: 1
Dissertacao Vandimar Marques Damas.pdf: 1363068 bytes, checksum: abb34855f1640790d53b08c5f555ebd6 (MD5)
Previous issue date: 2011-02-23 / This work is an ethnography of indigenous intercultural degree of UFG, a course which aims to provide higher education for indigenous teachers and teachers already working as such in their villages. Its main focus was to produce a video and a series of photographs in conjunction with indigenous teachers,and from this experience relate ethnographic video with shamanism, witchcraft and cannibalism. To discuss this relationship I insert here two basic concepts that still need development, which are shamanism imagery and cannibal ism imagery, these have been buil twith thread as information obtained during my field work and some ethnographies conducted by other researchers-along-the indigenous peoples who are in Brazil. My main theoret ical references are visual anthropology,theories and concepts of documentary filmmaking,as well as some concepts of ethnology as the Amerindian perspectivism. / Este trabalho é uma etnografia da licenciatura intercultural
indígena da UFG, curso que visa fornecer uma formação superior aos professores e professoras indígenas que já atuam como tais em suas aldeias. O seu principal foco foi a produção de um vídeo e uma série de fotografias em conjunto com professores indígenas, e a partir dessa experiência relaciono o vídeo etnográfico com o xamanismo, canibalismo e feitiçaria. Para discutir essa relação insiro aqui dois conceitos básicos, que ainda carecem de desenvolvimento, que são xamanismo imagético e canibalismo imagético, estes foram construídos tendo como fio condutor as informações colhidas durante o meu trabalho de campo e algumas etnografias realizadas - por outros pesquisadores - junto a povos indígenas que estão no Brasil . As minhas principais referências teóricas são a antropologia visual, as teorias e conceitos do cinema documentário, bem como alguns conceitos da etnologia indígena como o perspectivismo ameríndio.
|
197 |
Proposta da métrica eVSQM para avaliação de QoE no serviço de streaming de vídeo sobre TCP. / The proposed eVSQM metric for assessing QoE in video streaming over TCP.Demóstenes Zegarra Rodríguez 12 December 2013 (has links)
Atualmente existem inúmeros serviços multimídia que são transportados através da rede IP, dos quais, o tráfego dos serviços de vídeo experimentou um maior crescimento nos últimos anos. O sucesso de aplicações de streaming de vídeo é um dos fatores pelo qual, este tráfego se incrementou. Alguns recentes estudos projetam que este tipo de serviços no ano 2016, alcançará aproximadamente o 55% do tráfego total da Internet. Considerando a importância que os serviços de vídeo alcançarão nos próximos anos, este trabalho foca-se na avaliação da qualidade de experiência (QoE) dos usuários ao utilizar estes serviços. Assim, nesta tese é proposta uma métrica de avaliação de vídeo denominada eVsQM, do inglês enhanced Video streaming Quality Metric, a qual é baseada principalmente no número, duração e localização temporal dos congelamentos de imagens (pausas) durante uma transmissão de vídeo, considerando também o tipo de conteúdo do vídeo transmitido. Esta métrica foi determinada a partir de um modelo matemático que utilizou os resultados de testes subjetivos de avaliação de vídeo, pois, este tipo de testes são os que melhor se aproximam da QoE real do usuário. Cabe destacar, que na realização dos testes subjetivos foi utilizada uma metodologia concordante com o tipo de degradação que o vídeo possui, ou seja, a pausa. No streaming de vídeo novas soluções são criadas com a finalidade de melhorar a QoE do usuário. O DASH, do inglês Dynamic Adaptive Streaming over HTTP, muda a resolução do vídeo transmitido de acordo com as características da rede. Porém, se a rede é muito flutuante existirão muitas variações de resolução e a QoE do usuário será degradada. Neste trabalho é proposto um parâmetro a ser utilizado no algoritmo DASH que funciona como um limiar para controlar a frequência destas comutações de resolução. Este parâmetro é denominado como SDF (do inglês Switching Degradation Factor) e permite que a QoE mantida em níveis aceitáveis, inclusive em situações onde a rede é muito flutuante. Adicionalmente, neste trabalho é proposto um novo modelo de faturamento nos serviços de telecomunicações, que inclua no processo de tarifação um parâmetro relacionado com a QoE, visando ter uma tarifação de serviços de comunicações mais justa do ponto de vista dos usuários. Desta forma, usuários que recebem uma menor qualidade no serviço devem pagar menos em relação aos usuários que recebem uma melhor qualidade do mesmo serviço. / Nowadays, there are several multimedia services, which are carried via IP networks. From these all services; the traffic regarding video applications had the greatest growth in the last years. The success of video streaming applications is one of the major contributors to video traffic growth. Some recent studies project that video services, will reach approximately 55% of the total Internet traffic in 2016. Considering the relevance that video services will achieve in the coming years, this work focuses on the users Quality of Experience (QoE) when using these services. Thus, this thesis proposes an evaluation metric named enhanced Video streaming Quality Metric (eVsQM), which is based primarily on the number, duration and temporal location of the image freezes (pauses) during a video transmission. Also, this metric considers the video content type and was determined from a mathematical model that used as inputs, the video quality assessment results from subjective tests due, these types of test are the most correlated with real users QoE. It is worth noting that to perform these subjective tests was used a methodology consistent with the kind of video degradation (pause). For another hand, new video streaming solutions are created for the purpose of improving the users QoE of the user. Dynamic Adaptive Streaming over HTTP (DASH) changes the video resolution according to the network characteristics. However, if the network is very fluctuant, many video resolution switching events will be performed and users QoE will be degraded. This thesis proposes a parameter to be used in DASH algorithms that works as a threshold to control the resolution switching frequency. This parameter is named Switching Degradation Factor (SDF) and is responsible to maintain the QoE in acceptable levels, inclusive in scenarios in which the network capacity is very fluctuating.
|
198 |
Avaliação objetiva e subjetiva de qualidade de vídeo via rede IP com variação de atraso. / Objective and subjective assessment of video quality over IP network with packet delay variation.Dante Coaquira Begazo 04 October 2012 (has links)
Atualmente existe uma grande variedade de serviços de telecomunicações focados na transmissão de voz, vídeo e dados através de redes complexas, embora, em muitos casos, o usuário final não seja atendido com um nível de qualidade aceitável. Neste trabalho, se avalia como o serviço de streaming de vídeo em uma rede com protocolo Internet (IP) pode ser afetado por uma condição adversa da rede, tal como a variação de atraso (jitter). São mostrados os resultados de avaliações objetivas e subjetivas de streaming de vídeo que indicam que a qualidade de vídeo é diretamente afetada por fatores de degradação da rede IP como a variação de atraso de pacotes. Além disso, se verifica que cenas de maior movimento também são mais afetadas pela variação de atraso. Para a realização dos testes, utiliza-se um cenário de emulação de rede isolado, no qual são parametrizadas diferentes condições de rede. Assim, no canal de transmissão são configurados diversos valores de variação de atraso, obtendo-se uma Base de Dados de vídeos com diferentes graus de degradação de qualidade. Estes vídeos são avaliados utilizando métodos subjetivos: Índice por Categorias Absolutas (ACR - Absolute Category Rating) e Índice por Categorias de Degradação (DCR - Degradation Category Rating) e métricas objetivas: Relação Sinal-Ruído de Pico (PSNR - Peak Signal to Noise Ratio), Índice de Similaridade Estrutural (SSIM - Structural Similarity Index) e Medição de Qualidade de Vídeo (VQM - Video Quality Metric). Com a finalidade de mostrar o desempenho das métricas objetivas em relação às subjetivas são empregados os coeficientes de correlação, além do erro de predição e quadrático médio. Adicionalmente, é importante destacar que a partir dos resultados obtidos são estabelecidos intervalos de valores de variação de atraso para os quais a qualidade do vídeo é considerada aceitável ou não para o usuário final. Finalmente, obtém-se uma Base de Dados de vídeos com diferentes graus de degradação da qualidade e que pode ser utilizada em futuras pesquisas. / Nowadays, there is a wide range of telecommunications services focused on the transmission of voice, video and data across complex networks, although, in many cases, the end user is not satisfied with an acceptable quality level. In this work it is assessed how the video streaming service over an IP network can be affected by adverse conditions on the network, such as packet delay variation (jitter). Results from objective and subjective video streaming assessments are shown and indicate that the video quality is directly affected by IP network degradation factors such as packet delay variation. Beyond that, it is also verified that scenes with great movement content are also more sensitive to packet delay variation. For experimental tests, a network emulation totally isolated is considered, for which different network conditions are parameterized. Then, to the transmission channel, different values of packet delay variation are configured and videos are assessed, using subjective metrics: Absolute Category Rating (ACR) and Degradation Category Rating (DCR), and objective metrics: Peak Signal to Noise Ratio (PSNR), Structural Similarity (SSIM) and Video Quality Metric (VQM). In order to show the performance of objective metrics in relation to subjective ones correlation coefficients are employed as well as the prediction error and the mean square error. Finally, it is important to note that, from the results obtained, it can be established a range of delay variation values in which the video quality is acceptable or not at the end user. Additionally, a Video Data Base is obtained with different degrees of quality degradation and which can be used for future researches.
|
199 |
Joint source video coding : joint rate control for H.264/AVC video codingTeixeira, Luís Miguel Lopes January 2012 (has links)
Tese de doutoramento. Engenharia Electrotécnica e de Computadores. Faculdade de Engenharia. Universidade do Porto. 2012
|
200 |
Metadados em multimidia : aplicações e conceitos em MPEG-7 / Multimidia metadata concepts and applications in MPEG-7Ferreira, Luis Andre Villanueva da Costa 16 March 2007 (has links)
Orientador: Luiz Cesar Martini / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-08-08T14:42:59Z (GMT). No. of bitstreams: 1
Ferreira_LuisAndreVillanuevadaCosta_M.pdf: 1477572 bytes, checksum: 5c37464c03f469380fb804cf8249299a (MD5)
Previous issue date: 2007 / Resumo: Neste trabalho, uma pesquisa foi realizada com o objetivo de apresentar os metadados (ou dados sobre dados) e especificamente metadados em multimídia com o padrão MPEG-7 como sendo a base. Inicialmente, a teoria envolvendo os metadados em geral e metadados em multimídia em particular são apresentadas, com o propósito de preparar o leitor para suas aplicações, especialmente em vista da explosão de mídia estar sendo atualmente disponibilizada online. O usuário deve ser capaz de localizar a mídia que necessita de forma eficiente dentre esse mar de informação, e esse é o principal objetivo dos metadados. Com isso em mente, o MPEG-7 foi desenvolvido pela ISO (International Organization for Standardization ou Organização Internacional para Padronização). O MPEG-7 é padrão aberto baseado no formato XML (Extensible Markup Language ou Linguagem de Marcação Extensível) que permite que aperfeiçoamentos sejam desenvolvidos continuamente, o que é muito útil considerando o fluxo de novas mídias sendo disponibilizadas aos usuários diariamente. Este trabalho portanto apresenta os dois tipos de semânticas para metadados em multimídia, de baixo e alto nível. As semânticas de baixo nível incluem informações concretas sobre uma mídia como cores, contraste, pixels, etc. Por outro lado, as semânticas de alto nível são mais abstratas, e levam em consideração o que de fato está sendo exibido pela mídia, como pedras, arvores, pessoas, rios, etc. O intervalo semântico entre esses dois tipos de metadados apresenta um grande problema para a programação de metas. O principal objetivo deste trabalho é demonstrar como, utilizando a aplicação IBM VideoAnnex desenvolvida baseada no padrão MPEG-7, metadados em multimídia de baixo e alto nível semântico podem ser criados e anexados a um arquivo de vídeo em MPEG-2. A maior parte do processo de anexação é realizada diretamente utilizando a aplicação VideoAnnex como será mostrado, mas diversos metadados de alto nível devem ser inseridos diretamente no arquivo XML. Como as aplicações de metadados em multimídia são tão vastas quanto a mídia que eles representam, este trabalho apresentará primeiro uma abordagem mais geral para uso com um filme qualquer, e obviamente muito menos completa, e em seguida uma abordagem mais específica utilizando como objetivo uma partida de futebol. Estudos na área de metadados em multimídia ainda estão na fase inicial, então este trabalho não apresenta uma abordagem final, mas sim uma nova opção no uso de metadados em multimídia, especialmente importantes quando se considera a atual difusão da Internet e TV Digital / Abstract: In this work, a research was made in order to present Metadata (or data about data) and specifically Multimedia Metadata applications with the MPEG-7 standard as the basis. At first, the theory concerning Metadata in general and Multimedia Metadata in particular is presented, with the purpose to prepare the reader for its uses, specially with the current explosion of Media being made available online. The user must be able to locate the media he requires amongst this sea of information, and that is the Metadata main objective. With that in mind, MPEG-7 was developed by ISO (International Organization for Standardization). MPEG-7 is an open standard based on a XML (Extensible Markup Language) format that allows for improvements to be made continuously, which is very helpful considering new media is being made available to users every day. This work then presents the two types of Multimedia Metadata semantics, low level and high level. The low level semantics include concrete information about a movie or image like color, contrast, pixels, etc. On the other hand, high-level semantics take a more abstract approach, and take into consideration what is actually on a scene or image like rocks, sky, trees, actions, etc. The Semantic Gap between these two Metadata types presents a problem for most Metadata programming. This work?s main objective is to present how, using the IBM Videoannex application, developed based on the MPEG-7 standard, Multimedia Metadata of both low and high level semantics can be annexed to a MPEG-2 video file. Most of the annexation process can be made directly through the Videoannex application as will be shown, but several high level Metadata need to be inserted directly into the XML file. Since Multimedia Metadata uses are as vast as the media they represent, this work will present first an approach more general to any movie, but obviously much less complete and then a more focused approach, using a soccer match as target. Multimedia Metadata studies are still in the beginning stage, so this work doesn?t present an end approach, but more of a different option to the use of Multimedia Metadata, specially important with the current spread of the Internet and Digital TV / Mestrado / Telecomunicações e Telemática / Mestre em Engenharia Elétrica
|
Page generated in 0.0349 seconds