Kvalita služeb a kvalita zážitku pro sítě nové generace / Quality of services and experience qualify for next generation networks

Vaněk, Jiří January 2018 (has links)
The thesis sums up the traffic parameters for the evaluation of next-generation access networks. There are mentioned parameters for service quality management and parameters for measuring the quality of experience. The EU regulation on High Speed Internet in the Czech Republic is analyzed. The practical part compares the results between the implementation of the quality management of services and without implementation. Also there is comparing theoretical and practical transmission rates of physical ports. Part of the thesis is a questionnaire focused on the quality of experience of the video sequence.

Évaluer l'apport du binaural dans une application mobile audiovisuelle / Assessing the quality of experience of audiovisual services in a context of mobility : contribution of sound immersion

Moreira, Julian 10 July 2019 (has links)
Les terminaux mobiles offrent à ce jour des performances de plus en plus élevées (CPU, résolution de l’écran, capteurs optiques, etc.) Cela rehausse la qualité vidéo des services média, que ce soit pour le visionnage de contenu vidéo (streaming, TV, etc.) ou pour des applications interactives telles que le jeu vidéo. Mais cette évolution concernant l'image n'est pas ou peu suivie par l'intégration de systèmes de restitution audio de haute qualité dans ce type de terminal. Or, parallèlement à ces évolutions concernant l'image, des solutions de son spatialisé sur casque, à travers notamment la technique de restitution binaurale basée sur l'utilisation de filtres HRTF (Head Related Transfer Functions) voient le jour.Dans ce travail de thèse, nous nous proposons d’évaluer l’intérêt que peut présenter le son binaural lorsqu'il est utilisé sur une application mobile audiovisuelle. Une partie de notre travail a consisté à déterminer les différents sens que l’on pouvait donner au terme « application mobile audiovisuelle » et parmi ces sens ceux qui d’une part étaient pertinents et d’autre part pouvaient donner lieu à une évaluation comparative avec ou sans son binaural.Le couplage entre son binaural et visuel sur mobile occasionne en premier lieu une question d’ordre perceptive : comment peut-on organiser spatialement une scène virtuelle dont le son peut se déployer tout autour de l’utilisateur, et dont le visuel est restreint à un si petit écran ? La première partie de cette thèse est consacrée à cette question. Nous menons une expérience visant à étudier le découplage spatial possible entre un son binaural et un visuel rendus sur smartphone. Cette expérience révèle une forte tolérance de l’être humain face aux dégradations spatiales pouvant survenir entre les deux modalités. En particulier, l’absence d’individualisation des HRTF, ainsi qu’un très grand découplage en élévation ne semblent pas affecter la perception. Par ailleurs, les sujets semblent envisager la scène « comme si » ils y étaient eux-mêmes directement projetés, à la place de la caméra, et cela indépendamment de leur propre distance à l’écran. Tous ces résultats suggèrent la possibilité d’une association entre son binaural et visuel sur mobile dans des conditions d’utilisation proches du grand public.Dans la seconde partie de la thèse, nous tentons de répondre à la question de l’apport du binaural en déployant une expérience « hors les murs », dans un contexte plausible d’utilisation grand public. Trente sujets jouent dans leur vie quotidienne à un jeu vidéo de type Infinite Runner, développé pour l’occasion en deux versions, une avec du son binaural, et l’autre avec du son monophonique. L’expérience dure cinq semaines, à raison de deux sessions par jour. Ce protocole procède de la méthode dite "Experience Sampling Method", sur l’état de l’art de laquelle nous nous sommes appuyés. Nous calculons à chaque session des notes d’immersion, de mémorisation et de performance, et nous comparons les notes obtenues entre les deux versions sonores. Les résultats indiquent une immersion significativement meilleure pour le binaural. La mémorisation et la performance ne sont en revanche pas soumises à un effet statistiquement significatif du rendu sonore. Au-delà des résultats, cette expérience nous permet de discuter de la question de la validité des données en fonction de la méthode de déploiement, en confrontant notamment bien-fondé théorique et faisabilité pratique. / In recent years, smartphone and tablet global performances have been increased significantly (CPU, screen resolution, webcams, etc.). This can be particularly observed with video quality of mobile media services, such as video streaming applications, or interactive applications (e.g., video games). However, these evolutions barely go with the integration of high quality sound restitution systems. Beside these evolutions though, new technologies related to spatialized sound on headphones have been developed, namely the binaural restitution model, using HRTF (Head Related Transfer Functions) filters.In this thesis, we assess the potential contribution of the binaural technology to enhance the quality of experience of an audiovisual mobile application. A part of our work has been dedicated to define what is an “audiovisual mobile application”, what kind of application could be fruitfully experienced with a binaural sound, and among those applications which one could lead to a comparative experiment with and without binaural.In a first place, the coupling of a binaural sound with a mobile-rendered visual tackles a question related to perception: how to spatially arrange a virtual scene whose sound can be spread all around the user, while its visual is limited to a very small space? We propose an experiment in these conditions to study how far a sound and a visual can be moved apart without breaking their perceptual fusion. The results reveal a strong tolerance of subjects to spatial discrepancies between the two modalities. Notably, the absence or presence of individualization for the HRTF filters, and a large separation in elevation between sound and visual don’t seem to affect the perception. Besides, subjects consider the virtual scene as if they were projected inside, at the camera’s position, no matter what distance to the phone they sit. All these results suggest that an association between a binaural sound and a visual on a smartphone could be used by the general public.In the second part, we address the main question of the thesis, i.e., the contribution of binaural, and we conduct an experiment in a realistic context of use. Thirty subjects play an Infinite Runner video game in their daily lives. The game was developed for the occasion in two versions, a monophonic one and a binaural one. The experiment lasts five weeks, at a rate of two sessions per day, which relates to a protocol known as the “Experience Sampling Method”. We collect at each session notes of immersion, memorization and performance, and compare the notes between the monophonic sessions and the binaural ones. Results indicate a significantly better immersion in the binaural sessions. No effect of sound rendering was found for memorization and performance. Beyond the contribution of the binaural, we discuss about the protocol, the validity of the collected data, and oppose theoretical considerations to practical feasibility.

Video Stream Monitoring and Network-centric QoE Prediction through User-behavioral Studies and Automated Learning

Kittur Gonibasappa, Dhananjaya Kumara January 2017 (has links)
Quality of Experience (QoE) is the degree of delight or annoyance of the user of an application or service [1]. To ensure a proper level of QoE for end users, networks and service providers have to continuously monitor their systems in terms of technical parameters, which can then be used to estimate QoE. Especially for video streaming services, which consume a large amount of traffic, network problems such as bandwidth fluctuations quickly develop into annoying artefacts visible to the users, which may lead to abandonment of services. Internet Service Providers (ISPs) are therefore continuously monitoring video network streams in order to provide the better QoE. In this regard to conduct the user behavioral studies, the ISPs spend a large amount of money and energy every time. To avoid this, we are using existing user behavioral studies and simulating the user behavior in an automated set-up and try to measure the impact of network conditions. In our current studies based on the user-behavioral model used [5], we can conclude that low upload speeds don’t affect on simulated user behavior unless they are in high download speed networks. Simulated users with the mid-range download and upload bandwidth tend to face more stalling and quality switches compared to both low and high-bandwidth users. Key quality indicators(KQIs) of video QoE also depends on the number of videos we measure in a single session. Reloading of player helps to reduce stalling for mid and high bandwidths. Reloading worsens the situation in low bandwidth scenarios. / Kvalitet av erfarenhet (QoE) definieras som: "Graden av fröjd eller förargelse av användaren av en applikation eller en service. Den resulterar från uppfyllelsen av hans eller hennes förväntningar med hänsyn till hjälpmedlet, och/eller njutning av applikationen eller servicen i ljuset av användarens personlighet och aktuella tillstånd" [1]. Att att se till en riktig nivå av QoE för slut användare, nätverk och tjänstefamiljeförsörjare måste övervakar fortlöpande deras system när det gäller tekniska parametrar, som kan därefter vara den van vid bedömningen QoE. Speciellt för videoen som strömmar service, som konsumerar ett stort belopp av trafik, framkallar nätverksproblem liksom bandbreddväxlingar snabbt in i förargliga artefacts som är synliga till användarena, som kan leda till övergivande av service. Internetleverantörer (ISPs) är därför fortlöpande videopp nätverksströmmar för övervakning för att att ge den bättre QoEen. I detta avseende att föra de beteendestudierna för användaren, spenderar ISPsna en stor mängd pengar och energi varje gång. Att undvika denna, använder simulerar vi beteendestudier för existerande användare och användareuppförandet i en automatiserat aktivering och försök för att mäta inverkan av nätverksvillkor. I våra aktuella studier som baseras på den använda användare-beteendemodellen [5], oss kan avsluta som laddar upp lågt hastigheter inte påverkar på simulerat användareuppförande, om inte de är i höga nedladdninghastighetsnätverk. Simulerade användare med mitt–området nedladdar och laddar upp bandbredd ansar för att vända mot mer avbrottsoch kvalitetsströmbrytare som jämförs till både låga och höga bandbreddanvändare. Nyckelkvalitetsindikatorer (KQIs) av video QoE beror också på numret av video som vi mäter i en enkel period. Tillbakaläggande av spelaren hjälper att förminska avbrott för mittoch höga bandbredder. Tillbakaläggande försämrar läget i scenarion för låg bandbredd.

Perceptually meaningful time and frequency resolution in applying dialogue enhancement in noisy environments : Dialogue Enhancement research

PATIL, SUSHANTH January 2023 (has links)
Dialogue Enhancement (DE) is a process used in audio delivery systems to improve the clarity, intelligibility, and overall quality of the spoken dialogue in audio content. It is primarily used when dialogue is masked by music, surrounding noise, or other audio sources. This thesis project involves experiments to find the optimal time and frequency resolution needed for a DE system. The time resolution focuses on experimenting with various attack/release times for a DE system. The frequency domain analysis investigates whether people prefer a noise spectrum-dependent gain over a conventional full-band gain. The research methodology comprises three main parts. The first part focuses on system setup and choosing content/vectors to be used for the experiments. Next, the experiments are designed for time and frequency resolution. An exponential smoothing model is used to amplify/attenuate the dialogue stream at various times of attack/release. For the frequency counterpart, a banded gain model is designed which uses banded noise levels as input. Subsequently, a modified subjective listening test is designed to evaluate the experiments designed. The responses recorded for various types of content-noise combinations from the listeners are recorded and analyzed. Finally, the main outcome of this research emphasizes the advantages of a DE system. Further, it paves the way for further exploration of DE models and rigorous testing schemes with expert listeners. / Dialogue Enhancement (DE) är en process som används i ljudleveranssystem för att förbättra tydligheten, förståeligheten och den övergripande kvaliteten på den talade dialogen i ljudinnehåll. Det används främst när dialog maskeras av musik, omgivande brus eller andra ljudkällor. Detta examensarbete omfattar experiment för att hitta den optimala tids- och frekvensupplösningen för ett DEsystem. Tidsupplösningsexperimenten fokuserar på olika attack- och releasetider för ett DE-system. Frekvensdomänanalysen undersöker om människor föredrar en brusspektrumberoende förstärkning framför en konventionell fullbandsförstärkning. Forskningsmetodiken består av tre huvuddelar. Den första delen fokuserar på systeminställning och val av innehåll/vektorer som ska användas för experimenten. Därefter designas tids- och frekvensupplösningsexperimenten. En exponentiell tidsenvelopp används för att förstärka/dämpa dialogen vid olika tider för attack/release. För frekvensdomänexperimenten används en bandad förstärkningsmodell som använder bandade brusnivåer som insignal. I den tredje delen utformas ett subjektivt lyssningstest för att utvärdera experimenten. Lyssnarnas svar för olika typer av innehåll-bruskombinationer registreras och analyseras. Det huvudsakliga resultatet av denna forskning betonar fördelarna med ett DEsystem. Vidare banar det väg för utforskning av fler DE-modeller och rigorösa testscheman med expertlyssnare.

Mejora del streaming de vídeo en DASH con codificación de bitrate variable mediante el algoritmo Look Ahead y mecanismos de coordinación para la reproducción, y propuesta de nuevas métricas para la evaluación de la QoE

Belda Ortega, Román 19 July 2021 (has links)
[ES] Esta tesis presenta diversas propuestas encaminadas a mejorar la transmisión de vídeo a través del estándar DASH (Dynamic Adaptive Streaming over HTTP). Este trabajo de investigación estudia el protocolo de transmisión DASH y sus características. A la vez, plantea la codificación con calidad constante y bitrate variable como modo de codificación del contenido de vídeo más indicado para la transmisión de contenido bajo demanda mediante el estándar DASH. Derivado de la propuesta de utilización del modo de codificación de calidad constante, cobra mayor importancia el papel que juegan los algoritmos de adaptación en la experiencia de los usuarios al consumir el contenido multimedia. En este sentido, esta tesis presenta un algoritmo de adaptación denominado Look Ahead el cual, sin modificar el estándar, permite utilizar la información de los tamaños de los segmentos de vídeo incluida en los contenedores multimedia para evitar tomar decisiones de adaptación que desemboquen en paradas no deseadas en la reproducción de contenido multimedia. Con el objetivo de evaluar las posibles mejoras del algoritmo de adaptación presentado, se proponen tres modelos de evaluación objetiva de la QoE. Los modelos propuestos permiten predecir de forma sencilla la QoE que tendrían los usuarios de forma objetiva, utilizando parámetros conocidos como el bitrate medio, el PSNR (Peak Signal-to-Noise Ratio) y el valor de VMAF (Video Multimethod Assessment Fusion). Todos ellos aplicados a cada segmento. Finalmente, se estudia el comportamiento de DASH en entornos Wi-Fi con alta densidad de usuarios. En este contexto, se producen un número elevado de paradas en la reproducción por una mala estimación de la tasa de transferencia disponible debida al patrón ON/OFF de descarga de DASH y a la variabilidad del acceso al medio de Wi-Fi. Para paliar esta situación, se propone un servicio de coordinación basado en la tecnología SAND (MPEG's Server and Network Assisted DASH) que proporciona una estimación de la tasa de transferencia basada en la información del estado de los players de los clientes. / [CA] Aquesta tesi presenta diverses propostes encaminades a millorar la transmissió de vídeo a través de l'estàndard DASH (Dynamic Adaptive Streaming over HTTP). Aquest treball de recerca estudia el protocol de transmissió DASH i les seves característiques. Alhora, planteja la codificació amb qualitat constant i bitrate variable com a manera de codificació del contingut de vídeo més indicada per a la transmissió de contingut sota demanda mitjançant l'estàndard DASH. Derivat de la proposta d'utilització de la manera de codificació de qualitat constant, cobra major importància el paper que juguen els algorismes d'adaptació en l'experiència dels usuaris en consumir el contingut. En aquest sentit, aquesta tesi presenta un algoritme d'adaptació denominat Look Ahead el qual, sense modificar l'estàndard, permet utilitzar la informació de les grandàries dels segments de vídeo inclosa en els contenidors multimèdia per a evitar prendre decisions d'adaptació que desemboquin en una parada indesitjada en la reproducció de contingut multimèdia. Amb l'objectiu d'avaluar les possibles millores de l'algoritme d'adaptació presentat, es proposen tres models d'avaluació objectiva de la QoE. Els models proposats permeten predir de manera senzilla la QoE que tindrien els usuaris de manera objectiva, utilitzant paràmetres coneguts com el bitrate mitjà, el PSNR (Peak Signal-to-Noise Ratio) i el valor de VMAF (Video Multimethod Assessment Fusion). Tots ells aplicats a cada segment. Finalment, s'estudia el comportament de DASH en entorns Wi-Fi amb alta densitat d'usuaris. En aquest context es produeixen un nombre elevat de parades en la reproducció per una mala estimació de la taxa de transferència disponible deguda al patró ON/OFF de descàrrega de DASH i a la variabilitat de l'accés al mitjà de Wi-Fi. Per a pal·liar aquesta situació, es proposa un servei de coordinació basat en la tecnologia SAND (MPEG's Server and Network Assisted DASH) que proporciona una estimació de la taxa de transferència basada en la informació de l'estat dels players dels clients. / [EN] This thesis presents several proposals aimed at improving video transmission through the DASH (Dynamic Adaptive Streaming over HTTP) standard. This research work studies the DASH transmission protocol and its characteristics. At the same time, this work proposes the use of encoding with constant quality and variable bitrate as the most suitable video content encoding mode for on-demand content transmission through the DASH standard. Based on the proposal to use the constant quality encoding mode, the role played by adaptation algorithms in the user experience when consuming multimedia content becomes more important. In this sense, this thesis presents an adaptation algorithm called Look Ahead which, without modifying the standard, allows the use of the information on the sizes of the video segments included in the multimedia containers to avoid making adaptation decisions that lead to undesirable stalls during the playback of multimedia content. In order to evaluate the improvements of the presented adaptation algorithm, three models of objective QoE evaluation are proposed. These models allow to predict in a simple way the QoE that users would have in an objective way, using well-known parameters such as the average bitrate, the PSNR (Peak Signal-to-Noise Ratio) and the VMAF (Video Multimethod Assessment Fusion). All of them applied to each segment. Finally, the DASH behavior in Wi-Fi environments with high user density is analyzed. In this context, there could be a high number of stalls in the playback because of a bad estimation of the available transfer rate due to the ON/OFF pattern of DASH download and to the variability of the access to the Wi-Fi environment. To relieve this situation, a coordination service based on SAND (MPEG's Server and Network Assisted DASH) is proposed, which provides an estimation of the transfer rate based on the information of the state of the clients' players. / Belda Ortega, R. (2021). Mejora del streaming de vídeo en DASH con codificación de bitrate variable mediante el algoritmo Look Ahead y mecanismos de coordinación para la reproducción, y propuesta de nuevas métricas para la evaluación de la QoE [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/169467

