31 |
Web TV : causes, enjeux et perspectives des mutations socio-techniques dans la communication télévisuelle à l'ère numérique / Web television : causes, challenges and perspectives of the socio-technical changes in television communication in the digital ageBenea, Anamaria 26 November 2015 (has links)
Ce travail de recherche doctoral en sciences de l'information et de la communication se propose de construire une problématique autour de la web télévision et d'y répondre en tenant compte des spécificités de cette innovation technologique. Notre recherche se base sur une approche diachronique qui consiste à saisir la façon dont, en moins d'un siècle et demi, la télévision a identifié le bon message devant les médias et le public, pour nous arrêter sur les caractéristiques d'une réalité émergente, la web TV. Nous cherchons à explorer en quoi ce nouveau média révolutionne les moyens de communication audiovisuelle. Depuis les années 1950 l'information et par extension les médias représentent un objet d'étude toujours en émergence. La télévision a été l'objet de nombreuses recherches qui visaient à connaître son impact sur la société, la manière dont elle pouvait être utilisée pour influencer, pour informer, pour divertir, pour consommer. Elle a vite fasciné le public tout d'abord avec cette possibilité d'assister à un certain nombre d'évènements, d'avoir un potentiel d'ubiquité, procurant la sensation de voir l'histoire se dérouler sous ses yeux. Actuellement suite au développement de la technologie numérique, la télévision, les médias de masse par excellence sont en train de subir un changement de nature qui n'est pas sans incidence sur ce que l'on a l'habitude d'appeler la «culture télévisuelle». La convergence en cours des médias, facilitée par l'universalité du langage binaire, provoque une évolution technique du média qui devient progressivement un nouvel objet high-tech. Cette évolution de la nature technique de l'objet présente nécessairement des conséquences dans plusieurs secteurs d'activités et de domaines de recherche: la production, la publicité, la législation, la recherche et le développement, l'industrie, la sociologie, la psychologie, l'analyse de contenu, l'éducation, etc. Historiquement, en sciences sociales, la recherche sur les médias aux Etats-Unis et en Europe s'est orientée dès les années 1930 vers des études sur le contenu dans la perspective d'une analyse des effets.Dans ce contexte, dans un premier temps, nous traitons les éléments spécifiques de la communication audiovisuelle sur le support numérique, visant à déterminer la quantité de fonctionnalités qu'un produit médiatique sur ce support doit combiner afin de pouvoir se déclarer web tv. Ensuite, en raison de la rapidité de l'évolution accélérée et du caractère expérimental des médias numériques, nous allons traiter l'identification de la substance commune qui a un degré de résilience en termes de pratiques journalistiques en ligne et moins de l'apparence éphémère de la diversité, qui, peut conduire à l'impression que nous assistons à un schéma de soufflage final. Certains traits des web tv sont communs à ceux de la télévision traditionnelle à l'ère du web 2.0, parce que la télévision classique n'est pas restée figée concernant sa capacité de réinvention. Enfin, nous nous sommes intéressés à surprendre quelles sont les différences pas rapport à la télévision classiques et à déterminer si la prétention des promoteurs de la web tv d'avoir inventé une modalité complètement nouvelle est soutenable.Nôtre approche est praxéologique. Nous avons utilisé des instruments de travail adéquats : suivi des médias, observation, entretien, analyse de documents, questionnaire (discours sur la TV elle-même). / This doctoral research paper in Information and Communication Sciences intends to build a research issue around Web-television and to respond to it by taking into account the specificities of this technological innovation. Our research is based on a diachronic approach understanding how, in less than one century and half, television identified the right message to deliver to the media and the public, ending up with the characteristics of an emergent reality, that is Web-television. We are interested to explore how this new media is revolutionising audio-visual communication media. Since the 1950s, information, and by extension, media has represented a study object always emerging. Television was the object to many research aiming at knowing its impact on society, how it could be used in order to influence, to inform, to entertain, to consume. It rapidly fascinated the public firstly due to this possibility to attend a certain number of events, to have a potential of ubiquity, getting the feeling that one could see the history unfold before them. Nowadays, based on digital technology development, television, mass media par excellence, are about to undergo a change having an impact on the nature of what we commonly call “television culture”. The on-going media convergence, helped by the universal binary language, generates a technical evolution of the media thus gradually becoming a new high-tech object. This technical evolution of the object has necessarily consequences in numerous activity areas and research fields: manufacturing, advertisement, legislation, research and development, industry, sociology, psychology, content analysis, education etc. Historically, in social sciences, research on the media in the U.S. and in Europe has been oriented since the 1930s towards studies based on content from the point of view of an analysis of the effects.In the light of this, at first, we analyse the elements specific to audio-visual communication on digital support, aiming at defining the amount of features that a media product of this type of support should combine in order to be able to call itself Web TV. Moreover, due to the rapid progression and to the experimental nature of digital media, we shall discuss about identifying the common substance having a degree of resilience in terms of online daily habits and less about the apparently short life of diversity that may lead to the impression that we are witnessing a one final breath. Some characteristics of the Web television are the same with those of the traditional television from Web 2.0, because the classical television didn't remain motionless in terms of its capacity to reinvent itself. Finally, we were interested in tracing the differences between Web television and classical television, and in determining whether Web television promoters are right when they claim having invented a completely new method.We used a practise-based approach. We used adequate research tools: media monitoring, observation, interview, document analysis, questionnaire (speech on television itself).
|
32 |
Segmentation supervisée d'actions à partir de primitives haut niveau dans des flux vidéos / Action supervised segmentation based on high level features on video streamsChan-Hon-Tong, Adrien 29 September 2014 (has links)
Cette thèse porte sur la segmentation supervisée de flux vidéo dans un contexte applicatif lié à la reconnaissance d'actions de la vie courante.La méthode de segmentation proposée est dérivée la méthode des modèles de formes implicites (Implicit Shape Model) et s'obtient en optimisant les votes présents dans cette méthode d'élection.Nous démontrons que cette optimisation (dans un contexte de fenêtre temporelle glissante) peut être exprimée de manière équivalente dans le formalisme des SVM en imposant une contrainte de cohérence temporelle à l'apprentissage, ou, en représentant la fenêtre glissante selon une décomposition pyramidale dense.Tout ce processus est validé expérimentalement sur un jeu de données de la littérature de segmentation supervisée.Il y surpasse les autres méthodes de type modèles de formes implicites et le SVM linéaire standard.La méthode proposée est ensuite mise en œuvre dans le cadre de la segmentation supervisée d'actions.Pour cela, des primitives dédiées sont extraites des données squelette de la personne d'intérêt obtenues grâce à des logiciels standards.Ces primitives sont ensuite quantifiées puis utilisées par la méthode d'élection.Ce système de segmentation d'actions obtient les meilleurs scores de l'état de l'art sur un jeu de données de la littérature de reconnaissance d'actions, ce qui valide cette combinaison des primitives et de la méthode d'élection. / This thesis focuses on the supervised segmentation of video streams within the application context of daily action recognition.A segmentation algorithm is obtained from Implicit Shape Model by optimising the votes existing in this polling method.We prove that this optimisation can be linked to the sliding windows plus SVM framework and more precisely is equivalent with a standard training by adding temporal constraint, or, by encoding the data through a dense pyramidal decomposition. This algorithm is evaluated on a public database of segmentation where it outperforms other Implicit Shape Model like methods and the standard linear SVM.This algorithm is then integrated into a action segmentation system.Specific features are extracted from skeleton obtained from the video by standard software.These features are then clustered and given to the polling method.This system, combining our feature and our algorithm, obtains the best published performance on a human daily action segmentation dataset.
|
33 |
Développement et mise à l'essai d'une leçon de géographie biblique sur vidéodisque interactifMainguy, Claire 25 April 2018 (has links)
Québec Université Laval, Bibliothèque 2016
|
34 |
Triumvirat : suivi de Êtres de papier, êtres de pixelsMarcotte-Tambo, Sarah 12 October 2018 (has links)
Ce mémoire à deux temps est le résultat d’une pratique d’écriture centrée sur le développement du personnage et d’une étude de ce dernier en contexte de jeux. En premier lieu, un trio de personnages présenté sous forme de dossiers, c’est-à-dire d’ensembles de textes littéraires de différentes natures, constitue la partie créative. Les personnages qu’on y retrouve furent repêchés par l’auteure à la suite de sa participation à différents jeux d’écriture sur forums. Inspirée par le modèle de ces plateformes du Web, c’est par l’intermédiaire de fiches descriptives, de fragments, de nouvelles, que l'auteure présente les protagonistes choisis au lecteur. En second lieu, il est question d’observer, sous le couvert de l’essai, le personnage et son rapport à son auteur en regard du jeu, notamment jeu d’écriture mais également jeu vidéo. C’est principalement à travers un dialogue avec Chloé Delaume et son Corpus Simsi que l’auteure interroge la notion de personnage, à savoir, comme c’est le cas dans Corpus Simsi, ce qu’il en est du personnage libre de migrer d’un média et d’une fiction à l’autre. Le personnage tantôt avatar de jeu, tantôt protagoniste romanesque, mais surtout siège de maints possibles
|
35 |
Extraction et analyse d'objets-clés pour la structuration d'images et de vidéosHuart, Jérémy 14 February 2007 (has links) (PDF)
La description synthétique du contenu d'une image ou d'une vidéo est à l'heure actuelle une problématique majeure. Nous nous intéressons aux objets qui les composent pour leur pouvoir de représentativité. Après un état de l'art, ce document présente une méthode de segmentation locale par pyramide de graphes irrégulière permettant d'extraire, à partir de critères bas niveaux, des régions d'intérêt assimilables à des objets sémantiques. Cette méthode est utilisée pour détourer avec précision des objets dans des images fixes, dans un environnement interactif puis totalement automatique. Une estimation de mouvement permet d'étendre le procédé aux vidéos en extrayant dans chaque image les entités mobiles. Un filtrage et une classification de ces entités permet de ne retenir que les plus représentatives de chaque objet réel du plan. Ces représentants sont appelés objet-clé et vues-clés. La qualité des résultats expérimentaux permet de proposer de nombreuses applications en aval.
|
36 |
Automatic prediction of emotions induced by movies / Reconnaissance automatique des émotions induites par les filmsBaveye, Yoann 12 November 2015 (has links)
Jamais les films n’ont été aussi facilement accessibles aux spectateurs qui peuvent profiter de leur potentiel presque sans limite à susciter des émotions. Savoir à l’avance les émotions qu’un film est susceptible d’induire à ses spectateurs pourrait donc aider à améliorer la précision des systèmes de distribution de contenus, d’indexation ou même de synthèse des vidéos. Cependant, le transfert de cette expertise aux ordinateurs est une tâche complexe, en partie due à la nature subjective des émotions. Cette thèse est donc dédiée à la détection automatique des émotions induites par les films, basée sur les propriétés intrinsèques du signal audiovisuel. Pour s’atteler à cette tâche, une base de données de vidéos annotées selon les émotions induites aux spectateurs est nécessaire. Cependant, les bases de données existantes ne sont pas publiques à cause de problèmes de droit d’auteur ou sont de taille restreinte. Pour répondre à ce besoin spécifique, cette thèse présente le développement de la base de données LIRIS-ACCEDE. Cette base a trois avantages principaux: (1) elle utilise des films sous licence Creative Commons et peut donc être partagée sans enfreindre le droit d’auteur, (2) elle est composée de 9800 extraits vidéos de bonne qualité qui proviennent de 160 films et courts métrages, et (3) les 9800 extraits ont été classés selon les axes de “valence” et “arousal” induits grâce un protocole de comparaisons par paires mis en place sur un site de crowdsourcing. L’accord inter-annotateurs élevé reflète la cohérence des annotations malgré la forte différence culturelle parmi les annotateurs. Trois autres expériences sont également présentées dans cette thèse. Premièrement, des scores émotionnels ont été collectés pour un sous-ensemble de vidéos de la base LIRIS-ACCEDE dans le but de faire une validation croisée des classements obtenus via crowdsourcing. Les scores émotionnels ont aussi rendu possible l’apprentissage d’un processus gaussien par régression, modélisant le bruit lié aux annotations, afin de convertir tous les rangs liés aux vidéos de la base LIRIS-ACCEDE en scores émotionnels définis dans l’espace 2D valence-arousal. Deuxièmement, des annotations continues pour 30 films ont été collectées dans le but de créer des modèles algorithmiques temporellement fiables. Enfin, une dernière expérience a été réalisée dans le but de mesurer de façon continue des données physiologiques sur des participants regardant les 30 films utilisés lors de l’expérience précédente. La corrélation entre les annotations physiologiques et les scores continus renforce la validité des résultats de ces expériences. Equipée d’une base de données, cette thèse présente un modèle algorithmique afin d’estimer les émotions induites par les films. Le système utilise à son avantage les récentes avancées dans le domaine de l’apprentissage profond et prend en compte la relation entre des scènes consécutives. Le système est composé de deux réseaux de neurones convolutionnels ajustés. L’un est dédié à la modalité visuelle et utilise en entrée des versions recadrées des principales frames des segments vidéos, alors que l’autre est dédié à la modalité audio grâce à l’utilisation de spectrogrammes audio. Les activations de la dernière couche entièrement connectée de chaque réseau sont concaténées pour nourrir un réseau de neurones récurrent utilisant des neurones spécifiques appelés “Long-Short-Term- Memory” qui permettent l’apprentissage des dépendances temporelles entre des segments vidéo successifs. La performance obtenue par le modèle est comparée à celle d’un modèle basique similaire à l’état de l’art et montre des résultats très prometteurs mais qui reflètent la complexité de telles tâches. En effet, la prédiction automatique des émotions induites par les films est donc toujours une tâche très difficile qui est loin d’être complètement résolue. / Never before have movies been as easily accessible to viewers, who can enjoy anywhere the almost unlimited potential of movies for inducing emotions. Thus, knowing in advance the emotions that a movie is likely to elicit to its viewers could help to improve the accuracy of content delivery, video indexing or even summarization. However, transferring this expertise to computers is a complex task due in part to the subjective nature of emotions. The present thesis work is dedicated to the automatic prediction of emotions induced by movies based on the intrinsic properties of the audiovisual signal. To computationally deal with this problem, a video dataset annotated along the emotions induced to viewers is needed. However, existing datasets are not public due to copyright issues or are of a very limited size and content diversity. To answer to this specific need, this thesis addresses the development of the LIRIS-ACCEDE dataset. The advantages of this dataset are threefold: (1) it is based on movies under Creative Commons licenses and thus can be shared without infringing copyright, (2) it is composed of 9,800 good quality video excerpts with a large content diversity extracted from 160 feature films and short films, and (3) the 9,800 excerpts have been ranked through a pair-wise video comparison protocol along the induced valence and arousal axes using crowdsourcing. The high inter-annotator agreement reflects that annotations are fully consistent, despite the large diversity of raters’ cultural backgrounds. Three other experiments are also introduced in this thesis. First, affective ratings were collected for a subset of the LIRIS-ACCEDE dataset in order to cross-validate the crowdsourced annotations. The affective ratings made also possible the learning of Gaussian Processes for Regression, modeling the noisiness from measurements, to map the whole ranked LIRIS-ACCEDE dataset into the 2D valence-arousal affective space. Second, continuous ratings for 30 movies were collected in order develop temporally relevant computational models. Finally, a last experiment was performed in order to collect continuous physiological measurements for the 30 movies used in the second experiment. The correlation between both modalities strengthens the validity of the results of the experiments. Armed with a dataset, this thesis presents a computational model to infer the emotions induced by movies. The framework builds on the recent advances in deep learning and takes into account the relationship between consecutive scenes. It is composed of two fine-tuned Convolutional Neural Networks. One is dedicated to the visual modality and uses as input crops of key frames extracted from video segments, while the second one is dedicated to the audio modality through the use of audio spectrograms. The activations of the last fully connected layer of both networks are conv catenated to feed a Long Short-Term Memory Recurrent Neural Network to learn the dependencies between the consecutive video segments. The performance obtained by the model is compared to the performance of a baseline similar to previous work and shows very promising results but reflects the complexity of such tasks. Indeed, the automatic prediction of emotions induced by movies is still a very challenging task which is far from being solved.
|
37 |
Evaluation de la qualité de vidéos panoramiques synthétisées / Quality Evaluation for Stitched Panoramic VideosNabil mahrous yacoub, Sandra 27 November 2018 (has links)
La création des vidéos panoramiques de haute qualité pour des contenus immersifs en VR est généralement faite à l'aide d'un appareil doté de plusieurs caméras couvrant une scène cible. Malheureusement, cette configuration introduit à la fois des artefacts spatiaux et temporels dus à la différence entre les centres optiques et à la synchronisation imparfaite. Les mesures de qualité d'image traditionnelles ne peuvent pas être utilisées pour évaluer la qualité de ces vidéos, en raison de leur incapacité à capturer des distorsions géométriques. Dans cette thèse, nous proposons des méthodes pour l'évaluation objective des vidéos panoramiques basées sur le flux optique et la saillance visuelle. Nous validons cette métrique avec une étude centrée sur l'homme qui combine l'annotation d'erreurs percues et l'eye-tracking.Un défi important pour mesurer la qualité des vidéos panoramiques est le manque d'une vérité-terrain. Nous avons étudié l'utilisation des vidéos originales comme référence pour le panorama de sortie. Nous notons que cette approche n'est pas directement applicable, car chaque pixel du panorama final peut avoir une à $N$ sources correspondant à $N$ vidéos d'entrée avec des régions se chevauchant. Nous montrons que ce problème peut être résolu en calculant l'écart type des déplacements de tous les pixels sources à partir du déplacement du panorama en tant que mesure de la distorsion. Cela permet de comparer la différence de mouvement entre deux images données dans les vidéos originales et le mouvement dans le panorama final. Les cartes de saillance basées sur la perception humaine sont utilisées pour pondérer la carte de distorsion pour un filtrage plus précis.Cette méthode a été validée par une étude centrée sur l'homme utilisant une expérience empirique. L'expérience visait à déterminer si les humains et la métrique d'évaluation détectaient et mesuraient les mêmes erreurs, et à explorer quelles erreurs sont les plus importantes pour les humains lorsqu'ils regardent une vidéo panoramique.Les méthodes décrites ont été testées et validées et fournissent des résultats intéressants en ce qui concerne la perception humaine pour les mesures de qualité. Ils ouvrent également la voie à de nouvelles méthodes d'optimisation de l'assemblage vidéo, guidées par ces mesures de qualité. / High quality panoramic videos for immersive VR content are commonly created using a rig with multiple cameras covering a target scene. Unfortunately, this setup introduces both spatial and temporal artifacts due to the difference in optical centers as well as the imperfect synchronization. Traditional image quality metrics cannot be used to assess the quality of such videos, due to their inability to capture geometric distortions. In this thesis, we propose methods for the objective assessment of panoramic videos based on optical flow and visual salience. We validate this metric with a human-centered study that combines human error annotation and eye-tracking.An important challenge in measuring quality for panoramic videos is the lack of ground truth. We have investigated the use of the original videos as a reference for the output panorama. We note that this approach is not directly applicable, because each pixel in the final panorama can have one to N sources corresponding to N input videos with overlapping regions. We show that this problem can be solved by calculating the standard deviation of displacements of all source pixels from the displacement of the panorama as a measure of distortion. This makes it possible to compare the difference in motion between two given frames in the original videos and motion in the final panorama. Salience maps based on human perception are used to weight the distortion map for more accurate filtering.This method was validated with a human-centered study using an empirical experiment. The experiment was designed to investigate whether humans and the evaluation metric detect and measure the same errors, and to explore which errors are more salient to humans when watching a panoramic video.The methods described have been tested and validated and they provide interesting findings regarding human-based perception for quality metrics. They also open the way to new methods for optimizing video stitching guided by those quality metrics.
|
38 |
Protection de vidéo comprimée par chiffrement sélectif réduit / Protection of compressed video with reduced selective encryptionDubois, Loïc 15 November 2013 (has links)
De nos jours, les vidéos et les images sont devenues un moyen de communication très important. L'acquisition, la transmission, l'archivage et la visualisation de ces données visuelles, que ce soit à titre professionnel ou privé, augmentent de manière exponentielle. En conséquence, la confidentialité de ces contenus est devenue un problème majeur. Pour répondre à ce problème, le chiffrement sélectif est une solution qui assure la confidentialité visuelle des données en ne chiffrant qu'une partie des données. Le chiffrement sélectif permet de conserver le débit initial et de rester conforme aux standards vidéo. Ces travaux de thèse proposent plusieurs méthodes de chiffrement sélectif pour le standard vidéo H.264/AVC. Des méthodes de réduction du chiffrement sélectif grâce à l'architecture du standard H.264/AVC sont étudiées afin de trouver le ratio de chiffrement minimum mais suffisant pour assurer la confidentialité visuelle des données. Les mesures de qualité objectives sont utilisées pour évaluer la confidentialité visuelle des vidéos chiffrées. De plus, une nouvelle mesure de qualité est proposée pour analyser le scintillement des vidéos au cours du temps. Enfin, une méthode de chiffrement sélectif réduit régulé par des mesures de qualité est étudiée afin d'adapter le chiffrement en fonction de la confidentialité visuelle fixée. / Nowadays, videos and images are major sources of communication for professional or personal purposes. Their number grow exponentially and the confidentiality of the content has become a major problem for their acquisition, transmission, storage, and display. In order to solve this problem, selective encryption is a solution which provides visual privacy by encrypting only a part of the data. Selective encryption preserves the initial bit-rate and maintains compliance with the syntax of the standard video. This Ph.D thesis offers several methods of selective encryption for H.264/AVC video standard. Reduced selective encryption methods, based on the H.264/AVC architecture, are studied in order to find the minimum ratio of encryption but sufficient to ensure visual privacy. Objective quality measures are used to assess the visual privacy of encrypted videos. In addition, a new quality measure is proposed to analyze the video flicker over time. Finally, a method for a reduced selective encryption regulated by quality measures is studied to adapt the encryption depending on the visual privacy fixed.
|
39 |
Étude des décisions chronogénétiques des enseignants dans l'enseignement de la physique au collège ; une étude de cas au LibanBadreddine, Zeynab 28 January 2009 (has links) (PDF)
Ce travail empirique porte sur l'étude des décisions chronogénétiques des enseignants au collège. Le contexte d'observation est celui d'un enseignant de physique intervenant dans deux classes de cinquième simultanément. Nous inférons la prise d'une décision à partir des observables de la situation. Nous considérons qu'une décision est formée de trois composantes : les raisons de la décision, les indicateurs d'une prise de décision et le résultat de cette décision. La procédure suivie a été de découper les deux séquences concernées en unités de sens (les épisodes). Sur cette base nous avons construit un outil méthodologique permettant, d'une part, de relier l'échelle microscopique du savoir enseigné avec les échelles mésoscopique et macroscopique, reconstruisant ainsi la cohérence du discours d'un enseignant autour du contenu enseigné ; d'autre part, d'étudier l'effet qu'a le passage d'une classe à une autre sur la restructuration du savoir dans le discours de l'enseignante (décisions rétro-interactives). Notre analyse a produit une typologie des décisions chronogénétiques : les décisions temporelles (s'attarder, progresser) et les décisions d'articulation du contenu (appeler, annoncer, avancer, rappeler, reprendre, remettre). Elle nous a permis également de suivre la négociation de la progression du savoir au cours d'une séquence, et d'introduire les notions d'intention didactique et d'histoire des décisions. Nous avons pu mettre en évidence les ressemblances et les différences entre les pratiques de l'enseignant dans les deux classes. Finalement, à partir de l'exhaustivité du découpage en épisodes de la séquence, et l'implémentation experte sur Transana de la méthodologie correspondante, nous avons défini un modèle d'analyse du discours didactique.
|
40 |
Analyse de séquences d'images à cadence vidéo pour l'asservissement d'une caméra embarquée sur un droneLouvat, Benoit 05 February 2008 (has links) (PDF)
Dans cette thèse, nous développons un système d'asservissement visuel pour une caméra montée sur une tourelle commandable en pan et tilt et embarquée sur un drone. Ceci afin de réaliser des tâches telles que le suivi d'objets fixes et quelconques au sol quels que soient les mouvements du drone. Dans une première partie, un algorithme d'analyse d'image est proposé. Il est basé sur une estimation globale/locale permettant d'estimer la position de l'objet. Dans une seconde partie, une loi de commande classique fonctionnant avec une double boucle d'asservissement est proposée. Pour diminuer le temps de réponse du système, une nouvelle loi de commande sur-échantillonnée utilisant les résultats intermédiaires de l'analyse d'image est proposée. Nous nous intéressons aussi aux problèmes de non-linéarité du système et proposons une solution basée sur un contrôleur LQR. Des simulations et des expérimentations en conditions réelles montrent la validité de notre approche.
|
Page generated in 0.0555 seconds