271 |
Examining the impact of expert modeling videos on nursing students' simulation competencyDodson, Tracy Michelle 28 April 2022 (has links)
No description available.
|
272 |
Optimization algorithms for video service delivery / Algorithmes d'optimisation de service vidéoAbousabea, Emad Mohamed Abd Elrahman 12 September 2012 (has links)
L'objectif de cette thèse est de fournir des algorithmes d'optimisation pour l'accès aux services vidéo qu’ils soient non-gérés (Internet TV) ou gérés (IPTV). Nous étudions des statistiques récentes concernant les services vidéo non-gérés comme YouTube et nous proposons des techniques d'optimisation appropriées qui pourraient améliorer l'accès aux fichiers vidéos et réduire le coût de cet accès. En outre, l’analyse des coûts joue un rôle important dans les décisions qui concernent la mise en cache des fichiers vidéos et celles liées au choix des périodes temporelles d'hébergement de ces fichiers sur les serveurs. En ce qui concerne les services vidéo gérés appelés IPTV, nous avons mené des expériences sur une architecture ouverte IPTV-collaboration entre différents opérateurs. Ce modèle est analysé selon un critère de coût d’investissement et d'exploitation à l'intérieur de la sphère domestique. En outre, nous avons introduit une solution d’optimisation dynamique de l'arbre « minimum spanning tree » (MST) pour le service IPTV multicast. Lors d’un accès nomade, les arbres statiques pourraient être incapables de fournir le service de manière efficace vu que l'utilisation de la bande passante augmente aux côté des points de streaming (racines de la topologie). Finalement, nous étudions des mesures de sécurité fiables en streaming vidéo basées sur la méthodologie de la chaîne de hachage et nous proposons un nouvel algorithme hybride. Nous effectuons des comparaisons entre les différentes manières utilisées dans la réalisation de la fiabilité des chaînes de hachage basées sur les classifications génériques / The aim of this thesis is to provide optimization algorithms for accessing video services either in unmanaged or managed ways. We study recent statistics about unmanaged video services like YouTube and propose suitable optimization techniques that could enhance files accessing and reduce their access costs. Moreover, this cost analysis plays an important role in decision making about video files caching and hosting periods on the servers. Under managed video services called IPTV, we conducted experiments for an open-IPTV collaborative architecture between different operators. This model is analyzed in terms of CAPEX and OPEX costs inside the domestic sphere. Moreover, we introduced a dynamic way for optimizing the Minimum Spanning Tree (MST) for multicast IPTV service. In nomadic access, the static trees could be unable to provide the service in an efficient manner as the utilization of bandwidth increases towards the streaming points (roots of topologies). Finally, we study reliable security measures in video streaming based on hash chain methodology and propose a new algorithm. Then, we conduct comparisons between different ways used in achieving reliability of hash chains based on generic classifications
|
273 |
Lineamientos para el diseño, publicación y evaluación del contenido multimedia accesible en la WebAcosta, Tania 05 November 2020 (has links)
Actualmente, vivimos en una era en la que probablemente la Web es la tecnología de la información y comunicación más importante, ya que proporciona acceso instantáneo a una fuente de información casi ilimitada desde cualquier lugar y en cualquier momento. Esta información es accedida a través del hipertexto, imágenes y contenido multimedia. Sin embargo, a pesar del avance tecnológico y la disponibilidad de estándares que guían la creación y publicación de contenido web accesible, millones de personas con discapacidades y adultos mayores enfrentan dificultades para acceder al contenido Web. Dado el momento histórico en el cual esta investigación se ha desarrollado, destacamos el hecho de que, debido a la pandemia de coronavirus, miles de instituciones educativas y millones de estudiantes han experimentado una transición abrupta e inesperada, de la modalidad presencial a la modalidad virtual. La mayoría de instituciones se han visto obligadas a continuar sus actividades académicas implementando sistemas de aprendizaje a distancia a gran escala, con plataformas educativas que se caracterizan por el uso masivo de videos. Esta “nueva normalidad” ha afectado particularmente a los estudiantes con discapacidades, ya que, en los últimos meses la brecha digital se ha acrecentado aún más, debido a falta de accesibilidad del contenido multimedia publicado en la Web. Problema que ha sido evidenciado desde hace algunos años en los cursos en línea masivos y abiertos (Massive Open Online Courses, MOOC). Esta tesis se desarrolló en tres fases y presenta un conjunto de lineamientos que aportan al diseño, publicación y evaluación del contenido multimedia accesible en la Web. Se han considerado fundamentalmente los tres estándares recomendados por el World Wide Web Consortium (W3C). Las Pautas de accesibilidad al contenido web 2.0 y 2.1 (Web Content Accessibility Guidelines, WCAG 2.0 y WCAG 2.1), las Pautas de accesibilidad de las herramientas de autor 2.0 (Authoring Tool Accessibility Guidelines, ATAG 2.0) y las Pautas de accesibilidad de los agentes de usuario 2.0 (User Agent Accessibility Guidelines, UAAG 2.0). La primera fase se llevó a cabo entre los años 2016-2018, y se enfocó en el estudio de la accesibilidad de los sistemas de gestión de aprendizaje (Learning Management System, LMS), los editores de contenido en línea y los sitios web de instituciones de educación superior (IES). Los resultados fueron presentados en cuatro artículos, tres de ellos están publicados en los Proceedings of the 8th International Conference on Education and New Learning Technologies (EDULEARN 2016), en los Proceedings of the 9th International Conference on Education Technology and Computers (ICETC 2017) y en los Proceedings of the International Conference on Information Technology and Systems (ICITS 2018). El cuarto estudio se publicó en la revista científica Enfoque UTE Edición Especial, dedicada a la International Conference on Information Systems and Computer Science 2016 (INCISCOS 2016). En el primer artículo se realizó un análisis comparativo del estado de la accesibilidad de tres LMS, dos de ellas de código abierto, Moodle y Sakai, mientras que la tercera plataforma fue desarrollada por una IES. La evaluación se realizó manualmente considerando las recomendaciones dadas en las WCAG 2.0. Los resultados nos permitieron identificar algunos problemas de accesibilidad relacionados con el proceso de aprendizaje virtual (e-learning). Por ejemplo, se evidenciaron problemas relacionados con el “manejo del contenido multimedia” y las “herramientas de autor”. El segundo artículo se enfocó en la evaluación de la accesibilidad de los sitios web de todas las IES ecuatorianas ubicadas en las categorías A, B, C y D, clasificación realizada con el Consejo de Evaluación Acreditación y Aseguramiento de la Calidad (CEAACES). Uno de los resultados más importantes fue la identificación de 8,970 elementos no accesibles. Se demostró el incumplimiento de algunas características básicas recomendadas por las WCAG 2.0. Adicionalmente, observamos que la herramienta automática eXaminator, usada en el proceso de evaluación, no reportó los problemas relacionados con la accesibilidad de la multimedia. De esta forma, se identificó al estudio de accesibilidad de la multimedia como una posible línea de investigación, en la que se podía realizar una contribución importante. Los siguientes dos estudios se enfocaron en el análisis de la accesibilidad de los editores de contenido en línea incluidos en los LMS. En estas investigaciones se consideraron las WCAG 2.0 y la parte B de ATAG 2.0. Como resultado, se propuso un método que incluyó 63 características de accesibilidad que deberían cumplir las imágenes, los encabezados y las tablas. Posteriormente, se aplicaron 15 de las 63 características propuestas, las cuales estuvieron orientadas en la creación de encabezados accesibles a través de los editores en línea. Los editores TinyMCE y Atto disponibles en Moodle fueron consideraron como casos de estudio. Los resultados demostraron que estos editores tienen un amplio camino por recorrer para ser totalmente accesibles. La segunda fase de esta investigación se desarrolló entre los años 2018-2019. En esta fase se analizó en profundidad la accesibilidad tanto de los videos grabados como de los reproductores de videos usados en los MOOC. Como resultado, dos artículos fueron publicados en los Proceedings of the 11th International Conference on Education and New Learning Technologies (EDULEARN 2019). En el primer estudio se abordó el cumplimiento de ocho criterios de éxito propuestos en las WCAG 2.1: subtítulos, audiodescripción, audiodescripción o medio alternativo, audiodescripción extendida, lengua de señas, medio alternativo, sonido de fondo bajo o ausente e idioma de las partes. Como resultado, se plantearon 11 lineamientos de accesibilidad que permiten crear videos grabados accesibles para las personas con discapacidad visual, auditiva, cognitiva y adultos mayores. Estos lineamientos fueron aplicados en la evaluación de 60 videos incluidos en 30 MOOC ofertados por las 10 plataformas más populares. Los resultados evidenciaron algunos problemas de accesibilidad, los cuales vulneran uno de los derechos humanos, el cual es el acceso a la educación sin discriminación. El segundo estudio se enfocó en el análisis de los requerimientos de accesibilidad de los reproductores de video. En este trabajo se propusieron 125 lineamientos de accesibilidad, considerando 44 criterios de éxito propuestos por la UAAG 2.0. Los requerimientos propuestos fueron aplicados en la evaluación de seis reproductores de video: Elmedia, Media Player Classic, QuickTime player para Mac, UMPlayer para Mac, VLC Media Player y YouTube. Los resultados demostraron que las personas con discapacidad y los adultos mayores enfrentan varias dificultades durante el acceso a las alternativas textual y auditiva. Esta investigación resalta la importancia de la accesibilidad tanto del contenido multimedia como de los reproductores de video. La tercera fase de esta investigación, se desarrolló entre los años 2019-2020. Como resultado del trabajo realizado, se publicaron dos artículos en la revista IEEE Access. Esta revista tiene un factor de impacto 3.745 clasificada en el primer cuartil (Q1) de acuerdo al Journal Citation Reports (JCR) de la base de datos bibliográfica Web of Science (WOS), así como también tiene un índice de impacto 0.775 de acuerdo al Scimago Journal Rank (SJR) de la base de datos Scopus. En esta fase, la investigación se enfocó por una parte, en una propuesta inédita de 278 técnicas que guían a los autores, a los diseñadores, a los programadores y a los evaluadores en el proceso de publicación de contenido multimedia accesible en la Web considerando básicamente la parte B de ATAG 2.0. Posteriormente, se validaron algunas de las técnicas y lineamientos propuestos durante todo el tiempo de duración de este programa de doctorado. En el último artículo se presentó el resultado de la evaluación de la accesibilidad de 91,421 videos grabados. Estos videos estaban publicados en YouTube por 113 universidades, ubicadas entre las mil mejores del mundo de acuerdo al Shanghai Ranking. Se realizó un profundo análisis estadístico del cumplimiento de características de accesibilidad tales como, los subtítulos, la transcripción textual, la audiodescripción, el medio alternativo, entre otros. También se evaluó la accesibilidad de la plataforma YouTube, demostrándose que esta plataforma carece de funciones que permitan a los usuarios asociar audiodescripción, audiodescripción extendida o un video con la interpretación en lengua de señas. No obstante, YouTube ofrece la posibilidad de generar automáticamente subtítulos y transcripción textual en varios idiomas. Esto sin duda es de gran ayuda para los usuarios, pero no suficiente para cumplir con las WCAG 2.1. Los resultados obtenidos en esta investigación resaltan la necesidad urgente de mejorar el bajo nivel actual de accesibilidad de los videos educativos, así como de los videos publicados en la Web.
|
274 |
A platform for multi-video learning content in emergency-related educational scenariosLozano-Prieto, David January 2021 (has links)
Utilizing multiple videos is an upcoming approach for developing learning material. It consists of recording scenes from different perspectives using diverse recording approaches, for example, 360-degrees camera, a drone camera, and body cameras. Up until now, there is a lack of efficient ways to present such recordings and extract the benefits of applying this type of media in learning contexts. To close this gap, this thesis explores suitable manners for presenting this specific type of media, aiming to be helpful for the further training of emergency-related learners. To achieve this goal, we performed a study structured in three major blocks: design of the solution, development of the designed system, and assessment of the suitability of the presented solution. The design was informed by a literature review, a qualitative expert interview, and a preferences questionnaire. After the design process, the system named Theia was developed using web-based technologies. Finally, to validate the system’s suitability within the context of this project, an expert evaluation was carried out. It consisted of a mixed assessment combining qualitative methods, based on task performance and qualitative interview assessment, and the usage of a Technology Acceptance Model (TAM) questionnaire, aiming for the usability and the ease of use of the developed tool. After the evaluation, the proposed system was concluded to incorporate a suitable layout, navigation, functionalities, and interactive mechanisms for an adequate video presentation of media footage from simultaneous recordings within an educational context for emergency-related students. Additionally, valuable insights were extracted from the analysis of the results for the future of the area of research, including recommendations for an optimal footage recording and the starting point for future work in the research community.
|
275 |
Mobile Devices in the Hands of the Youngest ChildrenJones Thomory, Diana, Mykhailovska, Nataliia January 2016 (has links)
Det har blivit modernt att använda mobila enheter i tidig ålder. Studien syftar till att förstå hur barn interagerar med mobila enheter under de första 4 levnadsåren och hur de kan hjälpa föräldrar att få inlärningsfördelar för de yngsta barnen. För att möta syftet med undersökningen fanns flera formulerade frågor om hur barnens utvecklingsnivå kan påverka möjligheten till interaktion och lärande med mobila enheter, vilka fördelar och nackdelar föräldrarna upptäckt under sina barns användning. Relevanta teorin presenterades om barns fysiska och kognitiva utveckling från 0 till 4 års ålder. Den blandade forskningsmetoden strategi (enkät och intervjuer) var tillräckligt effektiva för att förstå hur barnens användning av mobila enheter skiljer sig för varje år när de blir äldre. Det presenterades också några rekommendationer till föräldrarna. / It has become modern to use mobile devices at an early age. The study aims to understand the way young children interacts with mobile devices during the first 4 years of life and how mobile devices can help parents gain learning benefits for the youngest children. In order to meet the purpose of the research there were several formulated questions concerning how the stage of children’s development can affect the possibility of interaction and learning with mobile devices and what advantages and disadvantages the parents discovered during their children’s usage of mobile devices. The relevant theory was presented regarding children’s physical and cognitive development from 0 to 4 years old. The mixed method approach (survey and interviews) was effective enough to understand how the children usage of mobile devices differs from year to year as they become older. There were some recommendations for the parents that were presented as well.
|
276 |
<b>SAVORING STEREOTYPES: EXPLORING ORIENTALIZED NARRATIVES THROUGH AMERICAN REACTIONS TO EAST ASIAN FOODS ON YOUTUBE</b>Tyler Chan (18452739) 28 April 2024 (has links)
<p dir="ltr">This study conducts a comprehensive multimodal analysis of online food reaction videos (OFRV), uploaded by Buzzfeed, featuring Americans consuming and engaging with East Asian foods. Employing social semiotic theory, Orientalism, and colonialist discourses as theoretical lenses, this research aims to discern how these videos contribute to narratives that perpetuate the orientalized view that East Asian culture is fundamentally different from American culture and examine how these narratives are constructed multimodally via the YouTube platform. The methodological approach involves moment analysis, multimodal transcription, and in-depth analysis of selected moments to unravel narrative patterns and the various multimodal methods employed. Findings reveal pervasive decontextualization, stigmatizing, and an us vs. them paradigm surrounding the food, which reinforces orientalized portrayals. The study identifies distinct narrative patterns such as savagery, strangeness, sickness, and fear surrounding representations of Asian food, highlighting the multifaceted ways these narratives are constructed. The term "gastronomic orientalism" emerges from the analysis, encapsulating the complex process by which these videos utilize food representation to create an oriental narrative. This paper not only illuminates the multimodal construction of gastronomic orientalism but also contributes to future research by introducing a qualitative analysis method. The findings from this research suggest that media producers should prioritize cultural sensitivity and inclusivity to counter othering narratives against Asians in online media. Additionally, it suggests that future studies delve into more diversified video content and incorporate quantitative methods to yield more generalizable findings on cultural representation narratives.</p>
|
277 |
[pt] DETECÇÃO DE CONTEÚDO SENSÍVEL EM VIDEO COM APRENDIZADO PROFUNDO / [en] SENSITIVE CONTENT DETECTION IN VIDEO WITH DEEP LEARNINGPEDRO VINICIUS ALMEIDA DE FREITAS 09 June 2022 (has links)
[pt] Grandes quantidades de vídeo são carregadas em plataformas de hospedagem de vídeo a cada minuto. Esse volume de dados apresenta um desafio no controle do tipo de conteúdo enviado para esses serviços de hospedagem de vídeo, pois essas plataformas são responsáveis por qualquer mídia
sensível enviada por seus usuários. Nesta dissertação, definimos conteúdo
sensível como sexo, violencia fisica extrema, gore ou cenas potencialmente
pertubadoras ao espectador. Apresentamos um conjunto de dados de vídeo
sensível para classificação binária de vídeo (se há conteúdo sensível no vídeo
ou não), contendo 127 mil vídeos anotados, cada um com seus embeddings
visuais e de áudio extraídos. Também treinamos e avaliamos quatro modelos
baseline para a tarefa de detecção de conteúdo sensível em vídeo. O modelo
com melhor desempenho obteve 99 por cento de F2-Score ponderado no nosso subconjunto de testes e 88,83 por cento no conjunto de dados Pornography-2k. / [en] Massive amounts of video are uploaded on video-hosting platforms
every minute. This volume of data presents a challenge in controlling the
type of content uploaded to these video hosting services, for those platforms
are responsible for any sensitive media uploaded by their users. There
has been an abundance of research on methods for developing automatic
detection of sensitive content. In this dissertation, we define sensitive
content as sex, extreme physical violence, gore, or any scenes potentially
disturbing to the viewer. We present a sensitive video dataset for binary
video classification (whether there is sensitive content in the video or not),
containing 127 thousand tagged videos, Each with their extracted audio and
visual embeddings. We also trained and evaluated four baseline models for
the sensitive content detection in video task. The best performing model
achieved 99 percent weighed F2-Score on our test subset and 88.83 percent on the
Pornography-2k dataset.
|
278 |
Video extraction for fast content access to MPEG compressed videosJiang, Jianmin, Weng, Y. 09 June 2009 (has links)
No / As existing video processing technology is primarily
developed in the pixel domain yet digital video is stored in compressed
format, any application of those techniques to compressed
videos would require decompression. For discrete cosine transform
(DCT)-based MPEG compressed videos, the computing cost of
standard row-by-row and column-by-column inverse DCT (IDCT)
transforms for a block of 8 8 elements requires 4096 multiplications
and 4032 additions, although practical implementation only
requires 1024 multiplications and 896 additions. In this paper, we
propose a new algorithm to extract videos directly from MPEG
compressed domain (DCT domain) without full IDCT, which is
described in three extraction schemes: 1) video extraction in 2 2
blocks with four coefficients; 2) video extraction in 4 4 blocks
with four DCT coefficients; and 3) video extraction in 4 4 blocks
with nine DCT coefficients. The computing cost incurred only
requires 8 additions and no multiplication for the first scheme,
2 multiplication and 28 additions for the second scheme, and
47 additions (no multiplication) for the third scheme. Extensive
experiments were carried out, and the results reveal that: 1) the
extracted video maintains competitive quality in terms of visual
perception and inspection and 2) the extracted videos preserve the
content well in comparison with those fully decompressed ones
in terms of histogram measurement. As a result, the proposed
algorithm will provide useful tools in bridging the gap between
pixel domain and compressed domain to facilitate content analysis
with low latency and high efficiency such as those applications in
surveillance videos, interactive multimedia, and image processing.
|
279 |
Confidence Measures for Automatic and Interactive Speech RecognitionSánchez Cortina, Isaías 07 March 2016 (has links)
[EN] This thesis work contributes to the field of the {Automatic Speech Recognition} (ASR). And particularly to the {Interactive Speech Transcription} and {Confidence Measures} (CM) for ASR.
The main goals of this thesis work can be summarised as follows:
1. To design IST methods and tools to tackle the problem of improving automatically generated transcripts.
2. To assess the designed IST methods and tools on real-life tasks of transcription in large educational repositories of video lectures.
3. To improve the reliability of the IST by improving the underlying (CM).
Abstracts:
The {Automatic Speech Recognition} (ASR) is a crucial task in a broad range of important applications which could not accomplished by means of manual transcription. The ASR can provide cost-effective transcripts in scenarios of increasing social impact such as the {Massive Open Online Courses} (MOOC), for which the availability of accurate enough is crucial even if they are not flawless. The transcripts enable search-ability, summarisation, recommendation, translation; they make the contents accessible to non-native speakers and users with impairments, etc. The usefulness is such that students improve their academic performance when learning from subtitled video lectures even when transcript is not perfect.
Unfortunately, the current ASR technology is still far from the necessary accuracy.
The imperfect transcripts resulting from ASR can be manually supervised and corrected, but the effort can be even higher than manual transcription.
For the purpose of alleviating this issue, a novel {Interactive Transcription of Speech} (IST) system is presented in this thesis. This IST succeeded in reducing the effort if a small quantity of errors can be allowed; and also in improving the underlying ASR models in a cost-effective way.
In other to adequate the proposed framework into real-life MOOCs,
another intelligent interaction methods involving limited user effort were investigated. And also, it was introduced a new method which benefit from the user interactions to improve automatically the unsupervised parts ({Constrained Search} for ASR).
The conducted research was deployed into a web-based IST platform with which it was possible to produce a massive number of semi-supervised lectures from two different well-known repositories, videoLectures.net and poliMedia.
Finally, the performance of the IST and ASR systems can be easily increased by improving the computation of the {Confidence Measure} (CM) of transcribed words. As so, two contributions were developed:
a new particular {Logistic Regresion} (LR) model;
and the speaker adaption of the CM for cases in which it is possible, such with MOOCs. / [ES] Este trabajo contribuye en el campo del {reconocimiento automático del habla} (RAH). Y en especial, en el de la {transcripción interactiva del habla} (TIH) y el de las {medidas de confianza} (MC) para RAH. Los objetivos principales son los siguientes:
1. Diseño de métodos y herramientas TIH para mejorar las transcripciones automáticas.
2. Evaluar los métodos y herramientas TIH empleando tareas de transcripción realistas extraídas de grandes repositorios de vídeos educacionales.
3. Mejorar la fiabilidad del TIH mediante la mejora de las MC.
Resumen:
El {reconocimiento automático del habla} (RAH) es una tarea crucial en una amplia gama de aplicaciones importantes que no podrían realizarse mediante transcripción manual. El RAH puede proporcionar transcripciones rentables en escenarios de creciente impacto social como el de los {cursos abiertos en linea masivos} (MOOC), para el que la disponibilidad de transcripciones es crucial, incluso cuando no son completamente perfectas. Las transcripciones permiten la automatización de procesos como buscar, resumir, recomendar, traducir; hacen que los contenidos sean más accesibles para hablantes no nativos y usuarios con discapacidades, etc. Incluso se ha comprobado que mejora el rendimiento de los estudiantes que aprenden de videos con subtítulos incluso cuando estos no son completamente perfectos.
Desafortunadamente, la tecnología RAH actual aún está lejos de la precisión necesaria.
Las transcripciones imperfectas resultantes del RAH pueden ser supervisadas y corregidas manualmente, pero el esfuerzo puede ser incluso superior al de la transcripción manual. Con el fin de aliviar este problema, esta tesis presenta un novedoso sistema de {transcripción interactiva del habla} (TIH).
Este método TIH consigue reducir el esfuerzo de semi-supervisión siempre que sea aceptable una pequeña cantidad de errores; además mejora a la par los modelos RAH subyacentes.
Con objeto de transportar el marco propuesto para MOOCs, también se investigaron otros métodos de interacción inteligentes que involucran esfuerzo limitado por parte del usuario. Además, se introdujo un nuevo método que aprovecha las interacciones para mejorar aún más las partes no supervisadas (ASR con {búsqueda restringida}).
La investigación en TIH llevada a cabo se desplegó en una plataforma web con el que fue posible producir un número masivo de transcripciones de videos de dos conocidos repositorios, videoLectures.net y poliMedia.
Por último, el rendimiento de la TIH y los sistemas de RAH se puede aumentar directamente mediante la mejora de la estimación de la {medida de confianza} (MC) de las palabras transcritas. Por este motivo se desarrollaron dos contribuciones: un nuevo modelo discriminativo {logístico} (LR);
y la adaptación al locutor de la MC para los casos en que es posible, como por ejemplo en MOOCs. / [CA] Aquest treball hi contribueix al camp del {reconeixment automàtic de la parla} (RAP).
I en especial, al de la {transcripció interactiva de la parla} i el de {mesures de confiança} (MC) per a RAP.
Els objectius principals són els següents:
1. Dissenyar mètodes i eines per a TIP per tal de millorar les transcripcions automàtiques.
2. Avaluar els mètodes i eines TIP per a tasques de transcripció realistes extretes de grans repositoris de vídeos educacionals.
3. Millorar la fiabilitat del TIP, mitjançant la millora de les MC.
Resum:
El {reconeixment automàtic de la parla} (RAP) és una tasca crucial per una àmplia gamma d'aplicacions importants que no es poden dur a terme per mitjà de la transcripció manual. El RAP pot proporcionar transcripcions en escenaris de creixent impacte social com els {cursos online oberts massius} (MOOC). Les transcripcions permeten automatitzar tasques com ara cercar, resumir, recomanar, traduir; a més a més,
fa accessibles els continguts als parlants no nadius i els usuaris amb discapacitat, etc. Fins i tot, pot millorar el rendiment acadèmic de estudiants que aprenen de xerrades amb subtítols, encara que aquests subtítols no siguen perfectes. Malauradament, la tecnologia RAP actual encara està lluny de la precisió necessària.
Les transcripcions imperfectes resultants de RAP poden ser supervisades i corregides manualment, però aquest l'esforç pot acabar sent superior a la transcripció manual. Per tal de resoldre aquest problema, en aquest treball es presenta un sistema nou per a {transcripció interactiva de la parla} (TIP). Aquest sistema TIP va ser reeixit en la reducció de l'esforç per quan es pot permetre una certa quantitat d'errors;
així com també en en la millora dels models RAP subjacents.
Per tal d'adequar el marc proposat per a MOOCs, també es van investigar altres mètodes d'interacció intel·ligents amb esforç d''usuari limitat.
A més a més, es va introduir un nou mètode que aprofita les interaccions per tal de millorar encara més les parts no supervisades (RAP amb {cerca restringida}).
La investigació en TIP duta a terme es va desplegar en una plataforma web amb la qual va ser possible produir un nombre massiu de transcripcions semi-supervisades de xerrades de repositoris ben coneguts, videoLectures.net i poliMedia.
Finalment, el rendiment de la TIP i els sistemes de RAP es pot augmentar directament mitjançant la millora de l'estimació de la {Confiança Mesura} (MC) de les paraules transcrites. Per tant, es van desenvolupar dues contribucions: un nou model discriminatiu logístic (LR);
i l'adaptació al locutor de la MC per casos en que és possible, per exemple amb MOOCs. / Sánchez Cortina, I. (2016). Confidence Measures for Automatic and Interactive Speech Recognition [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/61473
|
280 |
Les effets d’un cercle pédagogique sur le regard professionnel et les pratiques pédagogiques des enseignants du 3e cycle du primaire en grammaire actuelleGiguère, Marie-Hélène 05 1900 (has links)
Notre recherche doctorale vise à décrire les effets d’un cercle pédagogique sur les pratiques pédagogiques et didactiques d’enseignants du 3e cycle du primaire en grammaire actuelle. Ce projet s’inscrit dans une recherche plus large intitulée « Étude des effets, sur les pratiques pédagogiques des enseignants et la compétence à écrire des élèves, d’un dispositif de formation à la grammaire nouvelle qui intègre des exemples de pratiques sur vidéo et permet un partage d'expertise ». Elle vise à éclairer les conditions d’efficacité d’une formation continue sur différentes dimensions du développement professionnel au regard de la formation elle-même et de son effet sur le transfert des pratiques en classe.
Pour y parvenir, nous avons analysé les échanges provenant des cercles pédagogiques vécus durant une année scolaire. Nous avons également analysé deux activités de grammaire, avant et après la formation en grammaire offerte sous forme de capsules. Ces observations en classe ont été captées sur vidéo, dans la classe de 18 enseignants participant à notre expérimentation. Nous avons enfin analysé les réponses des participants à un questionnaire sur leur perception à l’égard du dispositif de formation auquel ils ont participé pendant neuf mois.
Nos analyses montrent qu’un dispositif de formation à la grammaire actuelle qui met au cœur de la formation l’analyse d’exemples de pratiques sur vidéo soutient le développement du regard professionnel des enseignants dans le contexte du cercle. Ceux-ci observent plus d’interactions et les interprètent mieux, de manière plus approfondie. Nos observations ont également montré que les enseignants développent majoritairement des pratiques dans leur classe, qu’ils développent de nouveaux savoirs en lien avec le cadre théorique de la nouvelle grammaire et qu’ils modifient la vision qu’ils ont de la grammaire actuelle au fil des rencontres.
Cette recherche peut enrichir les connaissances scientifiques sur le développement professionnel et influencer les formateurs d’enseignants de même que les cadres des milieux scolaires pour ajuster l’offre de formation continue afin de la rendre plus efficace. / This doctoral research aims at describing the effects of the video club device on the teaching practices of teachers of modern grammar in the third cycle of elementary school. It is part of a larger research project entitled "Study of the effects on teachers’ teaching practices and student writing skills of a training device for the teaching of modern grammar that incorporates videos of examplairy practices and allows the sharing of expertise". It aims to clarify the conditions that allow for efficient in-service training on different aspects of professional development with regard to the training itself and its effect on the transfer of effective practices in the classroom.
To achieve this, we analyzed the discussions from video clubs over a whole school year period. We also analyzed the video clips of two grammar activities in grammar, shot before and after training in the classroom of 18 teachers involved in our experiment. Finally, we analyzed the participants’ answers to a questionnaire on their perception of the professionnal development device in witch they participated for nine months.
Our analyses show that a training device to modern grammar that centers the training practice on the analysis of examples from video clips supports the development of professional vision of teachers in the context of the video club. They observe more interactions and interpret better, more thoroughly. Our observations also show that most teachers develop practices in their class, develop new knowledge related to the theory of modern grammar and change their vision of modern grammar as the workshops unfold.
This research can enrich scientific knowledge on professional development and influence executives in the school system in offering more efficient in-service training to teachers.
|
Page generated in 0.0515 seconds