• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 43
  • 6
  • 2
  • Tagged with
  • 51
  • 26
  • 17
  • 15
  • 11
  • 9
  • 8
  • 8
  • 7
  • 7
  • 7
  • 6
  • 6
  • 6
  • 6
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
41

DSpace aplicado al repositorio institucional RedLIEDS (Red Latinoamericana sobre Industrias Extractivas y Desarrollo Sostenible)

Muñante Arzapalo, Denisse Yessica January 2010 (has links)
Actualmente están ocurriendo algunos eventos y reflexiones en la comunidad internacional respecto al derecho y a la necesidad de acceso libre al conocimiento. Como modelo de publicación, difusión y preservación de contenidos académicos, tomamos a los Repositorios Institucionales, que facilitan el acceso a la posesión y uso de los derechos de publicación por parte de los autores y editoriales comerciales. Con miras a contribuir a alcanzar las metas planteadas para América Latina y el Caribe, relacionadas a la construcción de los Medios para preservar el Patrimonio Intelectual Académico sobre Industrias Extractivas y Desarrollo Sostenible, se propone la creación de una Red Latinoamericana basada en los Repositorios Institucionales, el cual será una comunidad digital interconectada cuyas actividades se relacionan con la temática del desarrollo sostenible y las industrias extractivas, con énfasis especial, en las actividades mineras, concentrado en unir y potenciar la participación de las instituciones académicas de la región de América Latina y el Caribe (LAC), en esa línea se estableció un Convenio de Cooperación con la Universidad Nacional Mayor de San Marcos del Perú para que en colaboración con la UNCTAD (Conferencia de las Naciones sobre el Comercio y Desarrollo) se ponga en marcha una red regional interactiva sobre las industrias extractivas y desarrollo sostenible. Se concibe como un proyecto de alcance regional, de carácter cooperativo que se ha desarrollado en dos fases. La primera fase estableció RedLIEDS en el Taller Internacional organizado por UNCTAD en Lima en Abril del 2003, se creó el Sitio Web que es considerado como uno de los principales medios a través del cual se difunde información en torno a la temática minera y desarrollo sostenible. Para la segunda fase incluye la utilización de los repositorios institucionales como fuente para la preservación del patrimonio intelectual de los miembros de la Red. En el futuro se espera motivar y poder contar con la cooperación de más instituciones educativas y otras entidades de la sociedad civil para nutrir esta iniciativa con la mayor información posible y que abarque a los principales países mineros de la región, así como generar espacios de participación ciudadana informada vía la interconexión que las Tecnologías de la Comunicación e Información facilitan. -- Palabras Claves: Repositorios Institucionales, DSpace, RedLIEDS, OAI, Dublin Core / -- Now, some events and reflections in the international community occur in favour of the right and the necessity to have the free access to knowledge. The Institutional Repositories, which be taken like a model of the publishing, dissemination and preservation of the academic contents, facilitate to access to the possession and the use of the publishing rights for authors and commercial publishers. In raison the achieving the proposed goals in Latin America and the Caribe, which are related to built the ways to preserve Academic Intellectual Patrimony about Extractive Industries and Sustainable Development, we propose to create a Latin American Net on the Institutional Repositories, which will be a interconnected digital community whose activities are related to the extractive industries, sustainable development and specially mining activities, which join and maximize the participation of academic institutions in Latin America and the Caribe (LAC); in this way, a Convention of Cooperation was created with the collaboration of the University Mayor de San Marcos from Peru and the UNCTAD (Conference of Nations about the Commerce and the Development), which put a interactive regional net about extractive industries and sustainable development. This project, which is considered like a regional project with a cooperative character, was developed en two phases. The first phase established RedLIEDS in the International Workshop which was organised by UNCTAD in Lima in April 2003, where was created the Web Site which is considered like a principal way to disseminate information about mining thematic and sustainable development. The second phase includes the utilisation of the institutional repositories like source to preserve the intellectual patrimony of net’s members. In the future, we hope to motivate and to increase the cooperation of educative institutions and others entities of the civil society in order to increase this initiative to have more information and to include to the principal mining countries of the region, as well as generating spaces of citizen participation informed via the interconnection that the Information Technology provide. -- Key Words: Institutional Repositories, DSpace, RedLIEDS, OAI, Dublin Core
42

Implementación de un dashboard para un repositorio de metadatos: caso de estudio REPOX

Cuba Samaniego, Lizbeth Mónica January 2016 (has links)
Publicación a texto completo no autorizada por el autor / Estudia a los dashboards desde el punto de vista académico y también teniendo en cuenta las tecnologías de Inteligencia de Negocio (BI) disponible en código abierto (open-source). La motivación de este trabajo es proponer una interfaz de un dashboard operativo para REPOX, que es una herramienta existente para gestionar los procesos de transferencia de datos de las bibliotecas digitales, también se dan las bases para el diseño, implementación y validación de un dashboard operativo para REPOX. / Tesis
43

Entorno para la Gestión Semántica de Información Biomédica en Investigación Traslacional

Miñarro Giménez, José Antonio 25 May 2012 (has links)
Las investigaciones traslacionales tienen el objetivo de poner a disposición de investigaciones las evidencias obtenidas en investigaciones básicas para ensayos clínicos. Para facilitar la investigación traslacional es necesario relacionar dicha información mediante la integración de repositorios de información biológica y médica. Debido a la complejidad, cantidad, diversidad y rápida evolución de la información biológica, es imposible gestionar los repositorios biológicos de manera manual ya que supondría una gran inversión en tiempo y en esfuerzo. Por lo tanto, cada vez más es necesario dotar de nuevas herramientas de gestión que faciliten esta tarea y pueda ser realizada de manera autónoma. Esta tesis presenta un entorno para la gestión e integración semántica utilizado las tecnologías de la Web semántica, las cuales son utilizadas para representar, almacenar, explotar y guiar el proceso de integración de la información y conocimiento. Como resultado principal se integraron repositorios de genes y proteínas ortólogas con enfermedades genéticas. / Translational research aims to connect basic biomedical researches with clinical research in order to reach new conclusions based on biomedical evidences. To facilitate the translational research, biological and biomedical information must be related. So, we need to integrate biological and biomedical repositories. Life sciences is a knowledge based discipline, in the data and knowledge is represented through vast amounts of complex and changing information stored in disparate resources and in machine-unfriendly formats. Therefore, the availability of computational methods for organizing, accessing and retrieving information in a systematic way has become crucial for the progress of research in life sciences. In this thesis, we present a framework for the semantic management and integration using semantic web technologies. This framework assists life scientists in the exploration of orthologs/genetic diseases research paths by providing a precise, explicit meaning for information units and intertwining such information.
44

Democratização da informação a partir do uso de repositórios digitais institucionais : da comunicação científica às informações tecnológicas de patentes

Brandão, Felipe Grando January 2016 (has links)
O presente estudo aborda a produção, a comunicação e o uso da informação científica e tecnológica no contexto dos repositórios digitais institucionais de universidades brasileiras, bem como a disseminação e o uso das informações contidas em documentos de patente. Verifica-se que o uso dessas informações ainda é insipiente no Brasil, mesmo nas universidades, e considera-se que um meio de promover esse tema é explorando os serviços prestados pelos repositórios na divulgação da propriedade intelectual gerada nessas instituições. Para tanto, tem-se como objetivo geral estudar a democratização do acesso à informação a partir dos repositórios digitais institucionais, considerando seus elementos aderentes e seu uso para a comunicação das informações tecnológicas de patentes. Trata-se de uma pesquisa exploratória e interpretativa, dividida em quatro etapas qualitativas: pesquisa do referencial bibliográfico; identificação dos campos de metadados sobre patentes nos repositórios; verificação da existência de depósitos de patentes no Instituto Nacional da Propriedade Industrial de titularidade das universidades pesquisadas; comparações e análises. Identificou-se que não é uma prática corrente a disponibilização das informações dos documentos de patente nos repositórios, bem como se constata uma baixa padronização em relação aos metadados utilizados ou aos valores a estes atribuídos. Propõe-se um conjunto de metadados para a descrição dos documentos de patente e promove-se uma discussão crítica a respeito dos temas abordados. / The present study deals with the production, communication and use of scientific and technological information in the context of institutional digital repositories of Brazilian universities, as well as the dissemination and use of the information contained in patent documents. It is verified that the use of this information is still insipient in Brazil, even in the universities, and it is considered that a means to promote this theme is exploring the services provided by the repositories in the divulgation of the intellectual property generated in these institutions. For this purpose, the general objective is to study the democratization of access to information from institutional digital repositories, considering their adherent elements and their use for the communication of technological patent information. This is an exploratory and interpretative research, divided in four qualitative stages: research of the bibliographic reference; identification of patent metadata fields in repositories; verification of the existence of patent deposits in the National Institute of Industrial Property owned by the researched universities; comparisons and analyzes. It was identified that it is not current practice to make patent document information available in repositories, as well as low standardization in relation to the metadata used or the values assigned to them. A set of metadata is proposed for the description of the patent documents and a critical discussion about the topics covered is promoted. / El presente estudio aborda la producción, la comunicación y el uso de la información científica y tecnológica en el contexto de los repositorios digitales institucionales de universidades brasileñas, así como la diseminación y el uso de la información contenida en documentos de patente. Se verifica que el uso de esas informaciones aún es insipiente en Brasil, incluso en las universidades, y se considera que un medio de promover ese tema es explorando los servicios prestados por los repositorios en la divulgación de la propiedad intelectual generada en esas instituciones. Para ello, se tiene como objetivo general estudiar la democratización del acceso a la información a partir de los repositorios digitales institucionales, considerando sus elementos adherentes y su uso para la comunicación de las informaciones tecnológicas de patentes. Se trata de una investigación exploratoria e interpretativa, dividida en cuatro etapas cualitativas: investigación del referencial bibliográfico; identificación de los campos de metadatos sobre patentes en los repositorios; verificación de la existencia de depósitos de patentes en el Instituto Nacional de la Propiedad Industrial de titularidad de las universidades investigadas; comparaciones y análisis. Se identificó que no es una práctica corriente la disponibilización de las informaciones de los documentos de patente en los repositorios, así como se constata una baja estandarización en relación a los metadatos utilizados oa los valores a éstos asignados. Se propone un conjunto de metadatos para la descripción de los documentos de patente y se promueve una discusión crítica sobre los temas abordados.
45

Democratização da informação a partir do uso de repositórios digitais institucionais : da comunicação científica às informações tecnológicas de patentes

Brandão, Felipe Grando January 2016 (has links)
O presente estudo aborda a produção, a comunicação e o uso da informação científica e tecnológica no contexto dos repositórios digitais institucionais de universidades brasileiras, bem como a disseminação e o uso das informações contidas em documentos de patente. Verifica-se que o uso dessas informações ainda é insipiente no Brasil, mesmo nas universidades, e considera-se que um meio de promover esse tema é explorando os serviços prestados pelos repositórios na divulgação da propriedade intelectual gerada nessas instituições. Para tanto, tem-se como objetivo geral estudar a democratização do acesso à informação a partir dos repositórios digitais institucionais, considerando seus elementos aderentes e seu uso para a comunicação das informações tecnológicas de patentes. Trata-se de uma pesquisa exploratória e interpretativa, dividida em quatro etapas qualitativas: pesquisa do referencial bibliográfico; identificação dos campos de metadados sobre patentes nos repositórios; verificação da existência de depósitos de patentes no Instituto Nacional da Propriedade Industrial de titularidade das universidades pesquisadas; comparações e análises. Identificou-se que não é uma prática corrente a disponibilização das informações dos documentos de patente nos repositórios, bem como se constata uma baixa padronização em relação aos metadados utilizados ou aos valores a estes atribuídos. Propõe-se um conjunto de metadados para a descrição dos documentos de patente e promove-se uma discussão crítica a respeito dos temas abordados. / The present study deals with the production, communication and use of scientific and technological information in the context of institutional digital repositories of Brazilian universities, as well as the dissemination and use of the information contained in patent documents. It is verified that the use of this information is still insipient in Brazil, even in the universities, and it is considered that a means to promote this theme is exploring the services provided by the repositories in the divulgation of the intellectual property generated in these institutions. For this purpose, the general objective is to study the democratization of access to information from institutional digital repositories, considering their adherent elements and their use for the communication of technological patent information. This is an exploratory and interpretative research, divided in four qualitative stages: research of the bibliographic reference; identification of patent metadata fields in repositories; verification of the existence of patent deposits in the National Institute of Industrial Property owned by the researched universities; comparisons and analyzes. It was identified that it is not current practice to make patent document information available in repositories, as well as low standardization in relation to the metadata used or the values assigned to them. A set of metadata is proposed for the description of the patent documents and a critical discussion about the topics covered is promoted. / El presente estudio aborda la producción, la comunicación y el uso de la información científica y tecnológica en el contexto de los repositorios digitales institucionales de universidades brasileñas, así como la diseminación y el uso de la información contenida en documentos de patente. Se verifica que el uso de esas informaciones aún es insipiente en Brasil, incluso en las universidades, y se considera que un medio de promover ese tema es explorando los servicios prestados por los repositorios en la divulgación de la propiedad intelectual generada en esas instituciones. Para ello, se tiene como objetivo general estudiar la democratización del acceso a la información a partir de los repositorios digitales institucionales, considerando sus elementos adherentes y su uso para la comunicación de las informaciones tecnológicas de patentes. Se trata de una investigación exploratoria e interpretativa, dividida en cuatro etapas cualitativas: investigación del referencial bibliográfico; identificación de los campos de metadatos sobre patentes en los repositorios; verificación de la existencia de depósitos de patentes en el Instituto Nacional de la Propiedad Industrial de titularidad de las universidades investigadas; comparaciones y análisis. Se identificó que no es una práctica corriente la disponibilización de las informaciones de los documentos de patente en los repositorios, así como se constata una baja estandarización en relación a los metadatos utilizados oa los valores a éstos asignados. Se propone un conjunto de metadatos para la descripción de los documentos de patente y se promueve una discusión crítica sobre los temas abordados.
46

Democratização da informação a partir do uso de repositórios digitais institucionais : da comunicação científica às informações tecnológicas de patentes

Brandão, Felipe Grando January 2016 (has links)
O presente estudo aborda a produção, a comunicação e o uso da informação científica e tecnológica no contexto dos repositórios digitais institucionais de universidades brasileiras, bem como a disseminação e o uso das informações contidas em documentos de patente. Verifica-se que o uso dessas informações ainda é insipiente no Brasil, mesmo nas universidades, e considera-se que um meio de promover esse tema é explorando os serviços prestados pelos repositórios na divulgação da propriedade intelectual gerada nessas instituições. Para tanto, tem-se como objetivo geral estudar a democratização do acesso à informação a partir dos repositórios digitais institucionais, considerando seus elementos aderentes e seu uso para a comunicação das informações tecnológicas de patentes. Trata-se de uma pesquisa exploratória e interpretativa, dividida em quatro etapas qualitativas: pesquisa do referencial bibliográfico; identificação dos campos de metadados sobre patentes nos repositórios; verificação da existência de depósitos de patentes no Instituto Nacional da Propriedade Industrial de titularidade das universidades pesquisadas; comparações e análises. Identificou-se que não é uma prática corrente a disponibilização das informações dos documentos de patente nos repositórios, bem como se constata uma baixa padronização em relação aos metadados utilizados ou aos valores a estes atribuídos. Propõe-se um conjunto de metadados para a descrição dos documentos de patente e promove-se uma discussão crítica a respeito dos temas abordados. / The present study deals with the production, communication and use of scientific and technological information in the context of institutional digital repositories of Brazilian universities, as well as the dissemination and use of the information contained in patent documents. It is verified that the use of this information is still insipient in Brazil, even in the universities, and it is considered that a means to promote this theme is exploring the services provided by the repositories in the divulgation of the intellectual property generated in these institutions. For this purpose, the general objective is to study the democratization of access to information from institutional digital repositories, considering their adherent elements and their use for the communication of technological patent information. This is an exploratory and interpretative research, divided in four qualitative stages: research of the bibliographic reference; identification of patent metadata fields in repositories; verification of the existence of patent deposits in the National Institute of Industrial Property owned by the researched universities; comparisons and analyzes. It was identified that it is not current practice to make patent document information available in repositories, as well as low standardization in relation to the metadata used or the values assigned to them. A set of metadata is proposed for the description of the patent documents and a critical discussion about the topics covered is promoted. / El presente estudio aborda la producción, la comunicación y el uso de la información científica y tecnológica en el contexto de los repositorios digitales institucionales de universidades brasileñas, así como la diseminación y el uso de la información contenida en documentos de patente. Se verifica que el uso de esas informaciones aún es insipiente en Brasil, incluso en las universidades, y se considera que un medio de promover ese tema es explorando los servicios prestados por los repositorios en la divulgación de la propiedad intelectual generada en esas instituciones. Para ello, se tiene como objetivo general estudiar la democratización del acceso a la información a partir de los repositorios digitales institucionales, considerando sus elementos adherentes y su uso para la comunicación de las informaciones tecnológicas de patentes. Se trata de una investigación exploratoria e interpretativa, dividida en cuatro etapas cualitativas: investigación del referencial bibliográfico; identificación de los campos de metadatos sobre patentes en los repositorios; verificación de la existencia de depósitos de patentes en el Instituto Nacional de la Propiedad Industrial de titularidad de las universidades investigadas; comparaciones y análisis. Se identificó que no es una práctica corriente la disponibilización de las informaciones de los documentos de patente en los repositorios, así como se constata una baja estandarización en relación a los metadatos utilizados oa los valores a éstos asignados. Se propone un conjunto de metadatos para la descripción de los documentos de patente y se promueve una discusión crítica sobre los temas abordados.
47

[pt] MINERAÇÃO DE INFORMAÇÃO EM LINGUAGEM NATURAL PARA APOIAR A ELICITAÇÃO DE REQUISITOS / [en] MINING INFORMATION IN NATURAL LANGUAGE TO SUPPORT REQUIREMENTS ELICITATION

ROXANA LISETTE QUINTANILLA PORTUGAL 02 December 2016 (has links)
[pt] Este trabalho descreve a mineração de informações em linguagem natural a partir do repositório de projetos GitHub. É explicada como o conteúdo de projetos semelhantes dada uma busca por domínio podem ser úteis para o reuso de conhecimento, e assim, ajudar nas tarefas de Elicitação de Requisitos. Técnicas de mineração de textos, regularidades independentes do domínio, e os metadados de GitHub são os métodos utilizados para selecionar projetos relevantes e as informações dentro deles. Uma abordagem para atingir nossa meta utilizando pesquisa exploratória é explicada, bem como descrevemos os resultados alcançados. / [en] This work describes the mining of information in natural language from the GitHub repository. It is explained how the content of similar projects given a search domain can be useful for the reuse of knowledge, and thus help in the Requirements Elicitation tasks. Techniques of text mining, regularities independent from domain, and GitHub metadata are the methods used to select relevant projects and the information within them. One approach to achieve our goal is explained with an exploratory research and the results achieved.
48

Actitudes hacia el uso del ordenador e integración de los objetos de aprendizaje en la enseñanza de Arquitectura Técnica: motivación, utilidad y facilidad de uso percibidas

García Vera, Victoria Eugenia 06 February 2015 (has links)
En este trabajo se estudian las percepciones y actitudes del alumnado hacia el uso del ordenador y el uso de OA como apoyo a la enseñanza. También se estudia la relación entre la utilidad percibida de los OA con: la motivación manifestada por el alumnado durante la utilización de estos, su facilidad de uso percibida, y las percepciones y actitudes hacia el uso del ordenador; todo ello en el ámbito de la asignatura OCOMPV de la Universidad de Alicante. Los resultados indican que el alumnado tiene percepciones y actitudes favorables hacia el uso del ordenador y la utilización de OA como apoyo a la enseñanza. No obstante, el alumnado considera que el material digital es un complemento a la enseñanza presencial pero no un sustituto. Por otro lado, no manifiesta una preferencia clara entre el uso del ordenador y el uso de los libros. Los resultados nos permiten llegar a la conclusión, de que existe una relación positiva estadísticamente significativa entre la utilidad percibida de los OA con los tres aspectos mencionados anteriormente (motivación manifestada, facilidad de uso percibida, y percepciones y actitudes hacia el uso del ordenador). Este hallazgo contribuye a poner de relieve, que en el proceso de diseño y creación de un OA se debe procurar que estos motiven y sean fáciles de usar. Así mismo, se pone de manifiesto la importancia del desarrollo de políticas activas, que fomenten percepciones y actitudes positivas hacia el uso del ordenador, por parte de las instituciones educativas que desean promover la enseñanza apoyada en el uso de las TIC. / Vicerrectorado de Investigación, Desarrollo e Innovación de la Universidad de Alicante.
49

Avaliação do processo de indexação de assuntos em repositórios institucionais pela abordagem da recuperação da informação /

Tartarotti, Roberta Cristina Dal'Evedove January 2019 (has links)
Orientador: Mariângela Spotti Lopes Fujita / Resumo: Na contemporaneidade, os repositórios institucionais possibilitam a reunião, armazenamento, tratamento, preservação e visibilidade dos recursos informacionais produzidos no âmbito acadêmico. Considerando-se que o campo da Organização do Conhecimento possui os fundamentos teórico-práticos necessários no que tange aos problemas de representação e recuperação em sistemas de recuperação da informação, a proposição da tese foi investigar/avaliar o processo de indexação de assuntos em repositórios institucionais no contexto de bibliotecas universitárias e sua influência na recuperação da informação pelos usuários, visando o aprimoramento do tratamento/da representação temática da informação documental e da recuperação por assuntos. O objetivo geral da pesquisa foi contribuir para a implementação/melhorias de diretrizes de indexação de assuntos em repositórios institucionais no contexto de bibliotecas universitárias, possibilitando a adequada representação e recuperação por assuntos nestes sistemas de recuperação da informação. Para tanto, foram delineados os seguintes objetivos específicos: a) realizar estudo teórico sobre os repositórios institucionais como sistemas de recuperação da informação e do processo de indexação de assuntos em perspectiva dicotômica: do tratamento/da representação e da recuperação por assuntos no contexto de bibliotecas universitárias; b) investigar o tratamento/a representação temática da informação documental em repositórios institucionais no contexto d... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: In present times, the institutional repositories enable the gathering, storage, treatment, preservation and visibility of information resources produced in the academic field. Considering that the Knowledge Organization field has the necessary theoretical-practical foundations regarding the issues of representation and retrieval in information retrieval systems, the proposition of the thesis was to investigate/evaluate the subject indexing process in institutional repositories in the context of academic libraries and its influence on information retrieval by users, aiming at improving the treatment/thematic representation of documentary information and subject retrieval. The general objective of the research was to contribute to the implementation / improvement of subject index guidelines in institutional repositories in the context of academic libraries, enabling the adequate representation and subject retrieval in information retrieval systems. To this end, the following specific objectives were outlined: a) conducting a theoretical study on institutional repositories as information retrieval systems and the subject index process within in a dichotomous perspective: of the treatment/of the representation and of the subject retrieval in the context of academic libraries; b) investigating the treatment/the thematic representation of documentary information in institutional repositories in the context of academic libraries, by means of the application of organizational diagnos... (Complete abstract click electronic access below) / Resumen: En los tiempos contemporáneos, los repositorios institucionales permiten la recolección, almacenamiento, tratamiento, preservación y visibilidad de los recursos informacionales producidos en el campo académico. Considerando que el campo de la Organización del Conocimiento presenta los fundamentos teórico-prácticos necesarios en cuanto a los problemas de representación y recuperación en los sistemas de recuperación de información, la propuesta de la tesis fue investigar/evaluar el proceso de indización por materias en repositorios institucionales y su influencia en la recuperación de información por los usuarios, pretendiendo el perfeccionamiento del tratamiento temático de la información documental y de la recuperación por materias en estos sistemas de recuperación tanto en el contexto de bibliotecas universitarias como en el ámbito académico. El objetivo general de la investigación fue contribuir a la implementación/mejoras de directrices de indización por materias en repositorios institucionales en el contexto de bibliotecas universitarias, posibilitando la adecuada representación y recuperación por materias en estos sistemas de recuperación de información. Para ello, fueron delineados los seguientes objetivos específicos: a) realizar un estudio teórico sobre el proceso de indización por materias desde la perspectiva de la Organización del Conocimiento en perspectiva dicotómica: del tratamiento/de la representación y de la recuperación por materias en el contexto de bibliot... (Resumen completo clicar acceso eletrônico abajo) / Doutor
50

Confidence Measures for Automatic and Interactive Speech Recognition

Sánchez Cortina, Isaías 07 March 2016 (has links)
[EN] This thesis work contributes to the field of the {Automatic Speech Recognition} (ASR). And particularly to the {Interactive Speech Transcription} and {Confidence Measures} (CM) for ASR. The main goals of this thesis work can be summarised as follows: 1. To design IST methods and tools to tackle the problem of improving automatically generated transcripts. 2. To assess the designed IST methods and tools on real-life tasks of transcription in large educational repositories of video lectures. 3. To improve the reliability of the IST by improving the underlying (CM). Abstracts: The {Automatic Speech Recognition} (ASR) is a crucial task in a broad range of important applications which could not accomplished by means of manual transcription. The ASR can provide cost-effective transcripts in scenarios of increasing social impact such as the {Massive Open Online Courses} (MOOC), for which the availability of accurate enough is crucial even if they are not flawless. The transcripts enable search-ability, summarisation, recommendation, translation; they make the contents accessible to non-native speakers and users with impairments, etc. The usefulness is such that students improve their academic performance when learning from subtitled video lectures even when transcript is not perfect. Unfortunately, the current ASR technology is still far from the necessary accuracy. The imperfect transcripts resulting from ASR can be manually supervised and corrected, but the effort can be even higher than manual transcription. For the purpose of alleviating this issue, a novel {Interactive Transcription of Speech} (IST) system is presented in this thesis. This IST succeeded in reducing the effort if a small quantity of errors can be allowed; and also in improving the underlying ASR models in a cost-effective way. In other to adequate the proposed framework into real-life MOOCs, another intelligent interaction methods involving limited user effort were investigated. And also, it was introduced a new method which benefit from the user interactions to improve automatically the unsupervised parts ({Constrained Search} for ASR). The conducted research was deployed into a web-based IST platform with which it was possible to produce a massive number of semi-supervised lectures from two different well-known repositories, videoLectures.net and poliMedia. Finally, the performance of the IST and ASR systems can be easily increased by improving the computation of the {Confidence Measure} (CM) of transcribed words. As so, two contributions were developed: a new particular {Logistic Regresion} (LR) model; and the speaker adaption of the CM for cases in which it is possible, such with MOOCs. / [ES] Este trabajo contribuye en el campo del {reconocimiento automático del habla} (RAH). Y en especial, en el de la {transcripción interactiva del habla} (TIH) y el de las {medidas de confianza} (MC) para RAH. Los objetivos principales son los siguientes: 1. Diseño de métodos y herramientas TIH para mejorar las transcripciones automáticas. 2. Evaluar los métodos y herramientas TIH empleando tareas de transcripción realistas extraídas de grandes repositorios de vídeos educacionales. 3. Mejorar la fiabilidad del TIH mediante la mejora de las MC. Resumen: El {reconocimiento automático del habla} (RAH) es una tarea crucial en una amplia gama de aplicaciones importantes que no podrían realizarse mediante transcripción manual. El RAH puede proporcionar transcripciones rentables en escenarios de creciente impacto social como el de los {cursos abiertos en linea masivos} (MOOC), para el que la disponibilidad de transcripciones es crucial, incluso cuando no son completamente perfectas. Las transcripciones permiten la automatización de procesos como buscar, resumir, recomendar, traducir; hacen que los contenidos sean más accesibles para hablantes no nativos y usuarios con discapacidades, etc. Incluso se ha comprobado que mejora el rendimiento de los estudiantes que aprenden de videos con subtítulos incluso cuando estos no son completamente perfectos. Desafortunadamente, la tecnología RAH actual aún está lejos de la precisión necesaria. Las transcripciones imperfectas resultantes del RAH pueden ser supervisadas y corregidas manualmente, pero el esfuerzo puede ser incluso superior al de la transcripción manual. Con el fin de aliviar este problema, esta tesis presenta un novedoso sistema de {transcripción interactiva del habla} (TIH). Este método TIH consigue reducir el esfuerzo de semi-supervisión siempre que sea aceptable una pequeña cantidad de errores; además mejora a la par los modelos RAH subyacentes. Con objeto de transportar el marco propuesto para MOOCs, también se investigaron otros métodos de interacción inteligentes que involucran esfuerzo limitado por parte del usuario. Además, se introdujo un nuevo método que aprovecha las interacciones para mejorar aún más las partes no supervisadas (ASR con {búsqueda restringida}). La investigación en TIH llevada a cabo se desplegó en una plataforma web con el que fue posible producir un número masivo de transcripciones de videos de dos conocidos repositorios, videoLectures.net y poliMedia. Por último, el rendimiento de la TIH y los sistemas de RAH se puede aumentar directamente mediante la mejora de la estimación de la {medida de confianza} (MC) de las palabras transcritas. Por este motivo se desarrollaron dos contribuciones: un nuevo modelo discriminativo {logístico} (LR); y la adaptación al locutor de la MC para los casos en que es posible, como por ejemplo en MOOCs. / [CA] Aquest treball hi contribueix al camp del {reconeixment automàtic de la parla} (RAP). I en especial, al de la {transcripció interactiva de la parla} i el de {mesures de confiança} (MC) per a RAP. Els objectius principals són els següents: 1. Dissenyar mètodes i eines per a TIP per tal de millorar les transcripcions automàtiques. 2. Avaluar els mètodes i eines TIP per a tasques de transcripció realistes extretes de grans repositoris de vídeos educacionals. 3. Millorar la fiabilitat del TIP, mitjançant la millora de les MC. Resum: El {reconeixment automàtic de la parla} (RAP) és una tasca crucial per una àmplia gamma d'aplicacions importants que no es poden dur a terme per mitjà de la transcripció manual. El RAP pot proporcionar transcripcions en escenaris de creixent impacte social com els {cursos online oberts massius} (MOOC). Les transcripcions permeten automatitzar tasques com ara cercar, resumir, recomanar, traduir; a més a més, fa accessibles els continguts als parlants no nadius i els usuaris amb discapacitat, etc. Fins i tot, pot millorar el rendiment acadèmic de estudiants que aprenen de xerrades amb subtítols, encara que aquests subtítols no siguen perfectes. Malauradament, la tecnologia RAP actual encara està lluny de la precisió necessària. Les transcripcions imperfectes resultants de RAP poden ser supervisades i corregides manualment, però aquest l'esforç pot acabar sent superior a la transcripció manual. Per tal de resoldre aquest problema, en aquest treball es presenta un sistema nou per a {transcripció interactiva de la parla} (TIP). Aquest sistema TIP va ser reeixit en la reducció de l'esforç per quan es pot permetre una certa quantitat d'errors; així com també en en la millora dels models RAP subjacents. Per tal d'adequar el marc proposat per a MOOCs, també es van investigar altres mètodes d'interacció intel·ligents amb esforç d''usuari limitat. A més a més, es va introduir un nou mètode que aprofita les interaccions per tal de millorar encara més les parts no supervisades (RAP amb {cerca restringida}). La investigació en TIP duta a terme es va desplegar en una plataforma web amb la qual va ser possible produir un nombre massiu de transcripcions semi-supervisades de xerrades de repositoris ben coneguts, videoLectures.net i poliMedia. Finalment, el rendiment de la TIP i els sistemes de RAP es pot augmentar directament mitjançant la millora de l'estimació de la {Confiança Mesura} (MC) de les paraules transcrites. Per tant, es van desenvolupar dues contribucions: un nou model discriminatiu logístic (LR); i l'adaptació al locutor de la MC per casos en que és possible, per exemple amb MOOCs. / Sánchez Cortina, I. (2016). Confidence Measures for Automatic and Interactive Speech Recognition [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/61473

Page generated in 0.0496 seconds