Return to search

Acesso e compreensão de conteúdos em português por estrangeiros em bibliotecas digitais científicas : uma proposta metodológica e sua implementação

Tese (doutorado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2017. / Submitted by Raquel Almeida (raquel.df13@gmail.com) on 2018-01-03T16:59:59Z
No. of bitstreams: 1
2017_FranciscoClaudioSampaioMenezes.pdf: 3289822 bytes, checksum: b8f47ba496299580041cca0841cae96d (MD5) / Approved for entry into archive by Raquel Viana (raquelviana@bce.unb.br) on 2018-03-14T20:14:03Z (GMT) No. of bitstreams: 1
2017_FranciscoClaudioSampaioMenezes.pdf: 3289822 bytes, checksum: b8f47ba496299580041cca0841cae96d (MD5) / Made available in DSpace on 2018-03-14T20:14:03Z (GMT). No. of bitstreams: 1
2017_FranciscoClaudioSampaioMenezes.pdf: 3289822 bytes, checksum: b8f47ba496299580041cca0841cae96d (MD5)
Previous issue date: 2018-03-14 / A sociedade do conhecimento se caracteriza pela veloz ampliação do acesso a conteúdos digitais e pelo uso das tecnologias de informação e comunicação, as quais disponibilizam instantaneamente tais acervos em qualquer parte do globo. Mercê dessa nova ecologia tecnológica, significativas transformações ocorrem nos serviços oferecidos pelas bibliotecas e no seu relacionamento com usuários, tanto presencialmente como à distância. No contexto dessa atuação, além das fronteiras clássicas das bibliotecas e de uma necessidade de maior vitalidade linguística do português no mundo digital, a pesquisa objeto desta tese identifica alguns obstáculos ao acesso e compreensão de conteúdos científicos digitais por não falantes do português e propõe uma metodologia automatizada para facilitar a compreensão de textos científicos. A identificação das necessidades de falantes estrangeiros para acessar e compreender os conteúdos de bibliotecas digitais em língua portuguesa se fundamentou em dados coletados junto a estudantes estrangeiros francófonos, da Universidade de Brasília e da Universidade Charles de Gaulle (Lille 3) na França. O arcabouço conceitual interdisciplinar da tese está baseado em diversas disciplinas: arquitetura da informação, teoria da relevância, multimodalidade e no processamento da linguagem natural. A metodologia proposta no trabalho é operacionalizada por um aplicativo, desenvolvido em software livre na linguagem de programação Python, que integra a filtragem de texto, a sumarização textual automática, a tradução por máquina e o alinhamento sentencial automático. Esse dispositivo computacional pode ser utilizado em qualquer biblioteca interessada em ofertar um serviço personalizado para seus usuários estrangeiros. Os resultados obtidos são encorajadores, possibilitam uma maior vitalidade da língua portuguesa no campo científico e oferecem um campo fértil para novas pesquisas na áreas abordadas pela tese. / The knowledge society is marked by the quick amplification of access to digital contents and by the use of information and communication technologies, which make available such contents everywhere in the globe. Thanks to this new technological ecology, significative transformations occur in services offered by libraries and in its relationship with users, both in face-to-face contact and at distance. In the context of such an activity beyond of the classical libray frontiers and of a necessity of greater linguistic vitality of Portuguese in the digital world, this research identifies some obstacles for access and understanding of digital scientific contents by nonportuguese speakers and proposes an automated methodology to facilitate the understanding of scientific texts. The identification of foreign speakers’ needs in accessing and understanding contents in digital libraries in Portuguese language is based on data collected with foreign francophone students, in Universidade de Brasília (in Brazil) and Université Chales de Gaulle (Lille 3, in France). The interdisciplinary conceptual framework of the thesis has its theoretical fundaments on several disciplines: information architecture, relevance theory, multimodality and natural language processing. The methodology proposed in this work is made operational through a set of computer programs, developed in the programming language Python under the concept of free software. It integrates four software devices: text filter, automatic text summarization, machine translation and automatic sentence alignment. This software can be used in any library that might be interested in offering a personalized service for its foreign users. The results achieved are very encouraging, ensure greater vitality of Portuguese language in the scientific field and offer a very fertile field for further research in this thesis subject. / La société de la connaissance est marquée par un très rapide enlargissement de l’accès à des contenus numériques et l’usage des technologies de l’information et communication, lesquelles mettent à disposition en ligne ce patrimoine numérique à toutes les parties du globe. Grace à cette nouvelle écologie technologique, des transformations significatives ont lieu dans les services offerts par les bibliothèques et dans son rapport avec leurs usagers, soit à distance comme de façon présentielle. Dans ce contexte, audelà des frontières classiques des bibliothèques et d´une nécessité d´une plus grande vitalité linguistique du portugais dans le monde numérique, la recherche objet de la présente thèse identifie quelques obstacles à l’accès et compréhension de contenus numériques par des non-parlants du portugais et on propose une méthodologie automatisée pour rendre plus facilie la compréhension de textes scientifiques. L’identification des besoins des parlants étrangers pour accèder et comprendre les contenus de bibliothèques numériques en langue portugaise est basé sur des données collectés auprès des étudiants étrangers francophones, à l´Université de Brasilia e à l´Université Charles de Gaulle (Lille 3), en France. Le environment conceptuel interdisciplinaire de cette thèse s’appuie en plusieurs disciplines: architecture de l’information, theorie de la pertinence, multimodalité et dans le traitement automatique de la langue. La méthodologie proposé dans ce travail est mis en fonctionnement par un outil informatique, dévéloppé en logiciel libre en language Python, lequel intègre un filtrage du texte original, la sommairisation textuelle automatique, la traduction par machine e l’alignemenet sentenciel automatique. Ce dispositif computationel peut être utilisé en n’importe quelle bibliothèque interessée pour offrir un service “à la carte” à ses utilisateurs étrangers. Les résultats obtenus sont très encourageants, permettent une plus grande vitalité linguistique de la langue portugaise dans le champ scientifique et offrent un terrain fertile pour des nouvelles recherches dans les domaines abordés para cette thèse.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/31438
Date29 November 2017
CreatorsMenezes, Francisco Cláudio Sampaio de
ContributorsBaptista, Dulce Maria
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageFrench
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Sourcereponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB
RightsA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data., info:eu-repo/semantics/openAccess

Page generated in 0.0024 seconds