• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 51
  • 3
  • 2
  • Tagged with
  • 56
  • 56
  • 25
  • 24
  • 18
  • 14
  • 9
  • 8
  • 8
  • 7
  • 7
  • 7
  • 7
  • 7
  • 7
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Modelos de comercialização de livros eletrônicos para bibliotecas do Distrito Federal

Costa, Raquel Pereira 11 December 2015 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-graduação em Ciência da Informação, 2015. / Submitted by Tania Milca Carvalho Malheiros (tania@bce.unb.br) on 2016-01-21T13:25:29Z No. of bitstreams: 1 2015_RaquelPereiraCosta.pdf: 1954818 bytes, checksum: f493042ab577e07edfce43047514b423 (MD5) / Approved for entry into archive by Patrícia Nunes da Silva(patricia@bce.unb.br) on 2016-01-21T14:01:08Z (GMT) No. of bitstreams: 1 2015_RaquelPereiraCosta.pdf: 1954818 bytes, checksum: f493042ab577e07edfce43047514b423 (MD5) / Made available in DSpace on 2016-01-21T14:01:08Z (GMT). No. of bitstreams: 1 2015_RaquelPereiraCosta.pdf: 1954818 bytes, checksum: f493042ab577e07edfce43047514b423 (MD5) / Este trabalho busca identificar os modelos de comercialização utilizados na aquisição de livros eletrônicos para bibliotecas do Distrito Federal. Inicialmente, identifica o conceito de livro eletrônico, seus formatos mais comuns e os aparelhos e programas utilizados para a sua leitura. Em seguida, identifica e analisa os modelos existentes de comercialização de livros eletrônicos para bibliotecas e os vendedores, que costumam ser editoras, agregadores ou distribuidores. São analisados os modelos de seleção disponíveis para as bibliotecas, dos quais os mais comuns são por título, por pacote ou por plano de aprovação. Esses modelos de negócios incluem o acesso perpétuo, a assinatura, o empréstimo de curto prazo e a aquisição orientada pelo usuário. Destaca os aspectos relacionados ao contrato de venda de livros eletrônicos e à necessidade de uma política de renovação e cancelamento das assinaturas; foca também nos direitos autorais e na gestão desses direitos, bem como em experiências de outras bibliotecas com livros eletrônicos. Analisa os resultados da pesquisa realizada com bibliotecas do Distrito Federal que compraram livros eletrônicos, comparando esses resultados com a literatura anteriormente citada. / This paper seeks to identify the business models used for the acquisition of electronic books for libraries in the Federal District. Initially, identifies the concept of electronic book, its most common formats and the devices and programs used for their reading. Then identifies and analyzes the existing models of acquisition of electronic books to libraries; and the different sellers, who usually are publishers, aggregators or distributors. The selection of models available for libraries are analyzed, of which the most common are by title, per package or approval plan. These business models include the perpetual access, the subscription, the short-term loan and the patron driven acquisition. Highlights aspects related to the licensing of electronic books and the need for a policy of renewal and cancellation of subscriptions; also focuses on copyright and the digital rights management, as well as the experiences of other libraries in dealing with electronic books. Finally, the methodology is described
12

Uma plataforma para suporte às bibliotecas digitais de eventos científicos com foco na extração de informação

ALVES, Neide Ferreira 16 August 2013 (has links)
Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-04-17T14:18:29Z No. of bitstreams: 2 TESE Neide Ferreira Alves .pdf: 4496625 bytes, checksum: 5673d5cd06a3ba049f1bdaec261136d6 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-04-17T14:18:29Z (GMT). No. of bitstreams: 2 TESE Neide Ferreira Alves .pdf: 4496625 bytes, checksum: 5673d5cd06a3ba049f1bdaec261136d6 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-08-16 / A presente tese descreve as especificações e requisitos para o desenvolvimento de Bibliotecas Digitais de documentos textuais, considerando a possibilidade de reuso e a extração de dados. Considerando o imenso volume de informação disponível nesses repositórios, é de grande interesse a construção de sistemas capazes de selecionar automaticamente apenas os dados de interesse do usuário, facilitando assim o acesso, a manipulação e a divulgação dessas informações. O Modelo de Referências de Biblioteca Digital da DELOS foi utilizado para guiar a construção do ambiente, como consequência foi desenvolvida a plataforma pLiveMemory com módulos implementados para desktop e web, neste último, a infraestrutura da nuvem do Google é utilizada. Entre os módulos desenvolvidos há um específico para identificação e extração de referências bibliográficas, o qual usa, entre outros, o algoritmo de Naïve Bayes juntamente com as técnicas de expressões regulares. Também há um módulo para identificação de palavras-chave em arquivos de formato PDF editável. Os resultados obtidos mostraram os ganhos com a utilização das estratégias adotadas nas diversas fases do projeto, como na classificação automática de informação dos textos de artigos científicos.
13

Conociendo "El libro total": Biblioteca digital universal de obras literarias

Cuesta, Sandra 26 November 2021 (has links)
Webinar de Biblioteca realizado el 26 de noviembre de 2021 / En este webinar se dará a conocer las áreas de conocimiento, tipo de contenido, número de contenidos y las herramientas con las que cuenta la plataforma de "El Libro Total".
14

Feedback de relevância orientado a termos: um novo método para ordenação de resultados de motores de busca. / Term-oriented relevance feedback: a novel ranking method for search engines.

Hattori, Fernando 23 May 2016 (has links)
O modelo de recuperação de informação mais amplamente utilizado no contexto de acervos digitais é o Vector Space Model. Algoritmos implementados para este modelo que aproveitam informações sobre relevância obtidas dos usuários (chamados feedbacks) na tentativa de melhorar os resultados da busca. Porém, estes algoritmos de feedback de relevância não possuem uma estratégia global e permanente, as informações obtidas desses feedbacks são descartadas para cada nova sessão de usuário (são perenes) ou não modificam os documentos como um todo (são alterações locais). Este trabalho apresenta um método de feedbacks de relevância denominado orientado a termos, permitindo que as modificações realizadas por influência dos feedbacks dos usuários sejam globais e permanentes. Foram realizados experimentos utilizando o dataset ClueWeb09 que dão evidências de que este método melhora a qualidade dos resultados da busca em relação ao modelo tradicional Vector Space Model. / The Vector Space Model is the most widely used information retrieval model within digital libraries\' systems. Algorithms developed to be used with this model use relevance information obtained from users (called feedbacks) to improve the search results. However, the relevance feedback algorithms developed are not global nor permanent, the feedbacks are discarded in users new sessions and do not affect every document. This paper presents a method that uses of relevance feedback named terms oriented. In this method, users\' feedbacks lead to modifications in the terms\' vectors representations. These modifications are global and permanent, influencing further searches. An experiment was conducted using the ClueWeb09 dataset, giving evidence that this method improves the quality of search results when compared with Vector Space Model.
15

Estudo exploratório sobre o uso e a busca de informações e de recursos didáticos por professores de biologia do ensino médio cadastrados na biblioteca digital de ciências da UNICAMP / Exploratory study on using online resources and the interest in information sources and educational resources by High School Biology Teachers enrolled in the Unicamp\'s Digital Library of Sciences

Chikuchi, Helika Amemiya 26 April 2011 (has links)
Este trabalho de caráter exploratório tinha como objetivos principais investigar o uso e a busca de informações e de recursos didáticos realizada pelos Professores de Biologia do Ensino Médio (PBEM) cadastrados na Biblioteca Digital de Ciências da Unicamp (BDC), em seu aprendizado e aperfeiçoamento profissional e nas suas atividades didáticas. Foram utilizados métodos de coleta de dados indiretos, que consistiram na aplicação de dois questionários estruturados online, e métodos diretos, que consistiram no registro realizado por ferramentas instaladas na BDC sobre as palavras-chave utilizadas, os comentários sobre os recursos e as mensagens eletrônicas dos professores. O primeiro questionário permitiu traçar um perfil dos PBEM. Eles têm em média 36,4 anos, a maioria é do sexo feminino, leciona em escola pública e vive na região sudeste. A maioria encontrou a BDC usando ferramentas de busca; no momento do cadastramento, já usava a Internet há mais de cinco anos, e estava interessada principalmente em conteúdos para subsidiar o preparo de aulas e em recursos didáticos. O segundo questionário mostrou que os PBEM tiveram uma formação inicial compatível com a função que exercem: a maioria fez Biologia ou Ciências Biológicas e licenciatura. Entretanto, quanto ao uso didático das tecnologias digitais, a maioria não teve nenhuma preparação nem na formação inicial e nem por meio de cursos de capacitação. Na investigação sobre fontes de informação utilizadas na preparação de aulas, obtenção de recursos didáticos e no aprendizado do professor, foi possível perceber que, de forma geral, ainda ocorre uma baixa utilização de fontes de informação que utilizam a Internet, como as bibliotecas digitais, os sites de universidades, os blogs, fóruns e grupos de discussão. Fontes impressas como jornais e revistas especializadas ou não, livros acadêmicos, livros paradidáticos também são utilizadas pela maioria dos professores de forma eventual. A fonte mais utilizada é o livro didático que desempenha papéis múltiplos: para o aprendizado do professor, preparação de aulas e recurso didático. Congressos, palestras e cursos são considerados fontes de aprendizado eventuais para a maioria. Por outro lado, trocas de experiências com os pares é considerada uma fonte frequente de informações para o aprendizado do professor. A análise cruzada de dados sugere que a maioria dos professores ainda não detém as habilidades necessárias para o uso das tecnologias e que não sabem avaliar criticamente os recursos digitais educacionais. Os resultados também indicaram a preferência por recursos que não exigem interatividade por parte dos alunos (apresentações em PowerPoint e imagens) sugerindo um uso limitado dos recursos digitais educacionais. O quadro geral indica a existência de fragilidades na forma como os PBEM participantes desta pesquisa estão se atualizando e aprendendo, sendo importante verificar se essa tendência se mantém na totalidade dos PBEM do país. / This exploratory study investigates what are the sources of information and resources used by High School Biology Teachers (HSBT) enrolled in the Digital Library of Science (DLS) in their learning and professional development and in their didatic activities. Methods were used for collecting indirect data, which consisted in applying two online structured questionnaires, and direct methods, which consisted in analysing the keywords, comments about resources and the electronic messages left by teachers. The first questionnaire allowed us to outline a profile of the HSBT. They are averaged 36.4 years old, most are female, teach in public school and live in the Southeast. Most of the teachers found BDC using search engines. At the time of their registration, they were already using the Internet for over five years, and were interested primarily in contents to support lessons planning and teaching resources. The second questionnaire showed that HSBT had an initial formation compatible with their function: the majority studied Biology and has graduation degree. However, concerning on the didactic use of digital technologies, most had nothing on initial formation neither on training courses. The results about information sources used in planning lessons, getting instructional resources and teacher\'s learning showed that, in general, there are a low use of information sources based on Internet (such as digital libraries, sites of universities, blogs, forums and discussion groups). Printed sources like newspapers, magazines, textbooks, academic books have been used eventually by most teachers. The most common source used is the textbook that plays multiple roles: for teacher learning, lesson planning and as didactic resource. Congresses, lectures and courses are considered eventual sources of learning for the majority. Moreover, exchanging experiences with colleagues is considered a frequent source of information for learning. Cross-analysis of data suggests that most teachers do not hold basic skills to use technology, and also do not know how to evaluate digital resources in education. The results also indicated their preference for resources that do not require interactivity by students: the PowerPoint presentations and images (pictures, video or animation). It seems there is a limited use of digital educational resources. The overall picture portrayed in this work suggests the existence of weaknesses in how HSBT are upgrading and learning about science and about information and communication technology. It is recommended that further investigations can be lead to confirm if this tendency is observed in the totality of brazilian HSBT.
16

Estudo exploratório sobre o uso e a busca de informações e de recursos didáticos por professores de biologia do ensino médio cadastrados na biblioteca digital de ciências da UNICAMP / Exploratory study on using online resources and the interest in information sources and educational resources by High School Biology Teachers enrolled in the Unicamp\'s Digital Library of Sciences

Helika Amemiya Chikuchi 26 April 2011 (has links)
Este trabalho de caráter exploratório tinha como objetivos principais investigar o uso e a busca de informações e de recursos didáticos realizada pelos Professores de Biologia do Ensino Médio (PBEM) cadastrados na Biblioteca Digital de Ciências da Unicamp (BDC), em seu aprendizado e aperfeiçoamento profissional e nas suas atividades didáticas. Foram utilizados métodos de coleta de dados indiretos, que consistiram na aplicação de dois questionários estruturados online, e métodos diretos, que consistiram no registro realizado por ferramentas instaladas na BDC sobre as palavras-chave utilizadas, os comentários sobre os recursos e as mensagens eletrônicas dos professores. O primeiro questionário permitiu traçar um perfil dos PBEM. Eles têm em média 36,4 anos, a maioria é do sexo feminino, leciona em escola pública e vive na região sudeste. A maioria encontrou a BDC usando ferramentas de busca; no momento do cadastramento, já usava a Internet há mais de cinco anos, e estava interessada principalmente em conteúdos para subsidiar o preparo de aulas e em recursos didáticos. O segundo questionário mostrou que os PBEM tiveram uma formação inicial compatível com a função que exercem: a maioria fez Biologia ou Ciências Biológicas e licenciatura. Entretanto, quanto ao uso didático das tecnologias digitais, a maioria não teve nenhuma preparação nem na formação inicial e nem por meio de cursos de capacitação. Na investigação sobre fontes de informação utilizadas na preparação de aulas, obtenção de recursos didáticos e no aprendizado do professor, foi possível perceber que, de forma geral, ainda ocorre uma baixa utilização de fontes de informação que utilizam a Internet, como as bibliotecas digitais, os sites de universidades, os blogs, fóruns e grupos de discussão. Fontes impressas como jornais e revistas especializadas ou não, livros acadêmicos, livros paradidáticos também são utilizadas pela maioria dos professores de forma eventual. A fonte mais utilizada é o livro didático que desempenha papéis múltiplos: para o aprendizado do professor, preparação de aulas e recurso didático. Congressos, palestras e cursos são considerados fontes de aprendizado eventuais para a maioria. Por outro lado, trocas de experiências com os pares é considerada uma fonte frequente de informações para o aprendizado do professor. A análise cruzada de dados sugere que a maioria dos professores ainda não detém as habilidades necessárias para o uso das tecnologias e que não sabem avaliar criticamente os recursos digitais educacionais. Os resultados também indicaram a preferência por recursos que não exigem interatividade por parte dos alunos (apresentações em PowerPoint e imagens) sugerindo um uso limitado dos recursos digitais educacionais. O quadro geral indica a existência de fragilidades na forma como os PBEM participantes desta pesquisa estão se atualizando e aprendendo, sendo importante verificar se essa tendência se mantém na totalidade dos PBEM do país. / This exploratory study investigates what are the sources of information and resources used by High School Biology Teachers (HSBT) enrolled in the Digital Library of Science (DLS) in their learning and professional development and in their didatic activities. Methods were used for collecting indirect data, which consisted in applying two online structured questionnaires, and direct methods, which consisted in analysing the keywords, comments about resources and the electronic messages left by teachers. The first questionnaire allowed us to outline a profile of the HSBT. They are averaged 36.4 years old, most are female, teach in public school and live in the Southeast. Most of the teachers found BDC using search engines. At the time of their registration, they were already using the Internet for over five years, and were interested primarily in contents to support lessons planning and teaching resources. The second questionnaire showed that HSBT had an initial formation compatible with their function: the majority studied Biology and has graduation degree. However, concerning on the didactic use of digital technologies, most had nothing on initial formation neither on training courses. The results about information sources used in planning lessons, getting instructional resources and teacher\'s learning showed that, in general, there are a low use of information sources based on Internet (such as digital libraries, sites of universities, blogs, forums and discussion groups). Printed sources like newspapers, magazines, textbooks, academic books have been used eventually by most teachers. The most common source used is the textbook that plays multiple roles: for teacher learning, lesson planning and as didactic resource. Congresses, lectures and courses are considered eventual sources of learning for the majority. Moreover, exchanging experiences with colleagues is considered a frequent source of information for learning. Cross-analysis of data suggests that most teachers do not hold basic skills to use technology, and also do not know how to evaluate digital resources in education. The results also indicated their preference for resources that do not require interactivity by students: the PowerPoint presentations and images (pictures, video or animation). It seems there is a limited use of digital educational resources. The overall picture portrayed in this work suggests the existence of weaknesses in how HSBT are upgrading and learning about science and about information and communication technology. It is recommended that further investigations can be lead to confirm if this tendency is observed in the totality of brazilian HSBT.
17

Feedback de relevância orientado a termos: um novo método para ordenação de resultados de motores de busca. / Term-oriented relevance feedback: a novel ranking method for search engines.

Fernando Hattori 23 May 2016 (has links)
O modelo de recuperação de informação mais amplamente utilizado no contexto de acervos digitais é o Vector Space Model. Algoritmos implementados para este modelo que aproveitam informações sobre relevância obtidas dos usuários (chamados feedbacks) na tentativa de melhorar os resultados da busca. Porém, estes algoritmos de feedback de relevância não possuem uma estratégia global e permanente, as informações obtidas desses feedbacks são descartadas para cada nova sessão de usuário (são perenes) ou não modificam os documentos como um todo (são alterações locais). Este trabalho apresenta um método de feedbacks de relevância denominado orientado a termos, permitindo que as modificações realizadas por influência dos feedbacks dos usuários sejam globais e permanentes. Foram realizados experimentos utilizando o dataset ClueWeb09 que dão evidências de que este método melhora a qualidade dos resultados da busca em relação ao modelo tradicional Vector Space Model. / The Vector Space Model is the most widely used information retrieval model within digital libraries\' systems. Algorithms developed to be used with this model use relevance information obtained from users (called feedbacks) to improve the search results. However, the relevance feedback algorithms developed are not global nor permanent, the feedbacks are discarded in users new sessions and do not affect every document. This paper presents a method that uses of relevance feedback named terms oriented. In this method, users\' feedbacks lead to modifications in the terms\' vectors representations. These modifications are global and permanent, influencing further searches. An experiment was conducted using the ClueWeb09 dataset, giving evidence that this method improves the quality of search results when compared with Vector Space Model.
18

Geração automática de metadados: uma contribuição para a Web semântica. / Automatic metadata generation: a contribution to the semantic Web.

Eveline Cruz Hora Gomes Ferreira 05 April 2006 (has links)
Esta Tese oferece uma contribuição na área de Web Semântica, no âmbito da representação e indexação de documentos, definindo um Modelo de geração automática de metadados baseado em contexto, a partir de documentos textuais na língua portuguesa, em formato não estruturado (txt). Um conjunto teórico amplo de assuntos ligados à criação de ambientes digitais semântico também é apresentado. Conforme recomendado em SemanticWeb.org, os documentos textuais aqui estudados foram automaticamente convertidos em páginas Web anotadas semanticamente, utilizando o Dublin Core como padrão para definição dos elementos de metadados, e o padrão RDF/XML para representação dos documentos e descrição dos elementos de metadados. Dentre os quinze elementos de metadados Dublin Core, nove foram gerados automaticamente pelo Modelo, e seis foram gerados de forma semi-automática. Os metadados Description e Subject foram os que necessitaram de algoritmos mais complexos, sendo obtidos através de técnicas estatísticas, de mineração de textos e de processamento de linguagem natural. A finalidade principal da avaliação do Modelo foi verificar o comportamento dos documentos convertidos para o formato RDF/XML, quando estes foram submetidos a um processo de recuperação de informação. Os elementos de metadados Description e Subject foram exaustivamente avaliados, uma vez que estes são os principais responsáveis por apreender a semântica de documentos textuais. A diversidade de contextos, a complexidade dos problemas relativos à língua portuguesa, e os novos conceitos introduzidos pelos padrões e tecnologias da Web Semântica, foram alguns dos fortes desafios enfrentados na construção do Modelo aqui proposto. Apesar de se ter utilizado técnicas não muito novas para a exploração dos conteúdos dos documentos, não se pode ignorar que os elementos inovadores introduzidos pela Web Semântica ofereceram avanços que possibilitaram a obtenção de resultados importantes nesta Tese. Como demonstrado aqui, a junção dessas técnicas com os padrões e tecnologias recomendados pela Web Semântica pode minimizar um dos maiores problemas da Web atual, e uma das fortes razões para a implementação da Web Semântica: a tendência dos mecanismos de busca de inundarem os usuários com resultados irrelevantes, por não levarem em consideração o contexto específico desejado pelo usuário. Dessa forma, é importante que se dê continuidade aos estudos e pesquisas em todas as áreas relacionadas à implementação da Web Semântica, dando abertura para que sistemas de informação mais funcionais sejam projetados / This Thesis offers a contribution to the Semantic Web area, in the scope of the representation and indexing of documents, defining an Automatic metadata generation model based on context, starting from textual documents not structured in the Portuguese language. A wide theoretical set of subjects related to the creation of semantic digital environments is also presented. As recommended in SemanticWeb.org, the textual documents studied here were automatically converted to Web pages written in semantic format, using Dublin Core as standard for definition of metadata elements, and the standard RDF/XML for representation of documents and description of the metadata elements. Among the fifteen Dublin Core metadata elements, nine were automatically generated by the Model, and six were generated in a semiautomatic manner. The metadata Description and Subject were the ones that required more complex algorithms, being obtained through statistical techniques, text mining techniques and natural language processing. The main purpose of the evaluation of the Model was to verify the behavior of the documents converted to the format RDF/XML, when these were submitted to an information retrieval process. The metadata elements Description and Subject were exhaustively evaluated, since these are the main ones responsible for learning the semantics of textual documents. The diversity of contexts, the complexity of the problems related to the Portuguese language, and the new concepts introduced by the standards and technologies of the Semantic Web, were some of the great challenges faced in the construction of the Model here proposed. In spite of having used techniques which are not very new for the exploration and exploitation of the contents of the documents, we cannot ignore that the innovative elements introduced by the Web Semantic have offered improvements that made possible the obtention of important results in this Thesis. As demonstrated here, the joining of those techniques with the standards and technologies recommended by the Semantic Web can minimize one of the largest problems of the current Web, and one of the strong reasons for the implementation of the Semantic Web: the tendency of the search mechanisms to flood the users with irrelevant results, because they do not take into account the specific context desired by the user. Therefore, it is important that the studies and research be continued in all of the areas related to the Semantic Web?s implementation, opening the door for more functional systems of information to be designed.
19

Digitalizando o virtual :uma análise informacional do processo de implementação da Biblioteca Digital Paulo Freire

Bezerra, Emy Pôrto 05 October 2003 (has links)
Made available in DSpace on 2015-04-16T15:23:49Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 744028 bytes, checksum: a668c76f500b5ec8dc2537921a7a4cb0 (MD5) Previous issue date: 2003-10-05 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The recent technology advances have been changing the relationship between the men and the informational practices which as information generation, transfer and reception. The advent of digital format has been one of the responsible for this transformation or (r)evolution. The flexibility proposed for this new manner to format different kinds of documents has been broken many frontiers in the Science Information area. In this scenario, we can include the digital libraries. This one can be thought as libraries that provide a completely technological focal point to create, acquire, distribute and store documents. This investigation had as general purpose to analyze, the relationship between virtuality and generation information process at the context of the Paulo Freire s Digital Library in the its initial phase. Before the analysis, a questionnaire was elaborated and applied, such as a focus group interview both formed the phases of the data collect methodology. The more important data were divided in clipping, according to thematic categories (respecting the specific proposes), and further submitted to content analysis, following some enumeration rules (presence, frequency and intensity). Our main observation was the existence of a relation between digitalization process and the representation of information s virtualization (the data). / Os recentes avanços tecnológicos vêm modificando a maneira do homem relacionar-se com as práticas informacionais de geração, transferência e recepção. O advento do formato digital vem sendo um dos responsáveis por essa mudança ou (r)evolução. A flexibilidade proporcionada por essa nova maneira de formatar os mais variados tipos de documentos vem rompendo várias fronteiras no campo da Ciência da Informação. Neste cenário, podemos incluir as bibliotecas digitais. Estas podem ser conceituadas como bibliotecas que provêem um enfoque completamente computadorizado à criação, aquisição, distribuição e armazenamento de documentos. Esta pesquisa teve como objetivo geral analisar a relação existente entre a virtualização e o processo de geração de informação no contexto da Biblioteca Digital Paulo Freire em sua fase inicial de implementação. Anteriormente à análise foi elaborado e aplicado um questionário e realizada uma entrevista de grupo focal, como etapas da metodologia para coleta de dados. Os dados mais significativos foram divididos em recortes, conforme categorias temáticas (tendo em vista os objetivos específicos), e posteriormente submetidos à análise de conteúdo, segundo algumas regras de enumeração (presença, freqüência e intensidade). Nossa principal observação foi a existência de uma relação entre o processo de digitalização e a virtualização da representação da informação (os dados).
20

MD-PROM : um mecanismo de deduplicação de metadados e rastreio da proveniência / MD-PROM : a mechanism for metadata deduplication and provenance tracing

Borges, Eduardo Nunes January 2008 (has links)
Bibliotecas digitais são repositórios de objetos digitais que oferecem serviços aos seus usuários como pesquisa e publicação desses objetos. Cada objeto digital é descrito por um conjunto de metadados que especifica a forma como esse objeto pode ser recuperado. Sistemas de integração de bibliotecas digitais indexam objetos digitais adquiridos de fontes diferentes, os quais podem estar representados através de vários padrões de metadados. Estes metadados são heterogêneos tanto em conteúdo quanto em estrutura. Conseqüentemente, os sistemas de integração de bibliotecas digitais não estão aptos a fornecer respostas livres de informação redundante que integrem as várias fontes de dados. Quando um usuário realiza uma consulta sobre várias bibliotecas digitais, é interessante que sejam retornados metadados integrados das diversas fontes e a origem de cada informação recuperada, ou seja, a biblioteca digital que publicou aquela informação (metadado). O uso de proveniência de dados nas consultas a metadados em sistemas de integração de bibliotecas digitais, de modo a rastrear a origem das informações recuperadas, permite que usuários avaliem a qualidade das bibliotecas digitais. Este trabalho apresenta o MD-PROM (Metadata Deduplication and PROvenance tracing Mechanism), um mecanismo de deduplicação de metadados e rastreio da proveniência. Este mecanismo identifica metadados de objetos digitais duplicados em bibliotecas digitais distintas, integra os metadados duplicados e recupera informações de proveniência dos metadados integrados. A identificação de duplicatas é realizada através do casamento automático de esquemas dos metadados e da aplicação de funções de similaridade sobre os principais metadados que descrevem os objetos digitais. São propostas a função de similaridade de nomes próprios IniSim, o algoritmo de casamento de autores NameMatch e o algoritmo de casamento de objetos digitais Digital Object Match que identifica múltiplas representações dos metadados. Além dos algoritmos de similaridade, o MD-PROM especifica uma estrutura baseada em árvore para representar a proveniência de dados que identifica a origem dos metadados, bem como os valores dos quais os metadados foram derivados. Também é proposto um algoritmo de integração de metadados e rastreio da proveniência denominado MetadataProv. A principal contribuição do trabalho é melhorar a qualidade da pesquisa do usuário de bibliotecas digitais. O MD-PROMfornece uma resposta única, livre de redundância e sem perda de informação relevante para consultas a metadados de objetos digitais oriundos de bibliotecas digitais distintas. Além disso, são recuperadas informações de proveniência que permitem ao usuário verificar a veracidade e confiabilidade dos metadados retornados pelas consultas em sistemas de integração de bibliotecas digitais. São apresentados também os resultados de diversos experimentos que avaliam a qualidade da deduplicação de objetos digitais comparando a técnica proposta com outras abordagens estudadas. / Digital libraries are repositories of digital objects that provide services to their users such as search and publication of these objects. Each digital object is described by a set of metadata that specifies how this object can be retrieved. Integrated digital library systems index digital objects acquired from different sources, which can be represented through several metadata patterns. These metadata are heterogeneous both in content and in structure. Consequently, the integrated digital library systems are not able to provide answers free from redundant information that integrate the several data sources. When a user performs a query on various digital libraries, it is interesting to return integrated metadata from several sources and the origin of each information retrieved, that is, the digital library which published that information (metadata). Using data provenance in metadata queries on integrated digital library systems, so as to trace the origin of the information retrieved, allows users to analyze the quality of digital libraries. This work presents MD-PROM (Metadata Deduplication and PROvenance tracing Me- chanism), a mechanism for metadata deduplication and provenance tracing. This mechanism identifies duplicated digital objects metadata in different digital libraries, integrates duplicated metadata and retrieves provenance information of the integrated metadata. The identification of duplicates is performed through automatic metadata schema matching and through similarity functions applied over main metadata that describe the digital objects. The surname similarity function IniSim, the authors matching algorithm NameMatch and digital objects matching algorithm Digital Object Match, which identifies multiple representations of metadata, have been proposed. Besides the similarity algorithms, MD-PROM specifies a tree-based structure to represent the data provenance that identifies the origin of metadata as well as the values from which the metadata were derived. An algorithm for the integration of metadata and provenance tracing, called MetadataProv, is also proposed. The main contribution of this work is to improve the quality of the searches posed by the users of digital libraries. MD-PROM provides a single answer, free from redundancy and loss of relevant information related to queries on digital objects metadata from different digital libraries. In addition, provenance information is retrieved allowing the user to verify the accuracy and the reliability of the metadata returned by queries on integrated digital library systems. There are also reports on several experiments, which evaluate the quality of the deduplication of digital objects comparing the proposed technique with other approaches.

Page generated in 0.4471 seconds