71 |
Os registros de informação dos sistemas documentários: uma discussão no âmbito da Representação Descritiva / The information records of the documentary systems: a discussion in the field of Descriptive RepresentationCristina Dotta Ortega 02 July 2009 (has links)
A Organização da Informação engloba os processos necessários sob o ponto de vista informacional à construção e gestão de sistemas documentários. Nela localizamos a Representação Descritiva que se ocupa dos registros de informação destes sistemas e de seus pontos de acesso, no que tange aos aspectos da descrição formal. Para sua funcionalidade, é esperado que os registros dos sistemas documentários apresentem características que garantam aderência entre as entidades e as necessidades de informação que buscam representar. A hipótese principal de trabalho é a de que é preciso resgatar e reforçar o aspecto intelectual do processo de elaboração de registros de informação de sistemas documentários. Deste modo, o trabalho objetiva contribuir para a ressignificação da Representação Descritiva no que se refere à elaboração de modelos de registros de informação dos sistemas documentários, no contexto da Organização da Informação enquanto conjunto de fundamentos, métodos e instrumentos voltados à construção e gestão de sistemas documentários. Para tanto, realiza pesquisa exploratória sobre conceitos e processos documentários que cobrem o conhecimento sobre Representação Descritiva, visando identificar, caracterizar e discutir seus aspectos nucleares e definitórios. Considerando que os registros de informação se configuram como estruturas coerentes entre si, baseadas em tipologias documentais e previsão de necessidades de informação, conclui que a Representação Descritiva, conjuntamente com a Representação Temática, se ocupa da forma e do conteúdo que constituem estas estruturas. As mesmas são responsáveis, portanto, pela elaboração de modelos de registros de informação, no contexto da Organização da Informação, cujas atividades relacionam-se à construção e gestão de sistemas documentários. / Information Organization involves the processes necessary to the construction and management of documentary systems from an informational point of view. Inside Information Organization, we find Descriptive Representation, which is focused on documentary systems information records and their access points, in their relation to aspects of formal description. In order to achieve functionality, documentary systems records are expected to possess features that guarantee the adherence between the entities and the information needs they seek to represent. The main hypothesis of this study is that it is necessary for us to reclaim and reinforce the intellectual aspect of the process of generation of documentary systems information records. This way, the present study aims to contribute to the re-signification of Descriptive Representation as far as the development of models of documentary systems information records is concerned, in the context of Information Organization as a set of fundaments, methods and instruments for the construction and management of documentary systems. Keeping that in mind, an exploratory research was done about the concepts and documentary processes that cover the knowledge about Descriptive Representation, with the objective to identify, characterize and discuss their nuclear, defining aspects. Considering that information records exist as coherent structures among themselves, based on document typologies and on the prediction of information needs, we can conclude that Descriptive Representation, together with Thematic Representation, is concerned with the form and the content that constitute the records structure. These representations are therefore responsible for the development of models of information records, in the context of Information Organization, the activities of which are related to the construction and development management of documentary systems.
|
72 |
Os registros de informação dos sistemas documentários: uma discussão no âmbito da Representação Descritiva / The information records of the documentary systems: a discussion in the field of Descriptive RepresentationOrtega, Cristina Dotta 02 July 2009 (has links)
A Organização da Informação engloba os processos necessários sob o ponto de vista informacional à construção e gestão de sistemas documentários. Nela localizamos a Representação Descritiva que se ocupa dos registros de informação destes sistemas e de seus pontos de acesso, no que tange aos aspectos da descrição formal. Para sua funcionalidade, é esperado que os registros dos sistemas documentários apresentem características que garantam aderência entre as entidades e as necessidades de informação que buscam representar. A hipótese principal de trabalho é a de que é preciso resgatar e reforçar o aspecto intelectual do processo de elaboração de registros de informação de sistemas documentários. Deste modo, o trabalho objetiva contribuir para a ressignificação da Representação Descritiva no que se refere à elaboração de modelos de registros de informação dos sistemas documentários, no contexto da Organização da Informação enquanto conjunto de fundamentos, métodos e instrumentos voltados à construção e gestão de sistemas documentários. Para tanto, realiza pesquisa exploratória sobre conceitos e processos documentários que cobrem o conhecimento sobre Representação Descritiva, visando identificar, caracterizar e discutir seus aspectos nucleares e definitórios. Considerando que os registros de informação se configuram como estruturas coerentes entre si, baseadas em tipologias documentais e previsão de necessidades de informação, conclui que a Representação Descritiva, conjuntamente com a Representação Temática, se ocupa da forma e do conteúdo que constituem estas estruturas. As mesmas são responsáveis, portanto, pela elaboração de modelos de registros de informação, no contexto da Organização da Informação, cujas atividades relacionam-se à construção e gestão de sistemas documentários. / Information Organization involves the processes necessary to the construction and management of documentary systems from an informational point of view. Inside Information Organization, we find Descriptive Representation, which is focused on documentary systems information records and their access points, in their relation to aspects of formal description. In order to achieve functionality, documentary systems records are expected to possess features that guarantee the adherence between the entities and the information needs they seek to represent. The main hypothesis of this study is that it is necessary for us to reclaim and reinforce the intellectual aspect of the process of generation of documentary systems information records. This way, the present study aims to contribute to the re-signification of Descriptive Representation as far as the development of models of documentary systems information records is concerned, in the context of Information Organization as a set of fundaments, methods and instruments for the construction and management of documentary systems. Keeping that in mind, an exploratory research was done about the concepts and documentary processes that cover the knowledge about Descriptive Representation, with the objective to identify, characterize and discuss their nuclear, defining aspects. Considering that information records exist as coherent structures among themselves, based on document typologies and on the prediction of information needs, we can conclude that Descriptive Representation, together with Thematic Representation, is concerned with the form and the content that constitute the records structure. These representations are therefore responsible for the development of models of information records, in the context of Information Organization, the activities of which are related to the construction and development management of documentary systems.
|
73 |
Automatic genre classification of home pages on the web /Kennedy, Alistair. January 2004 (has links) (PDF)
Thesis (B.C.S.)--Dalhousie University, Halifax. / "Submitted in partial fulfillment of the requirements for the degree of bachelor of computer science with honours at Dalhousie University, Halifax, Nova Scotia, April 2004." Includes bibliographical references (p. 33-35). Also available in PDF via the World Wide Web.
|
74 |
Dagens "skräp", framtidens skatter : En undersökning om hur Kungliga biblioteket samlar in, ordnar och tillgängliggör sin samling av vardagstryck / Today´s” trash”, tomorrows treasures : A survey of how the National Library of Sweden collects, arranges and provides access to its collection of printed ephemeraEriksson, Lina January 2018 (has links)
The aim of this two years master’s thesis in Archive, Library and Museum studies is to investigate how the National Library of Sweden collects, arranges and provides access to its collection of printed ephemera. As a comparison, the thesis also looks at how Lund University Library is working with the same tasks. The main sources of information in this thesis comes from participant observations and interviews conducted with informants within the two libraries mentioned above. Document studies of the library’s internal documents and the Swedish Legal Deposit Law has also been used to get additional information. The findings in this thesis has been analyzed with a model based on a practice theory and a knowledge organization theory. The starting point in the investigation was to look at how these two libraries receives printed ephemera through legal deposits, if there are any problems connected to the legal deposits and if that possibly has an influence on the printed ephemera collections. The next part of the investigation focuses on how these collections has been organized with various classification systems over the years. In addition to this the survey wanted to find out if- and in what way these different systems have had an effect on the availability of this material and what tools the libraries uses to make it easier to find specific material within the collections and make it available for users. The results of the investigation show that National Library of Sweden and Lund University Library resave a wide range of material throw legal deposits but not nearly as much as they should get. One big problem is that many producers print their material outside of Sweden and are not aware that they are obligated to give copies of this to the Swedish Legal Deposit Library’s. The survey also reached the conclusion that the way the material is arranged and stored has a big impact on how accessible it is. However, by using cataloguing and digitalization the libraries can make this material more visible, and thus also more accessible.
|
75 |
Representação das necessidades de informação na organização da informação: uma análise de modelos teóricos de buscaEuclides, Maria Luzinete [UNESP] 19 September 2007 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:26:45Z (GMT). No. of bitstreams: 0
Previous issue date: 2007-09-19Bitstream added on 2014-06-13T19:34:29Z : No. of bitstreams: 1
euclides_ml_me_mar.pdf: 582671 bytes, checksum: 4d447e4f51ab6f12a774ebeb893934ed (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Universidade Estadual Paulista (UNESP) / A representação das necessidades de informação visando à recuperação de informação relevante tem exigido das áreas de Organização e Recuperação da Informação, o desenvolvimento de modelos teóricos e instrumentais que auxiliem nos procedimentos de análise, síntese, representação e recuperação do conteúdo documentário, contribuindo tanto para a sedimentação teórica da área quanto para a formação profissional. Nesse contexto, a percepção da demanda das necessidades de informação de uma comunidade usuária torna-se um aspecto importante a ser considerado pelo indexador, no processo de tratamento de conteúdos documentários de um sistema de informação. Desse modo, propõe-se uma investigação sobre a representação das necessidades de informação na perspectiva do usuário, a fim de identificar elementos conceituais e modelos que possam fornecer ao profissional indexador, subsídios para o tratamento de conteúdos documentários, voltados à demanda da comunidade usuária, de um sistema de informação. Por meio de uma abordagem exploratória de natureza teóricoinvestigativa e metodologia de análise dos modelos teóricos de busca de Tom Wilson e David Ellis, esta pesquisa visa contribuir para que o indexador possa melhorar a representação de conteúdos documentários e ampliar a visão sobre a demanda da comunidade usuária. Os resultados obtidos sinalizam que para o tratamento de conteúdos documentários voltados para a demanda a opção da abordagem sócio-cognitiva demonstra atender de modo mais satisfatório as complexidades que envolvem o usuário na sua dimensão social e por conseqüência as suas necessidades de informação. / The representation of the information needs aiming the retrieval of relevant information has demanded from the areas of Information Organization and Retrieval the development of theoretical and instrumental models which may help in the procedures of analysis, synthesis, representation and retrieval of the documentary contents, contributing both to the theoretical sedimentation of the area and to the professional training. In this context, the perception of the demand of the information needs of a users’ community becomes an important aspect to be considered by the indexer in the process of treatment of documentary contents of an information system. This way, one proposes an investigation about the representation of the information needs in the user’s perspective, in order to identify conceptual elements and models that may provide the indexing professional with subsidies for the treatment of information of documentary contents, turned to the demand of the users’ community of an information system. By means of an exploratory approach of theoretical investigative nature and a methodology of analysis of the theoretical search models of Tom Wilson and David Ellis, this research aims at contributing so the indexer may be able to improve the representation of the documentary contents and enlarge the vision about the demand of the users’ community. The results obtained signal that, for the treatment of documentary contents turned to the demand, the option of the socio-cognitive approach demonstrates to meet in a more satisfactory manner the complexities that involve the user in his/her social dimension and, consequently, his/her information needs.
|
76 |
Uma contribuição da teoria literária para a análise de conteúdo de imagens publicitárias do fim do século XIX e primeira metade do século XX, contemplando aspectos da natureza brasileiraCosta, Luzia Sigoli Fernandes [UNESP] 15 August 2008 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:32:42Z (GMT). No. of bitstreams: 0
Previous issue date: 2008-08-15Bitstream added on 2014-06-13T18:43:59Z : No. of bitstreams: 1
costa_lsf_dr_mar.pdf: 6276487 bytes, checksum: 9bd118b85c93c98dc6a6fae7ee9ff653 (MD5) / Universidade Estadual Paulista (UNESP) / Os fatores que colaboram com o processo de construção do conceito de Natureza têm nas obras literárias e imagéticas informações que refletem o pensamento da sociedade, num tempo e espaço determinados. A partir do entendimento da gênese e do percurso histórico da Ciência da Informação, pode-se identificar a diversidade documental que essa Ciência busca abarcar e explorar como objeto de estudo e de intervenção. Dentro dessa diversidade, percebe-se a complexidade apresentada tanto pela literatura como pela informação imagética, mais especificamente, cartazística, para a área disciplinar de Organização e Representação da Informação e do Conhecimento. Considerando essa complexidade, esta pesquisa tem como objetivo contribuir para a formulação de procedimentos metodológicos, no âmbito da análise de conteúdo de cartazes, tendo em vista a geração de produtos documentais. Tomando-se como base a Teoria de Shiyali Ramamrita Ranganathan, um dos primeiros teóricos da Ciência da Informação no século XX, explora-se uma aproximação teórico-conceitual entre as Categorias Essenciais e os elementos que compõem a estrutura do discurso retórico e as categorias da narrativa literária. Essa opção foi feita, diante da potencialidade que os enunciados literários suscitam em contribuir para um processo de ampliação conceitual das categorias ranganathianas. Nessa aproximação, estabeleceu-se um alinhamento teóricoconceitual capaz de verificar a possibilidade de uma efetiva contribuição de aspectos da Teoria Literária para a realização de análise de conteúdo cartazístico e de sua representação por meio da elaboração de sínteses ou resumos, no âmbito da Ciência da Informação. Faz-se uso dessas categorias ampliadas , para análise do conteúdo apresentado em cada cartaz, pautando-se em procedimentos de leitura do discurso retórico e identificação de... / The factors that contribute to the construction process of the concept of Nature have, in literary and visual works, information that reflects the thinking of society in a given time and space. From the understanding of the genesis and historical trajectory of Information Science, the diversity of documents that this Science seeks to embrace and explore as an object of study can be identified. Within this diversity, the complexity presented by literature as well as by image information and more specifically, posters, for the area of Information and Knowledge Organization and Representation, is perceived. Considering such complexity, this research aims to contribute to the formulation of methodological procedures, in the ambit of content analysis of posters, with an end to the elaboration of document products. Taking as the basis Shiyali Ramamrita Ranganathan´s theory, one of the first theorists in Information Science of the 20th century, a theoretical-conceptual approximation between Essential Categories and the elements that make up the structure of rhetorical discourse and literary narrative categories is explored. This choice was made in the light of the potentiality that literary enunciations engender to contribute to the process of conceptual enlargement of Ranganathan categories. In this approximation, a theoretical-conceptual alignment was established, capable of verifying the possibility of an effective contribution of aspects of Literary Theory to content analysis of posters and of their representation by means of the elaboration of summaries or abstracts, in the ambit of Information Science. Use is made of these enlarged categories for analysis of the content presented in each poster, based on procedures from rhetorical discourse reading and concept identification. In this process, the possibility of considering the denotative, as well as the connotative aspects present ...(Complete abstract, click electronic access below)
|
77 |
O assunto do e-mail como indício de fraude: contribuições da organização da informação para a prevenção criminalFurlaneto Neto, Mário [UNESP] 29 July 2008 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:32:42Z (GMT). No. of bitstreams: 0
Previous issue date: 2008-07-29Bitstream added on 2014-06-13T19:03:12Z : No. of bitstreams: 1
furlanetoneto_m_dr_mar.pdf: 1796012 bytes, checksum: 865e52ab7d190c4e8c70356423defeb4 (MD5) / Universidade Estadual Paulista (UNESP) / Em uma sociedade cada vez mais globalizada e inserida digitalmente, o e-mail apresenta destaque importante, ao acelerar a comunicação entre as pessoas. No entanto, ao mesmo tempo em que a Internet revelou benefícios incomensuráveis para a sociedade tornou-se, também, um meio para a prática dos crimes informáticos e, atualmente, constata-se o emprego do e-mail como fase do iter criminis, potencializado pela ausência de uma política de prevenção. Diante desse contexto, busca-se avaliar o campo assunto do e-mail, com ênfase nas contribuições da Organização da Informação como subsídio à prevenção criminal. Com isso, objetiva-se analisar o e-mail, enquanto um documento eletrônico, visando especificar suas partições, nomeadamente a área do cabeçalho, onde consta a representação do assunto, de maneira a apontar, em uma dimensão teórica, soluções relacionadas à prevenção criminal. Por meio de uma abordagem metodológica explorativa e descritiva, parte-se de uma caracterização teórica da temática, nomeadamente na doutrina e na jurisprudência brasileira, ocasião em que são enfrentadas as dimensões informativa, temática, probatória e criminal do email, para, em seguida, realizar-se o mapeamento de e-mails recebidos pelo autor e sua esposa de modo a caracterizar como se comportam os emitentes no preenchimento do assunto, ocasião em que se combina, quanto ao tipo de dado a ser coletado e tipo de análise, quantificação com interpretação. Ao aplicarem-se as facetas concreto e processo da Teoria de Indexação Sistemática de Kaiser (1911) ao campo assunto das mensagens eletrônicas que compuseram o corpus da pesquisa, os resultados revelam indícios de fraude em e-mails cujos assuntos foram categorizados em: a) Questões/pendências judiciais e administrativas; b) Apelo financeiro (prêmios, sorteios, benefícios, etc); c) Apelo emocional;... / In a more and more globalized and digitalized society , e-mail represents important prominence by accelerating communication among people. However, while bringing tremendous benefits to the society, Internet has also become a means by which computer crimes have been committed and, today, E-mail is used as a phase of iter criminis , which has been potentialized due to non-existence of preventive policies at all. So in this context, we try to assess the e-mail subject-field giving emphasis to the Information Organization contributions as subsidy towards preventing crimes. In this way, our purpose is to analyze the e-mail as an electronic document aiming at specifying its parts, - mainly the headlines, in which the subject is represented-, so that we may point to, on a theoretical dimension, solutions regarding criminal prevention. By means of a methodological, exploratory and descriptive approach, we start from the subject’s theoretical characterization, primarily grounded on Brazilian doctrine and jurisprudence, when e-mail’s informative, thematic and probationary dimensions are faced, in order to draw a map of e-mails received by the author and his wife so as to characterize the senders’ behavior when filling in the subject, for in their performance are matched quantification and interpretation with regard to the kind of datum to be collected , and the type of analysis . By applying concrete and process facets of the Theory of Systematic Indexation by Kaiser (1911) to the subject-field of electronic messages that were the investigation corpus, the results show signs of fraud on the emails , whose subjects were categorized as follow: a) judicial and administrative disputes; b) financial appeal (prizes, raffles, benefits, etc); c) emotional appeal; d) communication of electronic transaction (electronic trade); e) communication of electronic services; f) curiosity appeal... (Complete abstract click electronic access below)
|
78 |
Memória esquecida: uma análise da organização e representação da informação étnico-racial no OPAC da Biblioteca Central da Universidade Federal da ParaíbaSantana, Vanessa Alves 30 March 2012 (has links)
Made available in DSpace on 2015-04-16T15:23:22Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 2718441 bytes, checksum: 8015064ddc4cfab62177908ec5890b80 (MD5)
Previous issue date: 2012-03-30 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Libraries are places for organizing information in order to not only disseminate information that favors a particular social group, but also to serve as places for the preservation of history, memory and culture related to invisible groups, especially those under the category of social groups ethnically vulnerable, including African and Afro-descendants , whose participation and contribution to the formation of Brazilian society is still denied. This research aims to analyze how the process of organizing the ethnic and racial information occurs at Central Library of the UFPB. Its focus of analysis is on the OPAC, contextualizing university libraries, describing the terms concerning matters related to ethnic and racial information in all areas of knowledge, surveying how they are classified and how they were treated within these libraries and thus identifying the importance of ethnic and racial information for preservation of theAfrican/Afro-descendant memory for access and use purposes by researchers, students, representatives of social and black movements. Accordingly,we used the descriptive and exploratory research as well as the qualitative and quantitative approaches for both of them fit well together and are essential in regard to clarity and reliability of the results. The terms founds during search, seem inconsistent, representing only 0,165% of the total of titles that make up the archive of this library demonstrating deficiency of these institutions and the lack of information with the ethnic and racial theme being necessary to adopt an indexing policy with use of the terms that can provide visibility for these data. / As bibliotecas constituem lugares de organização da informação com vistas a disseminar não apenas a informação que privilegia um determinado grupo social, mas também servem como lugares de preservação da história, memória e cultura referentes aos grupos invisíveis, principalmente aqueles inseridos na categoria de grupos sociais etnicamente vulneráveis, incluindo-se africanos e afrodescendentes, cuja participação e contribuição na formação da sociedade brasileira é negada ainda hoje. Esta pesquisa, por sua vez, tem por objetivo analisar como se dá o processo de organização e representação da informação étnico-racial na biblioteca central da UFPB. Tem como foco de análise o OPAC, contextualizando bibliotecas universitárias, descrevendo os descritores referentes aos assuntos relacionados à informação étnico-racial em todas as áreas de conhecimento, verificando como estão indexados e como foram tratados dentro dessas bibliotecas e identificando a importância da informação étnico-racial para preservação da memória africana/afrodescendente para fins de acesso e uso por pesquisadores, estudantes, representantes dos movimentos sociais e negros. Nesse sentido, utilizamos da pesquisa descritiva, exploratória e das abordagens qualitativa e quantitativa por acreditar que ambas abordagens combinam e são fundamentais para se ter maior clareza e confiabilidade dos resultados. Os descritores encontrados aparecem timidamente durante o processo de busca correspondendo apenas 0,165% do total de títulos que compõem o acervo dessa biblioteca demonstrando uma deficiência por parte dessas instituições e a insuficiência da informação étnico-racial sendo necessária a uma política de indexação com aplicação dos termos que possam dar visibilidade a essas informações.
|
79 |
Organização e disponibilização de bases de informações municipais para gestão de políticas públicas / Organization and Availability of Muncipal Data Bases for Management of PublicMaria Lucinda Meirelles Aguiar 04 April 2006 (has links)
Análise sobre a estrutura e a organização da base de informações institucionais e estatísticas da Pesquisa Municipal Unificada PMU, sob a perspectiva da disponibilização de seus dados. As informações institucionais e estatísticas, em âmbito municipal, constituem importante subsídio para a gestão pública, devendo ser disseminadas aos executores dos setores governamentais, bem como aos representantes da sociedade civil organizada. Assim, são avaliados os processos de comunicação em sistemas informacionais e os referenciais para organização e tratamento das informações. Procura-se mostrar que o uso de procedimentos documentários e terminológicos pode melhorar as formas de disponibilização, o acesso e a apropriação da informação, concluindo-se que esses princípios devem ser incorporados às políticas de informação institucionais, como meio de otimizar a disponibilização e a recuperação das informações. / Analysis of the structure and organization of the data systems of the institutional and statistical data of the Unified Municipal Research (PMU), from the perspective of the availability of its data. Institutional and statistical data, in that concerning the municipality, provides vital assistance in the administration of public affairs and should be disseminated among administrators of government bodies, as well as representatives of organized civil society. Communication in information systems and the references for their organization and handling are thus evaluated. What is sought is to show that the use of documentary and terminological procedures can improve the means of data availability, as well as the accessing and appropriation of data. This leads to the conclusion that such principles should be incorporated into institutional information policies as a means to optimize data availability and recovery.
|
80 |
Dos sintagmas nominais aos descritores documentais: estudo de caso na indexação de teses e dissertações da área de DireitoNASCIMENTO, Gustavo Diniz 20 November 2015 (has links)
Submitted by Haroudo Xavier Filho (haroudo.xavierfo@ufpe.br) on 2016-05-19T18:03:16Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertação. Dos Sintagmas Nominais aos Descritores Documentais Estudo de Caso na Indexação de Te.pdf: 3525255 bytes, checksum: 7cb6e4bda3f02eb17e2009285414748d (MD5) / Made available in DSpace on 2016-05-19T18:03:16Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Dissertação. Dos Sintagmas Nominais aos Descritores Documentais Estudo de Caso na Indexação de Te.pdf: 3525255 bytes, checksum: 7cb6e4bda3f02eb17e2009285414748d (MD5)
Previous issue date: 2015-11-20 / O uso dos Sintagmas Nominais como instrumentos de organização e recuperação da informação digital vem se mostrando uma alternativa promissora para sistemas de informação. Nesse contexto, a indexação automática por meio de Sintagmas Nominais se mostra como uma alternativa que minimiza alguns problemas encontrados na indexação baseada em palavras isoladas, uma vez que os Sintagmas Nominais se constituem em unidades sintáticas que possuem semântica/sentido específico. No entanto, é notório que nem todos os Sintagmas Nominais que se encontram em um documento digital são representativos do mesmo, o que demonstra por sua vez a necessidade de uma seleção dos Sintagmas Nominais que realmente possam funcionar como descritores documentais. Nesse contexto, o presente trabalho tem como objetivo geral investigar a seleção de sintagmas nominais com valor de descritor no contexto do processo de indexação automática por meio de sintagmas nominais de resumos de teses e dissertações em português da área jurídica. Pretende-se: 1. Investigar o processo de indexação automática por meio de sintagmas nominais; 2. Verificar quais são as características de um Sintagma Nominal como valor de descritor documental; 3. Identificar na literatura científica nacional metodologias para seleção de sintagmas nominais em textos em português, bem como os critérios de seleção de cada metodologia; 4. Planejar experimento, onde os Sintagmas Nominais extraídos são categorizados quanto ao atendimento ou não a critérios de seleção propostos na literatura e quanto ao valor como Descritores, quando semelhantes aos descritores documentais resultantes da indexação manual; 5. Avaliar os critérios de seleção na indexação automática por meio de Sintagmas Nominais para teses e dissertações da área jurídica. Para o alcance dos objetivos propostos, fez-se uso de uma pesquisa bibliográfica e de um experimento. A pesquisa bibliográfica permitiu a identificação de pesquisas voltadas para a indexação automática por meio de Sintagmas Nominais, principalmente no que se refere à seleção de Sintagmas que funcionem como descritores documentais. Com base nas leituras dessas pesquisas, puderam-se identificar vários critérios utilizados para a seleção de Sintagmas. O experimento constituiu-se na aplicação dos critérios identificados na literatura aos sintagmas nominais extraídos de um conjunto de resumos de teses e dissertações da área jurídica, com o intuito de mensurar a utilidade ou não desses critérios no que diz respeito à seleção de sintagmas nominais descritores. Assim, realizou-se a indexação manual dos documentos, a extração automática dos Sintagmas Nominais constituintes dos mesmos, a categorização dos sintagmas nominais como descritores com base na semelhança aos descritores documentais advindos da indexação manual e a aplicação dos critérios de seleção aos sintagmas nominais extraídos. Por meio do experimento, foram percebidos comportamentos distintos entre cada critério, onde a maioria foi considerada útil para a seleção de sintagmas nominais. / The use of noun phrases as tools for information organization and retrieval has proven to be a promising alternative in information systems. In this context, automatic indexing through the noun phrases shows a new alternative that minimizes some problems encountered in indexing based on single words, given that noun phrases are syntactic units with specific semantic/meaning. However, it is evident that not all the noun phrases in a digital document are representative of the content, which in turn demonstrates the need for a selection of noun phrases that may serve as documentary descriptors. In this context, this work aims to investigate the selection of noun phrases with descriptor value in the context of the automatic indexing process by noun phrases from abstracts of theses and dissertations in the area of law in Portuguese. The specific objectives are: 1. Investigate the automatic indexing process by noun phrases; 2. Identify what are the characteristics of a noun phrase with descriptor value; 3. Identify the methodologies in national scientific literature for selection of noun phrases in texts in Portuguese, as well as the selection criteria of each methodology; 4. Organization of an experiment where each extracted noun phrase is categorized as descriptor and if it meets or not the proposed selection criteria in the literature; 5. Evaluate the selection criteria in the automatic indexing by noun phrases for theses and dissertations in the legal field. To achieve the objectives, it was made use of a bibliographic research and experiment. The literature review allowed the identification of research on automatic indexing by noun phrases, especially criteria used to choose noun phrases that act as documentary descriptors. Based on the readings of this research, it was possible to identify several criteria used for the selection of noun phrases. The experiment consisted in applying the criteria identified in the literature to noun phrases extracted from a set of abstracts of theses and dissertations in the legal field, in order to measure the usefulness or not of these criteria for the selection of noun phrases descriptors. Thus it was made manual indexing of documents, automatic extraction of noun phrases thereof, the categorization of noun phrases as descriptors based on their resemblance to the descriptors of manual indexing and the application of criteria in the extracted noun phrases. Through the experiment, we notice a different behavior for each criterion, where most of the criteria was considered useful for noun phrase selection.
|
Page generated in 0.1444 seconds