Submitted by Anderson Silva (avargas@icict.fiocruz.br) on 2012-09-13T14:30:24Z
No. of bitstreams: 1
leonardo.leite.dissertacao.ppgics.2009.pdf: 1412337 bytes, checksum: 9eabc618ae89d50895dd0f83ade7b915 (MD5) / Made available in DSpace on 2012-09-13T14:30:24Z (GMT). No. of bitstreams: 1
leonardo.leite.dissertacao.ppgics.2009.pdf: 1412337 bytes, checksum: 9eabc618ae89d50895dd0f83ade7b915 (MD5) / Fundação Oswaldo Cruz. Assessoria da Presidência. Coordenação de Gestão Tecnológica. Rio de Janeiro, RJ, Brasil / A competitividade cada vez mais acirrada tem feito com que empresas busquem
formas de obter e manter vantagens sobre seus concorrentes. Uma das formas é
através do monitoramento ambiental ou monitoramento tecnológico. Para que o
monitoramento de informação seja eficaz é necessário planejamento de busca que
enfoque a melhor base para a realização da busca; as palavras-chave adequadas; a
fórmula lógica da estratégia. O planejamento da busca necessita de um
conhecimento minucioso das técnicas de estratégia de busca, dos prós e contras da
estratégia no texto completo dos documentos, do uso das linguagens natural e
controlada na recuperação da informação. Neste sentido, esta dissertação apresenta
como questão norteadora a forma como se deve elaborar uma estratégia de busca
de informação em documentos de patente para monitoramento tecnológico. Mais
especificamente, o trabalho apresenta as características das principais bases de
patentes existentes; avaliação do uso da linguagem natural e controlada; do uso de
truncagem nas palavras-chave, da localização dos termos selecionados e quanto ao
escopo de proteção do documento de patente. Como foco da estratégia de busca foi
definido o diagnóstico da malária pela importância da doença em nível mundial,
considerando que um diagnóstico preciso influencia no tratamento mais adequado e
pode-se alcançar reduções nos custos das despesas de saúde em todo o mundo. A
estratégia de busca foi elaborada, na base de dados de patentes Derwent, pelo
cruzamento de palavras representativas do conceito malária e diagnóstico,
associados à classificação internacional de patentes no intervalo 2005 a 2009. Os
dados foram tratados e classificados em software de mineração de texto, em dois
níveis: primeiramente quanto à relevância para a malária, em segundo quanto ao
escopo de proteção. Os resultados mostram que maior parte dos documentos de
patente não são específicos para malária, nem tão pouco para o diagnóstico, a
busca por termos apenas no título limita o retorno dos resultados já que a maior
parte dos conceitos foram encontrados no resumo; o uso da linguagem natural e
controlada na mesma estratégia de busca é fundamental para se obter retorno mais
preciso da informação; a truncagem de termos é importante na estratégia de busca,
porém é necessário conhecimento das combinações dos termos para que não sejam
recuperadas informações irrelevantes. Como conclusão pode-se dizer que não há estratégia de busca que apresente 100% de relevância quanto aos documentos
recuperados, no que diz respeito à busca de patentes. A meta da estratégia de
busca ideal seria uma revocação elevada e uma alta precisão; no entanto,
revocação e precisão tendem a se correlacionar inversamente, ou seja, uma maior
precisão leva a uma menor revocação e vice-versa, o que significa que o
pesquisador de patentes tem de encontrar o equilíbrio adequado entre estes polos
de acordo com o tipo de busca escolhida. / The increasingly fierce competition between companies in the market has made
these companies look for ways to obtain and maintain an advantage over their
competitors. One way is through environmental monitoring or tracking technology.
For monitoring information is needed is an effective strategic planning search: better
basis for decision of the context for and the decision of the keywords and the
decision of the logical formula of the strategy. More specifically the strategic planning
of search requires a thorough knowledge of the techniques of search strategy, the
pros and cons of the strategy in full-text documents, the use of controlled natural
languages in information retrieval. Thus, this paper presents as main question is how
to devise a strategy for finding information in patent documents for tracking
technology. More specifically, the paper presents the characteristics of the main
bases of existing patents; evaluation of the use of natural language and controlled,
the use of truncation in the keywords, the location of selected terms and the scope of
protection of the patent document. The basic patent was selected by the Derwent
Innovation Index reindex the title and abstract of the patent in addition to allowing the
download of documents for use in data mining software. As a focus of the search
strategy was defined by the importance of malaria diagnosis of the disease
worldwide and diagnostic segment as an accurate diagnosis influences the most
appropriate treatment and can achieve reductions in costs of health expenditures
worldwide. The search strategy was developed by crossing concepts with the
diagnosis of malaria associated with the international patent classification within the
range 2005 to 2009. The documents were classified into two levels: first as to the
relevance to malaria and second on the scope of protection. The results show that
the search terms titles only limits the return of results, since most of the concepts
found in the summary, the use of natural language and controlled in the same search
strategy is crucial to get return more accurate information, the truncation is important
in terms search strategy, but you need knowledge of the combinations of terms that
are not retrieved irrelevant information. In conclusion we can say that there is no
search strategy to produce 100% of the retrieved documents as relevant, with regard
to the patent search. The goal of any search strategy would be revoked and a high
precision, ie the recovery of virtually all relevant documents. However, recall and
precision tend to correlate inversely, ie, a higher precision leads to lower recall and vice versa, which means that the patent researcher has to find the right balance
between these poles according to the type chosen search.
Identifer | oai:union.ndltd.org:IBICT/oai:www.arca.fiocruz.br:icict/5517 |
Date | January 2011 |
Creators | Leite, Leonardo Silva |
Contributors | Pimenta, Denise Nacif, Guimarães, Maria Cristina Soares, Silva, Cícera Henrique da, Silva, Cícera Henrique da |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da FIOCRUZ, instname:Fundação Oswaldo Cruz, instacron:FIOCRUZ |
Rights | Leonardo Silva Leite, info:eu-repo/semantics/openAccess |
Page generated in 0.0021 seconds