1 |
[pt] METODOS DE BUSCA POR SIMILARIDADE EM SEQUÊNCIAS TEMPORAIS DE VETORES COM UMA APLICAÇÃO À RECUPERAÇÃO DE ANÚNCIOS CLASSIFICADOS / [en] STAGED VECTOR STREAM SIMILARITY SEARCH METHODS WITH AN APPLICATION TO CLASSIFIED AD RETRIEVABRUNO FRANCISCO MARTINS DA SILVA 22 February 2024 (has links)
[pt] Uma sequência temporal de vetores (vector stream) pode ser modeladacomo uma sequência de pares ((v1, t1). . .(vn, tn)), onde vk é um vetor e tk écarimbo de tempo tais que todos os vetores são da mesma dimensão e tkmenor que tk+1. O problema de busca por similaridade em sequências temporais devetores é definido como: Dado um vetor (de alta dimensão) v e um intervalode tempo T, encontre uma lista ranqueada de vetores, recuperados de umasequência temporal de vetores, que sejam similares a v e que foram recebidosdentro do intervalo de tempo T. Esta dissertação primeiro introduz umafamília de métodos de busca por similaridade em sequências temporais devetores que não dependem da sequência completa, mas se adaptam à medidaque os vetores são incluídos na sequência. Os métodos geram uma sequênciade índices, que são então usados para implementar uma busca aproximadado vizinho mais próximo na sequência temporal de vetores. Em seguida, adissertação descreve uma implementação de um método da família baseado em Hierarchical Navigable Small World graphs. Utilizando esta implementação,a dissertação apresenta uma ferramenta de busca de anúncios classificadosque oferece recuperação de anúncios à medida que usuários continuamentesubmetem novos anúncios. A ferramenta é estruturada em um módulo principale três módulos auxiliares, sendo que o módulo principal é responsável porcoordenar os módulos auxiliares e prover uma interface para o usuário, e osmódulos auxiliares são responsáveis pela codificação dos textos e imagens emvetores, a indexação dos vetores, e o armazenamento dos textos, imagens evetores. Por fim, para avaliar a ferramenta, a dissertação utiliza um conjuntode aproximadamente 1 milhão de registros com as descrições de anúnciosclassificados e suas imagens. Os resultados mostraram que a ferramenta atingiuuma precisão de 98 por cento e um recall de 97 por cento. / [en] A vector stream can be modeled as a sequence of pairs ((v1, t1). . .(vn, tn)),
where vk is a vector and tk is a timestamp such that all vectors are of the
same dimension and tk less than tk+1. The vector stream similarity search problem is
defined as: Given a (high-dimensional) vector q and a time interval T, find a
ranked list of vectors, retrieved from a vector stream, that are similar to q and
that were received in the time interval T. This dissertation first introduces
a family of vector stream similarity search methods that do not depend on
having the full set of vectors available beforehand but adapt to the vector
stream as the vectors are added. The methods generate a sequence of indices
that are used to implement approximated nearest neighbor search over the
vector stream. Then, the dissertation describes an implementation of a method
in the family based on Hierarchical Navigable Small World graphs. Based on
this implementation, the dissertation presents a Classified Ad Retrieval tool
that supports classified ad retrieval as new ads are continuously submitted.
The tool is structured into a main module and three auxiliary modules, where
the main module is responsible for coordinating the auxiliary modules and for
providing a user interface, and the auxiliary modules are responsible for text
and image encoding, vector stream indexing, and data storage. To evaluate the
tool, the dissertation uses a dataset with approximately 1 million records with
descriptions of classified ads and their respective images. The results showed
that the tool reached an average precision of 98 percent and an average recall of 97 percent.
|
2 |
[en] A SOFTWARE ARCHITECTURE FOR AUTOMATED CATALOGUING OF GEOGRAPHIC DATA / [pt] UMA ARQUITETURA DE SOFTWARE PARA CATALOGAÇÃO AUTOMÁTICA DE DADOS GEOGRÁFICOSLUIZ ANDRE PORTES PAES LEME 12 September 2006 (has links)
[pt] Dados geográficos estão disponíveis em quantidade e
variedade
crescentes à medida que evoluem as tecnologias de
informática. Para torná-los
úteis, é necessário que mecanismos de busca de dados
possam identificar
dados apropriados a determinado propósito. Tais
mecanismos, comumente,
utilizam catálogos de metadados que descrevem cada dado
geográfico.
Entretanto, a geração de metadados é um processo que pode
consumir muito
tempo e estar sujeito a muitos erros, caso seja feito
manualmente. Essa
dissertação apresenta uma arquitetura de software e
tecnologias correlatas
para aplicações de catalogação automática de dados
geográficos. / [en] The amount and variety of geographic data increase as
technology
evolves. To make them useful it is necessary to implement
search engines
capable of identifying appropriate data. Such engines are
usually based on
metadata catalogs which describe the geographic data.
However, the metadata
generation process is time consuming and is not fail safe
if it is carried out
manually. This dissertation presents a software
architecture, and related
technologies, for the construction of automated
cataloguing applications of
geographic data.
|
3 |
[en] HIGH INTEREST RATES IN BRAZIL: A THEORETICAL APPROACH / [pt] JUROS ALTOS NO BRASIL: UMA ABORDAGEM TEÓRICARICARDO FIBE GAMBIRASIO 11 October 2006 (has links)
[pt] Esta dissertação visa propor e analisar, no contexto de
modelos dinâmicos
estocásticos de equilíbrio geral com rigidez de preços,
possíveis explicações para
o fato estilizado de que o juro no Brasil é excessivamente
alto. As implicações
de diferentes hipóteses aplicadas aos modelos serão
analisadas através de funções
de resposta a impulso (FRIs). Será analisada, quando
possível, a evidência
empírica disponível na literatura a favor ou contra cada
hipótese, e as FRIs
mostrarão o comportamento dinâmico da economia calibrada
sob cada hipótese.
São compatíveis com um juro real básico mais alto por um
período prolongado as
seguintes hipóteses: alta taxa subjetiva de desconto
intertemporal, alta indexação
de preços, baixa potência da política monetária, e
diminuição da credibilidade do
Banco Central frente o crescimento da dívida pública (um
caso de dominância
fiscal). / [en] This work proposes and analyses, in the context of dynamic
stochastic
general equilibrium models with price rigidities, possible
explanations for the
stylized fact that interest rates in Brazil are
exceedingly high. The implications
of different hypothesis applied to the model are analyzed
through impulse
response functions (IRFs). Whenever possible, empirical
evidence available in
the literature for or against each hypothesis is analyzed,
and the IRFs show the
dynamical behavior of the economy calibrated accordingly.
The following are
consistent with a higher basic interest rate for an
extended period: high subjective
intertemporal discount rate, high price indexation, low
monetary policy power,
and decreasing Central Bank s credibility caused by public
debt growth (an
example of fiscal dominance).
|
Page generated in 0.03 seconds