Spelling suggestions: "subject:"fndices"" "subject:"endices""
111 |
Caracterização fenológica da vegetação por análise harmônica em séries temporais EVI/MODIS no Parque Nacional das AraucáriasSantos, Tiago Rafael dos January 2017 (has links)
A floresta ombrófila mista, representada principalmente pela presença de Araucaria angustifolia possui elevada importância para a região sul do Brasil e o interesse econômico nessa espécie ocasionou uma forte exploração principalmente durante a primeira metade do século XX. O Parque Nacional das Araucárias possui a finalidade de preservar remanescentes de florestas com a presença de Araucaria angustifolia; sendo assim, a compreensão do comportamento da dinâmica fenológica das coberturas florestais é uma forma de auxiliar na gestão e manejo destas áreas. Dessa forma, foi executado a aplicação de uma metodologia baseada em análises harmônicas de séries temporais EVI/MODIS para realizar a caracterização e mapeamento fenológico das diferentes coberturas vegetais presentes no Parque Nacional das Araucárias, por meio desta metodologia foi possível identificar os valores médios de EVI durante toda a série temporal para as diferentes coberturas de uso e ocupação do solo, analisando a relação entre as variações fenológicas com dados de precipitação e temperatura máxima, representando essas variações de amplitude, fase e termo aditivo para a série completa e individualmente para cada ano. Baseado no algoritmo HANTS, aplicou-se a análise harmônica para uma série temporal de dez anos, compreendidas entre os anos de 2006 a 2015. A partir desse processamento foram analisadas as imagens de fase, amplitude e termo aditivo por meio de quatro conjunto de amostras previamente selecionadas, representando as quatro principais coberturas de vegetação presentes no parque. Com o intuito de auxiliar na interpretação visual dos dados, as imagens foram convertidas de RGB para HLS. Uma vez gerados todos os dados, foi possível caracterizar como ocorre a variação dos valores de índices de vegetação ao longo do ano, bem como o período do ano onde acontecem as maiores variações; além de ser possível indicar as áreas onde houve indicativos de mudanças significativas de uso do solo, mudanças ocasionadas por algum evento climático ou pelo próprio desenvolvimento da vegetação. Através dos dados extraídos com a análise harmônica e a identificação das diferentes fenologias gerou-se também uma classificação sobre a série temporal, com o objetivo de identificar as áreas que ainda apresentam remanescentes de Araucaria angustifolia de forma predominante. Por fim, concluiu-se que a aplicação de uma metodologia baseada em séries harmônicas possibilita uma maior compreensão das coberturas florestais presentes nesta unidade de conservação gerando informações úteis para a gestão e possível revisão do plano de manejo. Para alguma aplicação futura, espera-se utilizar esta metodologia em uma série temporal com maior resolução espacial. / The Mixed Coniferous-Broadleaf forest, mainly represented by the presence of Araucaria angustifolia, is highly important to the southern region of Brazil, the economic interest in this species led to a heavy exploration during the first half of the 20th century. The purpose of the Araucárias National Park is to preserve remnants of the forests with great presence of Araucaria angustifolia; therefore, the comprehension of the behavior of the phenological dynamic of the forest covers is a way of assisting the management and handling of these areas. Thereby, the goal is to apply a methodology based on harmonic analysis of EVI / MODIS time series to perform characterization and phenological mapping of the different vegetation covers present in Araucarias National Park; for that, it is intended to identify the medial values of EVI during the whole time series for different types of coverage of soil use and occupation, analyzing the relation between the phenological variations with precipitation data and maximum temperature, representing these variations of amplitude, phase and additive term for a complete series and individually for each year. Based on the HANTS algorithm, the harmonic analysis was applied to a time series of ten years, comprised between 2006 and 2015. Starting from this processing, images of the phase, amplitude and additive term were analyzed by means of four previously selected samples, representing the four main vegetation covers present in the park. In order to assist the visual interpretation of data, the images were converted from RGB to HLS. When all data was generated, it was possible to characterize how the variation in the value of vegetation indices happen throughout the year, as well as the time of the year when the biggest variations occur. Besides, it is possible to indicate the areas with significant changes in the use of soil, or changes caused by climatic events or by the vegetation own development. Through the data extracted with the harmonic analysis and the identification of the different phenologies, a classification was also generated on the time series, in order to identify the areas that still present remnants of Araucaria angustifolia predominantly.Ultimately, it is concluded that the application of a methodology based on the harmonic series enables a better comprehension of the forest covers present in this unity of conservation, generating useful information for the management and possible review of the management plan. For future application, the use of this methodology in a time series with greater spatial resolution is expected.
|
112 |
Democracia e desenvolvimento : medições, associações, causa e efeitoBispo, Romanul de Souza January 2015 (has links)
A necessidade de uma nova teoria que relacione a democracia ao desenvolvimento ensejou, neste trabalho, o imperativo de uma avaliação crítica na metodologia de formação de índices, especificamente no tocante à democracia e ao desenvolvimento. A revisão metodológica dos índices assinala para a força e as fraquezas envolvidas na medição de variáveis complexas. As controvérsias do tema da democracia e do desenvolvimento, e seus conceitos ao longo do tempo e do espaço, permitiram explorar os índices de democracia e de desenvolvimento atualmente mais utilizados nos principais trabalhos acadêmicos e institucionais a nível mundial. A hipótese da existência de uma associação robusta entre democracia e desenvolvimento – robusta no sentido que, independente da medição, o sentido da associação entre esses conceitos é o mesmo – resultou na comprovação empírica de que democracia e desenvolvimento seguem na mesma direção. Examina-se a relação de causa e efeito, pelo modelo econométrico, das concepções teóricas relativas ao tema. A primeira concepção deriva da teoria da modernização, em que as revoluções tecnológicas ou o desenvolvimento socioeconômico moldam as mudanças de valores e ampliam os direitos das pessoas para agir conforme suas escolhas e, em seguida, passam a exigir liberdades civis e políticas. A segunda concepção aponta para uma relação em que a variável dependente – neste caso o desenvolvimento – passa a ser afetada pela democracia, com a restrição de que tal comportamento só ocorre quando usamos os países mais democráticos. Esta segunda concepção é, nesta tese, denotada por premissa do empoderamento, pois ainda não temos uma teoria, ensejando o paradigma do Desenvolvimento Humano de Amartya Sen, que vislumbra o desenvolvimento como liberdade. Este trabalho de tese levantou elementos empíricos que não refutam a Teoria da Modernização e contém elementos estatísticos significativos para não refutar a premissa do empoderamento. Na teoria da modernização, desenvolvimento socioeconômico induz a democracia e, na premissa do empoderamento, a democracia exerce a função de catalizadora do desenvolvimento. Assim, a tese ora apresentada, vem a contribuir de forma embrionária na formação de uma nova teoria, ou seja, a Teoria do Empoderamento. / The need for a new theory that relates democracy to development gave rise in this work to the need for a critical assessment in indices formation methodology, specifically with regard to democracy and development. A methodological review of the indices points to the strengths and weaknesses involved in the measurement of complex variables. Disputes on the themes of democracy and development, as well as their concepts over time and space, allowed for the exploration of the most common indices of democracy and development currently in use in major academic and institutional works worldwide. The hypothesis of the existence of a robust association between democracy and development, robust in the sense that, regardless of its measurement, the direction of the association of these two concepts are the same, resulted in empirical evidence that democracy and development follow the same direction. Through the econometric model, the theoretical concepts related to the topic have their cause and effect relationship examined. The first concept derives from the modernization theory in which technological revolutions or socioeconomic development shape the changes in values and expands people’s rights to act according to their own choices, and then, come to demand civil and political liberties and, the second concept that points to a relationship in which the dependent variable, in this case the development, becomes affected by democracy, with the restriction that such behavior only occurs when we use the most democratic countries. In this dissertation, this second concept is denoted through the premise of empowerment because there is as yet no theory that allows for Amartya Sen’s paradigm of Human Development, which sees development as freedom. This thesis raised empirical elements that do not refute the Modernization Theory and brings significant statistical data so as not to refute the premise of empowerment. In the theory of modernization, socio-economic development leads to democracy and in the premise of empowerment, democracy plays a catalyst role in development. Thus, the dissertation presented hereby is a contribution in embryonic form to the formation of a new theory, namely, the Empowerment Theory.
|
113 |
Democracia e desenvolvimento : medições, associações, causa e efeitoBispo, Romanul de Souza January 2015 (has links)
A necessidade de uma nova teoria que relacione a democracia ao desenvolvimento ensejou, neste trabalho, o imperativo de uma avaliação crítica na metodologia de formação de índices, especificamente no tocante à democracia e ao desenvolvimento. A revisão metodológica dos índices assinala para a força e as fraquezas envolvidas na medição de variáveis complexas. As controvérsias do tema da democracia e do desenvolvimento, e seus conceitos ao longo do tempo e do espaço, permitiram explorar os índices de democracia e de desenvolvimento atualmente mais utilizados nos principais trabalhos acadêmicos e institucionais a nível mundial. A hipótese da existência de uma associação robusta entre democracia e desenvolvimento – robusta no sentido que, independente da medição, o sentido da associação entre esses conceitos é o mesmo – resultou na comprovação empírica de que democracia e desenvolvimento seguem na mesma direção. Examina-se a relação de causa e efeito, pelo modelo econométrico, das concepções teóricas relativas ao tema. A primeira concepção deriva da teoria da modernização, em que as revoluções tecnológicas ou o desenvolvimento socioeconômico moldam as mudanças de valores e ampliam os direitos das pessoas para agir conforme suas escolhas e, em seguida, passam a exigir liberdades civis e políticas. A segunda concepção aponta para uma relação em que a variável dependente – neste caso o desenvolvimento – passa a ser afetada pela democracia, com a restrição de que tal comportamento só ocorre quando usamos os países mais democráticos. Esta segunda concepção é, nesta tese, denotada por premissa do empoderamento, pois ainda não temos uma teoria, ensejando o paradigma do Desenvolvimento Humano de Amartya Sen, que vislumbra o desenvolvimento como liberdade. Este trabalho de tese levantou elementos empíricos que não refutam a Teoria da Modernização e contém elementos estatísticos significativos para não refutar a premissa do empoderamento. Na teoria da modernização, desenvolvimento socioeconômico induz a democracia e, na premissa do empoderamento, a democracia exerce a função de catalizadora do desenvolvimento. Assim, a tese ora apresentada, vem a contribuir de forma embrionária na formação de uma nova teoria, ou seja, a Teoria do Empoderamento. / The need for a new theory that relates democracy to development gave rise in this work to the need for a critical assessment in indices formation methodology, specifically with regard to democracy and development. A methodological review of the indices points to the strengths and weaknesses involved in the measurement of complex variables. Disputes on the themes of democracy and development, as well as their concepts over time and space, allowed for the exploration of the most common indices of democracy and development currently in use in major academic and institutional works worldwide. The hypothesis of the existence of a robust association between democracy and development, robust in the sense that, regardless of its measurement, the direction of the association of these two concepts are the same, resulted in empirical evidence that democracy and development follow the same direction. Through the econometric model, the theoretical concepts related to the topic have their cause and effect relationship examined. The first concept derives from the modernization theory in which technological revolutions or socioeconomic development shape the changes in values and expands people’s rights to act according to their own choices, and then, come to demand civil and political liberties and, the second concept that points to a relationship in which the dependent variable, in this case the development, becomes affected by democracy, with the restriction that such behavior only occurs when we use the most democratic countries. In this dissertation, this second concept is denoted through the premise of empowerment because there is as yet no theory that allows for Amartya Sen’s paradigm of Human Development, which sees development as freedom. This thesis raised empirical elements that do not refute the Modernization Theory and brings significant statistical data so as not to refute the premise of empowerment. In the theory of modernization, socio-economic development leads to democracy and in the premise of empowerment, democracy plays a catalyst role in development. Thus, the dissertation presented hereby is a contribution in embryonic form to the formation of a new theory, namely, the Empowerment Theory.
|
114 |
Elaboração de índice ambiental urbano através da análise de densidade populacional e superfície impermeável em bacias hidrográficasFagundes, Larissa January 2002 (has links)
O planejamento urbano possui um vasto campo a ser descoberto no que se refere às exigências mundiais ambientais existentes atualmente. Não apenas existem novas diretrizes a serem alcançadas, mas as cidades estão em constante evolução e, assim, a complexidade das mesmas também se torna um desafio. A partir dessas questões, o presente trabalho vem contribuir na elaboração de uma metodologia que facilite a construção de indicadores urbanos, principalmente naqueles que possam avaliar os limites do crescimento das cidades, representados aqui através da integração entre impermeabilização do solo urbano e densidade populacional. A escolha de indicadores é função de cada pesquisador que possui conhecimento sobre os problemas, ambientais ou não, existentes nas cidades. Qualquer cidade, de qualquer porte, em qualquer lugar do planeta pode estar apresentando um problema ambiental relacionado às funções urbanas. Muitos podem ser os indicadores ambientais urbanos, mas nesta pesquisa são relacionados dois tipos de indicadores: a densidade populacional e as superfícies impermeáveis urbanas, pois acredita-se que com o crescente aumento de construções urbanas, um descompasso é causado na capacidade de absorção do solo durante períodos de chuva. A impermeabilização do solo gera problemas de enchentes que, muitas vezes, causa inúmeros impedimentos como alagamentos de vias ou nas próprias construções urbanas que afetam a população, causando inclusive mortalidade no caso de pessoas e carros arrastadas pela forte corrente das águas. Uma metodologia simples pode facilitar o trabalho de planejamento de cidades como a utilização de procedimentos normalmente aplicados em estudos de recursos hídricos com o acréscimo de indicadores que também refletem as condições urbanas de bacias hidrográficas. As ferramentas utilizadas por esta pesquisa são: a) programas computacionais de geoprocessamento que agilizam e possibilitam a interconexão de diferentes informações urbanas localizadas no espaço; b) programas de sensoriamento remoto que atualizam informações cadastrais sobre a cidade utilizando imagens de satélite compatíveis; e, finalmente, c) modelos geoestatísticos que estimam valores próximos à realidade para toda a superfície urbana estudada, pois, muitas vezes, os dados disponíveis não cobrem toda a extensão da área em estudo. Os resultados fornecidos através desses procedimentos metodológicos se mostraram satisfatórios no que se refere a análise da transformação das condições naturais de drenagem da bacia hidrográfica estudada. Foram percebidas alterações que prejudicam o desempenho de drenagem urbana em locais onde a própria topografia da região, juntamente com os dados de impermeabilização do solo e de densidade populacional contribuem para situações de alagamentos. Com essas informações é possível prever esses locais problemáticos e, então, melhorar as propostas de planejamento urbano dessas regiões. Considera-se que a pesquisa estimula a utilização de bacias hidrográficas como unidades de planejamento ambiental em cidades, pois é através delas que se pôde compreender os efeitos dos adensamentos urbanos como as enchentes urbanas que são atualmente um grande problema enfrentado nas cidades brasileiras.
|
115 |
Correction, Depression, Cardiac Compression and Haller Indices Fail to Correlate with Cardiopulmonary Impairment in Pectus ExcavatumDonato, Britton 29 March 2018 (has links)
A Thesis submitted to The University of Arizona College of Medicine - Phoenix in partial fulfillment of the requirements for the Degree of Doctor of Medicine. / compression of the
right atrium and ventricle yet their LV function is
within normal range. In the setting of normal LV
function, symptomatic PE could potentially be the
result of right heart compression causing right heart
strain. Emphasis should therefore be placed on
analyzing the presence and degree of right heart
strain in patients with symptomatic pectus
excavatum.
When assessing for a correlation between the HI, CI,
DI, or CCI together and independently with
cardiopulmonary impairment, no significant
relationships were identified. While it would be highly
advantageous for a PE severity index to correlate with
objective physiologic impairment, our data suggest
that the currently defined indices fail to do so.
Data confirming such a correlation would provide a
means to measure both the severity of deformity
and changes in functional disability in patients with
PE. We aim to analyze the correlation between the
HI and three new indices with cardiopulmonary
impairment using the cardiopulmonary exercise
test (CPET). In this study we evaluated the
correlation of the Haller, correction, depression,
and cardiac compression indices with functional
cardiopulmonary impairment using preoperative
cardiopulmonary exercise test (CPET) data. We
hypothesize that the correction and cardiac
compression indices will be strongly correlated with
physiologic impairment in patients with PE, thus
providing a novel means to measure functional
disability as a function of disease severity.
Study Design
This is a retrospective study of 71 children between
the ages of birth and 18 years of age who
underwent evaluation for corrective surgery for
pectus excavatum between 2010 and 2016 at
Phoenix Children’s Hospital. Our final sample
underwent preoperative computed tomography
(CT) or MRI scan results as well as
cardiopulmonary exercise testing. For each
patient, the HI, CI, DI, and CCI were independently
assessed using the PACS System by a single rater.
Preoperative functional capacity was determined
by measurement of peak oxygen consumption
(VO2max reported as percent predicted) and
stroke volume (a surrogate for cardiac output)
which was assessed via the O2 pulse
(VO2max/heart rate) reported as percent predicted.
The possible values range from zero to 100% of
the predicted value.
Assessments
Halller Index Correction Index
Depression Index Cardiac Compression Index
Correction, Depression, Cardiac Compression and Haller Indices Fail to Correlate with
Cardiopulmonary Impairment in Pectus Excavatum
Abstract Results
Background: Pectus excavatum (PE) affects 1 in
every 300 to 1,000 live births with a male to female
ratio of 5:1, making it the most common congenital
chest wall deformity in children. The standard for
determining disease severity has become the Haller
Index, which has been shown to poorly correlate with
physiologic impairment. Recently, more novel indices
have been introduced in an effort to more effectively
represent disease burden. We aim to analyze the
correlation between these indices and
cardiopulmonary impairment in patients with PE using chest CT/ MRI as well as preoperative
cardiopulmonary exercise testing data.
Conclusions: We found that when assessing for a
correlation between the HI, CI, DI, or CCI together and
independently with cardiopulmonary impairment, both
the linear and multiple regression models failed to
identify a statistically significant relationship. While it
would be highly advantageous for a PE severity index
to correlate with objective physiologic impairment, our
data suggest that the currently defined indices fail to do so.
|
116 |
The European Employment Price Index: Implementation and Feasibility in AustriaZagler, Martin, Mühlberger, Ulrike January 1998 (has links) (PDF)
The study, on which this paper is based upon, has analyzed the
implementation and feasibility of the European Employment Price Index
(EEPI) in Austria. The European Employment Price Index is a Laspeyres
measure of the change in the demand-transaction price of the standardized
unit of labor. We find that it is feasible to construct the index with the
available company data with an approximate lag length of five month. Most
data were easily accessible within firms, with the exception of severance
payments, company pensions, and hypothetical costs. Only 228 observations
are required to obtain an aggregate EEPI for Austria within +/- one
percentage point at the 95 % significance level, whilst some 4800
observations are necessary for disaggregate series, enormously increasing
costs of provision.
|
117 |
Indexación efectiva de espacios métricos usando permutacionesFigueroa Mora, Karina Mariela January 2007 (has links)
Doctora en Ciencias, Mención Computación / En muchas aplicaciones multimedia y de reconocimiento de patrones es necesario hacer consultas por proximidad a grandes bases de datos modelándolas como un espacio métrico, donde los elementos son los objetos de la base de datos y la proximidad se mide usando una distancia, generalmente costosa de calcular. El objetivo de un índice es preprocesar la base de datos para responder consultas haciendo el menor número de evaluaciones de distancia.
Los índices métricos existentes hacen uso de la desigualdad triangular para responder consultas de proximidad, ya sea partiendo el espacio en regiones compactas o utilizando distancias precalculadas a un conjunto distinguido de elementos. En esta tesis presentamos una nueva manera de resolver el problema, representando los elementos como permutaciones. La permutación se obtiene eligiendo un conjunto de objetos, llamados permutantes, y considerando el orden relativo en el que se ven los permutantes desde cada elemento a indexar.
Nuestra contribución principal es el haber descubierto que la proximidad entre elementos se puede predecir con mucha precisión midiendo la distancia entre las permutaciones que representan esos elementos.
Una aplicación directa de nuestra técnica deriva en un método probabilístico simple y eficiente: Se ordena la base de datos por proximidad de las permutaciones de los elementos a la permutación de la consulta, y se recorre en ese orden. De la comparación experimental de esta técnica contra el estado del arte, en diversos espacios reales y sintéticos, se concluye que las permutaciones son mucho mejores predictores de proximidad que las técnicas hasta ahora usadas, sobre todo en dimensiones altas. Generalmente basta revisar una pequeña fracción de la base de datos para tener un alto porcentaje de la respuesta correcta.
Otra aplicación menos directa de nuestra técnica consiste en modificar el algoritmo exacto AESA, que por 20 años ha sido el índice más eficiente, en términos de cálculos de distancia, para buscar en espacios métricos. Nuestra variante, iAESA, utiliza las permutaciones para determinar el siguiente candidato a compararse contra la consulta. Los resultados experimentales muestran que es posible mejorar el desempeño de AESA hasta en 35\%. Esta técnica es adaptable a otros algoritmos existentes.
Se aplicó nuestra técnica al problema de identificación de rostros en imágenes, y se lograron resultados hasta ahora no alcanzados por los típicos algoritmos vectoriales usados en estas aplicaciones. Asimismo, dado que nuestra técnica no aplica explícitamente la desigualdad triangular, la probamos en algunos espacios de similaridad no métrica, obteniendo un índice que permite la búsqueda por proximidad con resultados semejantes al caso de los espacios métricos. / Este trabnajo fue financiado por Núcleo Milenio Centro de Investigación de la Web, Mediplan, Chile y la Universidad Michoacana de San Nicolás de Hidalgo, México
|
118 |
Métodos de acceso y procesamiento de consultas espacio-temporalesGutiérrez Retamal, Gilberto Antonio January 2007 (has links)
Doctor en Ciencias, Mención Ciencias de la Computación / Existe una necesidad creciente por contar con aplicaciones espacio-temporales que necesitan modelar la naturaleza dinámica de los objetos espaciales. Las bases de datos espacio-temporales intentan proporcionar facilidades que permitan apoyar la implementación de este tipo de aplicaciones. Una de estas facilidades corresponde a los métodos de acceso, que tienen por objetivo construir índices para permitir el procesamiento eciente de las consultas espacio-temporales.
En esta tesis se describen nuevos métodos de acceso basados en un enfoque que combina dos visiones para modelar información espacio-temporal: snapshots y eventos. Los snapshots se implementan por medio de un índice espacial y los eventos que ocurren entre snapshots consecutivos, se registran en una bitácora. Se estudió el comportamiento de nuestro enfoque considerando diferentes granularidades del espacio. Nuestro primer método de acceso espacio-temporal (SEST-Index) se obtuvo teniendo en cuenta el espacio completo y el segundo (SESTL) considerando las divisiones más finas del espacio producidas por el índice espacial.
En esta tesis se realizaron varios estudios comparativos entre nuestros métodos de acceso y otros métodos propuestos en la literatura (HR-tree y MVR-tree) para evaluar las consultas espacio-temporales tradicionales (time-slice y time-interval). Los estudios muestran la superioridad de nuestras estructuras de datos en términos de almacenamiento y eficiencia para procesar tales consultas en un amplio rango de situaciones. Para nuestros dos métodos de acceso se definieron modelos de costos que permiten estimar tanto el almacenamiento como el tiempo de las consultas. Estos modelos se validaron experimentalmente presentando una buena capacidad de estimación.
Basándonos en nuestros métodos propusimos algoritmos para procesar otros tipos de consultas espacio-temporales, más allá de time-slice y time-interval. Específicamente diseñamos algoritmos para evaluar la operación de reunión espacio-temporal, consultas sobre eventos y sobre patrones espacio-temporales. Se realizaron varios experimentos con el propósito de comparar el desempeño de nuestros métodos frente a otros propuestos en la literatura (3D R-tree, MVR-tree, HR-tree y CellList) para procesar estos tipos de consultas. Los resultados muestran un rendimiento, en general, favorable a nuestros métodos.
En resumen, nuestros métodos son los primeros que resuelven de manera eficiente no sólo las consultas de tipo time-slice y time-interval, sino también varias otras de interés en aplicaciones espacio-temporales.
|
119 |
To index or not to index:|bTime-space trade-offs in search engines with positional ranking functionsGonzález Cornejo, Senen Andrés January 2014 (has links)
Magíster en Ciencias, Mención Computación / Web search has become an important part of day-to-day life. Web search engines are important tools that give access to the information stored in the web. The success of a web search engine mostly depends on its efficiency and the quality of its ranking function. But also, web search engines give extra aids to their users, which make them more usable. An instance of this is the ability of generating result snippets and being able to retrieve the in-cache version of a web page, among others. Inverted indexes are a fundamental data structure used by web search engines to efficiently answer user queries.
In a basic setup, inverted indexes only allow for simple (though fairly effective) ranking functions (e.g., BM25). It is well known that the high quality of nowadays search-engine results is due to sophisticated ranking functions. A particular example that has been widely studied in the literature is that of positional ranking functions, where the positions of the query terms within the resulting documents are used in order to rank them. To support this kind of ranking, the classical solution are positional inverted indexes. However, these usually demand large amounts of extra space, typically about three times the space of an inverted index. Moreover, if the web search engine needs to produce text snippets or display a cached copy of a web page, the textual data must be also stored.
In this thesis we study time/space trade-offs for web search engines with positional ranking functions and text snippet generation. We aim to answer the question of whether positional inverted indexes are the most efficient way to store and retrieve positional data. In particular, we propose to get rid of positional data in inverted indexes, and instead obtain that information from the text collection itself. The challenge is to compress the text collection such that one can support the extraction of arbitrary documents, in order to find the positions of the query terms within them. We study and compare several alternatives for compressing the textual data. The first one uses a succinct data structure (in particular, a Wavelet Tree). We show how the space of the data structure can be reduced significantly, but also slowed down, by using high-order compressors within the nodes of the data structure. We then show how several text compression alternatives behave when used to obtain arbitrary documents (note that decompression speed is key in this application). Our starting point are compressors that either: (1) use little space for the text, yet with a slow decompression speed; and (2) have a very efficient decompression time (achieving a total performance comparable to that of positional inverted indexes), yet with a poor compression ratio. We then show how to obtain the best from both worlds: an efficient compression ratio, with a high decompression speed.
We conclude that there exist a wide range of practical time/space trade-offs, other than just positional inverted indexes. The main result is that using only about 50% of the space of current solutions (i.e., positional inverted indexes plus the compressed text), one can support positional ranking and snippet generation almost with no time penalties. This seems to indicate that not to index positional data is the best solution in many practical scenarios. This can change the way in which positional data is stored and retrieved in web search engines.
|
120 |
The market impact on shares entering or leaving JSE indicesMiller, Craig Elie 21 July 2012 (has links)
This study attempts to measure the effects on the share price of companies entering and exiting four FTSE/JSE indices; the J200, J210, J213 and J260. While results showed only weak statistical significance, systematic patterns were observed during the event window. Share prices of companies entering and exiting value weighted indices responded consistently with the investor awareness hypothesis. Share prices of companies entering and exiting indices weighted by fundamental factors responded consistently with the information hypothesis. The cumulative average abnormal returns (CAARs) were permanent and did not reverse within the first 200 days after the index change for all indices. Abnormal returns were calculated by using the market model and a one factor CAPM model. The market model was a superior benchmark in this study. This study found that the CAARs for index changes became positive only after the date of the index change. This implies that either the effect of passive index funds on the JSE is not significant, or that passive funds are allowed to incur tracking errors in order to trade strategically to secure the best price for a reconstituted portfolio. This conclusion is supported by the fact that there was no observable change in the index premium over time. The findings of this study may indicate market inefficiency, which means that arbitrage opportunities may exist around index changes. / Dissertation (MBA)--University of Pretoria, 2012. / Gordon Institute of Business Science (GIBS) / unrestricted
|
Page generated in 0.0405 seconds