• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 5
  • 5
  • Tagged with
  • 10
  • 10
  • 10
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

[en] INSTITUTIONAL OWNERSHIP AS A PREDICTOR OF FUTURE SECURITY RETURNS / [pt] USO DE DADOS DAS CARTEIRAS DE INVESTIDORES INSTITUCIONAIS NA PREDIÇÃO DE RETORNOS DE AÇÕES

RAPHAEL ALEXANDER ROTTGEN 29 February 2016 (has links)
[pt] Texto Dados sobre as carteiras de investidores institucionais em ações agora estão disponíveis em vários países e portanto podem ser usados em modelos para prever os futuros retornos de ações. Recentemente, vários produtos comerciais de investimento foram lançados que explicitamente usam tal tipo de dados na construção da carteira de investimentos. O intuito deste estudo é aplicar algoritmos de aprendizado de máquina em cima de dados das carteiras de ações de investidores institucionais nos Estados Unidos, a fim de avaliar se tais dados podem ser usados para prever futuros retornos de ações. Nosso trabalho mostra que um modelo usando um support vector machine conseguiu separar ações em três classes de futuro retorno com acurácia acima da esperada se um modelo aleatório fosse usado. / [en] Data on institutional ownership of securities is nowadays publicly available in a number of jurisdictions and can thus be used in models for the prediction of security returns. A number of recently launched investment products explicitly use such institutional ownership data in security selection. The purpose of the current study is to apply statistical learning algorithms to institutional ownership data from the United States, in order to evaluate the predictive validity of features based on such institutional ownership data with regard to future security returns. Our analysis identified that a support vector machine managed to classify securities, with regard to their four-quarter forward returns, into three bins with significantly higher accuracy than pure chance would predict. Even higher accuracy was achieved when predicting realized, i.e. past, fourquarter returns.
2

[en] RECOMMENDATION SYSTEMS: AN USER EXPERIENCE ANALYSIS IN DIGITAL PRODUCTS / [pt] SISTEMAS DE RECOMENDAÇÃO DE CONTEÚDO: UMA ANÁLISE SOBRE A EXPERIÊNCIA DO USUÁRIO EM PRODUTOS DIGITAIS

CAROLINA LIMEIRA ALVES 15 December 2015 (has links)
[pt] Big Data é o termo utilizado para caracterizar o conjunto de soluções tecnológicas que permitem o rápido processamento de um grande volume de dados variados. Estas soluções só se tornaram possíveis com os avanços tecnológicos ocorridos nas últimas décadas. Uma das funcionalidades que ganharam força e melhorias através desses tipos de tecnologias são os sistemas de recomendação. Tais sistemas têm como objetivo principal oferecer ao usuário sugestões de conteúdo que possam interessá-lo. Este conteúdo pode ser uma notícia, um produto, um contato, um filme, uma música ou qualquer outro tipo de informação. Esta dissertação estuda a percepção dos usuários em relação aos sistemas de recomendação, especialmente para o conteúdo televisivo (programas, séries e filmes). Para tal, fez-se uso de questionários, grupos de foco, análise do cenário atual e estudo de caso. Através destes métodos e técnicas foi possível identificar os diferentes fatores que influenciam a maneira como a funcionalidade é percebida e a forma como os serviços são utilizados. Além disso, se discute as consequências do uso excessivo da personalização de conteúdo, bem como questões éticas, privacidade, impactos sociais e psicológicos e a responsabilidade do designer de produtos digitais. Em conclusão, são feitas recomendações para o desenvolvimento deste tipo de sistema de forma que atenda aos seus objetivos e proporcione uma experiência mais satisfatória ao usuário. / [en] Big Data is the term used to identify the set of technological solutions that allows the fast processing of a big amount of diverse data that only became possible with the technological advances that have occurred in recent decades. One of the features that gained strength and improvements through these types of technologies are the recommendation systems. The objective of these kind of systems is to offer suggestions of content that might interest the users. This content can be some news, a product, a personal contact, a movie, a song or any other kind of information. This dissertation addresses the study of the perception of the users relative to recommendation systems, especially for television content (programs, series and movies). For this purpose, questionnaires, focus groups, context analysis and case studies were used. Through these methods and techniques it was possible to identify the different factors that influences how the functionality is perceived and how the services are used. Further, it discusses the consequences of the excessive use of personalized content, privacy, ethical and social issues, psychological impacts and the responsibility of the digital products designer. In conclusion, some recommendations are made regarding the development of this type of system so that it achieves its purposes and provides a more satisfying user experience.
3

[en] FORECASTING LARGE REALIZED COVARIANCE MATRICES: THE BENEFITS OF FACTOR MODELS AND SHRINKAGE / [pt] PREVISÃO DE MATRIZES DE COVARIÂNCIA REALIZADA DE ALTA DIMENSÃO: OS BENEFÍCIOS DE MODELOS DE FATORES E SHRINKAGE

DIEGO SIEBRA DE BRITO 19 September 2018 (has links)
[pt] Este trabalho propõe um modelo de previsão de matrizes de covariância realizada de altíssima dimensão, com aplicação para os componentes do índice S e P 500. Para lidar com o altíssimo número de parâmetros (maldição da dimensionalidade), propõe-se a decomposição da matriz de covariância de retornos por meio do uso de um modelo de fatores padrão (e.g. tamanho, valor, investimento) e uso de restrições setoriais na matriz de covariância residual. O modelo restrito é estimado usando uma especificação de vetores auto regressivos heterogêneos (VHAR) estimados com LASSO (Least Absolute Shrinkage and Selection Operator). O uso da metodologia proposta melhora a precisão de previsão em relação a benchmarks padrões e leva a melhores estimativas de portfólios de menor variância. / [en] We propose a model to forecast very large realized covariance matrices of returns, applying it to the constituents of the S and P 500 on a daily basis. To deal with the curse of dimensionality, we decompose the return covariance matrix using standard firm-level factors (e.g. size, value, profitability) and use sectoral restrictions in the residual covariance matrix. This restricted model is then estimated using Vector Heterogeneous Autoregressive (VHAR) models estimated with the Least Absolute Shrinkage and Selection Operator (LASSO). Our methodology improves forecasting precision relative to standard benchmarks and leads to better estimates of the minimum variance portfolios.
4

[en] A VISUAL ANALYSIS OF BUS GPS DATA IN RIO / [pt] UMA ANÁLISE VISUAL DOS DADOS DE GPS DOS ÔNIBUS NO RIO

BRUNO GUBERFAIN DO AMARAL 19 July 2016 (has links)
[pt] O tema Cidades Inteligentes é um assunto de interesse para gestores públicos e pesquisadores. Desenvolver cidades mais inteligentes é um dos desafios para o futuro próximo devido à crescente demanda por serviços públicos. Em particular, o transporte público é um dos aspectos mais visíveis de uma cidade viva e, portanto, a sua implementação deve ser muito eficiente. O sistema de transporte público da cidade do Rio de Janeiro é historicamente deficiente, principalmente porque ele é baseado em um antigo sistema de ônibus. Para melhorá-lo, a Prefeitura tomou algumas ações, como o desenvolvimento de um projeto de dados aberto que mostra, a quase a cada minuto, a posição instantânea de todos os ônibus na cidade. Embora não seja uma nova tecnologia, esta é a primeira iniciativa a ser desenvolvida no Rio. Neste trabalho, são aprsentadas ferramentas simples para a exploração visual deste grande conjunto de dados com base em informações históricas, que chega a um total de mais de um bilhão de amostras. Com essas ferramentas, um usuário será capaz de verificar as tendências, identificar padrões e localizar anomalias nesta grande quantidade de dados de GPS dos ônibus. / [en] Smart cities is a current subject of interest for public administrators and researchers. Getting the cities smarter is one of the challenges for the near future, due to the growing demand for public services. In particular, public transportation is one of most visible aspects of a living city and, therefore, its implementation must be very efficient. The public transportation system of the City of Rio de Janeiro is historically deficient, mostly because it is based on an old bus system. To change it, the City Hall took some actions, such as the development of an open data project that shows, at about every minute, the GPS instant position of all buses in the city. Although it is not a new technology, it is the first initiative to be developed in Rio. This work presents simple tools for the visual exploration of this big dataset based on the historical information from this service, which reaches a total of more than one billion samples. With these tools one is able to discover trends, identify patterns, and locate abnormalities within the massive collection of the buses GPS data.
5

[en] FORECASTING IN HIGH-DIMENSION: INFLATION AND OTHER ECONOMIC VARIABLES / [pt] PREVISÃO EM ALTA DIMENSÃO: INFLAÇÃO E OUTRAS VARIÁVEIS ECONÔMICAS

GABRIEL FILIPE RODRIGUES VASCONCELOS 26 September 2018 (has links)
[pt] Esta tese é composta de quatro artigos e um pacote de R. Todos os artigos têm como foco previsão de variáveis econômicas em alta dimensão. O primeiro artigo mostra que modelos LASSO são muito precisos para prever a inflação brasileira em horizontes curtos de previsão. O segundo artigo utiliza vários métodos de Machine Learning para prever um grupo de variáveis macroeconomicas americanas. Os resultados mostram que uma adaptação no LASSO melhora as previsões com um alto custo computacional. O terceiro artigo também trata da previsão da inflação brasileira, mas em tempo real. Os principais resultados mostram que uma combinação de modelos de Machine Learning é mais precisa do que a previsão do especialista (FOCUS). Finalmente, o último artigo trata da previsão da inflação americana utilizando um grande conjunto de modelos. O modelo vencedor é o Random Forest, que levanta a questão da não-linearidade na inflação americana. Os resultados mostram que tanto a não-linearidade quanto a seleção de variáveis são importantes para os bons resultados do Random Forest. / [en] This thesis is made of four articles and an R package. The articles are all focused on forecasting economic variables on high-dimension. The first article shows that LASSO models are very accurate to forecast the Brazilian inflation in small horizons. The second article uses several Machine Learning models to forecast a set o US macroeconomic variables. The results show that a small adaptation in the LASSO improves the forecasts but with high computational costs. The third article is also on forecasting the Brazilian inflation, but in real-time. The main results show that a combination of Machine Learning models is more accurate than the FOCUS specialist forecasts. Finally, the last article is about forecasting the US inflation using a very large set of models. The winning model is the Random Forest, which opens the discussion of nonlinearity in the US inflation. The results show that both nonlinearity and variable selection are important features for the Random Forest performance.
6

[pt] ENSAIOS SOBRE NOWCASTING COM DADOS EM ALTA DIMENSÃO / [en] ESSAYS ON NOWCASTING WITH HIGH DIMENSIONAL DATA

HENRIQUE FERNANDES PIRES 02 June 2022 (has links)
[pt] Em economia, Nowcasting é a previsão do presente, do passado recente ou mesmo a previsão do futuro muito próximo de um determinado indicador. Geralmente, um modelo nowcast é útil quando o valor de uma variável de interesse é disponibilizado com um atraso significativo em relação ao seu período de referência e/ou sua realização inicial é notavelmente revisada ao longo do tempo, se estabilizando somente após um tempo. Nesta tese, desenvolvemos e analisamos vários métodos de Nowcasting usando dados de alta dimensão (big data) em diferentes contextos: desde a previsão de séries econômicas até o nowcast de óbitos pela COVID-19. Em um de nossos estudos, comparamos o desempenho de diferentes algoritmos de Machine Learning com modelos mais naive na previsão de muitas variáveis econômicas em tempo real e mostramos que, na maioria das vezes, o Machine Learning supera os modelos de benchmark. Já no restante dos nossos exercícios, combinamos várias técnicas de nowcasting com um grande conjunto de dados (incluindo variáveis de alta frequência, como o Google Trends) para rastrear a pandemia no Brasil, mostrando que fomos capazes de antecipar os números reais de mortes e casos muito antes de estarem disponíveis oficialmente para todos. / [en] Nowcasting in economics is the prediction of the present, the recent past or even the prediction of the very near future of a certain indicator. Generally, a nowcast model is useful when the value of a target variable is released with a significant delay with respect to its reference period and/or when its value gets notably revised over time and stabilizes only after a while. In this thesis, we develop and analyze several Nowcasting methods using high-dimensional (big) data in different contexts: from the forecasting of economic series to the nowcast of COVID-19. In one of our studies, we compare the performance of different Machine Learning algorithms with more naive models in predicting many economic variables in real-time and we show that, most of the time, Machine Learning beats benchmark models. Then, in the rest of our exercises, we combine several nowcasting techniques with a big dataset (including high-frequency variables, such as Google Trends) in order to track the pandemic in Brazil, showing that we were able to nowcast the true numbers of deaths and cases way before they got available to everyone.
7

[pt] ANÁLISE ESTOCÁSTICA DA PROPAGAÇÃO DE UMA DOENÇA DE CARÁTER EPIDEMIOLÓGICO / [en] STOCHASTIC ANALYSES OF THE SPREAD OF AN EPIDEMIOLOGICAL DISEASE

BEATRIZ DE REZENDE BARCELLOS BORGES 29 November 2021 (has links)
[pt] Este trabalho analisa a propagação de uma doença epidemiológica com uma abordagem estocástica. Na análise, o número de indivíduos que cada membro infectado da população pode infectar é modelado como uma variável aleatória e o número de indivíduos infectados ao longo do tempo é modelado como um processo estocástico de ramificação. O foco do trabalho é caracterizar a influência do modelo probabilístico da variável aleatória que modela o contágio entre indivíduos na disseminação da doença e na probabilidade de extinção, e analisar a influência de uma vacinação em massa no controle da propagação da doença. A comparação é feita com base em histogramas e estatísticas amostrais do número de indivíduos infectados ao longo do tempo, como média e variância. Os modelos estatísticos referentes à parte que trata de uma população não vacinada são calculados usando simulações de Monte Carlo para 3 diferentes famílias de variáveis aleatórias: binomial, geométrica-1 e geométrica-0. Para cada família, 21 distribuições diferentes foram selecionadas e, para cada distribuição, 4000 simulações do processo de ramificação foram computadas. Os modelos estatísticos referentes a uma população parcialmente vacinada foram calculados usando simulações de Monte Carlo para a família de variável aleatória binomial. Para essa família, 21 distribuições diferentes foram selecionadas e, para cada uma delas foram escolhidas 6 diferentes percentagens de população vacinada. Para cada percentagem, foram analisadas vacinas com 4 diferentes eficácias. No total, foram realizadas 2.2 milhões de simulações, caracterizando o problema como big data. / [en] This work analyzes the spread of an epidemiological disease with a stochastic approach. In the analysis, the number of individuals that each infected member of the population can infect is modeled as a random variable and the number of infected individuals over time is modeled as a stochastic branching process. The focus of the work is to characterize the influence of the probabilistic model of the random variable that models contagion between individuals on the spread of the disease and the probability of extinction, and to analyze the influence of mass vaccination in controlling the spread of a disease. The comparison is based on histograms and sample statistics of the number of infected individuals over time, such as mean and variance. Statistical models for the chapter dealing with a vaccine free population are calculated using Monte Carlo simulations for 3 different families of random variables: binomial, geometric-1 and geometric-0. For each of the 3 families, 21 different distributions were selected and, for each distribution, 4000 simulations of the branching process were computed. Statistical models for a partially vaccinated population were calculated using Monte Carlo simulations for one family of random variable: the binomial. For it, 21 different distributions were selected and, for each of them, 6 different percentages of the vaccinated population were chosen. For each of them, 4 different vaccine efficacy were stipulated. In total, 2.2 million simulations were performed, featuring a big data problem.
8

[pt] ATIVISMO TRANSNACIONAL NAS MÍDIAS SOCIAIS: UMA REVISÃO DA LITERATURA DO ATIVISMO DE MUDANÇAS CLIMÁTICAS / [en] TRANSNACTIONAL ACTIVISM IN SOCIAL MEDIA: A LITERATURE REVIEW OF CLIMATE CHANGE ACTIVISM

ROBERTA NADALUTTI LA ROVERE 27 May 2019 (has links)
[pt] Em sua expressão contemporânea, os processos de ativismo tornaram-se transnacionais, com suas causas, ações e organização realizados além dos limites das fronteiras nacionais, estabelecendo uma dinâmica com a lógica de horizontalidade da comunicação digital. Através da internet, os ativistas teriam mais possibilidades de estabelecer redes entre si, divulgar suas causas e ações, promover seu ponto de vista sobre os acontecimentos e gerar mais engajamento no debate público e na participação dos processos pelos cidadãos globais. Por isso, o objetivo deste trabalho é promover uma reflexão de como os artigos acadêmicos analisam casos específicos de ativismo transnacional e seus contextos sociopolíticos para que seja produzido um entendimento da forma e extensão dos potenciais de horizontalidade da internet que estão sendo concretizados. Essa reflexão foi baseada em duas perguntas de pesquisa: quem são os ativistas envolvidos no debate público de mudanças climáticas nas mídias sociais; e como a formação de redes de relacionamento entre ativistas no debate público promovido pelas mídias sociais é analisada pelos acadêmicos. Como conclusão, é possível encontrar indícios de quebra de agenda-setting, divulgação de novos enquadramentos de discurso, estabelecimento de redes epistêmicas complementares e organização transnacional e colaborativa de causas e ações de ativismo pela internet, apesar da análise de big data das mídias sociais ainda estar pouco aprofundada nesta área. / [en] In its contemporary form, the processes of activism became transnational, since its actions, causes and organization is done beyond the limit of national borders, establishing a dynamical relationship with the logics of digital communications. Using the internet, activists would have more possibilities of establishing networks of collaboration, publicize its causes and actions, promote specific points of view and generate more engagement in the public debate and more people to participate in activism. Therefore, the purpose of this work is to promote a brief review of how the academic literature is analyzing specific cases of transnational activism and its sociopolitical context to generate a better understanding of which and how the potentials of horizontalization from the internet are manifested. Two research questions are addressed: how are the actors of climate change activism analyzed in the social media data analysis of the literature, and how are the social networks of activists being explored. The conclusion is that it is possible to find evidences of activists breaking the agendasetting of traditional media, as well as promoting new framing of the discourse surrounding its actions and causes, new networks of collaboration and transnational and collaborative forms of organizing and creating actions through social media. However, big data analysis of activism processes in social media is still beginning and new research with more depth in the information analysis would benefit immensely in the comprehension of its dynamics
9

[en] REAL-TIME RISKS DETERMINATION OF TRANSMISSION LINES OUTAGE BY LIGHTNINGS / [pt] DETERMINAÇÃO EM TEMPO REAL DOS RISCOS DE DESLIGAMENTOS EM LINHAS DE TRANSMISSÃO DEVIDO A DESCARGAS ATMOSFÉRICAS

MARCELO CASCARDO CARDOSO 12 February 2019 (has links)
[pt] As descargas atmosféricas são de grande importância para o setor elétrico, sendo frequentemente responsáveis por desligamentos de linhas de transmissão, que podem desencadear uma sequência de eventos que levem o sistema elétrico interligado ao colapso. As longas extensões de linhas de transmissão, expostas a intemperes climáticas, determinam uma probabilidade significativa de incidência direta de descargas atmosféricas nestes equipamentos. Devido ao caráter estratégico das linhas para o fornecimento de energia e a constatação de que descargas atmosféricas estão entre as principais causas de desligamentos, torna-se importante o estudo do comportamento das descargas atmosféricas, antes do instante da ocorrência do desligamento das linhas de transmissão, para compreender os padrões característicos potenciais causadores destes desligamentos. Os estudos encontrados atualmente estão orientados na eficiência das redes de detecção de descargas atmosféricas e na identificação de condições climáticas que indiquem a ocorrência de raios de forma preditiva, sem correlação a ocorrências em linhas de transmissão. Assim, essa dissertação consiste na determinação do risco de desligamentos de linhas de transmissão por descargas atmosféricas, visando fornecer informações antecipadas e possibilitar ações operativas para manter a segurança do sistema elétrico. O modelo desenvolvido nesse estudo, denominado Risco de Desligamentos de Linhas de Transmissão por Raios (RDLR), é composto de dois módulos principais, sendo o primeiro o agrupamento do conjunto amostral de descargas atmosféricas, realizado através de um método baseado em densidade. Nesse módulo, os ruídos são eliminados de forma eficiente e são formados grupos representativos de descargas atmosféricas. O segundo módulo consiste em uma etapa classificatória, baseado em redes neurais artificiais para identificar padrões de grupos de descargas que representem riscos de desligamentos de linhas de transmissão. Visando a otimização do modelo, foi aplicado um método de seleção das variáveis, através de componentes principais, para determinar aquelas que mais contribuem na caracterização desses eventos. O modelo RDLR foi testado com dados reais dos registros de desligamentos de linhas de transmissão, associado a outro banco com dados reais contendo milhões de registros de descargas atmosféricas oriundos das redes de detecção de raios, sendo obtidos excelentes resultados na determinação dos riscos de desligamentos de linhas de transmissão por descargas atmosféricas. / [en] Atmospheric discharges are of great importance to power systems, and are often responsible for outages of transmission lines, which can trigger a sequence of events that leads to a system collapse. The long extensions of transmission lines, exposed to climatic conditions, create significant probability of direct incidence of atmospheric discharges in these equipments. Due to the strategic nature of power supply lines and the fact that atmospheric discharges are among the main causes of outages, it is important to study atmospheric discharges characteristics before failure of transmission lines and understand patterns that are responsible for interruptions. Current studies focus on efficiency of lightning detection networks and on identification of climatic conditions that indicate lightning occurrence in a predictive approach, without any correlation with transmission lines outages. Therefore, this thesis consists on real-time risk determination of transmission lines outage by lightning, providing early information to enabling operational procedures for power system safety. The proposed model, named Transmission Lines Outage Risk by Lightning (TLORL) is composed of two main modules: Atmospheric Discharge Data Clustering and Classification. In the atmospheric discharges data-clustering module, performed by a density-based method, the outages are efficiently eliminated and representative groups of atmospheric discharges are formed. The second module consists of a classification step, based on artificial neural networks, to identify patterns of discharges groups that represent risks to cause transmission lines outages. Aiming at improving the proposed model, principal components analysis (PCA) was applied to determine the input variables that most contribute to the events characterization. The TLORL model was tested with real data transmission line outages, associated to another database with millions lightning records from the detection networks, producing excellent results of transmission lines outages caused by atmospheric discharges.
10

[en] ALUMNI TOOL: INFORMATION RECOVERY OF PERSONAL DATA ON THE WEB IN AUTHENTICATED SOCIAL NETWORKS / [pt] ALUMNI TOOL: RECUPERAÇÃO DE DADOS PESSOAIS NA WEB EM REDES SOCIAIS AUTENTICADAS

LUIS GUSTAVO ALMEIDA 02 August 2018 (has links)
[pt] O uso de robôs de busca para coletar informações para um determinado contexto sempre foi um problema desafiante e tem crescido substancialmente nos últimos anos. Por exemplo, robôs de busca podem ser utilizados para capturar dados de redes sociais profissionais. Em particular, tais redes permitem estudar as trajetórias profissionais dos egressos de uma universidade, e responder diversas perguntas, como por exemplo: Quanto tempo um ex-aluno da PUC-Rio leva para chegar a um cargo de relevância? No entanto, um problema de natureza comum a este cenário é a impossibilidade de coletar informações devido a sistemas de autenticação, impedindo um robô de busca de acessar determinadas páginas e conteúdos. Esta dissertação aborda uma solução para capturar dados, que contorna o problema de autenticação e automatiza o processo de coleta de dados. A solução proposta coleta dados de perfis de usuários de uma rede social profissional para armazenamento em banco de dados e posterior análise. A dissertação contempla ainda a possibilidade de adicionar diversas outras fontes de dados dando ênfase a uma estrutura de armazém de dados. / [en] The use of search bots to collect information for a given context has grown substantially in recent years. For example, search bots may be used to capture data from professional social networks. In particular, such social networks facilitate studying the professional trajectory of the alumni of a given university, and answer several questions such as: How long does a former student of PUC-Rio take to arrive at a management position? However, a common problem in this scenario is the inability to collect information due to authentication systems, preventing a search robot from accessing certain pages and content. This dissertation addresses a solution to capture data, which circumvents the authentication problem and automates the data collection process. The proposed solution collects data from user profiles for later database storage and analysis. The dissertation also contemplates the possibility of adding several other sources of data giving emphasis to a data warehouse structure.

Page generated in 0.433 seconds