1 |
[en] INSTITUTIONAL OWNERSHIP AS A PREDICTOR OF FUTURE SECURITY RETURNS / [pt] USO DE DADOS DAS CARTEIRAS DE INVESTIDORES INSTITUCIONAIS NA PREDIÇÃO DE RETORNOS DE AÇÕESRAPHAEL ALEXANDER ROTTGEN 29 February 2016 (has links)
[pt] Texto Dados sobre as carteiras de investidores institucionais em
ações agora estão disponíveis em vários países e portanto podem ser
usados em modelos para prever os futuros retornos de ações.
Recentemente, vários produtos comerciais de investimento foram
lançados que explicitamente usam tal tipo de dados na construção da
carteira de investimentos. O intuito deste estudo é aplicar algoritmos de
aprendizado de máquina em cima de dados das carteiras de ações de
investidores institucionais nos Estados Unidos, a fim de avaliar se tais
dados podem ser usados para prever futuros retornos de ações. Nosso
trabalho mostra que um modelo usando um support vector machine
conseguiu separar ações em três classes de futuro retorno com acurácia
acima da esperada se um modelo aleatório fosse usado. / [en] Data on institutional ownership of securities is nowadays publicly
available in a number of jurisdictions and can thus be used in models for
the prediction of security returns. A number of recently launched
investment products explicitly use such institutional ownership data in
security selection. The purpose of the current study is to apply statistical
learning algorithms to institutional ownership data from the United States,
in order to evaluate the predictive validity of features based on such
institutional ownership data with regard to future security returns. Our
analysis identified that a support vector machine managed to classify
securities, with regard to their four-quarter forward returns, into three bins
with significantly higher accuracy than pure chance would predict. Even
higher accuracy was achieved when predicting realized, i.e. past, fourquarter
returns.
|
2 |
[pt] RUMO A CIDADES MAIS INTELIGENTES: ESTRATÉGIAS PARA INTEGRAR DADOS QUANTITATIVOS E QUALITATIVOS POR MEIO DE PROCESSOS DE DESIGN PARTICIPATIVO / [en] TOWARDS SMARTER CITIES: STRATEGIES TO INTEGRATE QUANTITATIVE AND QUALITATIVE DATA BY PARTICIPATORY DESIGN PROCESSRAQUEL CORREA CORDEIRO 28 May 2024 (has links)
[pt] O conceito de cidades inteligentes é frequentemente associado a avanços
tecnológicos, porém também abrange aspectos do bem-estar dos cidadãos e a
sustentabilidade. A crescente disponibilidade de dados digitais resulta em um foco
excessivo na tecnologia, negligenciando a participação cidadã e subutilizado
consequentemente o potencial dessas informações. A nossa hipótese é que o design
pode facilitar o acesso a dados urbanos complexos por meio de narrativas baseadas
em dados e de processos participativos com a população. Logo, testamos um processo
de co-design utilizando métodos mistos para analisar o comportamento de
mobilidade. Estruturada em duas fases, a pesquisa inicialmente explorou projetos de
mobilidade, analisando relatórios da iniciativa Civitas e entrevistando profissionais
atuantes na área. Os desafios e soluções identificados foram testados na segunda fase,
usando métodos como coleta de dados abertos municipais, diário de uso e análise de
sentimentos em redes sociais. Por fim, foi realizado um workshop de co-design
usando ferramentas de visualização de dados para co-analisar a relação dos efeitos
meteorológicos na mobilidade urbana. Os resultados destacam o potencial do
designer como mediador, com participantes relatando facilidade para analisar
volumes substanciais de dados e considerando a proposta inovadora e agradável.
Pesquisas futuras poderiam avaliar a compreensão dos dados pelos participantes. A
contribuição desta tese reside em um processo de co-design que pode incluir diversos
atores, como governo, setor privado e cidadãos, utilizando ferramentas de narrativas
baseadas em dados, aplicáveis a quaisquer projetos com vasto volume de informação. / [en] The concept of smart cities is often associated with technological
advancement, but it also encompasses aspects of citizen well-being and
sustainability. The growing availability of digital data results in an excessive focus
on technology, neglecting citizen participation and consequently underutilizing the
potential of this information. Our hypothesis is that design can facilitate access to
complex urban data through data storytelling and participatory processes.
Therefore, we tested a co-design process using mixed methods to analyze mobility
behavior. Structured in two phases, the study initially explored mobility projects by
analyzing reports from the Civitas initiative and interviewing professionals in the
field. The identified challenges and solutions were then tested in the second phase,
employing data collection methods such as city open data analysis, diary studies,
and sentiment analysis on social media. Finally, a co-design workshop was
conducted incorporating data visualization tools to co-analyze the weather effects
on urban mobility. The results highlight the significant potential of the designer as
a facilitator, with participants reporting ease in analyzing substantial data volumes
and considering the proposal innovative and enjoyable. Future research may
evaluate participants understanding of the data. The contribution of this thesis lies
in a co-design process that can involve various stakeholders, including government,
private enterprises, and citizens, using data storytelling tools applicable to any
project dealing with large data volumes.
|
3 |
[pt] A RESPONSABILIDADE CIVIL PELOS DANOS CAUSADOS POR SISTEMAS DOTADOS DE INTELIGÊNCIA ARTIFICIAL / [en] CIVIL LIABILITY FOR DAMAGES CAUSED BY ARTIFICIAL INTELLIGENCE SYSTEMSSTEFANNIE MYRIAM QUELHAS BILLWILLER 10 October 2024 (has links)
[pt] Após a exposição de noções gerais, conceitos e princípios atinentes à
inteligência artificial, bem como a utilização de guias deontológicos utilizados para
nortear esse projeto de pesquisa, apresentar-se-á as problemáticas envolvendo a
utilização dos sistemas inteligentes e os reflexos na vida cotidiana das pessoas. No
cenário atual, o presente estudo visa debater os impactos da IA e prováveis danos
injustos que os sistemas cometem contra determinados grupos de pessoas; os
chamados danos algorítmicos. Dessa forma, quando e a quem recorrer quando tais
danos são cometidos? Quem é civilmente responsável por arcar com eventuais
prejuízos que as vítimas venham a sofrer? Ressalte-se que ainda não há legislação
específica sobre o assunto em vigor, e tal tema será também analisado no âmbito
desta pesquisa: será que o ordenamento jurídico brasileiro já possui ferramentas
para dirimir as questões que hoje a IA apresenta no âmbito da responsabilidade
civil? / [en] After the presentation of general notions, concepts and principles relating to artificial intelligence, as well as the use of ethical guides used to guide this research project, the problems involving the use of intelligent systems and the consequences in the daily lives of people. In the current scenario, this study aims to debate the impacts of AI and probable unfair harm that systems commit against certain groups of people; so-called algorithmic damages. Therefore, when and to whom can we turn when such damages are committed? Who is civilly responsible for bearing any losses that victims may suffer? It should be noted that to date there is no specific legislation on the subject in force, and this topic will also be analyzed within the scope of this research: does the Brazilian legal system already have tools to resolve the issues that AI presents today in the context of civil liability?
|
4 |
[en] RECOMMENDATION SYSTEMS: AN USER EXPERIENCE ANALYSIS IN DIGITAL PRODUCTS / [pt] SISTEMAS DE RECOMENDAÇÃO DE CONTEÚDO: UMA ANÁLISE SOBRE A EXPERIÊNCIA DO USUÁRIO EM PRODUTOS DIGITAISCAROLINA LIMEIRA ALVES 15 December 2015 (has links)
[pt] Big Data é o termo utilizado para caracterizar o conjunto de soluções
tecnológicas que permitem o rápido processamento de um grande volume de
dados variados. Estas soluções só se tornaram possíveis com os avanços
tecnológicos ocorridos nas últimas décadas. Uma das funcionalidades que
ganharam força e melhorias através desses tipos de tecnologias são os sistemas
de recomendação. Tais sistemas têm como objetivo principal oferecer ao usuário
sugestões de conteúdo que possam interessá-lo. Este conteúdo pode ser uma
notícia, um produto, um contato, um filme, uma música ou qualquer outro tipo de
informação. Esta dissertação estuda a percepção dos usuários em relação aos
sistemas de recomendação, especialmente para o conteúdo televisivo (programas,
séries e filmes). Para tal, fez-se uso de questionários, grupos de foco, análise do
cenário atual e estudo de caso. Através destes métodos e técnicas foi possível
identificar os diferentes fatores que influenciam a maneira como a funcionalidade
é percebida e a forma como os serviços são utilizados. Além disso, se discute as
consequências do uso excessivo da personalização de conteúdo, bem como
questões éticas, privacidade, impactos sociais e psicológicos e a responsabilidade
do designer de produtos digitais. Em conclusão, são feitas recomendações para o
desenvolvimento deste tipo de sistema de forma que atenda aos seus objetivos e
proporcione uma experiência mais satisfatória ao usuário. / [en] Big Data is the term used to identify the set of technological solutions that
allows the fast processing of a big amount of diverse data that only became
possible with the technological advances that have occurred in recent decades.
One of the features that gained strength and improvements through these types of
technologies are the recommendation systems. The objective of these kind of
systems is to offer suggestions of content that might interest the users. This
content can be some news, a product, a personal contact, a movie, a song or any
other kind of information. This dissertation addresses the study of the perception
of the users relative to recommendation systems, especially for television content
(programs, series and movies). For this purpose, questionnaires, focus groups,
context analysis and case studies were used. Through these methods and
techniques it was possible to identify the different factors that influences how the
functionality is perceived and how the services are used. Further, it discusses the
consequences of the excessive use of personalized content, privacy, ethical and
social issues, psychological impacts and the responsibility of the digital products
designer. In conclusion, some recommendations are made regarding the
development of this type of system so that it achieves its purposes and provides a
more satisfying user experience.
|
5 |
[en] FORECASTING LARGE REALIZED COVARIANCE MATRICES: THE BENEFITS OF FACTOR MODELS AND SHRINKAGE / [pt] PREVISÃO DE MATRIZES DE COVARIÂNCIA REALIZADA DE ALTA DIMENSÃO: OS BENEFÍCIOS DE MODELOS DE FATORES E SHRINKAGEDIEGO SIEBRA DE BRITO 19 September 2018 (has links)
[pt] Este trabalho propõe um modelo de previsão de matrizes de covariância realizada de altíssima dimensão, com aplicação para os componentes do índice S e P 500. Para lidar com o altíssimo número de parâmetros (maldição da dimensionalidade), propõe-se a decomposição da matriz de covariância de retornos por meio do uso de um modelo de fatores padrão (e.g. tamanho, valor, investimento) e uso de restrições setoriais na matriz de covariância residual. O modelo restrito é estimado usando uma especificação de vetores auto regressivos heterogêneos (VHAR) estimados com LASSO (Least Absolute Shrinkage and Selection Operator). O uso da metodologia proposta melhora a precisão de previsão em relação a benchmarks padrões e leva a melhores estimativas de portfólios de menor variância. / [en] We propose a model to forecast very large realized covariance matrices of returns, applying it to the constituents of the S and P 500 on a daily basis. To deal with the curse of dimensionality, we decompose the return covariance matrix using standard firm-level factors (e.g. size, value, profitability) and use sectoral restrictions in the residual covariance matrix. This restricted model is then estimated using Vector Heterogeneous Autoregressive (VHAR) models estimated with the Least Absolute Shrinkage and Selection
Operator (LASSO). Our methodology improves forecasting precision relative to standard benchmarks and leads to better estimates of the minimum variance portfolios.
|
6 |
[en] A VISUAL ANALYSIS OF BUS GPS DATA IN RIO / [pt] UMA ANÁLISE VISUAL DOS DADOS DE GPS DOS ÔNIBUS NO RIOBRUNO GUBERFAIN DO AMARAL 19 July 2016 (has links)
[pt] O tema Cidades Inteligentes é um assunto de interesse para gestores
públicos e pesquisadores. Desenvolver cidades mais inteligentes é um dos
desafios para o futuro próximo devido à crescente demanda por serviços
públicos. Em particular, o transporte público é um dos aspectos mais
visíveis de uma cidade viva e, portanto, a sua implementação deve ser muito
eficiente. O sistema de transporte público da cidade do Rio de Janeiro é
historicamente deficiente, principalmente porque ele é baseado em um antigo
sistema de ônibus. Para melhorá-lo, a Prefeitura tomou algumas ações, como
o desenvolvimento de um projeto de dados aberto que mostra, a quase a cada
minuto, a posição instantânea de todos os ônibus na cidade. Embora não
seja uma nova tecnologia, esta é a primeira iniciativa a ser desenvolvida no
Rio. Neste trabalho, são aprsentadas ferramentas simples para a exploração
visual deste grande conjunto de dados com base em informações históricas,
que chega a um total de mais de um bilhão de amostras. Com essas
ferramentas, um usuário será capaz de verificar as tendências, identificar
padrões e localizar anomalias nesta grande quantidade de dados de GPS
dos ônibus. / [en] Smart cities is a current subject of interest for public administrators
and researchers. Getting the cities smarter is one of the challenges for
the near future, due to the growing demand for public services. In
particular, public transportation is one of most visible aspects of a living
city and, therefore, its implementation must be very efficient. The public
transportation system of the City of Rio de Janeiro is historically deficient,
mostly because it is based on an old bus system. To change it, the City
Hall took some actions, such as the development of an open data project
that shows, at about every minute, the GPS instant position of all buses in
the city. Although it is not a new technology, it is the first initiative to be
developed in Rio. This work presents simple tools for the visual exploration
of this big dataset based on the historical information from this service,
which reaches a total of more than one billion samples. With these tools
one is able to discover trends, identify patterns, and locate abnormalities
within the massive collection of the buses GPS data.
|
7 |
[en] FORECASTING IN HIGH-DIMENSION: INFLATION AND OTHER ECONOMIC VARIABLES / [pt] PREVISÃO EM ALTA DIMENSÃO: INFLAÇÃO E OUTRAS VARIÁVEIS ECONÔMICASGABRIEL FILIPE RODRIGUES VASCONCELOS 26 September 2018 (has links)
[pt] Esta tese é composta de quatro artigos e um pacote de R. Todos os artigos têm como foco previsão de variáveis econômicas em alta dimensão. O primeiro artigo mostra que modelos LASSO são muito precisos para prever a inflação brasileira em horizontes curtos de previsão. O segundo artigo utiliza vários métodos de Machine Learning para prever um grupo de variáveis macroeconomicas americanas. Os resultados mostram que uma adaptação no LASSO melhora as previsões com um alto custo computacional. O terceiro artigo também trata da previsão da inflação brasileira, mas em tempo real. Os principais resultados mostram que uma combinação de modelos de Machine Learning é mais precisa do que a previsão do especialista (FOCUS). Finalmente, o último artigo trata da previsão da inflação americana utilizando um grande conjunto de modelos. O modelo vencedor é o Random Forest, que levanta a questão da não-linearidade na inflação americana. Os resultados mostram que tanto a não-linearidade quanto a seleção de variáveis são importantes para os bons resultados do Random Forest. / [en] This thesis is made of four articles and an R package. The articles are all focused on forecasting economic variables on high-dimension. The first article shows that LASSO models are very accurate to forecast the Brazilian inflation in small horizons. The second article uses several Machine Learning models to forecast a set o US macroeconomic variables. The results show that a small adaptation in the LASSO improves the forecasts but with high computational costs. The third article is also on forecasting the Brazilian inflation, but in real-time. The main results show that a combination of Machine Learning models is more accurate than the FOCUS specialist forecasts. Finally, the last article is about forecasting the US inflation using a very large set of models. The winning model is the Random Forest, which opens the discussion of nonlinearity in the US inflation. The results show that both nonlinearity and variable selection are important features for the
Random Forest performance.
|
8 |
[pt] ANÁLISE ESTOCÁSTICA DA PROPAGAÇÃO DE UMA DOENÇA DE CARÁTER EPIDEMIOLÓGICO / [en] STOCHASTIC ANALYSES OF THE SPREAD OF AN EPIDEMIOLOGICAL DISEASEBEATRIZ DE REZENDE BARCELLOS BORGES 29 November 2021 (has links)
[pt] Este trabalho analisa a propagação de uma doença epidemiológica com
uma abordagem estocástica. Na análise, o número de indivíduos que cada
membro infectado da população pode infectar é modelado como uma variável
aleatória e o número de indivíduos infectados ao longo do tempo é modelado
como um processo estocástico de ramificação. O foco do trabalho é caracterizar a influência do modelo probabilístico da variável aleatória que modela o contágio entre indivíduos na disseminação da doença e na probabilidade de extinção, e analisar a influência de uma vacinação em massa no controle da
propagação da doença. A comparação é feita com base em histogramas e
estatísticas amostrais do número de indivíduos infectados ao longo do tempo,
como média e variância. Os modelos estatísticos referentes à parte que trata
de uma população não vacinada são calculados usando simulações de Monte
Carlo para 3 diferentes famílias de variáveis aleatórias: binomial, geométrica-1 e geométrica-0. Para cada família, 21 distribuições diferentes foram selecionadas e, para cada distribuição, 4000 simulações do processo de ramificação foram computadas. Os modelos estatísticos referentes a uma população parcialmente vacinada foram calculados usando simulações de Monte Carlo para a família de variável aleatória binomial. Para essa família, 21 distribuições diferentes foram
selecionadas e, para cada uma delas foram escolhidas 6 diferentes percentagens
de população vacinada. Para cada percentagem, foram analisadas vacinas com
4 diferentes eficácias. No total, foram realizadas 2.2 milhões de simulações,
caracterizando o problema como big data. / [en] This work analyzes the spread of an epidemiological disease with a
stochastic approach. In the analysis, the number of individuals that each
infected member of the population can infect is modeled as a random variable
and the number of infected individuals over time is modeled as a stochastic
branching process. The focus of the work is to characterize the influence of
the probabilistic model of the random variable that models contagion between
individuals on the spread of the disease and the probability of extinction, and
to analyze the influence of mass vaccination in controlling the spread of a
disease. The comparison is based on histograms and sample statistics of the
number of infected individuals over time, such as mean and variance. Statistical
models for the chapter dealing with a vaccine free population are calculated
using Monte Carlo simulations for 3 different families of random variables:
binomial, geometric-1 and geometric-0. For each of the 3 families, 21 different
distributions were selected and, for each distribution, 4000 simulations of the
branching process were computed. Statistical models for a partially vaccinated
population were calculated using Monte Carlo simulations for one family of
random variable: the binomial. For it, 21 different distributions were selected
and, for each of them, 6 different percentages of the vaccinated population
were chosen. For each of them, 4 different vaccine efficacy were stipulated. In
total, 2.2 million simulations were performed, featuring a big data problem.
|
9 |
[pt] ATIVISMO TRANSNACIONAL NAS MÍDIAS SOCIAIS: UMA REVISÃO DA LITERATURA DO ATIVISMO DE MUDANÇAS CLIMÁTICAS / [en] TRANSNACTIONAL ACTIVISM IN SOCIAL MEDIA: A LITERATURE REVIEW OF CLIMATE CHANGE ACTIVISMROBERTA NADALUTTI LA ROVERE 27 May 2019 (has links)
[pt] Em sua expressão contemporânea, os processos de ativismo tornaram-se transnacionais, com suas causas, ações e organização realizados além dos limites das fronteiras nacionais, estabelecendo uma dinâmica com a lógica de horizontalidade da comunicação digital. Através da internet, os ativistas teriam mais possibilidades de estabelecer redes entre si, divulgar suas causas e ações, promover seu ponto de vista sobre os acontecimentos e gerar mais engajamento no debate público e na participação dos processos pelos cidadãos globais. Por isso, o objetivo deste trabalho é promover uma reflexão de como os artigos acadêmicos analisam casos específicos de ativismo transnacional e seus contextos sociopolíticos para que seja produzido um entendimento da forma e extensão dos potenciais de horizontalidade da internet que estão sendo concretizados. Essa reflexão foi baseada em duas perguntas de pesquisa: quem são os ativistas envolvidos no debate público de mudanças climáticas nas mídias sociais; e como a formação de redes de relacionamento entre ativistas no debate público promovido pelas mídias sociais é analisada pelos acadêmicos. Como conclusão, é possível encontrar indícios de quebra de agenda-setting, divulgação de novos enquadramentos de discurso, estabelecimento de redes epistêmicas complementares e organização transnacional e colaborativa de causas e ações de ativismo pela internet, apesar da análise de big data das mídias sociais ainda estar pouco aprofundada nesta área. / [en] In its contemporary form, the processes of activism became transnational, since its actions, causes and organization is done beyond the limit of national borders, establishing a dynamical relationship with the logics of digital communications. Using the internet, activists would have more possibilities of establishing networks of collaboration, publicize its causes and actions, promote specific points of view and generate more engagement in the public debate and more people to participate in activism. Therefore, the purpose of this work is to promote a brief review of how the academic literature is analyzing specific cases of transnational activism and its sociopolitical context to generate a better understanding of which and how the potentials of horizontalization from the internet are manifested. Two research questions are addressed: how are the actors of climate change activism analyzed in the social media data analysis of the literature, and how are the social networks of activists being explored. The conclusion is that it is possible to find evidences of activists breaking the agendasetting of traditional media, as well as promoting new framing of the discourse surrounding its actions and causes, new networks of collaboration and transnational and collaborative forms of organizing and creating actions through social media. However, big data analysis of activism processes in social media is still beginning and new research with more depth in the information analysis would benefit immensely in the comprehension of its dynamics
|
10 |
[pt] ENSAIOS SOBRE NOWCASTING COM DADOS EM ALTA DIMENSÃO / [en] ESSAYS ON NOWCASTING WITH HIGH DIMENSIONAL DATAHENRIQUE FERNANDES PIRES 02 June 2022 (has links)
[pt] Em economia, Nowcasting é a previsão do presente, do passado recente ou
mesmo a previsão do futuro muito próximo de um determinado indicador.
Geralmente, um modelo nowcast é útil quando o valor de uma variável de
interesse é disponibilizado com um atraso significativo em relação ao seu
período de referência e/ou sua realização inicial é notavelmente revisada
ao longo do tempo, se estabilizando somente após um tempo. Nesta tese,
desenvolvemos e analisamos vários métodos de Nowcasting usando dados
de alta dimensão (big data) em diferentes contextos: desde a previsão
de séries econômicas até o nowcast de óbitos pela COVID-19. Em um
de nossos estudos, comparamos o desempenho de diferentes algoritmos de
Machine Learning com modelos mais naive na previsão de muitas variáveis
econômicas em tempo real e mostramos que, na maioria das vezes, o
Machine Learning supera os modelos de benchmark. Já no restante dos
nossos exercícios, combinamos várias técnicas de nowcasting com um grande
conjunto de dados (incluindo variáveis de alta frequência, como o Google
Trends) para rastrear a pandemia no Brasil, mostrando que fomos capazes
de antecipar os números reais de mortes e casos muito antes de estarem
disponíveis oficialmente para todos. / [en] Nowcasting in economics is the prediction of the present, the recent past or
even the prediction of the very near future of a certain indicator. Generally,
a nowcast model is useful when the value of a target variable is released
with a significant delay with respect to its reference period and/or when
its value gets notably revised over time and stabilizes only after a while.
In this thesis, we develop and analyze several Nowcasting methods using
high-dimensional (big) data in different contexts: from the forecasting of
economic series to the nowcast of COVID-19. In one of our studies, we
compare the performance of different Machine Learning algorithms with
more naive models in predicting many economic variables in real-time and
we show that, most of the time, Machine Learning beats benchmark models.
Then, in the rest of our exercises, we combine several nowcasting techniques
with a big dataset (including high-frequency variables, such as Google
Trends) in order to track the pandemic in Brazil, showing that we were
able to nowcast the true numbers of deaths and cases way before they got
available to everyone.
|
Page generated in 0.0319 seconds