Global ETD Search

1	[en] INSTITUTIONAL OWNERSHIP AS A PREDICTOR OF FUTURE SECURITY RETURNS / [pt] USO DE DADOS DAS CARTEIRAS DE INVESTIDORES INSTITUCIONAIS NA PREDIÇÃO DE RETORNOS DE AÇÕES RAPHAEL ALEXANDER ROTTGEN 29 February 2016 (has links) [pt] Texto Dados sobre as carteiras de investidores institucionais em ações agora estão disponíveis em vários países e portanto podem ser usados em modelos para prever os futuros retornos de ações. Recentemente, vários produtos comerciais de investimento foram lançados que explicitamente usam tal tipo de dados na construção da carteira de investimentos. O intuito deste estudo é aplicar algoritmos de aprendizado de máquina em cima de dados das carteiras de ações de investidores institucionais nos Estados Unidos, a fim de avaliar se tais dados podem ser usados para prever futuros retornos de ações. Nosso trabalho mostra que um modelo usando um support vector machine conseguiu separar ações em três classes de futuro retorno com acurácia acima da esperada se um modelo aleatório fosse usado. / [en] Data on institutional ownership of securities is nowadays publicly available in a number of jurisdictions and can thus be used in models for the prediction of security returns. A number of recently launched investment products explicitly use such institutional ownership data in security selection. The purpose of the current study is to apply statistical learning algorithms to institutional ownership data from the United States, in order to evaluate the predictive validity of features based on such institutional ownership data with regard to future security returns. Our analysis identified that a support vector machine managed to classify securities, with regard to their four-quarter forward returns, into three bins with significantly higher accuracy than pure chance would predict. Even higher accuracy was achieved when predicting realized, i.e. past, fourquarter returns. [pt] APRENDIZADO DE MAQUINA [en] MACHINE LEARNING [pt] INVESTIDORES INSTITUCIONAIS [en] INSTITUCIONAL INVESTORS [pt] BIG DATA [en] BIG DATA [pt] MODELOS DE FATORES PARA ACOES
2	[pt] RUMO A CIDADES MAIS INTELIGENTES: ESTRATÉGIAS PARA INTEGRAR DADOS QUANTITATIVOS E QUALITATIVOS POR MEIO DE PROCESSOS DE DESIGN PARTICIPATIVO / [en] TOWARDS SMARTER CITIES: STRATEGIES TO INTEGRATE QUANTITATIVE AND QUALITATIVE DATA BY PARTICIPATORY DESIGN PROCESS RAQUEL CORREA CORDEIRO 28 May 2024 (has links) [pt] O conceito de cidades inteligentes é frequentemente associado a avanços tecnológicos, porém também abrange aspectos do bem-estar dos cidadãos e a sustentabilidade. A crescente disponibilidade de dados digitais resulta em um foco excessivo na tecnologia, negligenciando a participação cidadã e subutilizado consequentemente o potencial dessas informações. A nossa hipótese é que o design pode facilitar o acesso a dados urbanos complexos por meio de narrativas baseadas em dados e de processos participativos com a população. Logo, testamos um processo de co-design utilizando métodos mistos para analisar o comportamento de mobilidade. Estruturada em duas fases, a pesquisa inicialmente explorou projetos de mobilidade, analisando relatórios da iniciativa Civitas e entrevistando profissionais atuantes na área. Os desafios e soluções identificados foram testados na segunda fase, usando métodos como coleta de dados abertos municipais, diário de uso e análise de sentimentos em redes sociais. Por fim, foi realizado um workshop de co-design usando ferramentas de visualização de dados para co-analisar a relação dos efeitos meteorológicos na mobilidade urbana. Os resultados destacam o potencial do designer como mediador, com participantes relatando facilidade para analisar volumes substanciais de dados e considerando a proposta inovadora e agradável. Pesquisas futuras poderiam avaliar a compreensão dos dados pelos participantes. A contribuição desta tese reside em um processo de co-design que pode incluir diversos atores, como governo, setor privado e cidadãos, utilizando ferramentas de narrativas baseadas em dados, aplicáveis a quaisquer projetos com vasto volume de informação. / [en] The concept of smart cities is often associated with technological advancement, but it also encompasses aspects of citizen well-being and sustainability. The growing availability of digital data results in an excessive focus on technology, neglecting citizen participation and consequently underutilizing the potential of this information. Our hypothesis is that design can facilitate access to complex urban data through data storytelling and participatory processes. Therefore, we tested a co-design process using mixed methods to analyze mobility behavior. Structured in two phases, the study initially explored mobility projects by analyzing reports from the Civitas initiative and interviewing professionals in the field. The identified challenges and solutions were then tested in the second phase, employing data collection methods such as city open data analysis, diary studies, and sentiment analysis on social media. Finally, a co-design workshop was conducted incorporating data visualization tools to co-analyze the weather effects on urban mobility. The results highlight the significant potential of the designer as a facilitator, with participants reporting ease in analyzing substantial data volumes and considering the proposal innovative and enjoyable. Future research may evaluate participants understanding of the data. The contribution of this thesis lies in a co-design process that can involve various stakeholders, including government, private enterprises, and citizens, using data storytelling tools applicable to any project dealing with large data volumes. [pt] BIG DATA [pt] PARTICIPACAO CIDADA [pt] CIDADE INTELIGENTE [pt] MOBILIDADE URBANA [en] BIG DATA [en] CITIZEN PARTICIPATION [en] SMART CITY [en] URBAN MOBILITY
3	[pt] A RESPONSABILIDADE CIVIL PELOS DANOS CAUSADOS POR SISTEMAS DOTADOS DE INTELIGÊNCIA ARTIFICIAL / [en] CIVIL LIABILITY FOR DAMAGES CAUSED BY ARTIFICIAL INTELLIGENCE SYSTEMS STEFANNIE MYRIAM QUELHAS BILLWILLER 10 October 2024 (has links) [pt] Após a exposição de noções gerais, conceitos e princípios atinentes à inteligência artificial, bem como a utilização de guias deontológicos utilizados para nortear esse projeto de pesquisa, apresentar-se-á as problemáticas envolvendo a utilização dos sistemas inteligentes e os reflexos na vida cotidiana das pessoas. No cenário atual, o presente estudo visa debater os impactos da IA e prováveis danos injustos que os sistemas cometem contra determinados grupos de pessoas; os chamados danos algorítmicos. Dessa forma, quando e a quem recorrer quando tais danos são cometidos? Quem é civilmente responsável por arcar com eventuais prejuízos que as vítimas venham a sofrer? Ressalte-se que ainda não há legislação específica sobre o assunto em vigor, e tal tema será também analisado no âmbito desta pesquisa: será que o ordenamento jurídico brasileiro já possui ferramentas para dirimir as questões que hoje a IA apresenta no âmbito da responsabilidade civil? / [en] After the presentation of general notions, concepts and principles relating to artificial intelligence, as well as the use of ethical guides used to guide this research project, the problems involving the use of intelligent systems and the consequences in the daily lives of people. In the current scenario, this study aims to debate the impacts of AI and probable unfair harm that systems commit against certain groups of people; so-called algorithmic damages. Therefore, when and to whom can we turn when such damages are committed? Who is civilly responsible for bearing any losses that victims may suffer? It should be noted that to date there is no specific legislation on the subject in force, and this topic will also be analyzed within the scope of this research: does the Brazilian legal system already have tools to resolve the issues that AI presents today in the context of civil liability? [pt] INTELIGENCIA ARTIFICIAL [pt] ALGORITMICO [pt] BIG DATA [pt] RESPONSABILIDADE CIVIL [en] ARTIFICIAL INTELLIGENCE [en] ALGORITHMIC [en] BIG DATA [en] CIVIL LIABILITY
4	[en] RECOMMENDATION SYSTEMS: AN USER EXPERIENCE ANALYSIS IN DIGITAL PRODUCTS / [pt] SISTEMAS DE RECOMENDAÇÃO DE CONTEÚDO: UMA ANÁLISE SOBRE A EXPERIÊNCIA DO USUÁRIO EM PRODUTOS DIGITAIS CAROLINA LIMEIRA ALVES 15 December 2015 (has links) [pt] Big Data é o termo utilizado para caracterizar o conjunto de soluções tecnológicas que permitem o rápido processamento de um grande volume de dados variados. Estas soluções só se tornaram possíveis com os avanços tecnológicos ocorridos nas últimas décadas. Uma das funcionalidades que ganharam força e melhorias através desses tipos de tecnologias são os sistemas de recomendação. Tais sistemas têm como objetivo principal oferecer ao usuário sugestões de conteúdo que possam interessá-lo. Este conteúdo pode ser uma notícia, um produto, um contato, um filme, uma música ou qualquer outro tipo de informação. Esta dissertação estuda a percepção dos usuários em relação aos sistemas de recomendação, especialmente para o conteúdo televisivo (programas, séries e filmes). Para tal, fez-se uso de questionários, grupos de foco, análise do cenário atual e estudo de caso. Através destes métodos e técnicas foi possível identificar os diferentes fatores que influenciam a maneira como a funcionalidade é percebida e a forma como os serviços são utilizados. Além disso, se discute as consequências do uso excessivo da personalização de conteúdo, bem como questões éticas, privacidade, impactos sociais e psicológicos e a responsabilidade do designer de produtos digitais. Em conclusão, são feitas recomendações para o desenvolvimento deste tipo de sistema de forma que atenda aos seus objetivos e proporcione uma experiência mais satisfatória ao usuário. / [en] Big Data is the term used to identify the set of technological solutions that allows the fast processing of a big amount of diverse data that only became possible with the technological advances that have occurred in recent decades. One of the features that gained strength and improvements through these types of technologies are the recommendation systems. The objective of these kind of systems is to offer suggestions of content that might interest the users. This content can be some news, a product, a personal contact, a movie, a song or any other kind of information. This dissertation addresses the study of the perception of the users relative to recommendation systems, especially for television content (programs, series and movies). For this purpose, questionnaires, focus groups, context analysis and case studies were used. Through these methods and techniques it was possible to identify the different factors that influences how the functionality is perceived and how the services are used. Further, it discusses the consequences of the excessive use of personalized content, privacy, ethical and social issues, psychological impacts and the responsibility of the digital products designer. In conclusion, some recommendations are made regarding the development of this type of system so that it achieves its purposes and provides a more satisfying user experience. [pt] INTERNET [en] INTERNET [pt] PERSONALIZACAO [en] PERSONALIZATION [pt] SISTEMAS DE RECOMENDACAO [en] RECOMMENDER SYSTEMS [pt] EXPERIENCIA DO USUARIO [en] USER EXPERIENCE [pt] USUARIO [pt] BIG DATA [en] BIG DATA
5	[en] FORECASTING LARGE REALIZED COVARIANCE MATRICES: THE BENEFITS OF FACTOR MODELS AND SHRINKAGE / [pt] PREVISÃO DE MATRIZES DE COVARIÂNCIA REALIZADA DE ALTA DIMENSÃO: OS BENEFÍCIOS DE MODELOS DE FATORES E SHRINKAGE DIEGO SIEBRA DE BRITO 19 September 2018 (has links) [pt] Este trabalho propõe um modelo de previsão de matrizes de covariância realizada de altíssima dimensão, com aplicação para os componentes do índice S e P 500. Para lidar com o altíssimo número de parâmetros (maldição da dimensionalidade), propõe-se a decomposição da matriz de covariância de retornos por meio do uso de um modelo de fatores padrão (e.g. tamanho, valor, investimento) e uso de restrições setoriais na matriz de covariância residual. O modelo restrito é estimado usando uma especificação de vetores auto regressivos heterogêneos (VHAR) estimados com LASSO (Least Absolute Shrinkage and Selection Operator). O uso da metodologia proposta melhora a precisão de previsão em relação a benchmarks padrões e leva a melhores estimativas de portfólios de menor variância. / [en] We propose a model to forecast very large realized covariance matrices of returns, applying it to the constituents of the S and P 500 on a daily basis. To deal with the curse of dimensionality, we decompose the return covariance matrix using standard firm-level factors (e.g. size, value, profitability) and use sectoral restrictions in the residual covariance matrix. This restricted model is then estimated using Vector Heterogeneous Autoregressive (VHAR) models estimated with the Least Absolute Shrinkage and Selection Operator (LASSO). Our methodology improves forecasting precision relative to standard benchmarks and leads to better estimates of the minimum variance portfolios. [pt] PREVISAO [en] FORECASTING [pt] MODELO DE FATORES [en] FACTOR MODELS [pt] BIG DATA [en] BIG DATA [pt] LASSO [en] LASSO [pt] COVARIANCIA REALIZADA [en] REALIZED COVARIANCE [pt] ALOCACAO DE PORTFOLIO [en] PORTFOLIO ALLOCATION
6	[en] A VISUAL ANALYSIS OF BUS GPS DATA IN RIO / [pt] UMA ANÁLISE VISUAL DOS DADOS DE GPS DOS ÔNIBUS NO RIO BRUNO GUBERFAIN DO AMARAL 19 July 2016 (has links) [pt] O tema Cidades Inteligentes é um assunto de interesse para gestores públicos e pesquisadores. Desenvolver cidades mais inteligentes é um dos desafios para o futuro próximo devido à crescente demanda por serviços públicos. Em particular, o transporte público é um dos aspectos mais visíveis de uma cidade viva e, portanto, a sua implementação deve ser muito eficiente. O sistema de transporte público da cidade do Rio de Janeiro é historicamente deficiente, principalmente porque ele é baseado em um antigo sistema de ônibus. Para melhorá-lo, a Prefeitura tomou algumas ações, como o desenvolvimento de um projeto de dados aberto que mostra, a quase a cada minuto, a posição instantânea de todos os ônibus na cidade. Embora não seja uma nova tecnologia, esta é a primeira iniciativa a ser desenvolvida no Rio. Neste trabalho, são aprsentadas ferramentas simples para a exploração visual deste grande conjunto de dados com base em informações históricas, que chega a um total de mais de um bilhão de amostras. Com essas ferramentas, um usuário será capaz de verificar as tendências, identificar padrões e localizar anomalias nesta grande quantidade de dados de GPS dos ônibus. / [en] Smart cities is a current subject of interest for public administrators and researchers. Getting the cities smarter is one of the challenges for the near future, due to the growing demand for public services. In particular, public transportation is one of most visible aspects of a living city and, therefore, its implementation must be very efficient. The public transportation system of the City of Rio de Janeiro is historically deficient, mostly because it is based on an old bus system. To change it, the City Hall took some actions, such as the development of an open data project that shows, at about every minute, the GPS instant position of all buses in the city. Although it is not a new technology, it is the first initiative to be developed in Rio. This work presents simple tools for the visual exploration of this big dataset based on the historical information from this service, which reaches a total of more than one billion samples. With these tools one is able to discover trends, identify patterns, and locate abnormalities within the massive collection of the buses GPS data. [pt] RIO DE JANEIRO [en] RIO DE JANEIRO [pt] GPS [en] GPS [pt] VISUALIZACAO [en] VISUALIZATION [pt] ONIBUS [en] BUSES [pt] BIG DATA [en] BIG DATA [pt] CIENCIA DE DADOS [pt] CIDADES INTELIGENTES [en] SMART CITIES
7	[en] FORECASTING IN HIGH-DIMENSION: INFLATION AND OTHER ECONOMIC VARIABLES / [pt] PREVISÃO EM ALTA DIMENSÃO: INFLAÇÃO E OUTRAS VARIÁVEIS ECONÔMICAS GABRIEL FILIPE RODRIGUES VASCONCELOS 26 September 2018 (has links) [pt] Esta tese é composta de quatro artigos e um pacote de R. Todos os artigos têm como foco previsão de variáveis econômicas em alta dimensão. O primeiro artigo mostra que modelos LASSO são muito precisos para prever a inflação brasileira em horizontes curtos de previsão. O segundo artigo utiliza vários métodos de Machine Learning para prever um grupo de variáveis macroeconomicas americanas. Os resultados mostram que uma adaptação no LASSO melhora as previsões com um alto custo computacional. O terceiro artigo também trata da previsão da inflação brasileira, mas em tempo real. Os principais resultados mostram que uma combinação de modelos de Machine Learning é mais precisa do que a previsão do especialista (FOCUS). Finalmente, o último artigo trata da previsão da inflação americana utilizando um grande conjunto de modelos. O modelo vencedor é o Random Forest, que levanta a questão da não-linearidade na inflação americana. Os resultados mostram que tanto a não-linearidade quanto a seleção de variáveis são importantes para os bons resultados do Random Forest. / [en] This thesis is made of four articles and an R package. The articles are all focused on forecasting economic variables on high-dimension. The first article shows that LASSO models are very accurate to forecast the Brazilian inflation in small horizons. The second article uses several Machine Learning models to forecast a set o US macroeconomic variables. The results show that a small adaptation in the LASSO improves the forecasts but with high computational costs. The third article is also on forecasting the Brazilian inflation, but in real-time. The main results show that a combination of Machine Learning models is more accurate than the FOCUS specialist forecasts. Finally, the last article is about forecasting the US inflation using a very large set of models. The winning model is the Random Forest, which opens the discussion of nonlinearity in the US inflation. The results show that both nonlinearity and variable selection are important features for the Random Forest performance. [pt] PREVISAO [en] FORECASTING [pt] MODELO DE FATORES [en] FACTOR MODELS [pt] BIG DATA [en] BIG DATA [pt] LASSO [en] LASSO [pt] ECONOMETRIA EM ALTA DIMENSAO [en] HIGH-DIMENSION ECONOMETRICS
8	[pt] ANÁLISE ESTOCÁSTICA DA PROPAGAÇÃO DE UMA DOENÇA DE CARÁTER EPIDEMIOLÓGICO / [en] STOCHASTIC ANALYSES OF THE SPREAD OF AN EPIDEMIOLOGICAL DISEASE BEATRIZ DE REZENDE BARCELLOS BORGES 29 November 2021 (has links) [pt] Este trabalho analisa a propagação de uma doença epidemiológica com uma abordagem estocástica. Na análise, o número de indivíduos que cada membro infectado da população pode infectar é modelado como uma variável aleatória e o número de indivíduos infectados ao longo do tempo é modelado como um processo estocástico de ramificação. O foco do trabalho é caracterizar a influência do modelo probabilístico da variável aleatória que modela o contágio entre indivíduos na disseminação da doença e na probabilidade de extinção, e analisar a influência de uma vacinação em massa no controle da propagação da doença. A comparação é feita com base em histogramas e estatísticas amostrais do número de indivíduos infectados ao longo do tempo, como média e variância. Os modelos estatísticos referentes à parte que trata de uma população não vacinada são calculados usando simulações de Monte Carlo para 3 diferentes famílias de variáveis aleatórias: binomial, geométrica-1 e geométrica-0. Para cada família, 21 distribuições diferentes foram selecionadas e, para cada distribuição, 4000 simulações do processo de ramificação foram computadas. Os modelos estatísticos referentes a uma população parcialmente vacinada foram calculados usando simulações de Monte Carlo para a família de variável aleatória binomial. Para essa família, 21 distribuições diferentes foram selecionadas e, para cada uma delas foram escolhidas 6 diferentes percentagens de população vacinada. Para cada percentagem, foram analisadas vacinas com 4 diferentes eficácias. No total, foram realizadas 2.2 milhões de simulações, caracterizando o problema como big data. / [en] This work analyzes the spread of an epidemiological disease with a stochastic approach. In the analysis, the number of individuals that each infected member of the population can infect is modeled as a random variable and the number of infected individuals over time is modeled as a stochastic branching process. The focus of the work is to characterize the influence of the probabilistic model of the random variable that models contagion between individuals on the spread of the disease and the probability of extinction, and to analyze the influence of mass vaccination in controlling the spread of a disease. The comparison is based on histograms and sample statistics of the number of infected individuals over time, such as mean and variance. Statistical models for the chapter dealing with a vaccine free population are calculated using Monte Carlo simulations for 3 different families of random variables: binomial, geometric-1 and geometric-0. For each of the 3 families, 21 different distributions were selected and, for each distribution, 4000 simulations of the branching process were computed. Statistical models for a partially vaccinated population were calculated using Monte Carlo simulations for one family of random variable: the binomial. For it, 21 different distributions were selected and, for each of them, 6 different percentages of the vaccinated population were chosen. For each of them, 4 different vaccine efficacy were stipulated. In total, 2.2 million simulations were performed, featuring a big data problem. [pt] MODELAGEM ESTOCASTICA [pt] DOENCAS CONTAGIOSAS [pt] VACINACAO [pt] PROPAGACAO DE INCERTEZAS [pt] BIG DATA [en] STOCHASTIC MODELLING [en] INFECTIOUS DISEASE [en] VACCINATION [en] PROPAGATION OF UNCERTAINTY [en] BIG DATA
9	[pt] ATIVISMO TRANSNACIONAL NAS MÍDIAS SOCIAIS: UMA REVISÃO DA LITERATURA DO ATIVISMO DE MUDANÇAS CLIMÁTICAS / [en] TRANSNACTIONAL ACTIVISM IN SOCIAL MEDIA: A LITERATURE REVIEW OF CLIMATE CHANGE ACTIVISM ROBERTA NADALUTTI LA ROVERE 27 May 2019 (has links) [pt] Em sua expressão contemporânea, os processos de ativismo tornaram-se transnacionais, com suas causas, ações e organização realizados além dos limites das fronteiras nacionais, estabelecendo uma dinâmica com a lógica de horizontalidade da comunicação digital. Através da internet, os ativistas teriam mais possibilidades de estabelecer redes entre si, divulgar suas causas e ações, promover seu ponto de vista sobre os acontecimentos e gerar mais engajamento no debate público e na participação dos processos pelos cidadãos globais. Por isso, o objetivo deste trabalho é promover uma reflexão de como os artigos acadêmicos analisam casos específicos de ativismo transnacional e seus contextos sociopolíticos para que seja produzido um entendimento da forma e extensão dos potenciais de horizontalidade da internet que estão sendo concretizados. Essa reflexão foi baseada em duas perguntas de pesquisa: quem são os ativistas envolvidos no debate público de mudanças climáticas nas mídias sociais; e como a formação de redes de relacionamento entre ativistas no debate público promovido pelas mídias sociais é analisada pelos acadêmicos. Como conclusão, é possível encontrar indícios de quebra de agenda-setting, divulgação de novos enquadramentos de discurso, estabelecimento de redes epistêmicas complementares e organização transnacional e colaborativa de causas e ações de ativismo pela internet, apesar da análise de big data das mídias sociais ainda estar pouco aprofundada nesta área. / [en] In its contemporary form, the processes of activism became transnational, since its actions, causes and organization is done beyond the limit of national borders, establishing a dynamical relationship with the logics of digital communications. Using the internet, activists would have more possibilities of establishing networks of collaboration, publicize its causes and actions, promote specific points of view and generate more engagement in the public debate and more people to participate in activism. Therefore, the purpose of this work is to promote a brief review of how the academic literature is analyzing specific cases of transnational activism and its sociopolitical context to generate a better understanding of which and how the potentials of horizontalization from the internet are manifested. Two research questions are addressed: how are the actors of climate change activism analyzed in the social media data analysis of the literature, and how are the social networks of activists being explored. The conclusion is that it is possible to find evidences of activists breaking the agendasetting of traditional media, as well as promoting new framing of the discourse surrounding its actions and causes, new networks of collaboration and transnational and collaborative forms of organizing and creating actions through social media. However, big data analysis of activism processes in social media is still beginning and new research with more depth in the information analysis would benefit immensely in the comprehension of its dynamics [pt] INTERNET [pt] ATIVISMO TRANSNACIONAL [pt] MIDIAS SOCIAIS [pt] BIG DATA [pt] MUDANCAS CLIMATICAS [pt] COMUNICACAO DIGITAL [en] INTERNET [en] TRANSNATIONAL ACTIVISM [en] SOCIAL MEDIA [en] BIG DATA [en] CLIMATE CHANGES [en] DIGITAL COMMUNICATIONS
10	[pt] ENSAIOS SOBRE NOWCASTING COM DADOS EM ALTA DIMENSÃO / [en] ESSAYS ON NOWCASTING WITH HIGH DIMENSIONAL DATA HENRIQUE FERNANDES PIRES 02 June 2022 (has links) [pt] Em economia, Nowcasting é a previsão do presente, do passado recente ou mesmo a previsão do futuro muito próximo de um determinado indicador. Geralmente, um modelo nowcast é útil quando o valor de uma variável de interesse é disponibilizado com um atraso significativo em relação ao seu período de referência e/ou sua realização inicial é notavelmente revisada ao longo do tempo, se estabilizando somente após um tempo. Nesta tese, desenvolvemos e analisamos vários métodos de Nowcasting usando dados de alta dimensão (big data) em diferentes contextos: desde a previsão de séries econômicas até o nowcast de óbitos pela COVID-19. Em um de nossos estudos, comparamos o desempenho de diferentes algoritmos de Machine Learning com modelos mais naive na previsão de muitas variáveis econômicas em tempo real e mostramos que, na maioria das vezes, o Machine Learning supera os modelos de benchmark. Já no restante dos nossos exercícios, combinamos várias técnicas de nowcasting com um grande conjunto de dados (incluindo variáveis de alta frequência, como o Google Trends) para rastrear a pandemia no Brasil, mostrando que fomos capazes de antecipar os números reais de mortes e casos muito antes de estarem disponíveis oficialmente para todos. / [en] Nowcasting in economics is the prediction of the present, the recent past or even the prediction of the very near future of a certain indicator. Generally, a nowcast model is useful when the value of a target variable is released with a significant delay with respect to its reference period and/or when its value gets notably revised over time and stabilizes only after a while. In this thesis, we develop and analyze several Nowcasting methods using high-dimensional (big) data in different contexts: from the forecasting of economic series to the nowcast of COVID-19. In one of our studies, we compare the performance of different Machine Learning algorithms with more naive models in predicting many economic variables in real-time and we show that, most of the time, Machine Learning beats benchmark models. Then, in the rest of our exercises, we combine several nowcasting techniques with a big dataset (including high-frequency variables, such as Google Trends) in order to track the pandemic in Brazil, showing that we were able to nowcast the true numbers of deaths and cases way before they got available to everyone. [pt] APRENDIZADO DE MAQUINA [pt] MODELOS DE ALTA DIMENSAO [pt] COVID-19 [pt] NOWCASTING [pt] BIG DATA [pt] PREVISAO [en] MACHINE LEARNING [en] HIGHDIMENSIONAL MODELS [en] COVID-19 [en] NOWCASTING [en] BIG DATA [en] FORECASTING

Search results