1 |
[en] MORPHOSYNTACTIC TAGGER FOR PORTUGUESE-TWITTER / [pt] ANOTADOR MORFOSSINTÁTICO PARA O PORTUGUES-TWITTERPEDRO LARRONDA ASTI 13 October 2011 (has links)
[pt] Nesta dissertação, apresentamos um processador linguístico que resolve a tarefa
de Anotação morfossintática de mensagens em português postadas no
Twitter. Ao analisar as mensagens escritas por brasileiros no Twitter,
é fácil verificar que novos caracteres são introduzidos no alfabeto e também
que novas palavras são adicionadas ao idioma. Além disso, observamos que
essas mensagens são sintaticamente mal formadas. Isto impossibilita o uso
nessas mensagens de diversos processadores linguísticos existentes para o português. Resolvemos esse problema considerando essas mensagens como escritas
em uma nova língua, o português-twitter. O alfabeto dessa nova língua
contém o alfabeto do português e o seu vocabulário contém o vocabulário da
língua portuguesa. Porém, suas gramáticas são diferentes. Para construir os
processadores desta nova linguagem, utilizamos a técnica de aprendizado supervisionado
denominada Entropy Guided Transformation Learning
(ETL). Adicionalmente, para treinar os processadores ETL, construímos um
corpus anotado de mensagens em português-twitter. Não temos conhecimento
da existência de outros Anotadores Morfossintáticos para o português-twitter.
Porém, sabemos que, no estado-da-arte da Anotação Morfossintática para o
português, a acurácia é de aproximadamente 96%, variando de acordo com
o conjunto de classes escolhido. Construímos o processador composto de dois
estágios, um morfológico e um contextual. Como métrica de avaliação, adotamos
a acurácia, que mede quantos por cento do corpus foi anotado corretamente.
Nossos resultados experimentais apresentam uma acurácia de 90,24%
para o anotador proposto. Isto corresponde a um aprendizado significativo,
pois o sistema inicial tem uma acurácia de apenas 76,58%. Este resultado é
compatível com o aprendizado observado nos correspondentes processadores
na língua portuguesa. / [en] In this paper we present a language processor that solves the task of Morphosyntactic
Tagging of messages posted in Portuguese on Twitter. By analyzing
the messages written by Brazilian on Twitter, it is easy to notice that new
characters are introduced in the alphabet and also that new words are added
to the language. Furthermore, we note that these messages are syntactically
malformed. This precludes the use of existing Portuguese processors in these
messages, nevertheless this problem can be solved by considering these messages
as written in a new language, the Portuguese-Twitter. Both the alphabet
and the vocabulary of such idiom contain features of Portuguese. However, the
grammar is are different. In order to build the processors for this new language,
we have used a supervised learning technique known as Entropy Guided
Transformation Learning (ETL). Additionally, to train ETL processors,
we have built an annotated corpus of messages in Portuguese-Twitter. We are
not aware of any other taggers for the Morphosyntactic Portuguese-Twitter
task, thus we have compared our tagger to the the accuracy of state-of-art
Morphosyntactic Annotation for Portuguese, which has accuracy around 96%
depending on the tag set chosen. To assess the quality of the processor, we have
used accuracy, which measures how many tokens were tagged correctly. Our
experimental results show an accuracy of 90,24% for the proposed Morphosyntatic
Tagger. This corresponds to significant learning, since the initial
baseline system has an accuracy of only 76,58%. This finding is consistent with
the observed learning for the corresponding regular Portuguese taggers.
|
2 |
[en] TWITTER AND PUBLIC SPHERE: PLURALITY AND REPRESENTATION IN THE DISCUSSION OF THE BRAZILIAN CIVIL RIGHTS FRAMEWORK FOR THE INTERNET / [pt] TWITTER E ESFERA PÚBLICA: PLURALIDADE E REPRESENTAÇÃO NA DISCUSSÃO SOBRE O MARCO CIVIL DA INTERNETLETICIA VARELA CAPONE 15 June 2016 (has links)
[pt] Esta é uma pesquisa no campo da Internet e Democracia que dialoga com os estudos que analisam as contribuições da Web para a esfera pública nos regimes democráticos contemporâneos (GOMES; MAIA, 2008; DAHLGREN, 2005; BOHMAN, 2004; CHADWICK, 2009). Nesse contexto, tem como tema a discussão no Twitter sobre o Marco Civil da Internet, com o objetivo de perceber quais foram as grandes polêmicas, quão plural foi o debate e que tipo de mídia esteve presente no espaço especificado para análise. As hipóteses eram de que a conversa estabelecida no Twitter traria uma pluralidade relativa de vozes e uma contribuição em termos de pluralidade midiática. Com base em métodos quantitativos e qualitativos, aplicados sobre uma amostra relevante de 636 tweets, foi constatado um predomínio de vozes especialistas, bem como um grande compartilhamento de conteúdo produzido por mídias complementares, que dominaram a discussão no recorte estabelecido. / [en] This is a research in the field of Internet and Democracy that dialogues with the studies that analyze Web contributions to the public sphere of contemporary democratic regimes (GOMES; MAIA, 2008; DAHLGREN, 2005; BOHMAN, 2004; CHADWICK, 2009). The intention was to analyze the discussion on Twitter about the Brazilian Civil Rights Framework for the Internet, in order to observe which were the major controversies, how plural was the debate and what kind of media (mainstream or complementary media) was present in the specified space. Based on qualitative and quantitative analysis of the object, 636 tweets, we found a prevalence of expert voices, as well as a large share of content produced by complementary media.
|
3 |
[pt] O TWITTER COMO INSTRUMENTO AUXILIAR DE INTERATIVIDADE NA TV ABERTA: UMA APLICAÇÃO NO PROGRAMA CENTRAL DA COPA / [en] TWITTER AS AN INTERACTIVE SUPPORT TOOL FOR BROADCAST TV: AN APPLICATION IN THE CENTRAL DA COPA TV SHOWILANA TERESA NOVELLO SIQUEIRA 20 March 2012 (has links)
[pt] Esta pesquisa focaliza as redes sociais e a forma como extrapolaram a
função primária de viés social para contemplar adicionalmente outros tipos de
manifestações. Estuda particularmente sua utilização na interatividade em
programas de TV. Especificamente, analisa como o Twitter trouxe uma
oportunidade de interatividade com o telespectador. O estudo optou pelo
programa Central da Copa, exibido durante a Copa do Mundo de 2010. Este
programa não fazia parte dos produtos de prateleira da emissora, tendo sido
veiculado pontualmente em horários não-programados, mas após exibição dos
jogos da seleção brasileira. Além disso, foi produzido e exibido em um período
específico exclusivamente para discussão de assuntos correlatos à Copa. Por este
motivo, para fins de observação de um fenômeno, foi possível examinar dados e
estruturar informações pontualmente. Os resultados indicam um comportamento
espontâneo por parte da audiência, provocado e estimulado pelos temas abordados
durante a exibição. As percepções dos telespectadores sobre as mais diversas
características do produto exibido indicam que o Twitter possa, em casos como
este, atuar como instrumento de análise de marketing para empresas. Foi possível
constatar que ao interagir, telespectadores apontam preferências, percepções e
críticas sobre os produtos, o que pode ser utilizado para construir uma estratégia
de relacionamento aderente aos reais anseios do público. Um veículo de
comunicação em massa que, por natureza, é universal ganha oportunidade de
retorno segmentada, imediata e gratuita. / [en] This research focuses on social networking and how they extrapolated the
primary function of social bias to additionally include other types of events. It
studies particularly its use in interactive TV programs. Specifically, it analyzes
how Twitter has brought an opportunity for interactivity with the viewer. The
study opted for Central da Copa (Central Cup program), broadcasted during the
2010 Soccer World Cup. This program was not part of TV Globo´s schedule. It
was broadcasted after the games of the Brazilian national team. Furthermore, it
was produced and broadcasted in a specific period only to discuss issues related to
theSoccer World Cup. Therefore, observing this phenomenon, it was possible to
exam the data and structure all the information. The results indicate a spontaneous
behavior from the audience, provoked and stimulated by the topics discussed
during the exhibition. The perceptions of viewers on several characteristics of the
product displayed may indicate that Twitter, in cases like this, acts as an analytical
tool for marketing companies. It was found that when interacting, viewers point
their preferences, perceptions and criticisms about the products. This information
can be used to build a relationship strategy related to the real desires of the public.
A universal mass communication vehicle such as TV Globo gains targeted,
immediate and free opportunity.
|
4 |
[pt] AVALIAÇÃO ECONÔMICA DE DESASTRES: UMA METODOLOGIA BASEADA EM MÍDIAS SOCIAIS / [en] ECONOMIC DISASTER ASSESSMENT: A SOCIAL MEDIA-BASED METHODOLOGYDANIEL RICARDO ECKHARDT DA SILVA 25 August 2020 (has links)
[pt] Desastres variam em diferentes aspectos, como intensidade, impactos, tipo, duração, início e consequências. É um grande desafio buscar uma metodologia de avaliação de custos econômicos de desastres, sejam de pequenas ou grandes proporções, de início súbito ou lento, bem como para gerenciar seus respectivos custos (diretos, indiretos, interrupção de serviços, intangíveis). Dentro deste contexto, as mídias sociais, por serem uma fonte de dados com informações públicas, disponíveis em tempo real e com baixo custo de coleta, tornam-se fontes de dados importantes neste processo. Desta forma, o objetivo principal desta tese é propor uma metodologia de avaliação econômica de desastres baseada nas informações coletadas através das mídias sociais. Para atingir este objetivo, revisões sistemáticas da literatura (RSL) foram realizadas para compreender o estado da arte das metodologias de avaliação existentes e analisar como as mídias sociais podem ser utilizadas para suportar a avaliação econômica de desastres. Os resultados das RSL fornecem uma taxonomia, um framework e uma agenda de pesquisa que servem de base para criação de uma inédita metodologia de avaliação de custos econômicos de desastres, denominada AVECODE. Composta por três fases (Pré-evento, Desastre, Pós-evento) e duas áreas transversais (Coordenação e Tecnologia), a AVECODE é aplicada em um estudo de caso ocorrido no Rio de Janeiro em 2019, através do desenvolvimento de um protótipo e de dados coletados do Twitter. Os resultados desta aplicação são, então, comparados e analisados com a avaliação realizada pelo governo local. A AVECODE mostra-se uma importante ferramenta para concepção e implementação de políticas públicas, onde os resultados obtidos permitem a rastreabilidade das informações coletadas, a identificação de custos não contabilizados e averiguações nos quantitativos e custos gerados pelo governo local. Finalmente, a aplicação da metodologia em um estudo de caso permite ratificar a correlação da metodologia proposta com a prática. / [en] Disasters vary in different aspects, such as intensity, impacts, type, duration, onset, and consequences. Therefore, it is a great challenge to seek an economical cost assessment methodology to deal with disasters, whether small or large, of sudden or slow onset, as well as to manage their costs (direct, indirect, service interruption, intangibles). Within this context, social media, as a source of data with public information, available in real-time and with a low cost of collection, become a crucial data source in this process. Thus, the main objective of this thesis is to propose a methodology for the economic assessment of disasters based on information collected through social media. For that purpose, a systematic literature review (SLR) was carried out to understand the state of the art of existing assessment methodologies and to analyze how social media can be applied to support economic disaster assessment. The results of the SLR provide a taxonomy, a framework, and a research agenda that serve as a basis for creating an original methodology for assessing economic costs of disasters, named AVECODE. Comprised of three phases (Pre-event, Disaster, Post-event) and two transversal areas (Coordination and Technology), AVECODE is applied in a case study that took place in Rio de Janeiro in 2019, through the development of a prototype and data collected from Twitter. The results of this application are compared and analyzed with the disaster evaluation carried out by the local government. AVECODE proves to be a valuable tool for the design and implementation of public policies, where the results obtained allow the traceability of the collected information, the identification of unaccounted costs, and inquiries in the amounts and costs estimated by the local government. Finally, the application of the methodology in a case study allows us to confirm the correlation between the proposed methodology and practice.
|
5 |
[en] ASSESSMENT OF THE IMPACT OF TRAFFIC ACCIDENTS ON THE FLOW OF URBAN ROADS BASED ON SPEED VALUES / [pt] AVALIAÇÃO DO IMPACTO DE ACIDENTES DE TRÂNSITO NO TRÁFEGO DE VIAS URBANAS A PARTIR DE VALORES DE VELOCIDADEIVANILDO BARBOSA 23 February 2016 (has links)
[pt] Uma das preocupações das grandes cidades é a minimização dos efeitos do aumento da quantidade de veículos em circulação e dos acidentes que, consequentemente, tendem a ocorrer com maior frequência. Com a popularização e a miniaturização dos receptores GPS, a disponibilidade de valores de velocidade observados nas vias urbanas e a publicação de ocorrências de trânsito georreferenciadas em redes sociais, é agora possível avaliar as condições do trânsito quanto às reduções de velocidade. Contudo, é necessário filtrar os dados de tal forma a minimizar incertezas temáticas, espaciais e temporais. Esta tese propõe uma metodologia para a avaliação do impacto de acidentes de trânsito, empregando valores de velocidade. Para tanto, considera metodologias auxiliares para: (1) processamento de rotas rastreadas com GPS para identificar vias com maior circulação, calcular estatísticas das velocidades observadas e estimar o tráfego em vias de mão dupla, pela análise das direções do movimento; (2) representação do comportamento do tráfego a partir dos valores de velocidade registrados nas vias; (3) extração e seleção dos dados sobre acidentes extraídos do Twitter para identificar os possíveis efeitos desses acidentes nos valores de velocidade. As contribuições desta tese são: (1) avaliação do tráfego, em condições normais e após a ocorrência de acidentes, com base em valores de velocidade, de aquisição mais simples do que os valores de fluxo e concentração de tráfego; (2) emprego de publicações de eventos em redes sociais, permitindo rápido acesso à informação; (3) aplicação das avaliações em vias urbanas, em lugar de rodovias, o que implica em levar em consideração as interferências no tráfego inerentes às interseções, sinais de trânsito e fluxo de pedestres; e (4) uma metodologia para extração de estatísticas de velocidade a partir de dados GPS, enfatizando as possíveis fontes de erro existentes nos processos de map matching e classificação temporal. / [en] A major concern in large cities is to minimize the effects of the increasing quantity of vehicles in circulation and, consequently, of the accidents that tend to occur more frequently. Due to the popularization and miniaturization of GPS receivers, the availability of large volumes of data about vehicle speed in urban roads and the large number of traffic-related messages published in social networks, it is now possible to collect enough input data to model traffic conditions based on the observed reduction in speed values. However, it is necessary to filter the data to minimize thematic, spatial and temporal uncertainties. This thesis proposes a methodology to assess the impact of traffic accidents by analyzing speed values. To achieve this goal, it also proposes auxiliary methodologies, aiming at: (1) processing GPS-tracked routes to compute speed statistics and estimate traffic in two-way streets, by performing direction analysis; (2) representing traffic behavior based on the observed speed values; (3) extracting and selecting accident-related data by mining Twitter posts for later identification of the likely effects on speed values. The main contributions of this thesis are: (1) the assessment of traffic conditions based on speed values, which are easier to acquire than data about traffic volume and concentration; (2) the use of posts from social networks, which provide timely access to traffic events; (3) the assessment of urban roads instead of freeways or roads, which require modeling intersections, traffic lights and pedestrian flow; and (4) a methodology designed to extract speed statistics from raw GPS data, which handles likely error sources related to both map matching process and temporal classification.
|
6 |
[en] SAILING IS CONCISE - LEMINSKI: FROM BOOKS TO THE INTERNET / [pt] NAVEGAR É CONCISO - LEMINSKI: DO LIVRO À INTERNETLUCIANA DE MORAES SARMENTO SCHEINER 31 August 2016 (has links)
[pt] Esta tese de doutorado analisa as representações da obra do poeta Paulo Leminski na internet, focalizando especificamente o microblog Twitter, a rede social Facebook e o site Kamiquase (principal site sobre a obra do poeta). A análise parte de uma discussão sobre as relações entre arte e tecnologia e sobre os efeitos da internet no que diz respeito à produção e circulação da literatura (em especial a poesia). Parte-se da hipótese de que a poesia, através da internet, consegue realizar o antigo projeto das vanguardas do início do século XX, fazendo-se presente no cotidiano de pessoas comuns. Entretanto, sem o viés político tão sonhado vanguardas. Indaga-se até que ponto o ambiente virtual revigora, reatualiza e possibilita novas interpretações e criações a partir da obra de Leminski - ainda que tais representações circulem de maneira fragmentada e descontextualizada. / [en] This thesis examines the representations of the work of the poet Paulo Leminski on the Internet, focusing specifically on the microblogging site Twitter, the social networking site Facebook and Kamiquase (main site about the poet s work). The analysis starts discussing the relationship between art and technology and how the Internet is affecting literature (especially poetry). The inference is that the virtual environment refreshes, renews and enables new interpretations and creations from the work of Leminski - though such representations circulate in a fragmented and decontextualized way.
|
7 |
[pt] DEBATES POLÍTICOS, AGIR ESTRATÉGICO E TWITTER: A COLONIZAÇÃO DO MUNDO DA VIDA EXERCIDA ATRAVÉS DA ESFERA PÚBLICA CONECTADA / [en] POLITICAL DEBATES, STRATEGIC ACTION AND TWITTER: THE LIFEWORLD COLONIZATION EXERCISED THROUGH THE CONNECTED PUBLIC SPHERERICARDO CANAVAN MARTINS JUNQUEIRA 02 May 2022 (has links)
[pt] Com a emergência da internet e o constante aperfeiçoamento das Tecnologias
da Informação e Comunicação (TICs) ao longo das últimas três décadas, verificase no Brasil, assim como no resto do mundo, a reconfiguração de forma virtualizada
da esfera pública na qual as questões sociais são discutidas, observando-se, ainda,
que interesses individuais, sociais, políticos e econômicos entrelaçam-se e
apropriam-se uns dos outros na criação e manutenção de espaços para discussões,
que, por sua vez, são amplamente utilizados como caixas de ressonância para que
as mais variadas questões ecoem pela sociedade; é o caso da rede social conhecida
mundialmente como Twitter. Assim, aliando-a às devidas complementações
extraídas das obras de autores hodiernos como Eduardo Magrani e Evgeny
Morozov, torna-se fundamental o recurso à teoria de Jürgen Habermas para que se
possa entender a configuração, importância e problemas da atual esfera pública
nacional, bem como para que se possa extrair conclusões sobre a racionalidade dos
debates políticos travados dentro da plataforma Twitter, demonstrando que, sob o
pretexto de fornecer um espaço de efetivação da práxis comunicacional cotidiana,
a plataforma, na verdade, instrumentaliza interesses, e, consequentemente, promove
a colonização do mundo da vida de seus usuários. Outrossim, em virtude do caráter
pragmático-formal da teoria habermasiana, também se demonstra como um agente
político influente pode se valer estrategicamente da plataforma para ascensão de
seus interesses próprios através da análise de algumas de suas manifestações. / [en] The emergence of the internet and the constant improvement of Information
and Communication Technologies (ICTs) over the last three decades, in Brazil, as
in the rest of the world, the reconfiguration of the public sphere in which are
discussed, also observing that individual, social, political and economic interests
intertwine and appropriate each other in the creation and maintenance of spaces for
discussions, which, in turn, are widely used as boxes of resonance so that the most
varied issues echo through society; this is the case of the social network known
worldwide as Twitter. Thus, combining it with the necessary complements
extracted from the works of contemporary authors such as Eduardo Magrani and
Evgeny Morozov, it is essential to resort to the theory of Jürgen Habermas in order
to understand the configuration, importance and problems of the current national
public sphere, as well as how to draw conclusions about the rationality of the
political debates held within the Twitter platform, demonstrating that, under the
pretext of providing a space for the realization of everyday communicational praxis,
the platform actually instrumentalizes interests, and, consequently, promotes the
colonization of the lifeworld of its users. Furthermore, due to the pragmatic-formal
character of the Habermasian theory, it is also demonstrated how an influential
political agent can strategically use the platform to advance its own interests
through the analysis of some of its manifestations.
|
Page generated in 0.0427 seconds