Spelling suggestions: "subject:"[een] TEXT-DATA"" "subject:"[enn] TEXT-DATA""
31 |
[pt] DIFERENCIAÇÕES DE GÊNERO NA CARACTERIZAÇÃO DE PERSONAGENS: UMA PROPOSTA METODOLÓGICA E PRIMEIROS RESULTADOS / [en] GENDER REPRESENTATIONS ON CHARACTERS DESCRIPTION: A METHODOLOGICAL PROPOSAL AND EARLY RESULTSFLAVIA MARTINS DA ROSA P DA SILVA 10 August 2021 (has links)
[pt] Este trabalho apresenta uma metodologia que propõe a combinação de dados
quantitativos e distanciados com a leitura mais detalhada e aproximada em análises
de discurso, oferecendo a oportunidade de novos olhares sobre os dados e diversas
perspectivas de análise. A metodologia faz uso de recursos dos estudos linguísticos
com corpus, tais como listas de frequência, preferência, categorização e leitura de
linhas de concordância. Demonstra-se sua aplicação, tomando-se como objeto de
exploração obras da literatura brasileira em domínio público compiladas em um
corpus com cerca de 5 milhões de palavras, anotado semântica e
morfossintaticamente, e utilizam-se ferramentas computacionais que permitem
buscas com base em padrões léxico-sintáticos da língua portuguesa. O objetivo é
identificar como as personagens masculinas e femininas são caracterizadas nos
textos, possibilitando tanto elaborar uma visão geral de como mulheres e homens
são construídos através da linguagem. O estudo se dá em duas frentes: observando
os predicadores na descrição das personagens e as ações são desempenhadas por elas, fazendo distinção entre masculinas e femininas, comparando-as e analisando as diferenças de forma crítica. / [en] This work presents a methodology that proposes the combination of
quantitative and distant-read data with detailed, closer reading in discourse
analysis, enabling new possible views over data and diverse perspectives of
analysis. This methodology makes use of resources most used in corpus-based
linguistic, such as frequency lists, preferences, categorization, and reading
concordance lines. Its application is demonstrated using as exploration object
Brazilian literature titles in the public domain, compiled in a corpus with
approximately 5 million words, semantically and morpho-syntactically
annotated, and by using computational tools that enable searches based on
lexical-syntactic patterns of the Portuguese language. The purpose is to identify
how the male and female characters are portrayed in those texts, enabling the
creation of a general view on how women and men are built through language.
The study happens in two fronts: by observing the predicates used on describing
characters and the actions these characters take, comparing the male and female
results and analyzing them in a critical way.
|
32 |
[pt] DE MICRO À MACRO: ENSAIOS EM ANÁLISE TEXTUAL / [en] FROM MICRO TO MACRO: ESSAYS IN TEXTUAL ANALYSISLEONARDO CAIO DE LADALARDO MARTINS 04 July 2022 (has links)
[pt] Este estudo explora fontes de dados não convencionais como dados textuais de jornais e pesquisas de internet do Google Trends em dois problemas
empíricos: (i) analisar o impacto da mobilidade sobre o número de casos e mortes por Covid-19; (ii) nowcasting do PIB em alta-frequência. O primeiro artigo
usa fontes de dados não estruturados como controle para fatores comportamentais não observados e encontra que um aumento na mobilidade residencial
diminui significativamente o número de casos e mortes num horizonte de quatro
semanas. O segundo artigo usa fontes de dados não estruturadas para fazer um
nowcasting semanal do PIB, mostrando que dados textuais e Google Trends
pode aumentar a qualidade das projeções (medido pelo EQM, EAM e outras
métricas) comparado com as expectativas de mercado do Focus como base. Em
ambos casos, dados não estruturados reveleram-se fontes ricas de informação
não codificadas em indicadores estruturados convencionais. / [en] This study exploits non-conventional data sources such as newspaper
textual data and internet searches from Google Trends in two empirical
problems: (i) analysing the impacts of mobility on cases and deaths due to
Covid-19; (ii) nowcasting GDP in high-frequency. The first paper resorts to
unstructured data to control for non-observable behavioural effects and finds
that an increase in residential mobility significantly reduces Covid-19 cases
and deaths over a 4-week horizon. The second paper uses unstructured data
sources to nowcast GDP on a weekly basis, showing that textual data and
Google Trends can significantly enhance the quality of nowcasts (measured by
MSE, MAE and other metrics) compared to Focus s market expectations as
a benchmark. In both cases, unstructured data was revealed to be a valuable
source of information not encoded in structured indicators.
|
33 |
Vyhledávání informací v české Wikipedii / Information Retrieval in Czech WikipediaBalgar, Marek January 2011 (has links)
The main task of this Masters Thesis is to understand questions of information retrieval and text classifi cation. The main research is focused on the text data, the semantic dictionaries and especially the knowledges inferred from the Wikipedia. In this thesis is also described implementation of the querying system, which is based on achieved knowledges. Finally properties and possible improvements of the system are talked over.
|
Page generated in 0.0291 seconds