Made available in DSpace on 2016-04-28T18:22:42Z (GMT). No. of bitstreams: 1
Marcia Veirano Pinto.pdf: 5387766 bytes, checksum: 9f381764386ef7108e63b97937f3f77e (MD5)
Previous issue date: 2013-08-05 / This study will investigate variation in the language of American movies over an 80-
year time period. The corpus is a collection of 640 movie subtitles that includes
comedies, dramas, action-adventure, and horror-suspense movies from 1930 to 2010
totaling, approximately, 7,750,000 tokens and 325,000 types. The sampling frame for
the corpus comprised the film guide 1001 Movies you Must See before you Die , in
which sixty-seven renowned film critics elected the best movies of each decade, the
website www.filmsite.org, as well as nominations for the Oscar, BAFTA, and the
Academy of Science Fiction, Fantasy and Horror Films awards. The corpus was tagged
for part of speech with the Biber tagger, and post-processed with the TagCount
programs, which provides further syntactic and semantic analyses. This study will
provide two different MD analyses, namely one that uses the existing 1988 dimensions
to characterize the movies, and another that extracts new dimensions of variation based
solely on movies. For the first one, scores were computed for each movie on each of the
first five 1988 dimensions, for the corpus as a whole as well as for each individual
movie genre. And for the second analysis, a new factor analysis was run to determine
the factors that best represent the data, which were then interpreted in terms of
underlying dimensions of variation. For both analyses, the effects of a set of
independent variables were considered, including year of first screening, award
nomination/win, length, genre, director, ratings, original/adapted script and production
studio. Cluster analyses were also carried out to determine the optimal groups of movies
within each dimension, such that they cut across the existing genre labels and provided
characterizations that were grounded on linguistic characteristics rather than marketdriven
concerns. The chapter will present each analysis together with text samples that
illustrate the salient features of movies on each dimension. It will also present the
results for cluster analysis that dissects time periods as well as statistical tests on these
clusters that determine whether there are significant differences across movie genres
over time. / O objetivo desta pesquisa é investigar dimensões de variação na linguagem dos filmes
americanos ao longo de 80 anos de cinema falado. Para tanto, buscou-se suporte teórico
na visão de linguagem da Linguística de Corpus e na abordagem metodológica da
Análise Multidimensional. Mais especificamente, nas duas modalidades propostas por
essa metodologia: a que mapeia o registro filme nas 5 dimensões de variação do inglês
apontadas por Biber (1988), e a que propõe novas dimensões de variação baseadas
apenas nos textos retratados dos filmes. Ambas as modalidades de análise levaram em
conta as variáveis extralinguísticas: ano em que os filmes foram apresentados ao público,
indicações/ premiações, duração, gênero, diretores, roteiro original versus adaptado,
estúdio em que foram produzidos e avaliação da crítica. O corpus utilizado na pesquisa
é composto por 640 legendas de filmes de gêneros diversos organizados sob quatro
grandes categorias: comédia, drama, ação-aventura e horror-suspense-mistério. Os
filmes foram selecionados com base no guia de filmes 1001 filmes par a ver antes de
morrer , elaborado por sessenta e sete críticos de cinema renomados, que elegeram os
melhores filmes de cada década, do sítio www.filmesite.org, e das nomeações e
premiações recebidas pelas seguintes Academias: Oscar, BAFTA e Filmes de Horror,
Fantasia e Ficção Científica (The Academy of Science Fiction, Fantasy and Horror
Films). Para que se pudesse concluir o trabalho com a proposição de uma nova
categorização para os filmes, baseada nas dimensões de variação encontradas recorreuse
à análise estatística de Clusters, que permitiu o agrupamento ideal dos filmes de
acordo com suas características morfossintáticas e semânticas
Identifer | oai:union.ndltd.org:IBICT/oai:leto:handle/13634 |
Date | 05 August 2013 |
Creators | Pinto, Marcia Veirano |
Contributors | Sardinha, Antonio Paulo Berber |
Publisher | Pontifícia Universidade Católica de São Paulo, Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem, PUC-SP, BR, Lingüística |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da PUC_SP, instname:Pontifícia Universidade Católica de São Paulo, instacron:PUC_SP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0022 seconds