Return to search

Ação de Linguagem e Mineração de dados : níveis de complexidade na análise de textos

Esta é uma pesquisa quali-quantitativa que tem por base teórico-epistemológica o Interacionismo Sociodiscursivo (ISD) e a Teoria da Complexidade, uma vez que ambas as teorias contribuem para a compreensão da ação de linguagem, enquanto Sistema Adaptativo Complexo (SAC), de sujeitos engajados em atividades de produção de textos. Dessa forma, na medida em que o desempenho de sujeitos de diferentes níveis de ensino tem sido apontado como problemático por órgãos de pesquisa em Educação, no que se refere às práticas de leitura e de produção textual, considerou-se relevante investigar a maneira como uma ferramenta digital de mineração de dados, neste caso, a ferramenta Sobek, pode evidenciar níveis de complexidade entre o conteúdo de um texto-referência e o texto-produzido. O objeto de estudo desta tese, portanto, é o recorte propiciado pela ferramenta Sobek, que ocorre por meio da geração de um grafo composto por palavras (signos) recorrentes nos textos, com vistas a sustentar a construção de uma perspectiva inter(trans)disciplinar, referente aos modos de extrair e interpretar o conteúdo desses a partir de níveis de complexidade. O corpus de pesquisa foi composto por 2 turmas de ensino superior, em nível de graduação, envolvendo a coleta de 34 textos. Esses textos foram submetidos à técnica de mineração de dados, com a utilização de uma nova versão da ferramenta, desenvolvida neste estudo, a qual permitiu importar e comparar, de forma automatizada, o conteúdo de dois textos, sendo possível gerar 3 tipos de grafos: de união, de intersecção e de diferença. O resultado da análise de dados indicou um padrão de estabilidade da ação de linguagem dos sujeitos, em relação ao conteúdo do texto-referência, sem apresentar significativa variabilidade de conceitos. Para além de uma nova versão da ferramenta, outra contribuição desta pesquisa foi a de sugerir que níveis de complexidade em caráter de estabilidade e variabilidade podem ser associados a zonas de desenvolvimento humano. / This is a quali-quantitative research whose theoretical and epistemological basis are the Interactionism Sociodiscursivo (ISD) and the Complexity Theory, once both theories contribute to the understanding of the language action, as Complex Adaptive System (CAS), of individuals engaged in text production activities. Thus, as the individuals‟ performance in different levels of education has been identified as problematic by Research Institutes of Education, related to reading and textual production practices, it was considered relevant to investigate the way a digital data mining tool, in this case, Sobek, may reveal levels of complexity between the content of a reference-text and a produced-text. The object of study of this thesis, so is the cut provided by Sobek tool, which occurs through the generation of a graph composed of words (signs) recurring in the texts, in order to support the construction of an inter(trans) disciplinary perspective, referring to ways to extract and interpret the content of the texts. The research corpus was composed of 2 classes of higher education at the undergraduate level, involving the collection of 34 texts. These texts were submitted to data mining technique, with the use of a new version of the tool, developed in this study, which allowed to import and compare, automatically, the contents of two texts automatically, been possible to generate 3 types of graphs: union, intersection and difference. The result of data analysis indicated a recurring pattern in the analyzed texts, which was to maintain the language action as stable as possible to the content of the reference-text, without presenting significant variability of concepts. In addition to the new version of the tool, another contribution of this research was to suggest that the levels of complexity in stability and variability may be associated with human development zones.

Identiferoai:union.ndltd.org:IBICT/oai:lume.ufrgs.br:10183/139313
Date January 2016
CreatorsCorrêa, Ygor
ContributorsBiazus, Maria Cristina Villanova, Reategui, Eliseo Berni
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UFRGS, instname:Universidade Federal do Rio Grande do Sul, instacron:UFRGS
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.002 seconds