Return to search

Modelagem generalista ou individualizada na construção de modelos preditivos para a identificação de insucesso acadêmico

Submitted by JOSIANE SANTOS DE OLIVEIRA (josianeso) on 2017-06-27T13:30:09Z
No. of bitstreams: 1
Paulo Fernando Benetti Marcon_.pdf: 962793 bytes, checksum: 8c45fbcf4084b51d6348450029bf5f28 (MD5) / Made available in DSpace on 2017-06-27T13:30:09Z (GMT). No. of bitstreams: 1
Paulo Fernando Benetti Marcon_.pdf: 962793 bytes, checksum: 8c45fbcf4084b51d6348450029bf5f28 (MD5)
Previous issue date: 2017-03-31 / Nenhuma / O uso de recursos tecnológicos para auxiliar nas tarefas de ensino e aprendizagem é uma realidade. A disseminação de ambientes virtuais de aprendizado, como meio de promover a realização de cursos on-line, demonstra franca expansão. Além de tarefas que propiciam a ampliação dos meios de ensino, tais sistemas permitem o registro completo de todas as interações dos alunos no decorrer da realização de disciplinas. Essa gama de informação produzida pode ser utilizada para predição de estudantes em situação de risco enquanto a disciplina ocorre, o que para instituições de ensino pode representar redução nos índices de reprovação e evasão. Entretanto o número elevado de variáveis envolvidas, ainda mais quando várias disciplinas são consideradas, dificulta a construção de modelos computacionais eficientes. Desta forma, este trabalho visa investigar a construção de modelos generalistas – treinados com dados de diversas disciplinas disponíveis – contrapondo a construção de modelos
individualizados – treinados individualmente com dados de cada disciplina. Para isto um amplo conjunto de dados educacionais foi extraído, obtido de uma instituição de ensino superior, composto de diferentes cursos, disciplinas e períodos letivos, não sendo utilizadas variáveis que invadissem a privacidade dos estudantes. Uma vez definidas as características e transformações dos dados que contribuíam à identificação de insucesso acadêmico no decorrer da disciplina então foram aplicados algoritmos clássicos de Mineração de Dados seguindo ambas as abordagens, generalista e individualizada, e a cada unidade de conteúdo das disciplinas. Os
resultados obtidos demonstram vantagens e desvantagens de ambas as abordagens e que dadas as circunstâncias os modelos individualizados podem ser melhores, obtendo taxas de acerto maiores, e que em outras circunstâncias modelos generalistas apresentam um custo menor para a obtenção e manutenção dos modelos preditivos, mesmo com uma queda nos índices de acerto. / The use of technological resources to assist teaching and learning tasks is a reality. The
dissemination of virtual learning environments, as a mean of promoting online courses, shows a clear expansion. In addition to tasks that allow the expansion of teaching resources, such systems allow the complete recording of all the interactions of the students inside the courses. This range of information produced can be used to predict at-risk students while the course is taking place, which for educational institutions may represent a reduction in failure and dropout rates. However, the high number of variables involved, especially when several courses are considered, makes it difficult to construct efficient computational models. In this way, this work aims to investigate the construction of generalist models – trained with data from several available courses – counterposing the construction of individualized models – individually trained with data from each course. In this way, a broad set of educational data was extracted, obtained from a higher education institution, composed of different undergraduate programs, courses and academic periods, not using variables that invaded students' privacy. Once the
characteristics and transformations of the data that contributed to the identification of academic insuccess during the course were defined, then classical data mining algorithms were applied following both generalist and individualized approaches and to each content unit of the course. The results obtained demonstrate the advantages and disadvantages of both approaches and that given the circumstances the individualized models may be better, obtaining higher hit rates, and that in other circumstances generalist models present a lower cost for the obtaining and maintenance of the predictive models, even with a drop in hit rates.

Identiferoai:union.ndltd.org:IBICT/oai:www.repositorio.jesuita.org.br:UNISINOS/6386
Date31 March 2017
CreatorsMarcon, Paulo Fernando Benetti
Contributorshttp://lattes.cnpq.br/4658545839496086, Valiati, João Francisco
PublisherUniversidade do Vale do Rio dos Sinos, Programa de Pós-Graduação em Computação Aplicada, Unisinos, Brasil, Escola Politécnica
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UNISINOS, instname:Universidade do Vale do Rio dos Sinos, instacron:UNISINOS
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0155 seconds