Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Nos dias atuais, a maioria das operações feitas por empresas e organizações é armazenada
em bancos de dados que podem ser explorados por pesquisadores com o objetivo
de se obter informações úteis para auxílio da tomada de decisão. Devido ao grande volume
envolvido, a extração e análise dos dados não é uma tarefa simples. O processo geral de
conversão de dados brutos em informações úteis chama-se Descoberta de Conhecimento
em Bancos de Dados (KDD - Knowledge Discovery in Databases). Uma das etapas deste
processo é a Mineração de Dados (Data Mining), que consiste na aplicação de algoritmos
e técnicas estatísticas para explorar informações contidas implicitamente em grandes bancos
de dados. Muitas áreas utilizam o processo KDD para facilitar o reconhecimento de
padrões ou modelos em suas bases de informações. Este trabalho apresenta uma aplicação
prática do processo KDD utilizando a base de dados de alunos do 9 ano do ensino básico
do Estado do Rio de Janeiro, disponibilizada no site do INEP, com o objetivo de descobrir
padrões interessantes entre o perfil socioeconômico do aluno e seu desempenho obtido em
Matemática na Prova Brasil 2011. Neste trabalho, utilizando-se da ferramenta chamada
Weka (Waikato Environment for Knowledge Analysis), foi aplicada a tarefa de mineração
de dados conhecida como associação, onde se extraiu regras por intermédio do algoritmo
Apriori. Neste estudo foi possível descobrir, por exemplo, que alunos que já foram reprovados
uma vez tendem a tirar uma nota inferior na prova de matemática, assim como
alunos que nunca foram reprovados tiveram um melhor desempenho. Outros fatores,
como a sua pretensão futura, a escolaridade dos pais, a preferência de matemática, o
grupo étnico o qual o aluno pertence, se o aluno lê sites frequentemente, também influenciam
positivamente ou negativamente no aprendizado do discente. Também foi feita uma
análise de acordo com a infraestrutura da escola onde o aluno estuda e com isso, pôde-se
afirmar que os padrões descobertos ocorrem independentemente se estes alunos estudam
em escolas que possuem infraestrutura boa ou ruim. Os resultados obtidos podem ser
utilizados para traçar perfis de estudantes que tem um melhor ou um pior desempenho
em matemática e para a elaboração de políticas públicas na área de educação, voltadas
ao ensino fundamental. / Nowadays, most of the transactions made by companies and organizations is stored
in databases that can be explored by researchers in order to obtain useful information to
aid decision making. Due to the large volume involved, the extraction and analysis of data
is not a simple task. The general process of converting raw data into useful information
is called Knowledge Discovery in Databases (KDD). One step in this process is the Data
Mining, which involves the application of algorithms and statistical techniques to exploit
information contained implicitly in large databases. Many areas use the KDD process to
facilitate the recognition of patterns or models on their bases of information. This work
presents a practical application of KDD process using the database of students in the 9th
grade of elementary education in the State of Rio de Janeiro, available in INEP site, with
the aim of finding interesting patterns between the socioeconomic profile of the student
and his/her performance obtained in Mathematics. The tool called Weka was used and
the Apriori algorithm was applied to extracting association rules. This study revealed,
for example, that students who have been reproved once tend to get a lower score on the
math test, as well as students who had never been disapproved have had superior performance.
Other factors like student future perspectives, ethnic group, parent's schooling,
satisfaction in mathematics studying, and the frequency of access to Internet also affect
positively or negatively the students learning. An analysis related to the schools infrastructure
was made, with the conclusion that patterns do not change regardless of the
student studying in good or bad infrastructure schools. The results obtained can be used
to trace the students profiles which have a better or a worse performance in mathematics
and to the development of public policies in education, aimed at elementary education.
Identifer | oai:union.ndltd.org:IBICT/urn:repox.ist.utl.pt:BDTD_UERJ:oai:www.bdtd.uerj.br:4411 |
Date | 20 February 2014 |
Creators | Lyvia Aloquio |
Contributors | Anderson Amendoeira Namen, Roberto Pinheiro Domingos, Gustavo Mendes Platt, Annabell Del Real Tamariz |
Publisher | Universidade do Estado do Rio de Janeiro, Programa de Pós-Graduação em Modelagem Computacional, UERJ, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da UERJ, instname:Universidade do Estado do Rio de Janeiro, instacron:UERJ |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0028 seconds