Spelling suggestions: "subject:"mineração dde dados educacionais"" "subject:"mineração dde dados educacionaisâ""
1 |
Uma abordagem preditiva da evasão na educação a distância a partir dos construtos da distância transacionalRAMOS, Jorge Luis Cavalcanti 22 December 2016 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2017-08-31T12:35:50Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
Tese_Jorge_Luis_Cavalcanti_Ramos_Final.pdf: 7170280 bytes, checksum: 89435ef87395ca1ce9cdec68c87e843d (MD5) / Made available in DSpace on 2017-08-31T12:35:50Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
Tese_Jorge_Luis_Cavalcanti_Ramos_Final.pdf: 7170280 bytes, checksum: 89435ef87395ca1ce9cdec68c87e843d (MD5)
Previous issue date: 2016-12-22 / O crescimento da Educação a Distância (EAD) tem sido apoiado por teorias para auxiliar
o planejamento e a execução de cursos de maneira eficaz e eficiente. As pesquisas na área
também refletem esse crescimento, à medida que buscam atenuar ou resolver problemas
que surgem decorrentes dessa expansão, como por exemplo os altos índices de evasão
ainda verificados na modalidade. Para a maioria das instituições que participaram do
Censo Anual da EAD no Brasil em 2015, o grande obstáculo enfrentado tem sido a evasão
nos cursos, quando para 40% das instituições pesquisadas, a taxa média de evasão foi
entre 26% e 50% nos cursos totalmente ofertados a distância por essas instituições.
Partindo de uma necessidade de renovação de teorias da EAD, bem como aplicá-las no
sentido de auxiliar no enfrentamento nos desafios da modalidade, esta pesquisa enfocou
a Teoria da Distância Transacional, proposta por Moore (1972, 1973, 1993, 2013). Foi
sugerida uma nova abordagem para determinação dos seus construtos, com o propósito
de aplicá-los em um processo de detecção precoce de alunos com tendências a evasão,
em cursos superiores ofertados a distância. A utilização de técnicas de análise
multivariada para a obtenção dos construtos da distância transacional teve a intenção de
buscar uma abordagem distinta das atualmente verificadas na literatura. Essa
determinação é feita, na maioria dos casos, utilizando questionários aplicados a alunos e
professores. Também, as evidências na literatura apontam o uso de diversas técnicas de
mineração de dados e aprendizagem de máquina na definição de modelos preditivos em
contextos educacionais, com índices satisfatórios de acertos. A partir da obtenção dos
componentes (variáveis) dos construtos da distância transacional, foi também definido e
validado um modelo de previsão da evasão de alunos em cursos a distância, a partir desses
componentes. Foram usados diversos algoritmos classificadores, sendo o classificador
por regressão logística apresentado resultados mais relevantes quando comparados aos
registrados pela literatura na área. Foi então desenvolvida uma aplicação com o modelo
preditivo implementado, para testes com professores e tutores que atuam na EAD, sendo
a mesma bem avaliada por esses usuários. / The growth of Distance Education (DE) has been supported by theories to aid in the
planning and execution of courses in an effective and efficient way. Research in this area
also reflects this growth, as they seek to mitigate or solve problems arising from this
expansion, such as the high rates of dropouts still observed in the modality. For most of
the institutions that participated in the DE Annual Census in Brazil in 2015, the greatest
obstacle has been the avoidance of courses, when for 40% of the institutions surveyed,
the average rate of dropout was between 26% and 50% in courses offered at a distance
by these institutions. Based on a need to renew DE theories, as well as applying them to
help addressing the challenges of the modality, this research focused on the Transactional
Distance Theory proposed by Moore (1972, 1973, 1993, 2013). It was suggested a new
approach to determine their constructs, with the purpose of applying them in a process of
early detection of students with tendencies to dropout, in higher distance courses. The use
of multivariate analysis techniques to obtain the transactional distance constructs, had the
intention of looking for a different approach than those currently found in the literature.
This determination is made, in most cases, using questionnaires applied to students and
teachers. In addition, the literature evidences the use of several techniques of data mining
and machine learning in the definition of predictive models in educational contexts, with
satisfactory indexes of precision. After obtaining the components (variables) of the
constructs, it was also defined and validated a model of prediction of the dropout students
in distance courses, from these components. Several classifiers algorithms were used, and
the logistic regression classifier presented more relevant results when compared to those
recorded in the literature. Since then, an application with the predictive model was
implemented for test with users and was been well accepted by teachers and tutors who
work with DE.
|
2 |
Caracterização de alunos em ambientes de ensino online: estendendo o uso da DAMICORE para minerar dados educacionais / Characterization of students in online learning environments: extending the use of DAMICORE to educational data miningMoro, Luis Fernando de Souza 04 May 2015 (has links)
Com a popularização do uso de recursos tecnológicos na educação, uma enorme quantidade de dados, relacionados às interações entre alunos e esses recursos, é armazenada. Analisar esses dados, visando caracterizar os alunos, é tarefa muito importante, uma vez que os resultados dessa análise podem auxiliar professores no processo de ensino e aprendizagem. Entretanto, devido ao fato de as ferramentas utilizadas para essa caracterização serem complexas e pouco intuitivas, os profissionais da área de ensino acabam por não utilizá-las, inviabilizando a implementação de tais ferramentas em ambientes educacionais. Dentro desse contexto, a dissertação de mestrado aqui apresentada teve como objetivo analisar os dados provenientes de um sistema tutor inteligente, o MathTutor, que disponibiliza exercícios específicos de matemática, para identificar padrões de comportamento dos alunos que interagiram com esse sistema durante um determinado período. Essa análise foi realizada por meio de um processo de Mineração de Dados Educacionais (EDM), utilizando a ferramenta DAMICORE, com o intuito de possibilitar que fossem geradas, de forma rápida e eficaz, informações úteis à caracterização dos alunos. Durante a realização dessa análise, seguiram-se algumas fases do processo de descobrimento de conhecimento em bases de dados, seleção, pré-processamento, mineração dos dados e avaliação e interpretação. Na fase de mineração de dados, foi utilizada a ferramenta DAMICORE, que encontrou padrões que foram estudados na fase de avaliação e interpretação. A partir dessa análise foram encontrados padrões comportamentais dos alunos, por exemplo, alunos do sexo masculino apresentam rendimento superior ou inferior ao de alunas do sexo feminino e quais alunos terão um bom ou mau rendimento nas etapas finais do processo de ensino. Como principal resultado temos que uma das hipóteses criadas, Alunos que obtiveram bom desempenho no pós-teste imediato apresentaram dois dos três seguintes comportamentos: poucas interações na intervenção, baixo tempo interagindo com o sistema na intervenção e poucos misconceptions no pré-teste, teve sua acurácia comprovada dentre os dados utilizados nessa pesquisa. Assim, por meio desta pesquisa concluiu-se que a utilização da DAMICORE em contexto educacional pode auxiliar o professor a inferir o desempenho dos seus alunos oferecendo a ele a oportunidade de realizar as intervenções pedagógicas que auxiliem alunos com possíveis dificuldades e apresente novos desafios para aqueles com facilidade no tema estudado / With the popularization of the use of technological resources in education, a huge amount of data, related to the interactions between students and these resources, is stored. Analyzing this data, due to characterize the students, is an important task, since the results of this analysis can help teachers on teaching and learning process. However, due to the fact that the tools used to this characterization are complex and non-intuitive, the educational professionals do not use it, invalidating the implementation of such tools at educational environments. Within this context, this master\'s dissertation aimed analyzing the prevenient data from an educational web system named MathTutor, which offers specific math exercises to identify behavioral patterns of students who interacted with this system during some period. This analysis was performed by a process known as Educational Data Mining, using the tool named DAMICORE, in order to enable quickly and effectively the construction of helpful information to the characterization of the students. During the course of this analysis, some phases of the process of knowledge discovery in databases were followed: \"selection\", \"preprocessing\", \"data mining\" and \"evaluation and interpretation\". In \"data mining\" phase, the tool DAMICORE was used to find behavioral patterns of students which were studied at the \"evaluation and interpretation\" phase. From this analysis, behavioral patterns of students were found, for example, male students have higher or lower yield against the female students and which students are going to have a good or bad yield on the final steps of the educational process. As the main result we have one of the made assumptions, \"Students who get good performance in the \"immediate posttest\" showed two of the following behaviors: few interactions in the \"intervention\", low time interacting with the system in the \"intervention\" and few misconceptions in \"pretest\"\", has proven its accuracy among the data used in this dissertation. Thus, through this research, it was concluded that the use of DAMICORE at educational context can help teacher to infer the performance of their students offering him the opportunity to perform the pedagogical interventions that help students who faces difficulties and show new challenges for those who have facilities in the subject studied.
|
3 |
Uma abordagem de mineração de dados educacionais para previsão de desempenho a partir de padrões comportamentais de autorregulação da aprendizagemRODRIGUES, Rodrigo Lins 21 December 2016 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2017-09-01T12:03:00Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
Tese_Rodrigo_Lins_Rodrigues - V0.43-FINAL-CORRIGIDA.pdf: 5476393 bytes, checksum: c893cb1720ed122fe049b35bbd11a60e (MD5) / Made available in DSpace on 2017-09-01T12:03:00Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
Tese_Rodrigo_Lins_Rodrigues - V0.43-FINAL-CORRIGIDA.pdf: 5476393 bytes, checksum: c893cb1720ed122fe049b35bbd11a60e (MD5)
Previous issue date: 2016-12-21 / O uso crescente dos sistemas de LMS, do inglês Learning Management System, tem
gerado um crescente volume de dados provenientes de interações entre professores
e alunos. Esse volume de dados, se devidamente explorado, pode fornecer o
entendimento de como os alunos autorregulam-se no desenvolver da sua
aprendizagem e as relações destas habilidades com o desempenho acadêmico.
Diante deste contexto, delimitamos o objetivo de pesquisa desta tese como sendo a
modelagem preditiva do desempenho de estudantes por meio de indicadores
comportamentais de autorregulação da aprendizagem em ambientes de LMS. O
método utilizado nesta pesquisa foi baseado na metodologia CRISP-DM, percorrendo
pelas fases de Entendimento do domínio em educação, Entendimento dos dados
educacionais, Preparação dos dados, Modelagem, Avaliação do modelo e
Implementação da solução em formato de software de visualização de dados. O
processo de modelagem foi realizado por meio de dados históricos de uma instituição
de ensino superior, armazenados durante um período de sete anos. Como resultado
da fase de modelagem, foi realizado o desenvolvimento, avaliação e comparativo
entre quatro modelos de previsão, por meio dos algoritmos de Árvore de Decisão
(CART), Regressão Logística, SVM e Naive Bayes. O modelo de regressão logística
apresentou-se como sendo o mais satisfatório, sendo capaz de predizer o
desempenho acadêmico dos estudantes, de acordo com variáveis de autorregulação
da aprendizagem, com uma taxa de acurácia de 0,893 e área sobre a curva ROC de
0,9574. Por fim, foi realizada a concepção, implementação e avaliação de uma
solução de software, para visualização de dados, capaz de fornecer indícios de
previsibilidade do desempenho do aluno a partir do seu registro comportamental
armazenado na plataforma de LMS. / The growing use of Learning Management System has generated an increasing
volume of data from interactions between teachers and students. This volume of data,
if properly explored, can provide an understanding of how students self-regulate
themselves in the development of their learning and the relationships of these skills to
academic performance. Given this context, we delimit the research objective of this
thesis as the predictive modeling of student performance through behavioral indicators
of self-regulation of learning in LMS environments. The method used in this research
was based on the CRISP-DM methodology, through the Understanding phases of the
domain in education, Understanding of educational data, Data preparation, Modeling,
Evaluation of the model and Implementation of the solution in data visualization
software format. The modeling process was performed through historical data from a
higher education institution, stored over a period of seven years. As a result of the
modeling phase, the development, evaluation, and comparison between four
prediction models were performed through the Decision Tree (CART), Logistic
Regression, SVM and Naive Bayes algorithms. The logistic regression model was the
most satisfactory, being able to predict students' academic performance, according to
self-regulated learning variables, with an accuracy rate of 0.893 and area under the
ROC curve of 0.9574. Finally, the design, implementation, and evaluation of a software
solution for data visualization were carried out, able to provide evidence of
predictability of student performance from the behavioral register stored in the LMS
platform.
|
4 |
Caracterização de alunos em ambientes de ensino online: estendendo o uso da DAMICORE para minerar dados educacionais / Characterization of students in online learning environments: extending the use of DAMICORE to educational data miningLuis Fernando de Souza Moro 04 May 2015 (has links)
Com a popularização do uso de recursos tecnológicos na educação, uma enorme quantidade de dados, relacionados às interações entre alunos e esses recursos, é armazenada. Analisar esses dados, visando caracterizar os alunos, é tarefa muito importante, uma vez que os resultados dessa análise podem auxiliar professores no processo de ensino e aprendizagem. Entretanto, devido ao fato de as ferramentas utilizadas para essa caracterização serem complexas e pouco intuitivas, os profissionais da área de ensino acabam por não utilizá-las, inviabilizando a implementação de tais ferramentas em ambientes educacionais. Dentro desse contexto, a dissertação de mestrado aqui apresentada teve como objetivo analisar os dados provenientes de um sistema tutor inteligente, o MathTutor, que disponibiliza exercícios específicos de matemática, para identificar padrões de comportamento dos alunos que interagiram com esse sistema durante um determinado período. Essa análise foi realizada por meio de um processo de Mineração de Dados Educacionais (EDM), utilizando a ferramenta DAMICORE, com o intuito de possibilitar que fossem geradas, de forma rápida e eficaz, informações úteis à caracterização dos alunos. Durante a realização dessa análise, seguiram-se algumas fases do processo de descobrimento de conhecimento em bases de dados, seleção, pré-processamento, mineração dos dados e avaliação e interpretação. Na fase de mineração de dados, foi utilizada a ferramenta DAMICORE, que encontrou padrões que foram estudados na fase de avaliação e interpretação. A partir dessa análise foram encontrados padrões comportamentais dos alunos, por exemplo, alunos do sexo masculino apresentam rendimento superior ou inferior ao de alunas do sexo feminino e quais alunos terão um bom ou mau rendimento nas etapas finais do processo de ensino. Como principal resultado temos que uma das hipóteses criadas, Alunos que obtiveram bom desempenho no pós-teste imediato apresentaram dois dos três seguintes comportamentos: poucas interações na intervenção, baixo tempo interagindo com o sistema na intervenção e poucos misconceptions no pré-teste, teve sua acurácia comprovada dentre os dados utilizados nessa pesquisa. Assim, por meio desta pesquisa concluiu-se que a utilização da DAMICORE em contexto educacional pode auxiliar o professor a inferir o desempenho dos seus alunos oferecendo a ele a oportunidade de realizar as intervenções pedagógicas que auxiliem alunos com possíveis dificuldades e apresente novos desafios para aqueles com facilidade no tema estudado / With the popularization of the use of technological resources in education, a huge amount of data, related to the interactions between students and these resources, is stored. Analyzing this data, due to characterize the students, is an important task, since the results of this analysis can help teachers on teaching and learning process. However, due to the fact that the tools used to this characterization are complex and non-intuitive, the educational professionals do not use it, invalidating the implementation of such tools at educational environments. Within this context, this master\'s dissertation aimed analyzing the prevenient data from an educational web system named MathTutor, which offers specific math exercises to identify behavioral patterns of students who interacted with this system during some period. This analysis was performed by a process known as Educational Data Mining, using the tool named DAMICORE, in order to enable quickly and effectively the construction of helpful information to the characterization of the students. During the course of this analysis, some phases of the process of knowledge discovery in databases were followed: \"selection\", \"preprocessing\", \"data mining\" and \"evaluation and interpretation\". In \"data mining\" phase, the tool DAMICORE was used to find behavioral patterns of students which were studied at the \"evaluation and interpretation\" phase. From this analysis, behavioral patterns of students were found, for example, male students have higher or lower yield against the female students and which students are going to have a good or bad yield on the final steps of the educational process. As the main result we have one of the made assumptions, \"Students who get good performance in the \"immediate posttest\" showed two of the following behaviors: few interactions in the \"intervention\", low time interacting with the system in the \"intervention\" and few misconceptions in \"pretest\"\", has proven its accuracy among the data used in this dissertation. Thus, through this research, it was concluded that the use of DAMICORE at educational context can help teacher to infer the performance of their students offering him the opportunity to perform the pedagogical interventions that help students who faces difficulties and show new challenges for those who have facilities in the subject studied.
|
5 |
Magister - Metodologia de análise de programas de educação à distância baseada em Learning AnalyticsLacerda, Ivan Max Freire de 02 March 2018 (has links)
Submitted by Automação e Estatística (sst@bczm.ufrn.br) on 2018-07-26T17:05:20Z
No. of bitstreams: 1
IvanMaxFreireDeLacerda_TESE.pdf: 3236688 bytes, checksum: f8269c0c3bdbd5a0b84b45f9f4181c93 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2018-07-26T19:49:52Z (GMT) No. of bitstreams: 1
IvanMaxFreireDeLacerda_TESE.pdf: 3236688 bytes, checksum: f8269c0c3bdbd5a0b84b45f9f4181c93 (MD5) / Made available in DSpace on 2018-07-26T19:49:52Z (GMT). No. of bitstreams: 1
IvanMaxFreireDeLacerda_TESE.pdf: 3236688 bytes, checksum: f8269c0c3bdbd5a0b84b45f9f4181c93 (MD5)
Previous issue date: 2018-03-02 / O crescente aumento dos dados registrados em cursos ofertados na modalidade a distância
proporciona a utilização de métodos computacionais adaptados a pesquisa e agrupamento
de dados educacionais, visando a descoberta de comportamentos de aprendizado.
Essa área de pesquisa possibilita o desenvolvimento de ferramentas automatizadas
de acompanhamento, predição e intervenção visando o aprimoramento dos índices educacionais.
Em virtude disso, este trabalho propõe uma metodologia para a análise de
programas de ensino a distância com base na tecnologia Learning Analytics, utilizando
os dados de acesso dos alunos ao Ambiente Virtual de Aprendizagem (AVA), identificando
os padrões sequenciais de uso mais frequentes e classificando-os de acordo com
as categorias de aprendizagem autorregulada. Para a mineração sequencial de dados sequenciais
os algoritmos SPAM e VGEN foram aplicados aos bancos de dados de duas
instituições educacionais. Além do desenvolvimento da metodologia, como resultado
desse processamento, uma grande incidência de um comportamento não previsto pela teoria
da aprendizagem autorregulada foi identificado, e para classifica-lo foi criado um
padrão chamado baixa participação. / The increasing of the data registered in courses offered in the distance modality boost
the use of computational methods adapted to the research and the grouping of educational
data, aiming to discover learning behaviors patterns. This research area allows the development
of automated monitoring, prediction and intervention tools aiming at improving
the educational indexes. As a result, this work proposes a methodology for analyzing distance
learning programs based on the Learning Analytics technology, using the students’
access data to the Learning Management System (LMS), identifying the most frequent
sequential patterns of use and classifying them as according to the self-regulated learning
categories. For a sequential mining of sequential data the SPAM and VGEN algorithms
were applied to the databases of two educational institutions. In addition to the development
of the methodology, as a result of processing, a high incidence of behavior not
predicted in the self-regulated learning theory was identified, and to classify it was created
a pattern called low participation.
|
6 |
Estudo exploratório do uso de classificadores para a predição de desempenho e abandono em universidadeMotta, Porthos Ribeiro de Albuquerque 20 October 2016 (has links)
Submitted by JÚLIO HEBER SILVA (julioheber@yahoo.com.br) on 2016-12-02T15:54:04Z
No. of bitstreams: 2
Dissertação - Porthos Ribeiro de Albuquerque Motta - 2016.pdf: 10397634 bytes, checksum: 0610600c9a91143c40d1c6d22a401524 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Jaqueline Silva (jtas29@gmail.com) on 2016-12-13T15:28:18Z (GMT) No. of bitstreams: 2
Dissertação - Porthos Ribeiro de Albuquerque Motta - 2016.pdf: 10397634 bytes, checksum: 0610600c9a91143c40d1c6d22a401524 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2016-12-13T15:28:18Z (GMT). No. of bitstreams: 2
Dissertação - Porthos Ribeiro de Albuquerque Motta - 2016.pdf: 10397634 bytes, checksum: 0610600c9a91143c40d1c6d22a401524 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2016-10-20 / Educational Data Mining, by the triad of quality improvement, cost reduction and educational
effectiveness, acts and seeks to better understand the teaching and learning process.
In this context, the aim of this work is an exploratory study of classification methods to
predict student performance and dropout from data in university academic databases. In
this study we used demographic, socio-economic and academic results, obtained from the
Vestibular and the university database to analyze several classification techniques, as well
as balancing and attribute selection techniques, identified through a systematic review of
the literature. Following a trend found in the selected articles, we chose to use decision
trees as the primary classification algorithm, although comparative studies showed better
results with logistic regression techniques and Bayesian networks. This is because decision
trees allow an analysis of the attributes used in the generated models while maintaining
acceptable levels of accuracy, while other techniques work as a black box. Through
the tests we found that you get better results using balanced sets. In this sense, the Resample
technique that selects a balanced subset of the data showed better results than SMOTE
technique that generates synthetic data for balancing the dataset. Regarding the use of
attribute selection techniques, these did not bring significant advantages. Among the attributes
used, grades and economic factors often appear as nodes in the generated models.
An attempt to predict performance for each subject based on data from previous courses
was less successful, maybe because of the use of ternary predictive classes. Nevertheless,
the analysis carried out showed that the use of classifiers is a promising way to predict
performance and dropout, but further studies are still needed. / A Mineração de Dados Educacionais, por meio da tríade melhoria da qualidade, redução
do custo e eficácia do ensino, age e procura compreender melhor o processo de ensinoaprendizagem
dos alunos. Neste contexto, o objetivo desta dissertação é o estudo exploratório
de métodos de classificação para predizer o desempenho e o abandono de alunos a
partir de dados existentes nas bases de dados acadêmicas das universidades. Neste trabalho
foram usados dados demográficos, sócio-econômicos e resultados acadêmicos, oriundos
do Vestibular e do banco de dados acadêmico da universidade para analisar diversas
técnicas de classificação, assim como técnicas de balanceamento e seleção de atributos
identificadas através de uma revisão sistemática da literatura. Seguindo uma tendência
verificada nos artigos levantados, optou-se por utilizar como principal algoritmo de classificação
o J48, apesar de estudos comparativos terem mostrado melhores resultados com
técnicas de regressão logística e redes Bayesianas. Isto se deve ao fato das árvores de
decisão permitirem uma análise dos atributos usados nos modelos gerados, mantendo ní-
veis de acurácia aceitáveis, enquanto as outras técnicas funcionam como uma caixa preta.
Neste sentido, a técnica de Resample, que escolhe um subconjunto balanceado dos dados,
apresentou melhores resultados que a técnica de SMOTE, que gera dados sintéticos
para balancear os dados. Quanto ao uso de técnicas de seleção de atributos, estas não
trouxeram vantagens significativas. Dentre os atributos usados, notas e aspectos econômicos
aparecem com frequência nos modelos gerados. Uma tentativa de prever desempenho
por disciplina, com base em dados de disciplinas já cursadas em semestres anteriores foi
menos bem sucedida, talvez pelo fato de usar classes preditoras ternárias. Apesar disto,
as análises realizadas mostraram que o uso de classificadores é um caminho promissor
para a predição de desempenho e abandono, mas estudos mais aprofundados ainda são
necessários
|
7 |
Mineração de dados aplicada à classificação do risco de evasão de discentes ingressantes em instituições federais de ensino superiorAMARAL, Marcelo Gomes do 08 July 2016 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2017-07-11T14:35:16Z
No. of bitstreams: 3
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
projeto_v26016.pdf: 1271790 bytes, checksum: f724d8523f2ffdb11ce599aff1eb8eb6 (MD5)
projeto_v26016.pdf: 1271790 bytes, checksum: f724d8523f2ffdb11ce599aff1eb8eb6 (MD5) / Made available in DSpace on 2017-07-11T14:35:16Z (GMT). No. of bitstreams: 3
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
projeto_v26016.pdf: 1271790 bytes, checksum: f724d8523f2ffdb11ce599aff1eb8eb6 (MD5)
projeto_v26016.pdf: 1271790 bytes, checksum: f724d8523f2ffdb11ce599aff1eb8eb6 (MD5)
Previous issue date: 2016-07-08 / As Instituições Federais de Ensino Superior (IFES) possuem um
importante papel no desenvolvimento social e econômico do país, contribuindo
para o avanço tecnológico e cientifico e fomentando investimentos. Nesse
sentido, entende-se que um melhor aproveitamento dos recursos educacionais
ofertados pelas IFES contribui para a evolução da educação superior, como um
todo. Uma maneira eficaz de atender esta necessidade é analisar o perfil dos
estudantes ingressos e procurar prever, com antecedência, casos indesejáveis
de evasão que, quanto mais cedo identificados, melhor poderão ser estudados
e tratados pela administração. Neste trabalho, propõe-se a definição de uma
abordagem para aplicação de técnicas diretas de Mineração de Dados
objetivando a classificação dos discentes ingressos de acordo com o risco de
evasão que apresentam. Como prova de conceito, a análise dos aspectos
inerentes ao processo de Mineração de Dados proposto se deu por meio de
experimentações conduzidas no ambiente da Universidade Federal de
Pernambuco (UFPE). Para alguns dos algoritmos classificadores, foi possível
obter uma acurácia de classificação de 73,9%, utilizando apenas dados
socioeconômicos disponíveis quando do ingresso do discente na instituição,
sem a utilização de nenhum dado dependente do histórico acadêmico. / The Brazilian's Federal Institutions of Higher Education have an
important role in the social and economic development of the country,
contributing to the technological and scientific advances and encouraging
investments. Therefore, it is possible to infer that a better use of the educational
resources offered by those institutions contributes to the evolution of higher
education as a whole. An effective way to meet this need is to analyze the
profile of the freshmen students and try to predict, as soon as possible,
undesirable cases of dropout that when earlier identified can be examined and
addressed by the institution's administration. This work propose the
development of a approach for direct application of Data Mining techniques to
classify newcomer students according to their dropout risk. As a viability proof,
the proposed Data Mining approach was evaluated through experimentations
conducted in the Federal University of Pernambuco. Some of the classification
algorithms tested had an classification accuracy of 73.9% using only
socioeconomic data available since the student's admission to the institution,
without the use of any academic related data.
|
8 |
Definição de um modelo de referência de dados educacionais para a descoberta de conhecimento / Definition of an educational data reference model for knowledge discoveryBorges, Vanessa Araujo 04 October 2017 (has links)
Sistemas educacionais possuem diversas funcionalidades capazes de apoiar a interação entre alunos e professores de maneira dinâmica, síncrona e assíncrona. Uma das formas de monitorar a eficácia do processo educacional e por meio da utilização dos dados armazenados nesses sistemas como fonte de informação. Pesquisas em Learning Analytics, Academic Analytics e Mineração de Dados Educacionais, buscam explorar os dados de sistemas educacionais utilizando processamento analítico e técnicas de mineração de dados. No entanto, há uma serie de fatores que dificultam a gestão eficiente do processo educacional a partir dos dados de sistemas educacionais. A transformação de dados provenientes de diferentes tipos de sistemas educacionais, como Sistemas de Gestão de Aprendizagem e Sistemas Acadêmicos, e uma tarefa complexa devido a natureza heterogênea dos dados. Dados provenientes desses sistemas podem ser analisados considerando diferentes stakeholders, sob varias perspectivas e níveis de granularidade. Neste cenário, um modelo de referência para a descoberta de conhecimento a partir de dados de sistemas educacionais, denominado Modelo de Referência de Dados Educacionais (EDRM), foi desenvolvido neste trabalho. O EDRM e um modelo dimensional no formato star schema, estruturado em um Data Warehouse, projetado para ser uma fonte única de dados integrados e correlacionados voltada a tomada de decisão. Assim, e possível armazenar dados de diversas fontes, combina-los e, por fim, realizar analises que levem as instituições a desenvolver uma melhor compreensão, rastrear tendências e descobrir lacunas e ineficiências acerca do processo educacional. Neste trabalho, o EDRM foi validado por meio de um estudo de caso, utilizando bases de dados reais coletadas de diferentes sistemas educacionais. Os resultados mostram que o EDRM e eficiente em tarefas com diferentes objetivos, utilizando processamento analítico e mineração de dados. / Educational systems support dynamic, synchronous and asynchronous interaction between students and educators. Researches in Learning Analytics, Academic Analytics and Educational Data Mining explore data from educational systems for knowledge discovery through analytical processing, statistical analysis and data mining. However, there are some factors that hinder an efficient management of the educational process. The transformation of data from different kinds of educational system, as Learning Management Systems and Student Information Systems, can be even more difficult due to data heterogeneity. Data from these systems can be analyzed considering different stakeholders, under different perspectives and under different granularities. Motivated by this scenario, in this work we propose Modelo de Referência de Dados Educacionais (EDRM), a reference data model for knowledge discovery in data from educational systems. EDRM is an analytical model structured under a Data Warehouse architecture following a multidimensional data model. EDRM is projected for being an resource of integrated and correlated data focused in decision taking in the educational process. EDRM was developed considering a deep analysis of data and functionalities from different educational systems. In this sense, data from different kinds of systems and sources can be used unified, integrated and consistently. This allows institutions to better comprehend their data, as well as discover patterns, gaps and inefficiencies about their educational process. In this work, EDRM was validated in a case study using real-world databases from different educational systems. The results indicate that EDRM is efficient in tasks with different objectives, using Learning Analytics and Educational Data Mining techniques, and analyzing different perspectives.
|
9 |
TRILUA: um ambiente gamificado para apoio ao ensino de lógica de programaçãoSilva, Sandro José Ribeiro da 03 November 2016 (has links)
Submitted by Silvana Teresinha Dornelles Studzinski (sstudzinski) on 2017-03-03T16:51:21Z
No. of bitstreams: 1
Sandro José Ribeiro da Silva_.pdf: 1958508 bytes, checksum: 927c5b673859ca465e35998f946b5a64 (MD5) / Made available in DSpace on 2017-03-03T16:51:21Z (GMT). No. of bitstreams: 1
Sandro José Ribeiro da Silva_.pdf: 1958508 bytes, checksum: 927c5b673859ca465e35998f946b5a64 (MD5)
Previous issue date: 2016-11-03 / Nenhuma / O desenvolvimento de habilidades de programação de sistemas computacionais é uma necessidade crescente, devido ao amplo uso de recursos computacionais nas mais diversas áreas. Ao mesmo tempo, é conhecida a deficiência existente quanto à quantidade de profissionais sendo graduados nesta área. Alguns estudos indicam dificuldades dos estudantes e ao mesmo tempo falta de metodologias adequadas como possíveis elementos contribuindo para este contexto, corroborando a necessidade de desenvolvimento de pesquisas sobre o aprendizado de linguagens de programação. Entre as possíveis soluções para este problema de motivação, o desenvolvimento de um ambiente gamificado como ferramenta de ensino para linguagens de programação vem sendo explorado em projetos de pesquisa e também em opções comerciais. Uma das deficiências observadas nestas inciativas é justamente a falta de suporte aos professores para acompanhamento da evolução dos alunos. Buscando atender esta necessidade, o presente trabalho propõe um ambiente de apoio ao ensino de lógica de programação cujo diferencial é a inclusão de recursos de análise do comportamento dos alunos, voltados para o apoio ao professor. Desta forma, o trabalho proposto alia aos jogos eletrônicos o monitoramento on-line de suas etapas, através do uso de técnicas de mineração de dados educacionais. Com base em um framework para Gamificação, foi definido e desenvolvido um ambiente Web para ensino da linguagem Lua, com aspectos de Gamificação e Mineração de Dados Educacionais. Este ambiente foi utilizado em avaliações com alunos do ensino técnico, tendo sido observados resultados promissores nos aspectos motivacionais. As avaliações envolvendo a identificação de vantagens geradas para os professores com uso dos dados sobre o comportamento dos alunos também foram positivas e indicam um bom potencial para esta abordagem. / The development of computer systems programming skills is a growing necessity, due to the wide use of computational resources in different areas. At the same time, it is known the deficiency with respect to the amount of professionals being graduated in this area. Some studies indicates difficulties of students and lack of adequate methodologies as possible elements contributing to this context, supporting the need to develop research on learning programming languages. As a possible solution to this problem of motivation, the development of a gamified environment as a teaching tool for programming languages is being explored in research projects and also commercial options. One of the deficiencies observed in these initiatives is precisely the lack of support to teachers to follow up of the evolution of students, which consists in one of the differentials of the proposed work. In this way, the work integrates to electronic games the online monitoring through the use of educational data mining techniques. Based on the framework for gamification, has been defined and developed a web environment to the Lua language teaching, with aspects of gamification and education data mining. This environment has already been tested preliminarily with technical education students, being observed promising results. A new stage of development and testing is foreseen to deepening the identification of advantages generated for teachers with the use data on the behavior of students.
|
10 |
Uma ferramenta para recomendação pedagógica em mineração de dados educacionais / A tool for pedagogical recommendation on educational data miningPaiva, Ranilson Oscar Araújo 30 June 2013 (has links)
This work is about the creation of a tool for pedagogical recommendation which objective is to provide teachers, from web-based courses, personalized pedagogical recommendations generated based on the mining results of their students’ educational data. In order to guide this creation, we propose the Pedagogical Recommendation Process that counts on the coordinated work and cooperation of the Human Intelligence (domain specialists) and the Artificial Intelligence (computational tools). The process is constituted of four steps that occur in a sequential and cyclic way, starting with “Detect Practices”, where we detect if there are actions affecting the teaching and learning process. Is the next step, “Discover Patterns”, we use educational data mining techniques, based on predefined mining scenarios, to find patterns with pedagogical significance for the practices detected. In the following step, “Recommend”, it is where appropriate recommendations are offered, given the students’ current pedagogical situation. Finally, the “Monitor and Evaluate” step, where it is analyzed whether the students were positively affected by the recommendations and if they were relevant. The proposed tool was used in a case study with real data provided by a Spanish language course with 200 students enrolled, who produced more than 700 megabytes of information contained in, approximately, 1220000 triples. As results we were able to detected practices and the patterns associated to them, which were used to create recommendations, evaluated (relevance) by specialists in the educational/pedagogical domain and made available for the final users (teachers) to suggest them to their students. / A presente dissertação trata da criação de uma ferramenta para a recomendação pedagógica cujo objetivo é prover aos professores de cursos baseados na web, recomendações pedagógicas personalizadas geradas com base nos resultados da Mineração dos Dados Educacionais de seus alunos. Para orientar essa criação propomos o Processo de Recomendação Pedagógica, o qual conta com o trabalho conjunto e coordenado da Inteligência Humana (especialistas nos domínios envolvidos) e da Inteligência Artificial (ferramentas computacionais). O processo é constituído de quatro etapas que ocorrem de forma cíclica e sequencial, iniciando com “Detectar Práticas”, onde detectamos se existem ações afetando o processo de ensino e aprendizagem. Na etapa seguinte, “Descobrir Padrões”, utilizamos as técnicas de Mineração de Dados Educacionais, por meio de Cenários de Mineração predefinidos, para encontrar padrões de interesse pedagógico acerca das práticas detectadas. Na próxima etapa, “Recomendar”, são oferecidas recomendações apropriadas a atual situação pedagógica do aluno. Finalmente a etapa “Monitorar e Avaliar”, onde acompanhamos e analisamos se os alunos foram afetados positivamente pelas recomendações e se estas foram relevantes. A ferramenta de recomendação proposta foi utilizada em um estudo de caso, com dados reais provenientes de um curso de língua Espanhola com 200 alunos que produziram mais de 700 megabytes de informações dispostas em, aproximadamente, 1220000 triplas. Como resultados, fomos capazes de detectar práticas e os padrões associados a elas, que foram utilizados na criação de recomendações, avaliadas (relevância) por especialistas no domínio educacional/pedagógico, e disponibilizadas para que os usuários finais (professores) as ofereçam a seus alunos.
|
Page generated in 0.1199 seconds