1 |
Imputação de dados faltantes via algoritmo EM e rede neural MLP com o método de estimativa de máxima verossimilhança para aumentar a acurácia das estimativasRibeiro, Elisalvo Alves 14 August 2015 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Database with missing values it is an occurrence often found in the real world, beiging of this problem caused by several reasons (equipment failure that transmits and stores the data, handler failure, failure who provides information, etc.). This may make the data inconsistent and unable to be analyzed, leading to very skewed conclusions. This dissertation aims to explore the use of Multilayer Perceptron Artificial Neural Network (ANN MLP), with new activation functions, considering two approaches (single imputation and multiple imputation). First, we propose the use of Maximum Likelihood Estimation Method (MLE) in each network neuron activation function, against the approach currently used, which is without the use of such a method or when is used only in the cost function (network output). It is then analyzed the results of these approaches compared with the Expectation Maximization algorithm (EM) is that the state of the art to treat missing data. The results indicate that when using the Artificial Neural Network MLP with Maximum Likelihood Estimation Method, both in all neurons and only in the output function, lead the an imputation with lower error. These experimental results, evaluated by metrics such as MAE (Mean Absolute Error) and RMSE (Root Mean Square Error), showed that the better results in most experiments occured when using the MLP RNA addressed in this dissertation to single imputation and multiple. / Base de dados com valores faltantes é uma ocorrência frequentemente encontrada no mundo real, sendo as causas deste problema são originadas por motivos diversos (falha no equipamento que transmite e armazena os dados, falha do manipulador, falha de quem fornece a informação, etc.). Tal situação pode tornar os dados inconsistentes e inaptos de serem analisados, conduzindo às conclusões muito enviesadas. Esta dissertação tem como objetivo explorar o emprego de Redes Neurais Artificiais Multilayer Perceptron (RNA MLP), com novas funções de ativação, considerando duas abordagens (imputação única e imputação múltipla). Primeiramente, é proposto o uso do Método de Estimativa de Máxima Verossimilhança (EMV) na função de ativação de cada neurônio da rede, em contrapartida à abordagem utilizada atualmente, que é sem o uso de tal método, ou quando o utiliza é apenas na função de custo (na saída da rede). Em seguida, são analisados os resultados destas abordagens em comparação com o algoritmo Expectation Maximization (EM) que é o estado da arte para tratar dados faltantes. Os resultados obtidos indicam que ao utilizar a Rede Neural Artificial MLP com o Método de Estimativa de Máxima Verossimilhança, tanto em todos os neurônios como apenas na função de saída, conduzem a uma imputação com menor erro. Os resultados experimentais foram avaliados via algumas métricas, sendo as principais o MAE (Mean Absolute Error) e RMSE (Root Mean Square Error), as quais apresentaram melhores resultados na maioria dos experimentos quando se utiliza a RNA MLP abordada neste trabalho para fazer imputação única e múltipla.
|
2 |
Avaliação educacional : um olhar matemáticoFugita, Felipe January 2018 (has links)
Orientador: Prof. Dr. Daniel Miranda Machado / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Mestrado Profissional em Matemática em Rede Nacional - PROFMAT, Santo André, 2017. / Um dos objetivos desse trabalho é explicar a Teoria de Resposta ao Item, conhecida como TRI,
enfatizando o modelo logístico de três parâmetros e descrevendo suas principais características.
Outro objetivo é mostrar como o professor pode utilizar ferramentas estatísticas, em uma
planilha eletrônica, para: verificar a qualidade das questões que compõe sua prova; analisar
se existe uma correlação entre dois instrumentos de avaliação; utilizar a média escolar de um
aluno para inferir sobre o seu desempenho no vestibular; entre outras possibilidades.
Com a finalidade de explicar a TRI e seu método de estimação de parâmetros por Máxima
Verossimilhança, são apresentados previamente os modelos Matemáticos, Probabilísticos
e Estatísticos, pilares dessa teoria. Além disso, é descrito como os programas de avaliações
educacionais em larga escala de diversos países utilizam a TRI para monitorar o desempenho
de seus sistemas educacionais. Em seguida, são expostas algumas ferramentas Estatísticas, em
específico, o coeficiente de correlação, o método de mínimos quadrados e o ponto bisserial que
podem colaborar nos processos de avaliações educacionais que fazem parte da rotina escolar.
São ilustrados também exemplos de planilhas eletrônicas com a descrição passo a passo de
sua construção e dos comandos utilizados.
Desse modo, espera-se contribuir para compreensão da TRI e, consequentemente, dos indicativos
educacionais produzidos pelos programas de avaliações em larga escala, bem como,
para atuação e reflexão da prática docente em seus métodos de avaliação educacional. / One of the goals of this work is to explain Item Response Theory, known as IRT, emphasizing
the Three-Parameter Logistic model and describing its main characteristics. Another objective
is to demonstrate how educators can use statistical tools within a spreadsheet to: verify
the quality and reliability of test questions; examine whether there is a correlation between
two assessment tools; use the school average of a student to predict his or her performance in
entrance examinations; among other possibilities. To explain IRT and its method of parameter
estimation by maximum likelihood, this work presents the mathematical, probabilistic and
statistical models that are the pillars of the theory. It also describes how the large-scale educational
assessment programs of various countries use IRT to monitor the performance of their
education systems. Then, this work presents a selection of statistical tools, specifically, the
correlation coefficient, the least squares method and the point biserial correlation, which could
contribute to the process of routine educational assessments. Also provided are illustrated
examples of spreadsheets with step-by- step descriptions of their creation and the commands
used. Thus, the work hopes to contribute to the understanding of IRT and, consequently, of
the educational indicators produced by large-scale assessment programs, as well as benefit
educators in their practice and reflection on methods of educational evaluation.
|
Page generated in 0.0312 seconds