Return to search

Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina / Data prediction in populational surveys using machine learning techniques

Submitted by Aline Batista (alinehb.ufpel@gmail.com) on 2018-04-19T14:07:40Z
No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertacao_Leonardo_Ferreira.pdf: 1173663 bytes, checksum: 384c6abb1e58fbe7d32878fbb1484979 (MD5) / Approved for entry into archive by Aline Batista (alinehb.ufpel@gmail.com) on 2018-04-19T14:45:26Z (GMT) No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertacao_Leonardo_Ferreira.pdf: 1173663 bytes, checksum: 384c6abb1e58fbe7d32878fbb1484979 (MD5) / Made available in DSpace on 2018-04-19T14:45:34Z (GMT). No. of bitstreams: 2
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Dissertacao_Leonardo_Ferreira.pdf: 1173663 bytes, checksum: 384c6abb1e58fbe7d32878fbb1484979 (MD5)
Previous issue date: 2018-02-06 / Sem bolsa / O monitoramento do desenvolvimento dos indicadores de saúde e nutrição dos países depende de dados precisos e completos. Países de baixa e média renda dependem de inquéritos populacionais para tomada de decisões, já que seus sistemas de informação ainda são precários. Estes indicadores são desfechos de saúde que indicam a situação de uma intervenção, comportamento ou cuidado de saúde materno-infantil. Apesar de serem ótimas fontes de informação, os inquéritos populacionais também possuem informações incompletas que podem inviabilizar a construção destes indicadores de forma padronizada. O aprendizado de máquina surge como uma alternativa para completar estas lacunas existentes nos inquéritos com base em características sociodemográficas e preditores relacionados. Este trabalho avalia o desempenho de quatro técnicas de aprendizado de máquina (redes neurais, árvores de decisão, KNN e XGB) nesta tarefa, observando o comportamento de dois desfechos de saúde em quatro amostras diferentes. Os resultados apontam para a existência de uma grande variação no desempenho de acordo com o desfecho selecionado. A disponibilidade dos mesmos indicadores como preditores também é um desafio enfrentado. As técnicas de aprendizado de máquina estudadas apresentaram pouca variação de desempenho entre elas, o que sugere que a natureza dos dados é um fator determinante neste tipo de aplicação. Contudo, o primeiro desfecho apresentou resultados aceitáveis para uma aplicação prática, enquanto o segundo desfecho atingiu estimativas inferiores ao que especialistas consideram como um desempenho razoável. / Monitoring the development of countries’ health and nutrition indicators rely on accurate and complete data. Low-and middle-income countries depend on populational surveys for decision-making since their information systems are still unreliable. These indicators are health outcomes which point out the status of a maternal and child health intervention, behavior or care. Despite being great sources of information, the populational surveys also lack information which could prevent the creation of these standardized indicators. Machine learning arise as an alternative to fill the gaps found in the surveys based on sociodemographic characteristics and related predictors. This work evaluates the performance of four machine learning techniques (neural networks, decision trees, KNN and XGB) in this task by observing the behavior of two health outcomes in four different samples. The results indicate that a great variation can be found depending on the selected outcome. The availability of those indicators as predictors is also a challenge. The studied machine learning techniques presented a small performance variation between themselves which suggests that the nature of the data is determinant to this kind of application. Still, the first outcomes showed acceptable results for a practical application while the second outcome reached lower estimates compared to those which specialists consider as a reasonable performance.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufpel.edu.br:prefix/3848
Date06 February 2018
CreatorsFerreira, Leonardo Zanini
Contributorshttp://lattes.cnpq.br/1544604888519188, Fleischmann, Ana Marilza Pernas, Araújo, Ricardo Matsumura de
PublisherUniversidade Federal de Pelotas, Programa de Pós-Graduação em Computação, UFPel, Brasil, Centro de Desenvolvimento Tecnológico
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFPEL, instname:Universidade Federal de Pelotas, instacron:UFPEL
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0115 seconds