Return to search

Análise de surtos de doenças transmitidas pelo mosquito Aedes aegypti utilizando Big-Data Analytics e mensagens do Twitter

Orientador: Prof. Dr. Filipe Ieda Fazanaro / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Engenharia da Informação, 2017. / O uso do big-data aliado a técnicas de mineração de textos vem crescendo a cada ano em
diversas áreas da ciência, especialmente na área da saúde, na medicina de precisão, em
prontuários eletrônicos entre outros. A motivação desse trabalho parte da hipótese de que
é possível usar conceitos de big-data para analisar grandes quantidades de dados sobre
as doenças da dengue, chikungunya e zika vírus, para monitorar e antecipar informações
sobre possíveis surtos dessas doenças. Entretanto, a análise de grandes volumes de dados
- inerente ao estudo em big-data - possui desafios, particularmente, devido à falta de
escalabilidade dos algoritmos e à complexidade do gerenciamento dos mais diferentes tipos
e estruturas dos dados envolvidos. O principal objetivo desse trabalho é apresentar uma
implementação de técnicas de mineração de textos, em especial, aqueles oriundos de redes
sociais, tais como o Twitter, aliadas à abordagem de análises em big-data e aprendizado de
máquina, para monitorar a incidência das doenças da dengue, chikungunya e zika vírus,
todas transmitidas pelo mosquito Aedes aegypti. Os resultados obtidos indicam que a
implementação realizada, baseado na junção dos algoritmos de aprendizado de máquina
K-Means e SVM, teve rendimento satisfatório para a amostra utilizada em comparação
aos registros do Ministério da Saúde, indicando, assim, um potencial para utilização do seu
propósito. Observa-se que a principal vantagem das análises em big-data está relacionada
à possibilidade de empregar dados não estruturados os quais são obtidos em redes sociais,
sites de e-commerce, dentre outros. Nesse sentido, dados que antes pareciam, de certo
modo, de pouca importância, passam a ter grande potencial e relevância. / The use of the big-data allied to techniques of text mining has been growing every year
in several areas of science, especially in the area of health, precision medicine, electronic
medical records among others. The motivation from this work, is based on the hypothesis
that it is possible to use big-data concepts to analyze large volumes of data about the
dengue disease, chikungunya and zika virus, to monitor and anticipate information about
possible outbreaks for diseases. However, the analysis of large volumes of data - inherent
in the big-data study - has some challenges, particularly due to the lack of scalability of
the algorithms and the complexity of managing the most different types and structures
of the data involved. The main objective of this work is to present the implementation
of text mining techniques - especially from social networks such as Twitter - allies to the
approach of big-data and machine-learned analyzes to monitor the incidence of Dengue,
Chikungunya and Zika virus, all transmissions by the mosquito Aedes aegypti. The results
obtained indicate that the implementation made based on the combination of machine
learning algorithms, K-Means and SVM, got a satisfactory yield for a sample used, if
compared the publications of the records of the Ministry of Health, thus indicating a
potential for the purpose. It is observed that a main advantage of the big-data analyzes is
related to the possibility of employing unstructured data, e-commerce sites, among others.
In this sense, data that once seemed, in a way, of little importance, have great potential
and relevance.

Identiferoai:union.ndltd.org:IBICT/oai:BDTD:106910
Date January 2017
CreatorsCarlos, Marcelo Aparecido
ContributorsFazanaro, Filipe Ieda, Nogueira, Marcelo, Suyama, Ricardo
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf, 88 f. : il.
Sourcereponame:Repositório Institucional da UFABC, instname:Universidade Federal do ABC, instacron:UFABC
Rightsinfo:eu-repo/semantics/openAccess
Relationhttp://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106910&midiaext=74800, http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106910&midiaext=74801, Cover: http://biblioteca.ufabc.edu.brphp/capa.php?obra=106910

Page generated in 0.0094 seconds