Return to search

Classificação de intoxicação alcoólica por sinais de voz e algoritmos genéticos / Classification of alcohol intoxication by speech signals and genetic algorithms

Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2016. / Submitted by Fernanda Percia França (fernandafranca@bce.unb.br) on 2017-02-14T19:19:29Z
No. of bitstreams: 1
2016_GleisonMarquesLemosLeoni.pdf: 3276048 bytes, checksum: 8caf692b3c21c85ac800243642b3aeb7 (MD5) / Approved for entry into archive by Raquel Viana(raquelviana@bce.unb.br) on 2017-03-14T20:44:52Z (GMT) No. of bitstreams: 1
2016_GleisonMarquesLemosLeoni.pdf: 3276048 bytes, checksum: 8caf692b3c21c85ac800243642b3aeb7 (MD5) / Made available in DSpace on 2017-03-14T20:44:52Z (GMT). No. of bitstreams: 1
2016_GleisonMarquesLemosLeoni.pdf: 3276048 bytes, checksum: 8caf692b3c21c85ac800243642b3aeb7 (MD5) / Dados oficiais apontam que a intoxicação alcoólica se encontra entre as maiores causas de mortes no trânsito. A sociedade brasileira clama por uma solução, pois assiste, dia após dia, o aumento do número de acidentes envolvendo motoristas alcoolizados e/ou entorpecidos por outras drogas. O governo responde à sociedade endurecendo normativos legais e realizando campanhas de conscientização. Atualmente, o nível de alcoolemia de um motorista é obtido por meio de exame sanguí- neo ou por meio de etilômetros. A proposta deste trabalho é desenvolver um modelo, baseado em análise espectral, para possibilitar a indicação da alcoolização de uma pessoa embriagada por meio de sua fala. Sabe-se que o álcool é uma droga depressora, que atua no sistema nervoso central provocando mudanças comportamentais do indivíduo alcoolizado e efeitos físicos pela ação direta em parte do trato vocal. O resultado das sensações física e psicomotora no indivíduo embriagado traz ao ouvinte de seu discurso a impressão de escutar uma voz mais ruidosa. Esta sensação é percebida por técnicas de análise espectral. Neste trabalho foi realizada a análise espectral de tempo curto das falas de pessoas embriagadas e sóbrias por meio de GFCC (Gammatone Frequency Cepstral Coefficients). As características geradas foram selecionadas por um Algoritmo Genético (AG) com uma função de avaliação implementada com Regressão Logística. O objetivo do AG era alcançar a maior taxa de classificação com a menor quantidade de características espectrais possível. A técnica obteve taxas de classificação equivalente a 81,18% quando avaliados por meio de validação cruzada LOO (Leave One Out) e conseguiu reduzir as caraterísticas de entrada em mais de 90%. Foi também realizada a extração de características por meio de RFE (Recursive Feature Elimination). Por tal metodologia, alcançou-se uma taxa de classificação equivalente a 85,49%, tendo selecionado, contudo, 98 características. Na comunidade científica não foram encontrados estudos de classificação de vozes intoxicadas pelo álcool utilizando algoritmos genéticos nem GFCC. Além disso, as taxas de classificação alcançadas neste trabalho superam pesquisas anteriores que utilizaram somente características cepstrais da voz para realizar a classificação de falas intoxicadas pelo álcool. / Official data indicate that alcohol intoxication is currently among the leading causes of deaths in traffic. Brazilian society is clamoring for a solution, as it witnesses, day after day, the increase in the number of accidents involving drivers who are drunk and / or numb by other drugs. The government responds to society by hardening legal norms and conducting awareness campaigns. At present, the level of a driver’s blood alcohol content is obtained by blood test or by means of breathalyzer. The purpose of this work is to develop a model, based on spectral analysis, to enable the indication of the alcoholization of a drunk person through his speech. It is known that alcohol is a depressant drug, which acts on the central nervous system causing behavioral changes of the alcoholic individual and physical effects by direct action in part of the vocal tract. The result of the physical and psychomotor sensation in the drunk individual brings to the listener of his speech the impression of hearing a noisy voice. This sensation is perceived by spectral analysis techniques. In this work, the short-time spectral analysis of the speeches of intoxicated and sober people by GFCC (Gammatone Frequency Cepstral Coefficient) was performed. The generated features were selected by a Genetic Algorithm (AG) with an evaluation function implemented with Logistic Regression. The goal of GA was to achieve the highest classification rate with the least amount of spectral features possible. The technique obtained classification rates equivalent to 81.18% when evaluated through LOO cross-validation (Leave One Out) and managed to reduce input features by more than 90%. Feature extraction was also performed by RFE (Recursive Feature Elimination). By such methodology, a classification rate equivalent to 85.49% was reached, having, however, selected 98 characteristics. In the scientific community, no classification studies of alcohol intoxicated speeches were found using genetic algorithms or GFCC. In addition, the classification rates achieved in this study surpass previous studies that only used cepstral features of the speech to perform the classification of speech intoxicated by alcohol.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unb.br:10482/22911
Date13 December 2016
CreatorsLeoni, Gleison Marques Lemos
ContributorsBorges, Díbio Leandro
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UnB, instname:Universidade de Brasília, instacron:UNB
RightsA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data., info:eu-repo/semantics/openAccess

Page generated in 0.0047 seconds