Return to search

Classificação de issues obtidas de repositórios de software: uma abordagem baseada em características textuais

A classificação das issues ou questões nos repositórios de manutenção de software é
realizada atualmente pelos desenvolvedores de software. Entretanto, essa classificação
manual não é livre de erros, os quais geram problemas na distribuição das issues para as
equipes de tratamento. Isso acontece porque os desenvolvedores, geralmente os propositores
das issues, possuem o mal hábito de classificá-las como bugs. Essas classificações
errôneas produzem a distribuição de issues para uma equipe de tratamento de outro
tipo de issue, gerando retrabalho para as equipes entre outras desvantagens. Por isso,
o principal objetivo almejado com o estudo é a melhoria dessa classificação, utilizando
de uma abordagem de classificação das issues realizada de maneira automatizada. Essa
abordagem foi implementada com técnicas de Aprendizado de Máquina. Estas técnicas
mostram que as palavras-chave discriminantes dos tipos de issues podem ser utilizadas
como atributos de classificadores automáticos para a predição dessas issues. A abordagem
foi avaliada sobre 5 projetos open source extraídos de 2 issue trackers conhecidos,
Jira e Bugzilla. Por se tratarem de issue trackers de longa data, os projetos escolhidos
forneceram boa quantidade de issues para este estudo. Essas issues, cerca de 7000, foram
classificadas por especialistas humanos no trabalho [Herzig, Just e Zeller 2013], produzindo
um gabarito utilizado para a realização deste estudo. Este trabalho produziu um
classificador automático de issues, com acurácia de 81%, capaz de discriminá-las nos tipos
bug, request for enhancement e improvement. O bom resultado de acurácia sugere que
o classificador concebido possa ser utilizado em sistemas de encaminhamento de issues
para as equipes de tratamento, com a Ąnalidade de diminuir retrabalho dessas equipes
que ocorre em virtude da má classificação. / The classification of issues in software maintenance repositories is currently done by software developers. However, this classification is conducted manually and is not free of errors, which cause problems in the distribution of issues to the maintenance teams. This happen because the developers, which usually are the proponents of the issues, have the bad habit of classifying them as bugs. This erroneous rating generates rework and other disadvantages to the teams. Therefore, the main objective of this study is to improve this classification, using an issue classification approach conducted in an automated manner. In turn, this approach was implemented based on machine learning tecniques. These tecniques show that keywords discriminant of issues types can be used as attributes of automatic classifiers for prediction of these issues. The approach was evaluated on five open source projects extracted from two widely used issue trackers, Jira and Bugzilla. Because they are old issue trackers, the chosen projects provided good number of issues for this study. These issues, about 7.000, were classified by human experts at work [Herzig, Just e Zeller 2013], producing a feedback which was used for this study. This present work produced an automatic issues classifier, with 81% of accuracy, able to predict them in types of bug, request for enhancement and improvement. The result of accuracy obtained by this classifier suggests that it can be used in delivery systems to treatment teams with the purpose of reducing rework that occurs in these teams because of the poor issues rating. / Dissertação (Mestrado)

Identiferoai:union.ndltd.org:IBICT/urn:repox.ist.utl.pt:RI_UFU:oai:repositorio.ufu.br:123456789/18130
Date16 September 2015
CreatorsFerreira, Tarcísio Martins
ContributorsMaia, Marcelo de Almeida, Costa, Heitor Augustus Xavier, Matias Júnior, Rivalino
PublisherUniversidade Federal de Uberlândia, Programa de Pós-graduação em Ciência da Computação, Brasil
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFU, instname:Universidade Federal de Uberlândia, instacron:UFU
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0027 seconds