Return to search

Automatic decomposition of code review changesets in open source software projects.

Submitted by Maria Medeiros (maria.dilva1@ufcg.edu.br) on 2018-05-22T11:23:25Z
No. of bitstreams: 1
VICTOR DA CUNHA LUNA FREIRE - DISSERTAÇÃO (PPGCC) 2016.pdf: 1754894 bytes, checksum: 909db10b5000214961d54e54bebb5038 (MD5) / Made available in DSpace on 2018-05-22T11:23:25Z (GMT). No. of bitstreams: 1
VICTOR DA CUNHA LUNA FREIRE - DISSERTAÇÃO (PPGCC) 2016.pdf: 1754894 bytes, checksum: 909db10b5000214961d54e54bebb5038 (MD5)
Previous issue date: 2016 / Capes / Revisão de código é uma atividade amplamente utilizada para garantia da qualidade de código-fonte. Como uma típica atividade de revisão, revisão de código depende fortemente da habilidade dos desenvolvedores de entenderem o código sendo revisado. Como consequência, a presença de conjuntos de mudanças grandes contendo várias modificações independentes (e.g. consertos de bugs, refatoramentos, adições de funcionalidades, etc) pode afetar negativamente a eficácia da revisão de código. Para lidar com esse problema, Barnett et al. desenvolveram ClusterChanges — uma técnica de análise estática leve para decompor conjuntos de mudanças em partições diferentes que podem ser revisadas independentementes. Eles descobriram que ClusterChanges pode, de fato, criar partições diferentes para modificações independentes dentro do mesmo conjunto de mudança e que desenvolvedores concordam com sua decomposição. Porém, a implementação dos autores de ClusterChanges não está disponível publicamente e eles restringiram sua análise da técnica a projetos de software que são: i) de código fechado, (ii) escritos em C# e iii) desenvolvidos por uma única organização. Portanto, ainda há evidência empírica limitada da aplicabilidade de ClusterChanges para contextos diferentes. Para resolver essa situação, nós criamos JClusterChanges, uma implementação livre e de código aberto (FOSS) de ClusterChanges para software Java, e replicamos o estudo original de Barnett et al. usando uma amostra de 1000 pull requests oriundos de projetos de código aberto escritos em Java e armazenados do GitHub. Ao fazer isso, nós descobrimos que conjuntos de mudanças de código aberto também podem ser grandes e conter várias modificações independentes semelhantemente aos changesets do estudo original. Assim, nossa pesquisa confirma que o problema é tanto real quanto relevante para outros ambientes além do da Microsoft, aumenta o corpo de conhecimento sobre esse assunto e prove uma implementação FOSS de ClusterChanges que mostra que é possível implementar a técnica para outros contextos e que pode ser usada para auxiliar pesquisa futura nesse assunto. / Code review is a widely used activity for source code quality assurance. As a typical review activity, code review is strongly dependent on developers’ ability to understand the code under revision. As a consequence, the presence of large changesets containing several independent modifications (e. g. bug fixes, refactoring, features additions etc) can negatively affect the efficacy of code review. To cope with this problem, Barnett et al. developed ClusterChanges — a lightweight static analysis technique for decomposing changesets in different partitions that can be reviewed independently. They have found that ClusterChanges can indeed create different partitions for independent changes within the same changeset and that developers agree with their decomposition. However, the authors’ implementation of ClusterChanges is not publicly available and they restricted their analysis of the technique to software projects thatare: i) closed source, ii) writtenin C#and iii) developed by a single organization. Therefore, there is still limited empirical evidence of ClusterChanges’ applicability to different contexts. To address this situation, we created JClusterChanges, a free and open source implementation (FOSS) of ClusterChanges for Java software, and replicated the original Barnett et. al. study on a sample of 1000 pull requests from Java open source projects hosted on GitHub. By doing so, we found that open source changesets can also be large and contain several independent changes similarly to the changesets of the original study. Thus,our research confirms that the problem is both real and relevant to other environments besides Microsoft’s, increases the body of knowledge about this subject and provides a FOSS implementation of ClusterChanges that shows that it is possible to implement the technique for other contexts and can be used to help future research on this subject.

Identiferoai:union.ndltd.org:IBICT/oai:localhost:riufcg/765
Date22 May 2018
CreatorsFREIRE, Victor da Cunha Luna.
ContributorsFIGUEIREDO, Jorge Cesar Abrantes de., MONTEIRO, João Arthur Brunet.
PublisherUniversidade Federal de Campina Grande, PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO, UFCG, Brasil, Centro de Engenharia Elétrica e Informática - CEEI
Source SetsIBICT Brazilian ETDs
LanguageEnglish
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Biblioteca de Teses e Dissertações da UFCG, instname:Universidade Federal de Campina Grande, instacron:UFCG
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0145 seconds