HunkBlame
, [2] und [A]) verwendet.
Das Ziel dieser Diplomarbeit ist die Identifizierung und Analyse von Defekten. Dafür werden Bugreports mit ihren Reparaturen im VCS verknüpft sowie die ihnen zugrundeliegenden Bug-Commits identifiziert. Neben der Anwendung und Verbesserung der Verfahren werden diese hinterfragt und deren Ergebnisse untersucht. Bei der Überprüfung der Verfahren, insbesondere der Grundannahmen des SZZ-Algorithmus, zeigen sich gravierende Mängel, die weiteren Forschungsbedarf aufzeigen.
Als Forschungsobjekt dient das VCS des kommerziellen Infopark CMS der Infopark AG [B]. Es enthält 45.000 Commits und seine Historie reicht über zehn Jahre zurück. Neben Vergleichen mit anderen Studien werden neue Ergebnisse präsentiert. Unter anderem zeigte sich überraschenderweise, dass Commits, die wenige Zeilen ändern, defektanfälliger sind als Commits, die viele Zeilen ändern. Außerdem konnte belegt werden, dass Dateien, die häufiger oder von vielen verschiedenen Entwicklern geändert werden, defektanfälliger sind als Dateien, die seltener geändert oder von weniger Entwicklern modifiziert werden.Die digitale Version dieser Diplomarbeit ist unter [C] verfügbar.
HunkBlame
, [2] and [A]), is the basic method used for this research.
Identification and analysis of defects are the main goals of this thesis. Bugreports are linked to their bugfix commits, as well as to there underlying bug commit, in order to allow structured analysis. In addition to using and improving the known methods, the results are scrutinized. In the process the methods (the SZZ algorithm in particular) reveal significant shortcomings. There improvement remains subject to further research.
The VCS of the commercial Infopark CMS by the Infopark AG [B] serves as the object of this study. The repository contains more than 45,000 commits and ten years of development history. In addition to comparing the results to other studies, new results are presented. Surprisingly, a commit is more susceptible to defects, the fewer lines of code are modified. Files that are modified more frequently or that are modified by several different developers, are also more susceptible to defects.The digital version of this diploma thesis is available at [C].