In the popular sport of football, the exploration of key performance indicators has garnered significant interest among researchers, coaches, and analysts. While machine learning approaches, such as the expected goals model, have provided valuable insights into the attacking aspects of the game, the defensive side has received comparatively less attention. This thesis focuses on the defensive aspect of football, particularly during the opposition’s build-up phase, a strategy increasingly adopted by many teams. The goal of this project is to integrate valuable features from existing research with newly generated ones, developed in consultation with football experts, to create a model that provides insights into a team’s defensive behavior during the opponent’s build-up phase. The study utilizes synchronized event and tracking data from the Allsvenskan 2022 and 2023 seasons. An algorithm is developed to filter and analyze build-up sequences by generating appropriate defensive features. Subsequently, a logistic regression-based machine learning model is implemented to predict the outcome of an event during a build-up sequence, as well as the overall outcome of the sequence. This approach, enables the introduction of two new metrics aimed at evaluating a team’s defensive behavior during the opponent’s build-up phase. Additionally, a web-based application is developed to visualize and communicate the project results and insights to football experts and data analysts. Finally, the findings of this thesis highlight the benefits of combining tracking data with event data in football analytics. / Nyckeltalsundersökningar för att utvärdera och utveckla fotbollsklubbars prestation har väckt stort intresse bland forskare, tränare och analytiker. Traditionellt sett har dessa nyckeltal härletts genom observationsanalys. Dock har den ökande förekomsten av teknik inom den professionella fotbollsvärlden skapat möjligheter för att implementera mer automatiserade metoder för taktisk analys. Denna studie kommer specifikt att fördjupa sig inom det taktiska området av fotboll, som framstår som den mest relevanta och dynamiska delen av spelet. Målet med studien är att applicera modern teknologi, så som maskininlärning, på befintlig forskning, för att utveckla en modell som ger insikter om försvarsspelet under motståndarens uppbyggnadsfas. Studien undersöker synkroniserad händelse- och spårningsdata från Allsvenskan, Sveriges Högsta fotbollsserie, säsongerna 2022 och 2023. Efter att ha utvecklat en algoritm för att filtrera uppbyggnadssekvenser, användes denna data för att generera omfattande egenskaper som beskriver kvaliteten på ett lags försvarsspel. Därefter implementeras en maskininlärningsmodell, med hjälp av logistisk regressionsanalys, för att förutse utfallet av både en uppbyggnadssekvens och försvarsspelet. Resultatet visar på värdet av att kombinera spårningsdata med händelsedata inom fotbollsanalys. Modellens prestanda förbättrades avsevärt, både när det gäller att förutsäga utfallet av ett defensivt spel och en uppbyggnadssekvens.Dessutom har resultatet av studien lett till användbara insikter om försvarsspel för dataanalytiker inom fotboll. En webbaserad applikation utvecklades också för att visualisera och kommunicera resultaten.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-347343 |
Date | January 2024 |
Creators | Markou, Dimitrios |
Publisher | KTH, Medicinteknik och hälsosystem |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | English |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-CBH-GRU ; 2024:119 |
Page generated in 0.0066 seconds