Return to search

Towards a Data-Driven Football Playbook / Mot en datadriven fotbollsspelbok

At a competitive level, football teams often have multiple matches per week. Thus, time can be a limited resource for match analysts tasked with analysing the performance of their team and its opponents. Increased availability of data in the field offers possibilities to automate processes to save time. This thesis presents a method to automatically detect pre-defined moments of interest in the game, and how they can be analysed to gain insights into the play style of football teams and how they create and concede goal-scoring opportunities in open play. An algorithm was developed to synchronise Wyscout event data with Signality tracking data of 240 matches from the Swedish Allsvenskan, which resulted in a mean absolute error of 280 ms. Comprehensible features were extracted from the combined data to detect eleven moments of interest in the absence of manually labelled data: crosses, passes to the golden zone, switches of play, central through balls, wing plays, keeping possession, long balls from the back, counterattacks, establish possession, counterpresses and fall back. The detection for fall back failed, but the remaining moments of interest were detected with a precision of 0.84. The automatic moment detection was made accessible through a web-based application, enabling analysts to focus on analysing aspects of the game rather than spending time searching for them. The detected moments were then analysed, demonstrating that by conducting a more extensive analysis, a data-driven playbook providing insights into how football teams play and create or concede goal-scoring opportunities can be established. / På elitnivå har fotbollslag ofta flera matcher per vecka. Tiden kan därmed vara en begränsad resurs för matchanalytiker som har i uppgift att analysera prestationen hos sitt eget lag och dess motståndare. Ökad tillgänglighet av data i fotboll ger möjligheter att automatisera processer för att spara tid. Denna studie presenterar en metod för att automatiskt upptäcka fördefinierade spelfaser av intresse och hur de kan analyseras för att få insikter i fotbollslagens spelsätt och hur de skapar och släpper till målchanser i öppet spel. En algoritm utvecklades för att synkronisera Wyscout händelsedata med Signality spårningsdata från 240 matcher från Allsvenskan, vilket resulterade i ett genomsnittligt absolut synkroniseringsfel på 280 ms. Begripliga variabler extraherades från den kombinerade datan för att upptäcka elva spelfaser av intresse utan manuell datamärkning: inlägg, passningar till de gyllene zonerna, spelvändningar, centrala genomskärare, spel på kanterna, bibehållning av bollinnehav, långbollar från backlinjen, kontringar, etablering av bollinnehav, direkta återerövringar och tillbakafall. Detekteringen av tillbakafall misslyckades, men de återstående faserna av intresse upptäcktes med ett positivt prediktivt värde på 0,84. Den automatiserade fasupptäckten gjordes tillgänglig genom en webbaserad applikation, vilket möjliggör för analytiker att fokusera på att analysera olika aspekter av spelet i stället för att tillbringa tid på att söka efter dem. De upptäckta faserna av intresse analyserades sedan, vilket visade att genom att genomföra en mer omfattande analys kan en datadriven spelbok skapas som ger insikter i hur fotbollslag spelar och skapar eller släpper till målchanser.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-329266
Date January 2023
CreatorsPálmason Morthens, Ágúst
PublisherKTH, Medicinteknik och hälsosystem
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageEnglish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-CBH-GRU ; 2023:058

Page generated in 0.0023 seconds