<Blick hinter die Kulissen der Fußballanalyse: Teil 1 > Wie man Spieldaten aus Übertragungsmaterial gewinnt (1)
Vorwort
Hallo zusammen! Vielen Dank für eure Unterstützung, hier ist Scott von Playbox!
Der heutige Artikel erklärt die Geschichte hinter dem Asahi Shimbun-Artikel vom letzten Monat, in dem die Bewegung von Misumi analysiert wurde. Bei der Vorbereitung dieses Artikels wurden wir von Mr. Umemoto, einem Studenten der Universität Nagoya, und Mr. Nakamura, einem Studenten der Universität Tsukuba, unterstützt.
In diesem Artikel erklären wir die Geschichte hinter Japans erstem Spiel in der asiatischen Qualifikationsrunde für die Weltmeisterschaft, die kürzlich in der Asahi Shimbun veröffentlicht wurde. Bei der Vorbereitung dieses Artikels wurden wir von Mr. Umeki und Mr. Nakamura unterstützt, die beide an der Universität Nagoya/Universität Tsukuba studieren.
Umeki ist einer der führenden japanischen Forscher auf dem Gebiet der Fußballdatenanalyse und der einzige japanische Forscher, der an der berühmten Statsbomb-Konferenz im Ausland teilgenommen hat.
Bewertung der Positionierung der Mannschaftsverteidigung: Umemoto Rikuhei | StatsBomb Konferenz 2023
Mr. Nakamura ist Analytiker und Computer-Vision-Forscher an der Universität von Tsukuba, und seine Zukunft ist sehr vielversprechend. In Bezug auf die Fakultät, die Vereinsaktivitäten und das Labor ist er derselbe wie ich, aber sein Auge für das Beobachten von Fußball ist dem meinen wahrscheinlich weit überlegen.
Dieser Artikel ist etwas langatmig, aber er soll Ihnen eine Einführung in die Welt der Fußballanalyse bieten. Er wird in drei Teilen geliefert!
- <Blick hinter die Kulissen der Fußballanalyse: Teil 1: Wie man Spieldaten aus Übertragungsmaterial gewinnt (dieser Artikel)
- <Blick hinter die Kulissen der Fußballanalyse: Teil 2: Analyse des Ballträgers (xG, VAEP)
- <Analyse von Angriffsmustern abseits des Balles (OBSO)
Einführung - was sind "Daten" in der Fußballanalyse?
Manpower vs. Sensoren vs. Bildverarbeitung
Im Sport lassen sich die Methoden zur Datenerfassung grob in die folgenden drei Kategorien einteilen
- Manpower: Manuelle Aufzeichnung der Position der Spieler, des Balls und des Spielgeschehens beim Betrachten von Videomaterial.
- Sensoren: Die Spieler werden mit GPS ausgestattet, um Daten wie Position und Geschwindigkeit zu erfassen.
- Bildverarbeitung (Videoanalyse): Einsatz von KI zur automatischen Extraktion von Spieler- und Ballpositionen sowie von Ereignisinformationen aus dem Spielmaterial.
Die Vor- und Nachteile der einzelnen Methoden lassen sich wie folgt zusammenfassen.
| Methode | Kosten | Genauigkeit | Echtzeit-Charakter | Beschaffung von Informationen über die gegnerische Mannschaft | Erhältliche Daten |
|---|---|---|---|---|---|
| Arbeitskräfte | Menschliche Ressourcen | Fett | ✗ ✗ ✗ ◯ | Fett. | Nur Ereignisdaten |
| Sensoren | ✗ | ◎ | ◎ | ✗ ✗ ✗ | Nur Verfolgungsdaten |
| Bildverarbeitung | ✗ ✗ ◯ | ◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎ | Fett zu Fett | Fett | Verfolgungsdaten + Ereignisdaten |
Bei der Bildverarbeitung (Videoanalyse) gibt es einen Zielkonflikt: Das Streben nach Genauigkeit erhöht die Verarbeitungszeit, während die Erhöhung der Echtzeitleistung die Genauigkeit verringert. Es ist jedoch möglich, Daten von der gegnerischen Mannschaft zu erhalten, und es können sowohl Verfolgungsdaten als auch Ereignisdaten gewonnen werden. Es ist auch die flexibelste und realistischste Methode in der Praxis, da die Videoanalysten für die Erfassung des Bildmaterials verantwortlich sind. Außerdem wird die Genauigkeit von Jahr zu Jahr besser, weshalb sich Playbox auf die Videoanalyse konzentriert.
Die Sensormethode (GPS) umfasst auch Beschleunigungsmesser und andere Sensoren und hat sich in letzter Zeit so weit verbessert, dass der Fehler innerhalb eines Meters liegt. Am idealsten ist der Einsatz in Kombination mit der Videoanalyse, aber der Nachteil ist, dass die Daten der gegnerischen Mannschaft nicht erfasst werden können und die Installation und Verwaltung des Systems überraschend zeit- und kostenaufwändig ist. Darüber hinaus können keine Ereignisdaten wie Pässe und Schüsse erfasst werden.
Arten von Videomaterial, das für die Fußballanalyse verwendet werden kann
Es gibt drei Haupttypen von Videomaterial, das für die Fußballanalyse verwendet werden kann
- Übertragungsmaterial: Material, das der Öffentlichkeit in großem Umfang zur Verfügung steht, z. B. Live-Übertragungen im Fernsehen. Es erfordert viele Kameraschwenks und -zooms sowie einen gewissen Einfallsreichtum bei der Analyse, hat aber den Vorteil, dass es leicht zugänglich ist.
Screenshot eines Spiels der Premier League. Die Quelle des Zitats ist dieser **Tweet.***
-
Aufnahmen mit fester Kamera (die Methode, die hauptsächlich von Playbox verwendet wird): eine einfache Kameraeinstellung, die ständig das gesamte Spielfeld aufnimmt. Das Material ist zwar stabil und leicht zu analysieren, aber die Auflösung jedes einzelnen Spielers ist grob, da das gesamte Spielfeld gefilmt wird, was eine detaillierte Analyse wie die Erkennung von Rückennummern erschwert.
Beispiel für Aufnahmen des gesamten Spielfelds mit einer festen Kamera, die mit Playbox-Kamerageräten aufgenommen werden können. Siehe hier für weitere Informationen.
-
Drohnenaufnahmen: Sie können große Bereiche von oben aufnehmen und sind ideal für taktische Analysen, aber sie sind teuer und unterliegen rechtlichen Beschränkungen.
Im Rahmen meiner Masterarbeit habe ich einen Datensatz mit Aufnahmen von Spielfeldern aus der Luft erstellt. Man kann sehen, wo sich Menschen aufhalten, aber man kann nicht sagen, wer sie sind. Sie können diesen Datensatz übrigens bei Kaggle herunterladen.
Arten von Daten, die aus dem Filmmaterial gewonnen werden können
Die beiden wichtigsten Datenarten, die aus dem Filmmaterial gewonnen werden können, sind
- Tracking-Daten: Position der Spieler und des Balls, Bewegungsgeschwindigkeit, zurückgelegte Entfernung usw.
- Ereignisdaten: spezifische Spielzüge, die während eines Spiels auftreten, wie Pässe, Schüsse und Dribblings.
Durch die Kombination dieser Daten kann das System für eine Vielzahl von Zwecken eingesetzt werden, z. B. für eine detaillierte taktische Analyse und die Leistungsbewertung einzelner Spieler.
Gründe für die Wahl von Broadcast-Filmmaterial für dieses Projekt
Da wir bei dem Spiel, das wir dieses Mal analysierten (das WM-Qualifikationsspiel gegen Japan), nicht vor Ort waren, hatten wir nur Zugang zu Übertragungsmaterial, das der Öffentlichkeit zugänglich gemacht worden war. Wir haben der Zeitung bestätigt, dass es kein Problem ist, solches öffentliches Filmmaterial zu analysieren und einen Artikel darüber zu schreiben, aber wir können derzeit nicht beurteilen, ob das Filmmaterial in Daten umgewandelt und kommerziell genutzt werden kann. Das liegt daran, dass Playbox bisher noch nicht mit diesem Problem konfrontiert war, da wir das Filmmaterial direkt von den Teams erhalten, es analysieren und die Ergebnisse zurücksenden.
In letzter Zeit haben wir jedoch Anfragen von Live-Spielern erhalten, die sagen, dass sie das tatsächliche Spielmaterial nicht auf YouTube zeigen können und daher die aus dem Material gewonnenen Daten nutzen möchten, um die Spielsituation zu animieren und zu verbreiten. In diesem Zusammenhang gibt es einige rechtliche Grauzonen, weshalb wir planen, in naher Zukunft einen Anwalt zu konsultieren, um die Situation zu klären.
Übrigens, wir haben ChatGPT gefragt,
Wenn das Video selbst urheberrechtlich geschützt ist, können die auf der Grundlage des Videos erstellten Daten und Animationen ebenfalls als "abgeleitetes Werk" betrachtet werden. Daher ist es ratsam, für die kommerzielle Nutzung die Genehmigung des Urheberrechtsinhabers einzuholen. Handelt es sich bei den aus dem Filmmaterial extrahierten Daten jedoch um "Sachinformationen ohne Urheberrecht", ist eine Genehmigung möglicherweise nicht erforderlich. Da die Entscheidung vom Einzelfall abhängt, empfehlen wir, einen Experten zu konsultieren".
Das Unternehmen sagte. Ja, konsultieren Sie einen Experten.
Im nächsten Kapitel wird detailliert erläutert, wie die Daten speziell aus dem Filmmaterial extrahiert werden.
2. Extraktion von Spieldaten aus Übertragungsmaterial
Normalerweise ist die Erfassung von Spielerdaten sehr zeit- und arbeitsaufwändig. So müssen z. B. eine Reihe von Spezialkameras im Stadion installiert und die Trikotfarben und Nummern der Spieler im Voraus im System registriert werden.
Wenn jedoch, wie in diesem Fall, die Analyse nur auf der Grundlage von Filmmaterial durchgeführt wird, das später der Öffentlichkeit zugänglich gemacht wird, ist eine solche Vorbereitung überhaupt nicht möglich. Mit anderen Worten: Der entscheidende Punkt ist, wie genau die KI Spieler und Bälle verfolgen kann, wenn sie sich auf "nur bestimmte Aufnahmen" stützt.
Es gibt weltweit mehrere Unternehmen, die dies bereits erreicht haben. Ein Unternehmen namens SkillCorner beispielsweise scheint über die Technologie zu verfügen, um Spielsituationen in Echtzeit zu reproduzieren, wobei es sich ausschließlich auf übertragenes Filmmaterial stützt.
Ich denke, dass es sich um einen ernsthaften Konkurrenten handelt, aber ich habe es vorgestellt, weil es wirklich cool ist, und Sie können sich darauf freuen, dass es so etwas in naher Zukunft für die Playbox geben wird!
Diese Technologie zur Extraktion des "Wer" und des "Wo" allein aus dem Filmmaterial nennt sich Game State Reconstruction (GSR). Action Spotting, das automatisch erkennt, "was getan wird" (z. B. Passen, Schießen usw.) , insbesondere in Bezug auf den Ball, wird Ball Action Spotting (BAS) genannt.
Rekonstruktion des Spielverlaufs (GSR).
GSR ist eine Technologie, die den Spielverlauf rekonstruiert, indem sie die Positionsdaten der Spieler und des Balls aus dem Videomaterial extrahiert.
Der folgende Blog von moai510, der das Verfahren ausführlich auf Japanisch zusammenfasst, ist eine gute Referenz.
- Paper-Einführung: Erklärung der Technologie im SoccerNet GSR Paper.
- Papiereinführung: SoccerNet Game State Reconstruction
Der neueste Stand der Technik (State-of-the-Art, SOTA) wurde in dem Papier "From Broadcast to Minimap: Unifying Detection, Tracking, and Calibration for Real- Rekonstruktion von Spielzuständen in Echtzeit". Die Methode kombiniert Open-Source-KI-Technologien wie YOLO-v5m, SegFormer und DeepSORT mit proprietären (leider nicht offengelegten) Datensätzen und berichtet, dass sie Spielzustände in nahezu Echtzeit rekonstruieren kann.
In diesem Artikel soll jedoch nicht näher auf diese spezielle Technologie eingegangen werden. Dies liegt daran, dass die neueste GSR-Methode, die eine Weiterentwicklung der in diesem Artikel verwendeten Methode ist, intern bei Playbox entwickelt wurde und fast die gleiche Genauigkeit wie die oben beschriebene State-of-the-Art-Methode erreicht, wobei ein völlig offener Datensatz verwendet wird! Eine ausführliche Erläuterung wird in naher Zukunft in einem separaten Artikel veröffentlicht!
Aus diesem Grund werden wir Ihnen nur kurz ein grundlegendes Bild von GSR geben.
Im Groben läuft der Prozess wie folgt ab:
- Die KI erkennt und verfolgt jeden Spieler und jeden Ball aus dem übertragenen Video (Spieler und Bälle werden wie unten links im Bild gezeigt erkannt)
- Die KI erkennt Linien und Punkte auf dem Spielfeld und wandelt die Positionsdaten auf dem Video in absolute Koordinaten auf dem Spielfeld um (Kamerakalibrierung, wie oben links im Bild gezeigt).
- Auf diese Weise kann die Position des Spielers im Video auf die exakte Position auf dem Spielfeld übertragen werden (umgewandelt in eine Gesamtansicht des Spielfelds, wie im rechten Teil des Bildes dargestellt).
Im obigen Beispiel werden die Spielfeldkoordinaten (oben links) auf der Grundlage der aus dem übertragenen Video gewonnenen Positionsdaten der Spieler (unten links) geschätzt und schließlich als Überkopf-Positionsdaten des gesamten Spielfelds (rechtes Bild) visualisiert. Andere Informationen wie Rückennummer, Rolle und Mannschaft können ebenfalls erkannt werden, aber dies ist der grundlegende Mechanismus der GSR.
Ball-Action-Spotting (BAS)
Während GSR eine Technologie ist, die die Position der Spieler und des Balls rekonstruiert, ist Ball Action Spotting (BAS) eine Technologie, die ballbezogene "Ereignisse" wie Pässe, Schüsse und Dribblings auf dem Video erkennt. Der derzeitige Stand der Technik ist T-DEED, eine im Jahr 2024 angekündigte Methode, die 12 verschiedene Ereignisse allein aus dem Video mit einer Genauigkeit von 73,4 % innerhalb einer Sekunde erkennen kann (weitere Informationen finden Sie im T-DEED-Papier ).
In diesem Zeitungsartikel haben wir nur ein paar kurze Videos von etwa 30 Sekunden analysiert, also haben wir uns nicht die Mühe gemacht, den Prozess mit KI zu automatisieren, sondern die Ereignisse manuell extrahiert. Das ging schneller und war genauer.
Nichtsdestotrotz entwickeln wir auch eine Technologie zur Ereigniserkennung wie diese BAS im Hauptprodukt Playbox. Sie basiert jedoch hauptsächlich auf Full-Pitch-Videos, so dass sie noch nicht auf Broadcast-Videos wie dieses angewendet werden kann. Wir würden in Zukunft gerne mehr darüber berichten.
Durch die Kombination von GSR- und BAS-Technologie verfügen wir über die Daten, die wir benötigen, um zu analysieren, "wer", "wo" und "was", und wir können fortschrittlichere und tiefgreifendere Analysen durchführen.
Herausforderungen bei der Datenextraktion und Playbox-Lösungen
Grenzen der KI-basierten Daten - wie weit kann sie automatisiert werden?
Videoanalysetechnologien wie GSR und BAS entwickeln sich Tag für Tag weiter, aber es gibt immer noch einige Herausforderungen, die schwer zu lösen sind. Die folgenden Herausforderungen sind bei der Verwendung von Broadcast-Material besonders ausgeprägt
- Häufige Kamerawechsel.
- Aufgrund der häufigen Kamerawechsel bei Fernsehübertragungen ist es nicht einfach, dieselben Athleten auf stabile Weise zu verfolgen.
- Änderungen der Videoauflösung und des Blickwinkels
- Wenn sich ein Spieler plötzlich aus dem Kamerabild herausbewegt oder sich der Blickwinkel beim Zoomen oder Schwenken der Kamera verschiebt, kann es schwierig sein, den Spieler oder den Ball genau zu verfolgen.
- Überlappende Spieler (Okklusion)
- Wenn sich Spieler gegenseitig überlappen oder wenn Schiedsrichter, Betreuer oder andere Objekte die Sicht versperren, kann die KI sie nur schwer erkennen.
- Ortung fliegender Bälle
- Die Spieler befinden sich grundsätzlich auf dem Boden, aber es ist schwierig, die genaue Position eines Balls in der Luft allein anhand von 2D-Videos zu bestimmen.
Selbst in dem kurzen Videoclip, der für diesen Zeitungsartikel verwendet wurde, war die KI nicht in der Lage, die Position und die Nummer des Spielers vollständig zu erkennen, und schließlich wurden einige der Informationen durch eine Überprüfung mit dem menschlichen Auge korrigiert (bei der Ereigniserkennung war dies reine Handarbeit). Aber es gibt Menschen auf der Welt, die versuchen, superschwierige Probleme wie AGI oder vollautomatisiertes Fahren auf hartnäckige Art und Weise zu lösen. Im Vergleich dazu sollte die Konvertierung von Fußballvideodaten recht einfach sein, ich werde mein Bestes tun.
Rechtliche Überlegungen und Herausforderungen der Videonutzung
Wie zu Beginn dieses Artikels erwähnt, gibt es neben den technischen Herausforderungen auch rechtliche Fragen bei der Verwendung von Videomaterial zur Datenerstellung.
Derzeit haben wir noch keine klare Antwort auf die Frage, wie aus Videos extrahierte Daten urheberrechtlich behandelt werden, wenn sie animiert und verwendet werden. Wir planen, demnächst einen Experten (Anwalt) zu konsultieren, und werden hier wieder berichten, wenn es klarer wird.
Wenn jemand mehr Informationen zu diesem Punkt hat, bitte kontaktieren Sie uns!
Schlussfolgerung - "Datenerfassung" ist der Ausgangspunkt für die Fußballanalyse
Bislang haben wir vorgestellt, wie man bei der Fußballanalyse Spieldaten aus Videos gewinnt, sowie die Herausforderungen und Lösungen, die sich dabei ergeben.
Die Fußballanalyse beginnt mit der Beschaffung guter Daten, und Playbox hat sich zum Ziel gesetzt, diesen Prozess zu automatisieren, damit immer mehr Mannschaften und Spieler auf einfache Weise von hochwertigen Analysen profitieren können.
Wir hoffen, dass der Inhalt dieses Artikels Ihnen hilft, die Fußballanalyse zu verstehen und Ihr Interesse daran zu wecken!
Im nächsten Artikel, dem zweiten Teil der Serie, werden wir im Detail erklären, wie die so gewonnenen Daten für spezifische Analysen verwendet werden können, indem wir Indikatoren wie xG ( erwarteterTorwert) und VAEP (Spielbewertungsindex) verwenden!
Website der Playbox Inc. 👉️ https://www.play-box.ai/
playbox, eine erschwingliche KI-Sportkamera mit automatischer Aufzeichnung und Bearbeitung 👉️ https://www.play-box.ai/lp
Kontaktieren Sie uns.
Wenn Sie Fragen, Anfragen oder Geschäftsvorschläge für Playbox haben, können Sie uns gerne unter der folgenden E-Mail-Adresse kontaktieren.
