Jiří Curney na světovém šampionátu 2018. Foto: Barbora Reichova
17. 7. 2019 Mistrovství světa (1) KOMENTÁŘŮ

Recenze studie „Your 2018 WFC Data Analytics Guide“

 



Na webových stránkách Českého florbalu (ČF) se objevila studie v doslovném překladu „Váš průvodce analytickými daty z MS mužů ve florbale 2018“ (zkráceně dle ČF „ANALÝZA DAT MS 2018“, ke stažení zde). Jedná se o „volné pokračování“ převážně finský týmem vytvořené studie „Jak střílet góly ve florbale!“, jejíž recenzi jsme přinesli zde.

Studii o posledním pražském MS mužů ve florbale vytvořil na zakázku hlavního metodika ČF bezesporu nejlepší český datový statistik a analytik florbalu Petr MALINA. S podporou metodického úseku a analytiků (sběr dat) Filipa Braunera, Martina Filka, Jana Kropáčka a Lukáše Kaďorka autor Malina připravil 158 stránkovou, v angličtině formulovanou studii zabývající se analýzou vstřelených branek na MS mužů ve florbale 2018 konaného v Praze mezi 1. – 9. 12. 2018. K ještě kvalitnějšímu jazykovému zpracování a udržení terminologické konzistence lze jen doporučit pro případnou re-edici zapojení jednoho ze spoluautorů studie o MS 2016 –  Davida Speldewinde, hráče australské reprezentace.

Pochvalu zaslouží uvedení (byť ne úplné např. chybí Gdiff, CFop, CPop, OMR…) použitých zkratek a příslušné definice, které v předchozí studii chybí úplně.

Graficky kvalitně a inovativně zpracovaný dokument umožňuje čtenáři v kapitole Shrnutí (SUMMARY) na 2 stránkách vstřebat nejdůležitější statistiky z dat, která pod autorovým vedením o průběhu zápasů na MS 2018 pečlivě posbírali výše jmenovaní zápasoví statistici. Běžný čtenář však může být zaskočen množstvím údajů, terminologií a jazykovou náročností studie, avšak ani Závěr (CONCLUSIONS) studie neuspokojí čtenáře, jenž očekával jasně strukturované a přístupně formulované myšlenky. Bohužel formulace shrnutí je takřka identická se závěrem, přičemž popsané výsledky resp. z nich odvozené poznatky a doporučení jsou příliš abstraktní a osloví, tak jen zlomek florbalové komunity. Snad tyto nedostatky čtenáře neodradí od přečtení si všech zbývajících více než 150 stran – to by bylo k jejich škodě.

Neboť v Úvodu (INTRODUCTION) je zdařile formulován a popsán účel, vznik a členění studie v návaznosti na studii analyzující předchozí MS. Možná mohl autor ještě zařadit krátké vysvětlení ohledně dvou klíčových přístupů a metod herního hodnocení týmů. První metoda vychází z dat o skórovaných gólech (Goal Scoring Data, GSD) a druhá se zaměřuje na data o držení míčku (Possession based Data, PBD).

V první kapitole se autor studie zaměřil na představení GSD a systému turnaje MS 2018. Kapitola je doplněna tabulkou, která uvádí porovnání GSD výsledků z MS 2016 a 2018. Dále se formou tabulky věnuje KPI (klíčovým parametrům) opět s přínosným porovnáním pro obě MS. Pro čtenářovu lepší orientaci by bylo vhodnější tabulky vždy „vměstnat“ na jednu stránku a graficky podpořit rozlišení hodnot červeně (MS 2016) a modře (MS 2018). Bohužel zvolenou barevnost se nepodařilo udržet u všech grafů konzistentní v celé studii.

Vše ostatní se ale dařilo týmu Maliny znamenitě – všechny ve studii na MS 2016 pozorované parametry byly doplněny o ekvivalenty z MS 2018 a porovnány. Trochu by čtenář mohl být zmaten zavádějícím označením podkapitol, neboť v kapitole 1.4 věnovaném gólům jsou efekty skórování (1.3.1 Score effectivity od strany 17) a další podkapitoly nesprávně označeny 1.3.x. To se díky automatické indexaci promítlo do přehledu obsahu. Toto nedopatření však nic nemění na bezchybnosti a přínosnosti obsahu. Autor se snaží zodpovědět časté otázky florbalových stratégů a koučů jako:

  • Kolika gólové vedení v zápase garantuje jeho výhru?
  • Jak důležitý je úvodní gól?
  • Jak klíčové je vedení po první resp. druhé třetině?

A nachází i v porovnání statistik obou MS odpovědi nejen na tyto otázky, ale i další týkající se časování gólů (1.3.2 Timing of goals), střelecké pozice a vzdálenosti, situačních efektů a asistencí, typů útoků, zónového zahájení, délky držení a příčin útoku s gólovým zakončením. Z důvodů odlišné kategorizace není poslední parametr – chyby v obraně – porovnatelný mezi jednotlivými MS. Autor Malina na to má pochopitelné vysvětlení – subjektivní posouzení bez precizní definice jednotlivých kategorií chyb v obraně týmu analyzujícího MS 2016 to neumožňuje. Proto se jeho tým vydal jinou, efektivnější cestou (snazší sběr dat a statisticky významnější vzorek). Vyslovení názoru a diskusi na to, která cesta je přínosnější, ještě pozdržíme.

A to proto, abychom nejdříve představili druhou kapitolu analyzující data o držení míčku (Possession based Data, PBD). Určitě čtenář při jejím čtení pozná změnu stylu – zatímco první kapitola věnující se GSD byla tak trochu (pokud si pomůžeme příměrem z krasobruslení) „povinná jízda“, v druhé zasvěcené analýze držení míčku (PBD) jde už o „jízdu volnou“. Autor se zbavil „zátěže“ povinnosti „udržet kompatibilitu (= porovnatelnost) s předchozí studií“ a s lehkostí popisuje metodu PBD postavené na parametrech:

  • kategorizace střelby (na branku, mimo, blokovaná)
  • zóny/oblasti střelby (členění do 6 oblastí útočné zóny)
  • typ držení míčku (bez útoku, postupný resp. rychlý útok, otočení hry do plných resp. s přečíslením)
  • kvality držení míčku.

Petr Malina posuzoval kontext hry dle kvality týmů a efektů vyplývajících ze specifik turnaje MS 2018, a to především s ohledem na typ a kvalitu držení míčku. Mimořádným počinem studie je zohlednění dvou nových parametrů příležitost ke skórování z křižného pasu resp. přihrávky do volné střelecké pozice (cross field pass resp. clear pass opportunity). Malinův tým posbíral zápasová data (omezená na TOP 8 týmů) a statisticky je vyhodnotil, přičemž hledal korelaci (=souvislost) mezi různými zápasovými parametry. Asi by bylo nespravedlivé vůči čtenářům prozradit výsledky analýzy, ale jednu výjimku uděláme. Malinovy závěry jasně prokazují, že pro vítězství v zápase není relevantní místo střelby (často se hovoří o mimořádném významu tzv. best scoring area = segmentu pro nejlepší gólové zakončení), to však studie vylučuje a označuje za mýtus.

Následující kapitoly se věnují analýzám hry týmů jako celku z pohledu KPI (klíčových výkonnostních parametrů), týmově specifických výsledků a kvality držení míčku. Tyto části studie poskytují čtenářům dostatek údajů, metodologických návrhů i statistických závěrů pro studium a diskusi ve florbalové komunitě. Přínosné jsou i detailní výsledky všech ve studii dále uváděný rozborů reprezentací TOP 8 zemí.

Bez kontextového napojení je do studie zařazena podkapitola věnující se individuálnímu porovnání hráčů ohledně střelby, přihrávek a blokování střel. Přináší řadu zajímavých poznatků o schopnostech špičkových hráčů. Asi málokdo ví, že Petri Kotilainen ze 100 držení míčku jeho pětky byl schopný vystřelit na branku 21 krát nebo že jeho spoluhráč Tatu Väänänen byl schopen blokovat více než 20% všech pokusů soupeře. Chybí však provázání k důležitosti těchto schopností jednotlivce nebo týmů na zápasové hodnocení a hlavně výsledek utkání.

V kapitole věnované diskusi se autor věnoval porovnání výhod a nevýhod GSD a PSD metod, s jasným závěrem, že GSD neposkytuje dostatečný analytický vhled na zápas, protože nezohledňuje gólovou efektivitu měřenou brankovým rozdílem. Výsledky tak mohou být zajímavé, ale je otázkou, do jaké míry jsou pro vývoj zápasu důležité (relevantní). U PSB autor tvrdí, že metoda umožňuje predikovat vstřelené branky a lépe modeluje data hráčů resp. týmů na hřišti (pomocí parametrů corsi, branky odhadované). Přínosná část diskuse se týká (ne)relevantnost parametrů, kdy např. sledování parametrů střelby se může jevit jako velmi dobrá praxe, ale z pohledu Petra Maliny to má jen hodnotu křížku na sběrném listu herní statistiky. Diskusi na toto téma zakončuje výzvou k ukončení této podle jeho pohledu nesmyslné a časově náročné aktivity. Méně skeptické (realistické) jsou výsledky studie vůči blokování střel, kdy se jednoznačně nepodařilo prokázat, že blokování významně koreluje s výsledkem utkání.

K jednoznačnému postoji dochází autor Malina ohledně clear path opportunity, CPo (jaké pojmenování se v češtině ujme? – příležitosti s nebráněným zakončením či přihrávka do volné střelecké pozice), když prezentuje výsledek, že při vyrovnaném počtu hráčů na hřišti padlo 53 % gólů z CPo a držení míčku s CP (po přihrávce do volné střelecké pozice) bylo 9 krát nebezpečnější než postupný útok.

Podobně je podle autora pro vítězství v zápase resp. turnaji důležitý parametr tzv. příležitosti po křižné nahrávce (cross field path opportunity, CFpo), přičemž doporučuje upravit metodiku tak, aby se do CFpo započítávaly jen skrz formaci soupeře (ne okolo) procházející přihrávky.

Podobně přínosně diskutuje Malina i otočení hry do rychlého protiútoku s menším počtem bránících hráčů (Odd man rush, OMR), kdy se jedná bezpochyby o nejnebezpečnější formu ofenzívy. Dochází však k závěru, že MS 2018 ukázalo možnosti obrany se s OMR úspěšně vyrovnat (především při stejné kvalitě soupeřů hlubokou obranou).

Ještě rozporuplnější je parametr chyby v obraně (Defence Mistake, DM), ale autor se k jeho hodnocení postavil realisticky, když hodnotí parametr DM pro finský tým jako vítěze turnaje, ale podpořen statistickým vyhodnocením dostupných zápasových dat odmítá tezi, že by hra na jistotu zajistila vítězství v zápase či celém turnaji.

Proto se může čtenář těšit na podkapitolu věnující se otázce „Jak hrát na vítězství?“. Její obsah však neprozradíme, co však říct můžeme, že kdo by hledal autorem Malinou zde „zašifrovaný“ zázračný návod na vítězství („florbalový grál“), tak bude zklamán. Autor prokázal v celé studii, že rozumí florbalu a nutnosti všestranného vyvážení způsobilosti vstřelit soupeři góly a bránit mu ve skórování, k čemuž přispívá řada herních ingrediencí od taktiky přes individuální a týmové schopnosti, až po neovladatelné prvky náhody.

Co konstatovat na závěr? Studie je bezpochyby přínosem pro florbalovou komunitu. Autor víc než důstojně navázal na „finskou“ studii z MS 2016 a přispěl k významnému rozšíření vědeckých a metodických poznatků o elitním florbale. Neváhal jít ale i svou, průkopnickou cestou, když prokázal neodůvodněnost až mýticky zdůrazňované střelby z „optimálního prostoru před brankou“ (best scoring zone) a naopak zdůraznil důležitost moderně pojaté herní souhry a útoků (CPo, CFpo, OMR) dle jeho poznatků významně přispívající ke skórování a finálně k vítězství v zápasech.

Autorovi a statistikům je třeba poděkovat za mravenčí práci při sběru dat a trpělivost při následných analýz zápasů. Trenéři a stratégové mohou těžit z hlavních kapitolách a příloze prezentovaných dat, diskutovaných poznatků a těšit se na diskusi v rámci odborné i laické veřejnosti. Můžeme jen doufat, že v recenzi zmiňované drobné nedostatky a návrhy na vylepšení budou autorským týmem ve studii opraveny a v dalších analýzách zohledněny.

Zajímavé bude sledovat i diskusi v rámci Českého florbalu, zda jeho vedení vyslyší Malinovo naléhavé poselství ohledně plýtvání času při sběru nerelevantních herních dat (např. křížkování místa odpalu skórující střely).


Autor: redakce



KOMENTÁŘE

  • Honza napsal:

    Nějak mi uniklo, jestli bylo cílem tohoto článku představení, doporučení nebo hanění analýzy pana Maliny a jeho týmu. Je to datová analýza, ne článek na isportu, dle článku autor vyžadoval spíše to druhé.

Napsat komentář: Honza

*