Profit Software (aiemmin Evolvit) julkaisi vuoden 2016 syksyllä Qlik Sensellä toteutetun jääkiekon analytiikkapalvelun yhteistyössä Liigan kanssa. Pudotuspelien alla palveluun lisättiin edistyneen analytiikan ominaisuuksia. Tässä artikkelissa kurkistetaan konepellin alle ja tutustutaan ennusteen toimintaan. Edistyneen analytiikan ratkaisut on toteutettu Qlik Sense – R – integraatiolla.

Kirjoittanut Saska Saarioja
Saska työskentelee Profit Softwarella visualisoinnin ja edistyneen analytiikan sovellusten parissa.

 

Liigan analytiikkapalvelussa on julkaistu ottelukierroksen jälkeen automaattisesti päivittyvät tulevien otteluiden ennusteet, sekä ennuste todennäköisimmästä playoff-puusta. Lisäksi runkosarjan ollessa käynnissä palveluun päivittyy ennuste todennäköisimmästä runkosarjan lopputilanteesta. Todennäköisimmät lopputulokset arvioidaan simuloimalla (n = 10 000) sarjassa jäljellä olevat runkosarjan sekä pudotuspelien ottelut.

Miten ennuste toimii?

Ennusteen tausta-aineistona käytetään kausien 2014-2015 ja 2015-2016 toteutuneita otteluita, sekä kauden 2016-2017 otteluita viimeisimpään pelattuun otteluun saakka. Ennuste perustuu joukkueiden arvioituihin voimasuhteisiin. Kauden 2014-2015 alussa kaikki joukkueet oletettiin tasavertaisiksi, jolloin joukkueille asetettiin täsmälleen sama voimaluku. Oletus joukkueiden tasavoimaisuudesta ei ole todenmukainen, mutta mallin haluttiin itsenäisesti kehittävän joukkueiden voimaerot ilman ennalta annettuja oletuksia.


Joukkueiden voimalukujen suhteen perusteella lasketaan todennäköisyydet kummankin joukkueen voitolle sekä tasapelille. Ottelun päätyttyä todennäköisyyksiä verrataan toteutuneeseen lopputulokseen, jonka perusteella joukkueiden voimaluvut päivitetään.

Koti- ja vierasjoukkueen voittotodennäköisyys lasketaan kaavalla:

HomeWinProb = 1/(1+10^-((HomeTeamELO - AwayTeamELO) / 400))
AwayWinProb = 1/(1+10^-((AwayTeamELO - HomeTeamELO) / 400))

 

Jos joukkueiden voimasuhteet ovat yhtä suuret, on kummankin joukkueen voittotodennäköisyys 50 %.
Voimaluvut päivitetään kaavalla:

K = vakio (8)
I = vakio (1) -> Playoffseissa 1,5
M = log(abs(GD - GDM*(HomeTeamELO - AwayTeamELO) / 100) + exp(1)-1)
HomeTeamELO <- HomeTeamELO + K*I*M*(HomeWin - HomeWinProb) 
AwayTeamELO <- AwayTeamELO + K*I*M*(AwayWin - AwayWinProb)

 

Lisäksi tasapelin todennäköisyys on arvioitu logistisella regressiomallilla:

TieCoeff <- -0.003465438
TieCoeff2 <- 0.000005849399
Vakio <- -1.295719

EloDiff <- HomeELO - AwayELO
EloDiff2 <- EloDiff * EloDiff

TieProb <- 1/(1+exp(-(EloDiff2 * TieCoeff2 + EloDiff * TieCoeff + Vakio)))

Mallin parametrit on laskettu kausien 2014-2015 ja 2015-2016 päättyneistä otteluista.

 

Ennustemalli julkaistiin 15.2.2017. Alla näkyy sen hetkisen ennusteen (9 täyttä ottelukierrosta jäljellä) ennustettu kauden loppupistemäärä, sekä kauden todellinen toteutunut pistemäärä runkosarjan päätyttyä. Kolmen kärjen osalta pistemäärässä on eroa yhteensä 2 pistettä. Neljällä joukkueella eroa on 6 – 9 pistettä. Kunkin joukkueen teoreettinen maksimipistemäärä 9 ottelukierroksella on ollut 27 pistettä.

Alla olevassa kuvassa on esitetty runkosarjan lopputilanteen ja 15.2.2017 ennustetun sarjataulukon pistemäärän erotus. Ilves ja JYP ovat menestyneet ennusteen odotusta paremmin ja SaiPa sekä Sport heikommin. Muut ovat menestyneet ennusteen mukaisesti – eroa on 0 – 3 pistettä.

15.2.2017 ennustettu playoff – kaavio on lähes identtinen kuin runkosarjan päättyessä ennustettu. Otteluparien voittotodennäköisyydet ovat eläneet ja Sportia lukuun ottamatta joukkueet ovat pysyneet ennallaan.

 

15.2.2017 Ennustettu playoff – kaavio:

Runkosarjan päättyessä ennustettu playoff – kaavio:

1. Playoff – kierroksen jälkeen ennustettu playoff – kaavio:

Yksinkertainen ja tehokas ennuste

Ennusteen luomiseen oli kaksi syytä: Ensinnäkin halusimme luoda yksinkertaisen, mutta mahdollisimman tehokkaan ennustemallin joka olisi helposti käytettävissä muiden ennakointiongelmien ratkaisemiseen. Toiseksi halusimme testata, kuinka saamme yhdistettyä edistyneen analytiikan sovelluksia (R) saumattomasti edistyneeseen visualisointivälineeseen (QlikSense) tuotantoympäristössä. Ennustemalli rakennettiin lopulta muutamassa päivässä.

 


Testaa palvelua itse! http://liiga.fi/analytiikka/

Kiinnostuitko edistyneestä analytiikasta? Ota yhteyttä!
Perttu Heinonen (perttu.heinonen@profitsoftware.com)