Sempre sul discorso prevedibilità trovo interessanti questi risultati.

Overall la rilevanza delle features per prevedere il vincitore sul dataset che ci ha girato maskass è la seguente:



Si vede che conoscere i punti liberi dei giocatori è molto più importante rispetto a conoscere i punti iniziali, sia nelle partite prestige che trestige.

Il fatto che siano rilevanti a livello di dataset non vuol dire che l'informazione sui punti iniziali non possa influire. Ad esempio, qui il contributo delle diverse informazioni alla vittoria del giallo (sarebbe lo stesso per gli altri colori)



I contributi chiaramente sono positivi per punti liberi ed iniziali del giallo, mentre quelli degli altri colori sono negativi.
Qui si vede che l'effetto dei punti iniziali e liberi è comparabile, anche se i punti liberi sono molto più importanti nelle partite trestige rispetto alle prestige.
Questi due grafici sembrano apparentemente in contrapposizione, ma il motivo è semplice: mentre la distribuzione dei punti iniziali ha un valore medio di 30 punti con poca varianza, i punti liberi in media sono circa 20, ma la distribuzione ha molta più varianza. In sostanza l'informazione sui punti liberi diventa ben più rilevante rispetto ai punti iniziali perché tipicamente in una partita c'è molta più disparità in termini di punti liberi piuttosto che di punti iniziali. Credo sia piuttosto comune assistere a partite dove magari due giocatori hanno 0 punti liberi ed il terzo 40 piuttosto, mentre con i punti iniziali queste situazioni non si verificano praticamente mai.