Discussione:
Valutazione della classifica
(troppo vecchio per rispondere)
Christian De Vivo
2010-06-12 20:49:49 UTC
Permalink
Ho elaborato un modulo excel per comparare la classifica prodotta da
un torneo (intesa come gruppi di punteggio e che non tiene conto dei
criteri di spareggio) con quella ideale che si sarebbe ottenuta sei i
giocatori si fossero classificati rispettando il loro ordine di
rating. La classifica ideale non tiene conto del sistema di punteggio
utilizzato per stilare la classifica. Il modulo lo trovate a questo
link:
http://arbitriscacchi.googlegroups.com/web/statistica.xls

I dati che vanno inseriti nel modulo sono i punteggi rating dei
giocatori in ordine di posizione. Sono stati inseriti due esempi per
far comprendere come effettuare l'inserimento. Gli esempi sono il CR
della Campania e quello del Lazio del 2010. Infondo al singolo foglio
excel si trovano le statistiche relative al torneo. Nel foglio
"risultati" invece si trovano le statistiche generali rapportate a
tutti i tornei tra il "torneo I" ed il "torneo N".

Le due tabelle di statistica rappresentano in percentuale: la prima,
la tabella di compatibilità delle singole posizioni di classifica con
le posizioni della classifica ideale; la seconda, la tabella di
compatibilità delle prime "N" posizioni con le prime "N" posizioni
della classifica ideale. Alla fine della seconda tabella c'è un indice
"totale" che esprime di quanto la statistica si discosta dalla
classifica rating.

In questo lavoro ho elaborato solo i criteri della statistica e non ho
avuto il tempo di inserire ancora molti dati. Nei prossimi giorni
fornirò, a chi lo richiederà espressamente, tutte le delucidazioni sui
parametri utilizzati per la costruzione del modulo, pur rimanendo
molto scettico sulla validità di questo tipo di analisi per misurare
la qualità di un determinato sistema di abbinamento.

Grazie, Christian
Alessandro Antonelli
2010-06-12 21:09:39 UTC
Permalink
Post by Christian De Vivo
Ho elaborato un modulo excel per comparare la classifica prodotta da
un torneo (intesa come gruppi di punteggio e che non tiene conto dei
criteri di spareggio) con quella ideale che si sarebbe ottenuta sei i
giocatori si fossero classificati rispettando il loro ordine di
rating.
[cut]

Ciao Christian,

perchè secondo te una classifica che rispetti l'ordine di rating sarebbe
ideale? Veramente non capisco. L'elo fornisce solo un'indicazione statistica
della forza sul lungo periodo di un giocatore. Sul singolo torneo possono
incidere mille fattori non ultimo l'evoluzione tecnica dei giocatori che non
può essere costantemente fotografata dal rating.

Secondo me una classifica ideale deve rispecchiare la forza di gioco
espressa nel singolo torneo e non il rating. Certo la "forza di gioco" non è
un concetto semplice da numerizzare. Credo però che la performance si
avvicini molto allo scopo.

Ciao
Alessandro
Christian De Vivo
2010-06-13 00:16:04 UTC
Permalink
Post by Alessandro Antonelli
perchè secondo te una classifica che rispetti l'ordine di rating sarebbe
ideale? Veramente non capisco. L'elo fornisce solo un'indicazione statistica
della forza sul lungo periodo di un giocatore. Sul singolo torneo possono
incidere mille fattori non ultimo l'evoluzione tecnica dei giocatori che non
può essere costantemente fotografata dal rating.
E' proprio perché il rating è l'unica indicazione statistica della
forza di un giocatore che esso deve essere assunto come riferimento
nell'elaborazione di una classifica "ideale". E' vero infatti che nel
singolo torneo alcuni giocatori possono sensibilmente discostare il
loro livello di gioco dalle attese, ma mediamente ciò che prevale
nelle classifiche è il rispetto dei valori espressi dal rating: questo
è indiscutibile e facilmente dimostrabile.
Post by Alessandro Antonelli
Secondo me una classifica ideale deve rispecchiare la forza di gioco
espressa nel singolo torneo e non il rating. Certo la "forza di gioco" non è
un concetto semplice da numerizzare. Credo però che la performance si
avvicini molto allo scopo.
Non sarà mai possibile avere una classifica che rispecchi la forza di
gioco di un giocatore nel singolo torneo se quest'ultimo non è
strutturato in modo tale da fare incontrare tutti i giocatori tra di
loro. Solo in questo tipo di tornei infatti la performance assume lo
stesso valore statistico del punteggio ottenuto all'interno di una
classifica. Ma qualsiasi altro sistema di abbinamento, diverso da un
round robin, difficilmente esprimerà la reale forza di gioco di un
giocatore. Sia la classifica per punteggio che quella per performance
saranno sempre quindi soggette ad un grande margine di errore. E'
semplice inoltre costatare come, in un torneo svizzero, una classifica
basata sulla performance o su altri fattori non coincida affatto con
la classifica per punteggio. La performance è influenzata
inesorabilmente del percorso abbinativo e, per tale motivo, non ha lo
stesso valore statistico per tutti i giocatori.

Ciao, Christian
mario.scafroglia
2010-06-13 06:42:24 UTC
Permalink
Post by Christian De Vivo
Non sarà mai possibile avere una classifica che rispecchi la forza di
gioco di un giocatore nel singolo torneo se quest'ultimo non è
strutturato in modo tale da fare incontrare tutti i giocatori tra di
loro. Solo in questo tipo di tornei infatti la performance assume lo
stesso valore statistico del punteggio ottenuto all'interno di una
classifica. Ma qualsiasi altro sistema di abbinamento, diverso da un
round robin, difficilmente esprimerà la reale forza di gioco di un
giocatore.
Insomma, schifezza per schifezza, visto che ormai i Tornei si giocano
quasi soltanto a 5 turni, anche il sistema Amalfi dovrebbe avere diritto
ad esistenza, al pari degli altri sistemi
...

Ma questa riflessione, riflessione è una parola grossa, è facilmente
confutabile : schifezza per schifezza, che necessità c'è, a parte
qualche prebenda e qualche carriera spianata per qualche arbitro presso
la Fide, che necessità c'è di una schifezza in più, che necessità c'è
del sistema Amalfi, che come schifezza è assolutamente certificata?
Proprio nessuna :-)
Come si dice a Bergamo, "Peppa per Peppa, mi tengo Peppa mia"...
LordSte
2010-06-13 11:44:35 UTC
Permalink
Post by mario.scafroglia
Come si dice a Bergamo, "Peppa per Peppa, mi tengo Peppa mia"...
Mi sa che tu a Bergamo non ci sei mai stato...
ms
2010-06-13 09:27:08 UTC
Permalink
Post by Christian De Vivo
Non sarà mai possibile avere una classifica che rispecchi la forza di
gioco di un giocatore nel singolo torneo se quest'ultimo non è
strutturato in modo tale da fare incontrare tutti i giocatori tra di
loro. Solo in questo tipo di tornei infatti la performance assume lo
stesso valore statistico del punteggio ottenuto all'interno di una
classifica. Ma qualsiasi altro sistema di abbinamento, diverso da un
round robin, difficilmente esprimerà la reale forza di gioco di un
giocatore. Sia la classifica per punteggio che quella per performance
saranno sempre quindi soggette ad un grande margine di errore.
Scusami ma mi sembra una grossa sciocchezza sostenere che in un singolo
torneo la classifica ideale è meglio rappresentata dal rating iniziale dei
giocatori che non dalle performance fatte nel torneo stesso.

Siamo tutti d'accordo che la perfezione di un torneo con girone
all'italiana non è eguagliabile con nessun altro sistema: tu sfrutti
questo punto per derivare il concetto (in maniera erronea a mio avviso e
anche un pò capziosa) che allora tutti gli altri sistemi di classifica
sono uguali, non potendo raggiungere la perfezione al 100%. Non è vero, la
scelta non è tra il Bene Assoluto e il Male Assoluto, tra 0 e 1: la scelta
è su livelli intermedi di attendibilità che sono differenti a seconda del
sistema usato.

Tu dici che "sia la classifica per punteggio che quella per performance
sono soggette ad un grande margine di errore", e usi questo argomento
(vero) per giustificare qualunque altra classifica che possa essere
prodotta (potenzialmente anche un'estrazione a sorte).

L'utilizzo dell'elo iniziale invece che la performance per valutare come
un giocatore si sia comportato in un torneo mi sembra poi contro il buon
senso, vista che, come in tutti gli sport, c'è una bella differenza tra
quello che è la forza di un giocatore e quello che realmente riesce ad
esprimere in una competizione singola.

ciao
--
questo articolo e` stato inviato via web dal servizio gratuito
http://www.newsland.it/news segnala gli abusi ad ***@newsland.it
Christian De Vivo
2010-06-13 10:19:32 UTC
Permalink
Post by ms
Scusami ma mi sembra una grossa sciocchezza sostenere che in un singolo
torneo la classifica ideale è meglio rappresentata dal rating iniziale dei
giocatori che non dalle performance fatte nel torneo stesso.
Ripeto, la performance è funzione del percorso effettuato dal singolo
giocatore. Se il percorso abbinativo di due giocatori è diverso, e
sottolineo il "diverso", la performance inevitabilmente avrà un valore
"statistico" anche'esso diverso per entrambi i giocatori. La lista
rating invece, partendo da un campione più ampio di valutazione, è
inequivocabilmente più attendibile. C'è da osservare inoltre quanto,
nei tornei round robin, l'ordine di performance si avvicini sia
all'ordine di classifica che all'ordine della lista rating.
Post by ms
Siamo tutti d'accordo che la perfezione di un torneo con girone
all'italiana non è eguagliabile con nessun altro sistema: tu sfrutti
questo punto per derivare il concetto (in maniera erronea a mio avviso e
anche un pò capziosa) che allora tutti gli altri sistemi di classifica
sono uguali, non potendo raggiungere la perfezione al 100%. Non è vero, la
scelta non è tra il Bene Assoluto e il Male Assoluto, tra 0 e 1: la scelta
è su livelli intermedi di attendibilità che sono differenti a seconda del
sistema usato.
Prendo atto che la performance non è il modo migliore per esprimere la
forza di un giocatore e che esiste un criterio migliore: la
performance calcolata in un torneo round robin in cui tutti i
giocatori hanno lo "stesso" percorso abbinativo. Che la perfezione poi
non sia ragiungibile è la realtà che lo dimostra. Non si può definire
una classifica perfetta tra 100 giocatori effettuando 5 turni. In un
torneo del genere anche la performance di tanti giocatori non è
attendibile. L'unico riferimento obiettivo in questi casì non può
altro che essere qualcosa che abbia un più ampio campione statistico:
la lista rating per l'appunto. La capziosità sta in chi non vuole
accettare questo e vuole nascondere il fatto che nessun sistema di
abbinamento, a parte il pluricitato round robin, riprodurrà
perfettamente l'ordine delle performance dei giocatori (che tra l'atro
coinciderà quasi integralmente con l'ordine rating).
Post by ms
Tu dici che "sia la classifica per punteggio che quella per performance
sono soggette ad un grande margine di errore", e usi questo argomento
(vero) per giustificare qualunque altra classifica che possa essere
prodotta (potenzialmente anche un'estrazione a sorte).
Ebbene ti stupirà, ma è proprio quello che voglio dire. Anche in un
sistama di abbinamento a sorteggio casuale, analizzando un numero
significativo di tornei con giusta proporzione turni-giocatori, si
evincerà che statisticamente il giocatore con più alto rating arriverà
quasi sempre in testa al torneo. Lo scopo base della classifica è
quello di mostrare chi è il giocatore più forte, quello
dell'abbinamento invece è quello di selezionarlo. Quindi non esiste un
sistema di abbinamento migliore ed uno peggiore, ma solo modi diversi
di definire la stessa cosa: la classifica finale.
Post by ms
L'utilizzo dell'elo iniziale invece che la performance per valutare come
un giocatore si sia comportato in un torneo mi sembra poi contro il buon
senso, vista che, come in tutti gli sport, c'è una bella differenza tra
quello che è la forza di un giocatore e quello che realmente riesce ad
esprimere in una competizione singola.
Ma fino a ieri non si diceva che un giocatore aveva giocato bene
quando aveva superato le attese previste dal suo rating? E la
performance, a partire da quale dato viene calcolata? Dal rating
stesso degli avversari! Purtroppo vorrei evitare di essere considerato
fazioso. Ho effettuato un lavoro statistico senza neppure ancora
analizzare tutti i dati prodotti. Vedo però che si è già aperto un
processo e che si è già stabilita una sentenza. L'Elo, come il
punteggio ATP del tennis, è sempre stato il miglior sistema di
valutazione della forza dei giocatori ed è utilizzato come riferimento
per tutto. Ad oggi prendo atto che tale sistema è stato
inequivocabilmente superato dalla validità scientifica della
performance.

Riporto ancora una volta un esempio per chiarire le idee. Torneo 10
turni: il giocatore A (con Elo 1800) perde con 5 giocatori con Elo
2000 e vince contro 5 giocatori con Elo 1440, la sua performance è di
poco superiore ai 1700 punti Elo; il giocatore B (sempre Elo 1800)
perde contro 5 giocatori di Elo 2000 e patta contro 5 giocatori con
Elo 1800, la sua performance è di poco inferiore a 1700 punti Elo.
Seguendo il valore della performance, perché A e B non sono arrivati
vicini in classifica? E non rispondetemi perché uno ha realizzato la
metà dei punti dell'altro, perché stiamo parlando di "forza di un
giocatore".

Ciao, Christian
Massimiliano Orsi
2010-06-13 10:57:09 UTC
Permalink
L'Elo, come il punteggio ATP del tennis, è
sempre stato il miglior sistema di valutazione della forza dei giocatori
ed è utilizzato come riferimento per tutto. Ad oggi prendo atto che tale
sistema è stato inequivocabilmente superato dalla validità scientifica
della performance.
Scusa, mi spieghi come mai, visto che L'Elo iniziale e' piu' preciso
della performance, la FIDE accetta norme GM e MI se un giocatore supera
certi valori di performance? Non basterebbe dire che se un certo
giocatore si presenta ad un torneo con un rating maggiore di tot, allora
la norma e' fatta automaticamente, indipendentemente dai punti che fara'?

Grazie per la risposta.

Massimiliano Orsi
Christian De Vivo
2010-06-13 12:00:23 UTC
Permalink
Post by Massimiliano Orsi
Scusa, mi spieghi come mai, visto che L'Elo iniziale e' piu' preciso
della performance, la FIDE accetta norme GM e MI se un giocatore supera
certi valori di performance? Non basterebbe dire che se un certo
giocatore si presenta ad un torneo con un rating maggiore di tot, allora
la norma e' fatta automaticamente, indipendentemente dai punti che fara'?
Perché alcuni giocatori per conseguire un "tot" di rating possono
facilmente selezionare i tornei nei quali gli sarà più facile vincere,
evitando facilmente scontri diretti con i giocatori di alto livello.
Un confronto sulla performance in questi casi annulla tale
possibilità, constringendo i giocatori in questione a confrontarsi con
avversari di pari categoria o superiore.

Ciao, Christian
ms
2010-06-13 13:39:47 UTC
Permalink
Post by Christian De Vivo
Post by ms
Tu dici che "sia la classifica per punteggio che quella per performance
sono soggette ad un grande margine di errore", e usi questo argomento
(vero) per giustificare qualunque altra classifica che possa essere
prodotta (potenzialmente anche un'estrazione a sorte).
Ebbene ti stupirà, ma è proprio quello che voglio dire. Anche in un
sistama di abbinamento a sorteggio casuale
Intendevo dire estrazione a sorte del piazzamento finale in classifica.
Post by Christian De Vivo
Ma fino a ieri non si diceva che un giocatore aveva giocato bene
quando aveva superato le attese previste dal suo rating?
E allora? E' vero, quando capita che un giocatore performi in un torneo
meglio del proprio elo si dice che ha giocato bene. E' proprio qui il
punto: quello che conta (ai fini di una valutazione della classifica) sono
i valori esperessi nel torneo, non la storia pregressa del giocatore.
Post by Christian De Vivo
Purtroppo vorrei evitare di essere considerato
fazioso. Ho effettuato un lavoro statistico senza neppure ancora
analizzare tutti i dati prodotti. Vedo però che si è già aperto un
processo e che si è già stabilita una sentenza.
Nessun processo e nessuna sentenza, se ho dato questa impressione mi
spiace e mi scuso.

Dico semplicemente che a mio buon senso di giocatore, è evidente che gli
esempi di tornei che sono stati portati qui su IHS, in cui è stato
utilizzato l'Amalfi, mostrano una classifica che appare maggiormente
distorta rispetto ad altri criteri di abbinamento.
Che il numero di casi prova sia ancora insufficiente, che la presenza di
soli 5 turni abbia penalizzato maggiormente i risultati dell'Amalfi, che
sia stato un caso, o altro, non lo so.
Ma mi pare inutile arrampicarsi sugli specchi (questo mi pare che si
faccia) per negare una verità che mi pare lampante: mi sembrerebbe più
costruttivo o aspettare un maggiore universo di dati o, come è stato
suggerito da altri, semplicemente prendere atto che l'Amalfi non considera
l'attendibilità della classifica finale come elemento prioritario.

ciao,
ms
--
questo articolo e` stato inviato via web dal servizio gratuito
http://www.newsland.it/news segnala gli abusi ad ***@newsland.it
Roberto Ricca
2010-06-13 13:48:20 UTC
Permalink
Torneo 10 turni: il giocatore A (con Elo 1800) perde con 5 giocatori
con Elo 2000 e vince contro 5 giocatori con Elo 1440, [...] il
giocatore B (sempre Elo 1800) perde contro 5 giocatori di Elo 2000 e
patta contro 5 giocatori con Elo 1800
Seguendo il valore della performance, perché A e B non sono arrivati
vicini in classifica?

Se ipotizziamo un sistema di abbinamenti tradizionale ed un cammino
normale dei due giocatori (cioe` nessuno ha avuto particolarmente
fortuna o sfiga negli abbinamenti), e` evidente che la performance
fornisce dati non significativi.

Ma la colpa non e` della performance, ma del rating dei giocatori che
non hanno poi disputato il torneo che questo rating faceva presumere.

Prova ad assegnare ai giocatori un rating di torneo che coincide con la
loro performance e prova a ricalcolare la performance (chiamiamola di
secondo livello?). Gia` si ottengono valori piu` significativi.

Ripeti l'iterazione alcune altre volte (anche solo due) e a questo punto
abbiamo un rating (che e` poi la performance di livello N) che e` sempre
piu` vicino alla performance (di livello N+1). In molti casi
coincideranno pure, ma accontentiamoci di prendere il punto medio dei
due numeri.

Questo e` a mio giudizio un valore che puo` essere concretamente usato
per fare tutte le considerazioni di valutazione di una classifica.
--
Roberto Ricca
2010: GO GIANTS (Anybody but the Dodgers) [Magic Number: 103]
Christian De Vivo
2010-06-13 16:59:14 UTC
Permalink
Post by Roberto Ricca
Ma la colpa non e` della performance, ma del rating dei giocatori che
non hanno poi disputato il torneo che questo rating faceva presumere.
Io non metto in dubbio il significato della performance, ma la sua
funzione. La performance fornisce solo un valore numerico sul tipo di
gioco espresso in quel momento, contro quella serie "specifica" di
avversari. Se gli avversari di quel giocatore fossero stati altri,
nello stesso torneo, la performance sarebbe stata un'altra. La forza
del giocatore però non cambia ed è espressa, per me più
significativamente, dal rating (che si corregge di torneo in torneo).
Post by Roberto Ricca
Prova ad assegnare ai giocatori un rating di torneo che coincide con la
loro performance e prova a ricalcolare la performance (chiamiamola di
secondo livello?). Gia` si ottengono valori piu` significativi.
Ripeti l'iterazione alcune altre volte (anche solo due) e a questo punto
abbiamo un rating (che e` poi la performance di livello N) che e` sempre
piu` vicino alla performance (di livello N+1). In molti casi
coincideranno pure, ma accontentiamoci di prendere il punto medio dei
due numeri.
Alla fine troverò un numero, diverso dal rating in alcuni casi, e
molto simile ad esso in tanti altri. Non capisco perché commetto un
errore utilizzando direttamente il rating come riferimento iniziale.
Il problema tra l'altro rimane anche calcolando la performance in
questo modo: il numero è comunque calcolato non a parità di percorso,
ma in condizioni diverse da giocatore a giocatore. Che attendibilità
può avere in senso generale?

Ciao, Christian
Roberto Ricca
2010-06-14 14:58:15 UTC
Permalink
Alla fine troverò un numero, diverso dal rating in alcuni casi, e molto
simile ad esso in tanti altri.
Non credo proprio. Il rating infatti rappresenta (a grandi linee) la
forza di un giocatore; la performance (di livello N) il comportamento
del giocatore all'interno di *un* torneo. I due dati possono coincidere,
ma e` una rarita` (provare per credere), specialmente a livello
medio-basso.
Il problema tra l'altro rimane anche calcolando la performance in
questo modo: il numero è comunque calcolato non a parità di percorso,
ma in condizioni diverse da giocatore a giocatore.
Ovviamente, ma come si puo` fare diversamente? La performance-N, pero`,
rende molto piu` omogenei questi dati.

Esprimono valori assoluti? Chiaramente no e lo hai ben dimostrato con
l'altro esempio, quello di due giocatori che fanno un torneo identico,
con un'unica differenza, una sconfitta con due giocatori che tra loro
presentano una grande differenza di punteggio.

D'altra parte, poco tempo fa, in una discussione tra arbitri a cui anche
tu hai partecipato e` stato criticato il Sonneborn-Berger perche' non
da` qualita` alle sconfitte.

E` un mondo imperfetto... Accontentiamoci di ridurre i margini d'errore.
--
Roberto Ricca
2010: GO GIANTS (Anybody but the Dodgers) [Magic Number: 101]
John Travolta Sardus
2010-06-13 18:12:58 UTC
Permalink
Post by Christian De Vivo
Riporto ancora una volta un esempio per chiarire le idee. Torneo 10
turni: il giocatore A (con Elo 1800) perde con 5 giocatori con Elo
2000 e vince contro 5 giocatori con Elo 1440, la sua performance è di
poco superiore ai 1700 punti Elo; il giocatore B (sempre Elo 1800)
perde contro 5 giocatori di Elo 2000 e patta contro 5 giocatori con
Elo 1800, la sua performance è di poco inferiore a 1700 punti Elo.
Seguendo il valore della performance, perché A e B non sono arrivati
vicini in classifica? E non rispondetemi perché uno ha realizzato la
metà dei punti dell'altro, perché stiamo parlando di "forza di un
giocatore".
La risposta e' che i due non hanno incontrato avversari di media Elo
simile. Sarei portato a concludere dal tuo esempio che il sistema di
abbinamento non andava bene, avendo costruito al giocatore B un percorso
molto piu' difficile che al giocatore A. Quindi il criterio della
performance nel tuo esempio da' delle buone informazioni: fa vedere che il
sistema di abbinamento non funzionava.

Poi credo che la performance "di livello N" di cui ha parlato Roberto Ricca
migliori ancora il criterio dato dalla semplice performance.
Christian De Vivo
2010-06-13 23:54:02 UTC
Permalink
Post by John Travolta Sardus
Post by Christian De Vivo
Riporto ancora una volta un esempio per chiarire le idee. Torneo 10
turni: il giocatore A (con Elo 1800) perde con 5 giocatori con Elo
2000 e vince contro 5 giocatori con Elo 1440, la sua performance è di
poco superiore ai 1700 punti Elo; il giocatore B (sempre Elo 1800)
perde contro 5 giocatori di Elo 2000 e patta contro 5 giocatori con
Elo 1800, la sua performance è di poco inferiore a 1700 punti Elo.
Seguendo il valore della performance, perché A e B non sono arrivati
vicini in classifica? E non rispondetemi perché uno ha realizzato la
metà dei punti dell'altro, perché stiamo parlando di "forza di un
giocatore".
La risposta e' che i due non hanno incontrato avversari di media Elo
simile. Sarei portato a concludere dal tuo esempio che il sistema di
abbinamento non andava bene, avendo costruito al giocatore B un percorso
molto piu' difficile che al giocatore A. Quindi il criterio della
performance nel tuo esempio da' delle buone informazioni: fa vedere che il
sistema di abbinamento non funzionava.
Poi credo che la performance "di livello N" di cui ha parlato Roberto Ricca
migliori ancora il criterio dato dalla semplice performance.
Ecco il punro vero: la correttezza dell'abbinamento. Ma qualcuno può
spiegarmi perché anche negli svizzeri non viene rispettato l'ordine di
performance? Faccio un esempio ancora più semplice: giocatore "A" e
"B" gli stessi punti e con gli stessi avversari tranne uno, l'ultimo,
con il quale perdono entrambi. "A" perde con un giocatore di 100 punti
Elo superiore, B perde con un giocatore di 1000 punti superiore.
Secondo il criterio della performance, pur avendo fatto gli stessi
punti, B avrà una performance migliore di A e quindi ha giocato
meglio.

Ciao, Christian
John Travolta Sardus
2010-06-14 22:14:39 UTC
Permalink
Post by Christian De Vivo
Ecco il punro vero: la correttezza dell'abbinamento. Ma qualcuno può
spiegarmi perché anche negli svizzeri non viene rispettato l'ordine di
performance?
Per la precisione bisognerebbe anche dimostrare che un sistema in cui gli
accoppiamenti vengono fatti in ordine di performance dia come risultato una
classifica finale che rispetti l'ordine di performance, non e' cosi'
scontato. In generale comunque un sistema (come lo chiamiamo, sistema de
Vivo - Sardus? :-) ) che faccia gli accoppiamenti in base alla performance
non mi parrebbe neanche un'idea cosi' pazzesca ... magari si puo' fare
rispetto alla performance modificata "di livello N" di Ricca, cosi' si
tiene conto contemporaneamente anche di come stanno giocando i vari
giocatori.
Post by Christian De Vivo
Faccio un esempio ancora più semplice: giocatore "A" e
"B" gli stessi punti e con gli stessi avversari tranne uno, l'ultimo,
con il quale perdono entrambi. "A" perde con un giocatore di 100 punti
Elo superiore, B perde con un giocatore di 1000 punti superiore.
Secondo il criterio della performance, pur avendo fatto gli stessi
punti, B avrà una performance migliore di A e quindi ha giocato
meglio.
Qui non ci vedo nessun paradosso, il giocatore B e' stato piu' sfortunato
all'ultimo turno: che abbia performato meglio e' pacifico, e' accettato
anche dalla Fide che assegna a B una variazione Elo piu' favorevole che ad
A.
Roberto Ricca
2010-06-14 06:48:26 UTC
Permalink
Post by John Travolta Sardus
Sarei portato a concludere dal tuo esempio che il sistema di
abbinamento non andava bene, avendo costruito al giocatore B un
percorso molto piu' difficile che al giocatore A.
'azz... Questo si chiama essere condizionati dal newsgroup :-)

Non nego che sia la prima conclusione cui sono arrivato anch'io, ma e`
dipeso proprio da quanto detto la riga sopra.

Ockham, please :-)

E` molto piu` probabile che siano i rating iniziali a non aver definito
correttamente la forza di un giocatore all'interno del torneo.
Ricordiamoci che si sta parlando di giocatori che non superano i 2000
punti; affidabilita`, chi era costei? :-)
--
Roberto Ricca
2010: GO GIANTS (Anybody but the Dodgers) [Magic Number: 101]
Christian De Vivo
2010-06-14 07:18:03 UTC
Permalink
Post by Roberto Ricca
E` molto piu` probabile che siano i rating iniziali a non aver definito
correttamente la forza di un giocatore all'interno del torneo.
Ricordiamoci che si sta parlando di giocatori che non superano i 2000
punti; affidabilita`, chi era costei? :-)
Esempio2: il giocatore "A" e il giocaotre "B" hanno gli stessi punti e
gli stessi avversari tranne uno, l'ultimo, con il quale perdono
entrambi. "A" perde con un giocatore di 100 punti Elo superiore, B
perde con un giocatore di 600 punti Elo superiore. Secondo il criterio
della performance, pur avendo fatto gli stessi punti, B avrà una
performance migliore di A e quindi ha giocato meglio e, secondo questo
ultimo ragionamento, B ha anche un Elo sottostimato.

Ora capisco perché i giocatori con Elo inferiore a 2000 sono così
contenti quando incontrano un GM, la performance sale e diventano più
forti :-)

Ciao, Christian
Piero Pipetta
2010-06-15 13:23:24 UTC
Permalink
Post by Christian De Vivo
Secondo il criterio
della performance, pur avendo fatto gli stessi punti, B avrà una
performance migliore di A e quindi ha giocato meglio
Congratulazioni, hai appena dimostrato che il sistema Elo non e' perfetto...
Christian De Vivo
2010-06-15 16:57:45 UTC
Permalink
Post by Piero Pipetta
Congratulazioni, hai appena dimostrato che il sistema Elo non e' perfetto...
Che tutto è relativo l'ha dimostrato qualcuno prima di me :-)

Ciao, Christian
Christian De Vivo
2010-06-16 22:45:15 UTC
Permalink
Post by Piero Pipetta
 Secondo il criterio
della performance, pur avendo fatto gli stessi punti, B avrà una
performance migliore di A e quindi ha giocato meglio
Congratulazioni, hai appena dimostrato che il sistema Elo non e' perfetto...
La mia affermazione comunque era ironica, non si può stabilire che "B"
ha giocato meglio di "A" solo per il fatto che "B" ha incontrato un GM
e "A" invece no.

Ciao, Christian
Piero Pipetta
2010-06-17 07:10:34 UTC
Permalink
Post by Christian De Vivo
La mia affermazione comunque era ironica
Anche la mia era ironica, e voleva sottolineare il fatto che i difetti
che ritrovi nel criterio della performance sono gli stessi che trovi nel
calcolo dell'Elo.
John Travolta Sardus
2010-06-14 22:02:25 UTC
Permalink
Post by Roberto Ricca
Ockham, please :-)
E` molto piu` probabile che siano i rating iniziali a non aver definito
correttamente la forza di un giocatore all'interno del torneo.
Nell'esempio (artificiale) di cui stiamo discutendo non c'e' nessun indizio
a favore di quello che dici: infatti le performance dei due giocatori
risultano simili, che e' consistente con il fatto che avessero lo stesso
Elo ed anche parzialmente consistente con il fatto che avessero un Elo di
esattamente 1800 (nell'esempio hanno performato entrambi attorno al 1700).
Quello che invece e' sospetto e' che uno abbia incontrato giocatori di Elo
1440 e l'altro giocatori di Elo 1800 (fra l'altro noto che una cosa simile
non accadrebbe facilmente ne' con gli accoppiamenti svizzeri ne' con gli
accoppiamenti Amalfi :-)). Se uno si prendesse la briga (cosa che io non ho
nessuna intenzione di fare) di inventarsi un torneo intiero in cui questi
incontri possano avvenire veramente con un sistema di accoppiamento
ragionevole probabilmente scoprirebbe che in quel torneo li' il differente
piazzamento dei giocatori A e B a parita' di performance non e' l'unica
cosa strana.

Comunque sono d'accordo che un sistema di valutazione con una performance
"di livello N" oppure con qualche stima Bayesiana sarebbe mglio della
semplice performance.
John Travolta Sardus
2010-06-16 21:11:08 UTC
Permalink
Post by John Travolta Sardus
Post by Roberto Ricca
Ockham, please :-)
E` molto piu` probabile che siano i rating iniziali a non aver definito
correttamente la forza di un giocatore all'interno del torneo.
Nell'esempio (artificiale) di cui stiamo discutendo non c'e' nessun indizio
Ah, forse ho capito: intendevi il rating degli avversari di A e B ... che
hanno fatto si' che quello che continuava a pareggiare continuava a
beccarsi i 1800 e quello che continuava a vincere invece pescava i 1400 :-)
Christian De Vivo
2010-06-16 22:40:29 UTC
Permalink
Post by John Travolta Sardus
Ah, forse ho capito: intendevi il rating degli avversari di A e B ... che
hanno fatto si' che quello che continuava a pareggiare continuava a
beccarsi i 1800 e quello che continuava a vincere invece pescava i 1400 :-)
Nel mio esempio non si utilizzava di certo lo svizzero basato sul
rating :-)

Volevo solo dimostrare che la performance dipende dal percorso
abbinativo, ma forse è più istruttivo il secondo esempio.

Ciao, Christian
Piero Pipetta
2010-06-15 13:22:31 UTC
Permalink
Post by Christian De Vivo
L'unico riferimento obiettivo in questi casì non può
la lista rating per l'appunto.
Stai dando per scontato che l'errore connesso al sistema di
accoppiamento sia piu' grande dell'errore connesso a) alle imperfezioni
della valutazione Elo b) alle fluttuazioni di forma di ogni giocatore da
un torneo all'altro. Lo hai dimostrato? Se no, la tua posizione si basa
sul nulla.
Christian De Vivo
2010-06-15 16:51:52 UTC
Permalink
Post by Piero Pipetta
Stai dando per scontato che l'errore connesso al sistema di
accoppiamento sia piu' grande dell'errore connesso a) alle imperfezioni
della valutazione Elo b) alle fluttuazioni di forma di ogni giocatore da
un torneo all'altro. Lo hai dimostrato? Se no, la tua posizione si basa
sul nulla.
Le imperfezioni della lista Elo nascono principalmente da due fattori:
il numero basso di partite valide, che nella peggiore delle ipotesi è
uguale al numero di partite su cui di solito è calcolata la
performance; e la stima del primo rating di iserimento in lista,
l'errore più significativo, che comincia a ridimensionarsi solo dopo
una ventina di partite valide per la variazione (circa tre tornei). Il
sistema di valutazione però, ed è importante sottolinearlo, non
dipende minimamente dal percorso abbinativo del singolo giocatore in
quanto ogni partita viene valutata in maniera netta. La performance
invece è una media aritmetica, con l'aggiunta di una costante, che
tende ad essere strettamente legata, tanto al percorso abbinativo
quanto al sistema di valutazione rating stesso. Proprio per questo
essa eredita ed esalta, in maniera evidente, le eventuali
disomogeneità sia del sistema di abbinamento che del sistema di
valutazione del rating. Credo che gli esempi da me citati dimostrino
ampiamente quanto da me affermato.

Ciao, Christian
Bruno Rizzuti
2010-06-15 19:49:47 UTC
Permalink
Post by Christian De Vivo
Post by Piero Pipetta
Stai dando per scontato che l'errore connesso al sistema di
accoppiamento sia piu' grande dell'errore connesso a) alle imperfezioni
della valutazione Elo b) alle fluttuazioni di forma di ogni giocatore da
un torneo all'altro. Lo hai dimostrato? Se no, la tua posizione si basa
sul nulla.
La performance
invece è una media aritmetica, con l'aggiunta di una costante, che
tende ad essere strettamente legata, tanto al percorso abbinativo
quanto al sistema di valutazione rating stesso. Proprio per questo
essa eredita ed esalta, in maniera evidente, le eventuali
disomogeneità sia del sistema di abbinamento che del sistema di
valutazione del rating.
Sei in errore. Stanno provando a spiegartelo da piu' parti, ci provo
anche io.

L'errore e' evidente dal fatto che misuri una "grandezza" relativa ad un
certo "istante" facendo riferimento al valore di questa grandezza in un
intervallo di tempo differente. Come ti e' stato appena fatto notare,
questo potrebbe essere corretto solo se questa grandezza non e' soggetta
a fluttuazioni. Invece qui le fluttuazioni ci sono, ed e' anzi proprio a
quelle che siamo interessati.

L'errore e' gia' visibile nel tuo post di esordio. Infatti, e' vero che
"mediamente cio' che prevale nell*E* classifich*E* e' il rispetto dei
valori espressi dal rating". Qui pero' lo scopo non e' quello di
valutare l'attendibilita' dell'insieme delle classifich*E*. Lo scopo e'
piuttosto quello di valutare l'attendibilita' della singola
classific*A*. Quindi la frase su cui puntare l'attenzione e' "mediamente
cio' che prevale nell*A* classifich*A* e' il rispetto dei valori
espressi da XXXXXX". Ora puoi sostituire XXXXXX con il parametro che ti
pare, ma deve essere un parametro che e' funzione solo di quello che e'
successo in *quel* determinato torneo.

Ma allora, come mai molti dei tuoi ragionamenti sembrano funzionare? Ci
sono vari motivi. Innanzitutto, perche' c'e' una evidente correlazione
tra rating e performance, per cui di solito (ma non sempre!) le due cose
coincidono. Inoltre, e' anche vero che la performance sul singolo torneo
e' influenzata da vari fattori. Dunque, alla fine se vogliamo un
risultato attendibile bisogna guardare alle classifiche di vari tornei,
ed e' per quello che il rating sembra preferibile. Ma prova a pensare al
caso estremo di un giocatore il cui rendimento oscilla fortissimamente,
e vedrai che i conti non ti tornano piu'.

Ciao, Bruno.
Christian De Vivo
2010-06-16 02:32:37 UTC
Permalink
Post by Bruno Rizzuti
L'errore e' evidente dal fatto che misuri una "grandezza" relativa ad un
certo "istante" facendo riferimento al valore di questa grandezza in un
intervallo di tempo differente. Come ti e' stato appena fatto notare,
questo potrebbe essere corretto solo se questa grandezza non e' soggetta
a fluttuazioni. Invece qui le fluttuazioni ci sono, ed e' anzi proprio a
quelle che siamo interessati.
Su questo sono d'accordo, ma ciò che non capisco è perché si vuole
prendere come riferimento la performance che è anch'essa soggetta a
fluttuazioni, magari anche maggiori di quelle del rating, e che
dipendono spesso dalla "qualità" (guarda caso il rating) degli
avversari incontrati.
Post by Bruno Rizzuti
L'errore e' gia' visibile nel tuo post di esordio. Infatti, e' vero che
"mediamente cio' che prevale nell*E* classifich*E* e' il rispetto dei
valori espressi dal rating". Qui pero' lo scopo non e' quello di
valutare l'attendibilita' dell'insieme delle classifich*E*. Lo scopo e'
piuttosto quello di valutare l'attendibilita' della singola
classific*A*. Quindi la frase su cui puntare l'attenzione e' "mediamente
cio' che prevale nell*A* classifich*A* e' il rispetto dei valori
espressi da XXXXXX". Ora puoi sostituire XXXXXX con il parametro che ti
pare, ma deve essere un parametro che e' funzione solo di quello che e'
successo in *quel* determinato torneo.
Ho già espresso più volte che il mio sistama ideale di riferimento per
la valutazione della classifica "istantanea" di un torneo è quello che
tiene conto di un confronto con la classifica prodotta da un torneo
doppio girone round robin con gli stessi giocaotri. Il sistema sarà
anche inapplicabile, ma è l'unico che, almeno "teoricamente", ha
veramente più senso IMHO.

Per una giusta analisi della singola classifica, ogni giocatore
dovrebbe essere considerato nelle stesse condizioni di "gioco" e non
dovrebbe invece essere valutato su di un campione approssimato di
incontri (quello prodotto dei sistemi di abbinamento svizzeri ad
esempio). Nel momento in cui si vuole utilizzare un dato (performance,
rating, buchholz o altro) che abbia comunque legami "parziali" e non
"omogenei" con quello che è successo nel torneo o nei vari rornei, mi
si permetterà di scegliere quello che IMHO ha più valore statistico.
Post by Bruno Rizzuti
Ma allora, come mai molti dei tuoi ragionamenti sembrano funzionare? Ci
sono vari motivi. Innanzitutto, perche' c'e' una evidente correlazione
tra rating e performance, per cui di solito (ma non sempre!) le due cose
coincidono. Inoltre, e' anche vero che la performance sul singolo torneo
e' influenzata da vari fattori. Dunque, alla fine se vogliamo un
risultato attendibile bisogna guardare alle classifiche di vari tornei,
ed e' per quello che il rating sembra preferibile. Ma prova a pensare al
caso estremo di un giocatore il cui rendimento oscilla fortissimamente,
e vedrai che i conti non ti tornano piu'.
La correlazione tra performance e rating è evidente proprio nei tornei
round robin. In questo tipo di tornei infatti i due valori coincidono
molto spesso e ciò avvalora sia il fatto che il torneo round robin sia
il sistema che meglio possa evidenziare "al momento" la reale forza
dei giocatori, sia il fatto che "mediamente" i giocatori tendono a
rispettare le aspettative espresse dal proprio rating.

Sul caso che un giocatore abbia un rendimento che oscilla fortemente
sono d'accordo, forse la performance è più precisa in questi casi
nella valutazione della forza. Essendo però questo un caso poco
frequente, rispetto alla maggioranza delle prestazioni espresse in
torneo, non può essere preso questo come riferimento per tutti quanti
gli altri.

Ciao, Christian
Piero Pipetta
2010-06-16 16:11:17 UTC
Permalink
mi si permetterà di scegliere quello che IMHO ha più valore statistico.
Andiamo gia' meglio. Prima davi per scontato che il criterio del rating
fosse indubbiamente il migliore, ora siamo arrivati all'IMHO. Io
comunque sto aspettando la dimostrazione che il criterio "performance"
sia statisticamente meno significativo di quello "rating". La mia
impressione - e direi anche quella della quasi totalita' degli
intervenuti, e' che una tale dimostrazione non ci sia, perche' l'assunto
e' falso.
John Travolta Sardus
2010-06-17 06:44:04 UTC
Permalink
... ma ciò che non capisco è perché si vuole
prendere come riferimento la performance che è anch'essa soggetta a
fluttuazioni, magari anche maggiori di quelle del rating, e che
dipendono spesso dalla "qualità" (guarda caso il rating) degli
avversari incontrati.
Che dipendano dalla qualita' degli avversari incontrati non e' un difetto,
ma un pregio!
Per una giusta analisi della singola classifica, ogni giocatore
dovrebbe essere considerato nelle stesse condizioni di "gioco" e non
dovrebbe invece essere valutato su di un campione approssimato di
incontri (quello prodotto dei sistemi di abbinamento svizzeri ad
esempio). Nel momento in cui si vuole utilizzare un dato (performance,
rating, buchholz o altro) che abbia comunque legami "parziali" e non
"omogenei" con quello che è successo nel torneo o nei vari rornei, mi
si permetterà di scegliere quello che IMHO ha più valore statistico.
Direi che si vuole un dato che, quando calcolato in un torneo in cui si e'
giocato con un doppio girone round robin, corrisponda il piu' possibile
alla classifica: non deve corrispondervi solo in media, perche' di solito
il livello di gioco che ogni giocatore esprime in un torneo e' uguale al
livello di gioco che il giocatore esprime in media, deve corrispondervi
bene anche quando i giocatori esprimono una forza diversa dal proprio
rating; altrimenti quello che accade nel torneo non conta.

Il rating non risponde a questo requisito, perche' basta che un giocatore
forte giochi male che avra' una posizione di classifica inferiore al suo
rating. La performance neanche, perche' basta che un giocatoe incontri
persone con un rating alto che stanno pero' giocando male che la
performance salga in maniera ingiustificata. La performance "di livello N"
calcolata iterativamente invece ha buone possibilita'. Se trovo il tempo
scrivo un programma che fa un po' di statistiche e poi ne posto i risultati
... non li avro' certamente nel giro di una settimana perche' per scrivere
il programma nel tempo che ho mi servira' molto piu' tempo, ma adesso sono
curioso.
Christian De Vivo
2010-06-17 16:11:13 UTC
Permalink
Post by John Travolta Sardus
Direi che si vuole un dato che, quando calcolato in un torneo in cui si e'
giocato con un doppio girone round robin, corrisponda il piu' possibile
alla classifica: non deve corrispondervi solo in media, perche' di solito
il livello di gioco che ogni giocatore esprime in un torneo e' uguale al
livello di gioco che il giocatore esprime in media, deve corrispondervi
bene anche quando i giocatori esprimono una forza diversa dal proprio
rating; altrimenti quello che accade nel torneo non conta.
Credo IMHO che questo dato possa essere il punteggio in classifica :-)
Post by John Travolta Sardus
Il rating non risponde a questo requisito, perche' basta che un giocatore
forte giochi male che avra' una posizione di classifica inferiore al suo
rating. La performance neanche, perche' basta che un giocatoe incontri
persone con un rating alto che stanno pero' giocando male che la
performance salga in maniera ingiustificata. La performance "di livello N"
calcolata iterativamente invece ha buone possibilita'. Se trovo il tempo
scrivo un programma che fa un po' di statistiche e poi ne posto i risultati
... non li avro' certamente nel giro di una settimana perche' per scrivere
il programma nel tempo che ho mi servira' molto piu' tempo, ma adesso sono
curioso.
Mi basterebbe anche una formula partendo dal tabellone del torneo.

Ciao, Christian
John Travolta Sardus
2010-06-17 21:57:50 UTC
Permalink
Post by Christian De Vivo
Post by John Travolta Sardus
Direi che si vuole un dato che, quando calcolato in un torneo in cui si e'
giocato con un doppio girone round robin, corrisponda il piu' possibile
alla classifica: non deve corrispondervi solo in media, perche' di solito
il livello di gioco che ogni giocatore esprime in un torneo e' uguale al
livello di gioco che il giocatore esprime in media, deve corrispondervi
bene anche quando i giocatori esprimono una forza diversa dal proprio
rating; altrimenti quello che accade nel torneo non conta.
Credo IMHO che questo dato possa essere il punteggio in classifica :-)
Beh dai cosi' mi costringi alle precisazioni minuziose! Si vuole un dato,
che possa essere calcolato anche per un torneo senza accoppiamenti
all'italiana in modo da poterlo confrontare con la classifica, che, quando
calcolato ...
Post by Christian De Vivo
Post by John Travolta Sardus
Il rating non risponde a questo requisito, perche' basta che un giocatore
forte giochi male che avra' una posizione di classifica inferiore al suo
rating. La performance neanche, perche' basta che un giocatoe incontri
persone con un rating alto che stanno pero' giocando male che la
performance salga in maniera ingiustificata. La performance "di livello N"
calcolata iterativamente invece ha buone possibilita'. Se trovo il tempo
scrivo un programma che fa un po' di statistiche e poi ne posto i risultati
... non li avro' certamente nel giro di una settimana perche' per scrivere
il programma nel tempo che ho mi servira' molto piu' tempo, ma adesso sono
curioso.
Mi basterebbe anche una formula partendo dal tabellone del torneo.
E' quella di cui ha parlaro Roberto Ricca, solo che l'unico modo che
conosco per calcolarlo e' quello ricorsivo. Primo passo: calcolare la
performance. Secondo passo: usare la performance come rating per calcolare
una seconda performance (performance di secondo grado); passo n-esimo:
usare la performance calcolata al passo n-1 esimo per calcolare la
performance di grado n+1-esimo. Questa procedura intuitivamente ha un
limite, che si consdera raggiunto quando la performance di grado n+1 esimo
non si discosta piu' di un tot dalla performance di livello n-esimo. Magari
esiste un modo per calcolarla direttamente arrivando subito al valore del
limite, epro' non sono in grado di ricavarmelo. Ma con la procedura
ricorsiva ed il computer in poco tempo si hanno i valori desiderati.
Christian De Vivo
2010-06-18 10:16:48 UTC
Permalink
Post by John Travolta Sardus
E' quella di cui ha parlaro Roberto Ricca, solo che l'unico modo che
conosco per calcolarlo e' quello ricorsivo. Primo passo: calcolare la
performance. Secondo passo: usare la performance come rating per calcolare
usare la performance calcolata al passo n-1 esimo per calcolare la
performance di grado n+1-esimo. Questa procedura intuitivamente ha un
limite, che si consdera raggiunto quando la performance di grado n+1 esimo
non si discosta piu' di un tot dalla performance di livello n-esimo. Magari
esiste un modo per calcolarla direttamente arrivando subito al valore del
limite, epro' non sono in grado di ricavarmelo. Ma con la procedura
ricorsiva ed il computer in poco tempo si hanno i valori desiderati.
Il problema è che per il calcolo serve l'intero tabellone del torneo,
quindi credo che il calcolo della performance N si debba fare a parte.
Ci penso un po' e vi faccio sapere, in excel sarà comunque un
lavoraccio :-)

Ciao, Christian
Alessandro Antonelli
2010-06-14 15:21:04 UTC
Permalink
Post by Christian De Vivo
E' proprio perché il rating è l'unica indicazione statistica della
forza di un giocatore che esso deve essere assunto come riferimento
nell'elaborazione di una classifica "ideale". E' vero infatti che nel
singolo torneo alcuni giocatori possono sensibilmente discostare il
loro livello di gioco dalle attese, ma mediamente ciò che prevale
nelle classifiche è il rispetto dei valori espressi dal rating: questo
è indiscutibile e facilmente dimostrabile.
Non sarà mai possibile avere una classifica che rispecchi la forza di
gioco di un giocatore nel singolo torneo se quest'ultimo non è
strutturato in modo tale da fare incontrare tutti i giocatori tra di
loro. Solo in questo tipo di tornei infatti la performance assume lo
stesso valore statistico del punteggio ottenuto all'interno di una
classifica. Ma qualsiasi altro sistema di abbinamento, diverso da un
round robin, difficilmente esprimerà la reale forza di gioco di un
giocatore. Sia la classifica per punteggio che quella per performance
saranno sempre quindi soggette ad un grande margine di errore. E'
semplice inoltre costatare come, in un torneo svizzero, una classifica
basata sulla performance o su altri fattori non coincida affatto con
la classifica per punteggio. La performance è influenzata
inesorabilmente del percorso abbinativo e, per tale motivo, non ha lo
stesso valore statistico per tutti i giocatori.
Leggendo te e le altrui risposte rimango della medesima opinione.

E' ovvio che una classifica ideale non è ottenibile se non giocando un
doppio round robin. Allora con cosa confrontare la classifica imperfetta di
un torneo svizzero o Amalfi per determinarne il discostamento da una
ipotetica classifica ideale? Semplice, non si può. Non rimane che fare un
tentativo di definire una classifca che si avvicini all'ideale partendo da
un torneo imperfetto. Tu dici che il rating può raggiungere lo scopo ma a me
sembra un concetto del tutto antisportivo. La classifca ideale non è quella
che mette in ordine i giocatori dal più forte al più debole ma quella che li
ordina da quello che ha giocato meglio a quello che ha giocato peggio.
Quindi il rating è concettulamente sbagliato. La performance invece prende
atto dei risultati nel torneo oltre che del rating. Non sarà un metodo
perfetto e probabilmente è migliorabile ma al momento non mi viene in mente
qualcosa di preferibile.

Francamente ai miei occhi sembra una questione talmente ovvia che non
necessiterebbe di ulteriori approfondimenti ma com'è giusto ognuno ha le
proprie idee.

Ciao
Alessandro
mario.scafroglia
2010-06-14 17:04:24 UTC
Permalink
Post by Alessandro Antonelli
Francamente ai miei occhi sembra una questione talmente ovvia che non
necessiterebbe di ulteriori approfondimenti ma com'è giusto ognuno ha le
proprie idee.
... qualcuno è pure de coccio...
Christian De Vivo
2010-06-13 00:28:57 UTC
Permalink
link:http://arbitriscacchi.googlegroups.com/web/statistica.xls
Ho notato che il file .xls contiene un errore dovuto probabilemte alla
cneversione dal formato .ods. Pubblico il link alla versione
funzionante in Open Office. Mi scuso per l'errore.

http://groups.google.it/group/arbitriscacchi/web/statistica.ods

Ciao, Christian
Christian De Vivo
2010-06-17 16:35:54 UTC
Permalink
Il modulo excel da me costruito può confrontare la classifica di
punteggio sia con quella in ordine di rating che con quella in ordine
di performance (anche quella di performance di ordine N, come qualcuno
la chiama). Basta semplicemente inserire, al posto dei singoli
punteggi rating dei giocatori classificati, la loro performance.

Ciao, Christian
John Travolta Sardus
2010-06-17 21:59:21 UTC
Permalink
Post by Christian De Vivo
Il modulo excel da me costruito può confrontare la classifica di
punteggio sia con quella in ordine di rating che con quella in ordine
di performance (anche quella di performance di ordine N, come qualcuno
la chiama). Basta semplicemente inserire, al posto dei singoli
punteggi rating dei giocatori classificati, la loro performance.
Ciao, Christian
Ormai la cosa mi ha preso ... ho visto questo messaggio solo dopo che avevo
inviato il mio di risposta al tuo di qui sopra ... e l'iterazione e il
controllo di convergenza riesci ad inserirli?
Roberto Ricca
2010-06-17 23:10:04 UTC
Permalink
l'iterazione e il controllo di convergenza riesci ad inserirli?
Sulla convergenza non ci conterei. Ho parlato di performance a livello
N, proprio per bloccare i calcoli dopo un certo numero di passi.

Magari il problema e` solo definire un criterio di convergenza. Io
(partendo da un valore iniziale uguale per tutti) avevo scelto che tutte
le variazioni elo fossero zero, ma non ne venivo mai a capo.
--
Roberto Ricca
2010: GO GIANTS (Anybody but the Dodgers) [Magic Number: 163]
Massimiliano Orsi
2010-06-18 09:58:45 UTC
Permalink
Post by Roberto Ricca
Sulla convergenza non ci conterei.
Uh? Ma se non converge che senso ha?

Massimiliano Orsi
Roberto Ricca
2010-06-18 11:55:12 UTC
Permalink
Post by Massimiliano Orsi
Post by Roberto Ricca
Sulla convergenza non ci conterei.
Uh? Ma se non converge che senso ha?
In una dimostrazione matematica nessuno.

Ma qui l'obiettivo e` migliorare il valore di riferimento: rating,
performance, forse una sorta di 'adjusted APRO' (APRO=Average
Performance Rating Opponents; l'adjusted tiene anche conto
dell'incremento/decremento dovuto alla percentuale ottenuta) sono tutti
dati generalmente piu` precisi del precedente.

Se spingi l'iterazione 3/4 volte ottiene valori sempre piu` precisi
(rating -che e` la performance al passo precedente- e performance si
avvicinano sempre piu`), ma non credo si arrivi allo zero per tutti.

Coem scritto, io facevo i calcoli in un altro modo (basandomi sulla
variazione elo) e terminavo quando la somma dei quadrati delle
differenze tra il valore iniziale e quello finale era inferiore ad un
certo limite che mi ero predefinito. Non ottenevo l'unica soluzione
possibile (ammesso che esistesse), ma era un valore comunque di buon
significato.
--
Roberto Ricca
2010: GO GIANTS (Anybody but the Dodgers) [Magic Number: 98]
Christian De Vivo
2010-06-18 12:09:50 UTC
Permalink
Post by Roberto Ricca
Ma qui l'obiettivo e` migliorare il valore di riferimento: rating,
performance, forse una sorta di 'adjusted APRO' (APRO=Average
Performance Rating Opponents; l'adjusted tiene anche conto
dell'incremento/decremento dovuto alla percentuale ottenuta) sono tutti
dati generalmente piu` precisi del precedente.
Credo che un buon miglioramento lo si possa ottenere considerando
semplicemente la media ponderata del rating degli avversari in cui la
ponderazione viene effettuata con il punteggio ottenuto nel singolo
incontro.

Ciao, Christian
Piero Pipetta
2010-06-18 10:51:58 UTC
Permalink
Post by Roberto Ricca
Sulla convergenza non ci conterei.
Perche' no? Questo era il metodo di calcolo del rating che intendeva
applicare la PCA, anche se non credo sia mai entrato in vigore vista la
miserevole fine di quell'associazione, ed a quanto pare convergeva bene.
Christian De Vivo
2010-06-18 11:43:16 UTC
Permalink
Post by Piero Pipetta
Perche' no? Questo era il metodo di calcolo del rating che intendeva
applicare la PCA, anche se non credo sia mai entrato in vigore vista la
miserevole fine di quell'associazione, ed a quanto pare convergeva bene.
La "performance di ordine N" non converge a causa del sistema di
calcolo stesso della performance, che prevede l'aggiunta di una
costante in funzione della percentuale di vittorie ottanute. Tale
costante fa oscillare il valore della performance attorno alla media
rating degli avversari.

Prendiamo ad esempio il caso semplice di due giocatori: uno con Elo
1600 e l'altro con Elo 1500. Supponiamo inoltre che i giocatori in
questione abbiano effettuato un solo incontro in cui il giocatore con
l'Elo più alto ha vinto. Nel calolo della pervormance la media rating
degli avversari consiste nel semplice Elo dell'altro giocatore. In
questo caso la performance del primo è 2300, mentre quella del secondo
è 800. Se si vanno a sostituire tali valori al posto dell'Elo iniziale
e si ricalcola la performance (performance di livello 2) notiamo
subito che le performance diventano rispettivamente 1600 e 1500,
ovvero pari al rating iniziale. Ricalcolando il valore della
performance con questi valori (performance di 3° livello) riotteniamo
i valori della performance cosiddetta di "livello uno". Iterare il
procedimento è quindi inutile in quanto la performance oscillerà
sempre. E' facile verificare che lo stesso si sarebbe avuto anche in
caso di patta o di vincita del giocatore con Elo più basso.

Ciao, Christian
Christian De Vivo
2010-06-18 10:07:14 UTC
Permalink
Post by John Travolta Sardus
Ormai la cosa mi ha preso ... ho visto questo messaggio solo dopo che avevo
inviato il mio di risposta al tuo di qui sopra ... e l'iterazione e il
controllo di convergenza riesci ad inserirli?
Con il modulo attuale credo proprio di no. Un controllo di convergenza
implicherebbe l'inserimento di più dati per ogni singolo giocatore
(performance, elo, variazione ecc.) Definendo però bene quali sono i
criteri, credo sia possibile farlo. In questo modo si minerà però
fortemente la semplicità di inserimento dei dati. Ho lavorato in excel
proprio per rendere il modulo accessibile a chiunque.

Il modulo comunque funziona così: si inseriscono i valori in ordine di
classifica / punteggio (rating, performance, performance di ordine N);
si crea il tabellone (in ordine di rating, performance ecc.); a
seconda del numero di posizioni di classifica disponibili (se M è il
numero di turni, le posizioni di classifica saranno 2M+1) si forma una
possibile classifica "migliore" in funzione del numero di giocatori
(perché di solito tale numero è superiore al numero di posizioni); in
base a questo processo viene stabilito quanti e quali giocatori sono
"destinati" al primo posto, al secondo e così via; infine viene
confrontata la posizione di classifica effettiva con quella della
classifica "migliorata"; lo scostamento dalla classifica prevista
viene infine normalizzato al valore di scostamento massimo posssibile.
Post by John Travolta Sardus
Magari il problema e` solo definire un criterio di convergenza. Io
(partendo da un valore iniziale uguale per tutti) avevo scelto che tutte
le variazioni elo fossero zero, ma non ne venivo mai a capo.
Utilizzare come criterio di convergenza che la variazione sia zero,
non significa considerare che la performance tenda all'Elo del singolo
giocatore? :-)

Ciao, Christian
John Travolta Sardus
2010-06-20 22:19:41 UTC
Permalink
Post by Christian De Vivo
Post by John Travolta Sardus
Ormai la cosa mi ha preso ... ho visto questo messaggio solo dopo che avevo
inviato il mio di risposta al tuo di qui sopra ... e l'iterazione e il
controllo di convergenza riesci ad inserirli?
Con il modulo attuale credo proprio di no. Un controllo di convergenza
implicherebbe l'inserimento di più dati per ogni singolo giocatore
(performance, elo, variazione ecc.) Definendo però bene quali sono i
criteri, credo sia possibile farlo. In questo modo si minerà però
fortemente la semplicità di inserimento dei dati. Ho lavorato in excel
proprio per rendere il modulo accessibile a chiunque.
Ho fatto un po' di prove con il computer (solo per un girone
all'italiana) e ho visto che generalmente il calcolo della "performance
di ordine N" converge con una precisione dell' 1% dopo poche iterazioni
(addirittura dopo sole due iterazioni in alcuni casi che ho
considerato). Il fenomeno di cui tu hai parlato in un post piu' in alto
nel thread (i valori della performance di due giocatori continuano ad
oscillare ad ogni iterazione e non convergono mai) e' interessante ma ho
il sospetto che capiti solo quando ci sono solo due giocatori. Gia'
quando ce ne sono tre (che si incontrano tutti fra di loro) non sono
riuscito a riprodurlo (nelle poche prove che ho fatto ovviamente). Il
mio sospetto e' che con gia' con tre giocatori la media Elo degli
avversari incontrati da ogni giocatore non possa variare cosi'
tremendamente da un'iterazione alla successiva come accade con due soli
giocatori. Quello che ho capito sinora e' che la media Elo di tutti i
giocatori del torneo e la media delle performance sono esattamente la
stessa (l'Elo totale si conserva), per cui in un girone all'italiana la
media Elo degli avversari incontrati sara' piuttosto simile alla media
Elo complessiva se i partecipanti sono molti.

Spero che considerazioni simili valgano nel caso di un torneo con meno
turni. Non sono riuscito a fare ancora delle prove per questo caso
(essenziale per il tipo di calcoli che stiamo provando ad impostare)
perche' non sono ancora riuscito a generare delle tabelle di
accoppiamenti. Ho pensato ad un sistema: generare un tabellone
all'italiana e considerare i soli primi m turni, con m piu' piccolo del
numero di turni totale, uguale a sua volta al numero di giocatori meno
uno; ma non ho ancora avuto il tempo di scrivere un programmino anche
per quello. Ti faro' sapere.

In conclusione, la mia impressione e' che si possa fare il calcolo della
performance di ordine N fermandosi semplicemente alla seconda o terza
iterazione con ottime garanzie di buona precisione: quindi in pratica il
controllo di convergenza non e' essenziale e il calcolo si puo' fare
anche con un foglio Excel. Se avro' modo di fare dei controlli ulteriori
postero' ancora.
Post by Christian De Vivo
Post by John Travolta Sardus
Magari il problema e` solo definire un criterio di convergenza. Io
(partendo da un valore iniziale uguale per tutti) avevo scelto che tutte
le variazioni elo fossero zero, ma non ne venivo mai a capo.
Utilizzare come criterio di convergenza che la variazione sia zero,
non significa considerare che la performance tenda all'Elo del singolo
giocatore? :-)
No, anche se non riesco a trovare un'argomentazione sintetica e lucida
per mostrarlo. Ad ogni modo, come detto in un altro post da R. Ricca, la
convergenza non e' definita da variazione = 0 ma da variazione minore di
un tanto prefissato. La vera convergenza e' "al limite" per un numero
infinito di iterazioni.

Continua a leggere su narkive:
Loading...