
Introduzione
Il ciclismo è uno sport dove quasi tutto è misurabile (Jobson et al., 2009) e diverse strumentazioni possono definire con buona precisione tra i più disparati parametri. È forse considerato uno degli sport dove si possono ottenere più dati, tanto che i dati di frequenza cardiaca, potenza, HRV, core temperature, distanza, durata, cadenza, … sono spesso solo la base per ottenere altrettanti dati via via più complessi. Se guardiamo al passato di questo sport, esso viene ben rappresentato da una visione più olistica e alquanto ‘romantica’, dove i dati più elaborati derivavano solamente dai chilometri percorsi, spesso misurati a tavolino su carta, senza l’utilizzo di particolari strumentazioni. Ma il ciclismo odierno è un continuo evolversi grazie ad un filo conduttore chiaro e trasparente – anche se su quest’ultimo aggettivo ci sarebbe da discutere – che è ben rappresentato dalla scienza e dalla raccolta di una mole immensa di dati. La presenza di software sempre più complessi (Golden Cheetah, WKO, …) e di facile accesso permette con un semplice click di scaricare i dati e ‘trasformarli’ velocemente in altri dati o indici attraverso algoritmi più o meno complessi. Il grande problema è che i dati sono davvero tanti, spesso inutili e in sovrabbondanza o, ancora peggio, poco accurati, perché rispecchiano in modo errato la realtà.
Revisione della letteratura
Nel ciclismo, così come in altri sport, l’insieme delle gare e degli allenamenti può essere quantificato in termini di Training Load (TL), un concetto importante originariamente ideato da Banister et al. (1975) che, attraverso degli algoritmi, combina l’intensità e la durata della competizione/allenamento in maniera che si possa determinare la dose di allenamento; inoltre, in modo cumulativo (somma di diverse sessioni), si può utilizzare la dose per il monitoraggio e la prescrizione dell’allenamento dell’atleta.
L’avvento poi di algoritmi sempre più complessi, capaci di calcolare il carico di allenamento e lo stato di forma, hanno avuto l’effetto opposto di creare forse più confusione e incoerenza. A sostegno di ciò, interessante vedere come lo studio di Jobson et al. nel 2009 prospettasse un’evoluzione degli algoritmi di predizione del carico di allenamento in modo che diventassero sempre più precisi, ma nel 2022 (ben 13 anni dopo) lo studio di Passfield et al. ha concluso che attualmente emergono ancora parecchie limitazioni per quanto riguarda la predizione corretta del carico di allenamento.
Anche Vermeire et al. (2022) confermano questa tendenza. D’altra parte, l’avvento di nuovi simulatori del metabolismo umano (vedi alcuni software) durante l’azione ciclistica ha portato ad un ulteriore step nella predizione della performance, permettendo di stimare con precisione molto alta il tempo finale di gara o i livelli di alcuni parametri fisiologici dopo determinati sforzi. Sistemi che sono ancora agli stadi preliminari, ma che promettono di sostituire i modelli matematici esistenti per la predizione dei tempi di recupero (W’ balance) e della capacità prestativa (W’) al di sopra di un certo livello di intensità (la Critical Power, CP), che attualmente presentano diverse limitanti (Skiba et al., 2012). Il rischio è che le predizioni possono rivelare dei grossi errori di sovrastima o sottostima che possono influenzare pesantemente la predizione della prestazione.
Questo accade perché il limite più grande dei modelli matematici che contengono algoritmi è il fatto di tendere alla standardizzazione: per quanto accurati possano essere, tendono a oggettivizzare tutto all’estremo come viene ben espresso da Adetunji nel suo articolo (2022) e non colgono alcune variabili poco controllabili (fattori esterni), meglio visibili attraverso l’occhio umano esperto (il cosiddetto ‘occhiometro’). Inoltre, Impellizeri et al. (2019) presentano delle definizioni di TL esterno come lavoro fisico prescritto nel programma di allenamento di un atleta (cioè la sua quantità) e di TL interno come risposta psicofisiologica di un atleta a questo TL esterno (in pratica, riflettendo la dose di allenamento). Tuttavia, gli stessi ricercatori hanno osservato che né il concetto di TL interno né quello di TL esterno hanno una misura gold standard a cui fare riferimento e, pertanto, la validità di ogni misura di TL è probabilmente dipendente dal contesto.
A sostegno di ciò, un’altra interessante review del 2022 di Shei et al. dimostra come la letteratura attuale non mostri validità e affidabilità coerenti per varie metriche, con algoritmi non disponibili pubblicamente o privi di studi di convalida di alta qualità. I progressi nella tecnologia indossabile dovrebbero prendere in considerazione la standardizzazione delle metriche di convalida, la trasparenza degli algoritmi utilizzati e il miglioramento del modo in cui la tecnologia può essere adattata alle persone. Fino ad allora, è prudente prestare attenzione quando si interpretano le metriche riportate dai dispositivi indossabili dei consumatori.
Teoria e quesiti
Diversi studi hanno dimostrato una relazione tra il TL e il rischio di infortunio, di malattia e overtraining. Nel ciclismo in particolare, l’utilizzo sempre maggiore di strumentazioni che in altri sport non sarebbero possibili, nello specifico il misuratore di potenza, ha reso possibile e facilitato la registrazione dei dati delle varie sessioni con una risoluzione molto alta. Come vedremo in seguito, questo ha portato ad un’eccessiva sicurezza in questi algoritmi che poi si è rivelata fallace. Il dato oggettiva, ma oggettiva solo se il sistema è valido e si basa su criteri di validità; in caso contrario si rischia di andare fuori rotta e sbagliare completamente predizione, senza aiutare in alcun modo la prestazione dell’atleta, ma talvolta addirittura peggiorandola.
Recenti studi hanno proprio dimostrato la non validità assoluta dei diversi sistemi per quantificare il TL. Allora, a cosa serve l’utilizzo di queste strumentazioni?
Probabilmente può essere una forma di tutela per i coaches, che possono basarsi su qualcosa di apparentemente oggettivo e quindi poco contestabile per giustificare scelte, errori o imprevisti.
Inoltre, può essere considerato un supporto aggiuntivo che permetta di correggere alcune direzioni facilitando il compito. Ma il dato può essere ritenuto un valido sistema che sostituisca le metodiche più tradizionali basate sullo scambio informazionale tra atleta e coach? Oggettivare un contesto può condurre a meno errori? O forse a più errori quando manca validità?
I dati
Abbiamo brevemente descritto come il TL ha assunto connotati sempre più definiti e precisi. Da queste apparenti sicurezze Passfield et al. (2017) hanno cercato di dimostrare come fosse possibile massimizzare il livello di performance degli atleti, diminuendo tutti i rischi correlati. Cinque anni dopo però (2022), lo stesso Passfield e collaboratori revisionarono tale supposizione; infatti, arrivarono alla conclusione che deve essere ancora stabilito con evidenza che il TL di un atleta possa indicare effettivamente la dose della sessione di allenamento/competizione e relativi prescrizione e monitoraggio dell’allenamento.
A sottolineare questa preoccupazione sono i recenti risultati che hanno dimostrato circostanze in cui il TL calcolato non riflette lo stress generale della sessione ed è quindi improbabile che rappresenti la sua dose corretta di allenamento/competizione (Kesisoglou et al., 2021). Anche nel libro di Hunter e Coggan (2019) viene proposto un algoritmo per predire il TL basandosi sui dati della potenza media e potenza normalizzata (NP), ovvero il cosiddetto Training Stress Score (TSS) e i suoi derivati ATL (Acute Training Load), CTL (Chronic Training Load) e TSB (Training Stress Balance), gli stessi parametri utilizzati anche in software quali Training Peaks e Golden Cheetah (Figura 1).

Con il loro database raccolto hanno creato dei range di rischio o di sicurezza per quanto riguarda il carico di allenamento, ma spesso presentano diverse limitanti, perché non tengono conto di alcune caratteristiche fisiologiche dell’atleta, il relativo livello di fitness e altri fattori esterni, nonostante gli algoritmi siano basati sulle zone di allenamento dell’atleta stesso (anche qua, a loro volta contestabili).
Come sostengono Passfield et al. (2022), il problema è che le metriche proposte sono state convalidate rispetto a misure precedentemente non convalidate o semplicemente non sono state convalidate affatto. Il contributo eccezionale di Banister et al. (1975) è stato quello di concepire e dimostrare che il TL di un atleta, quantificato come Training Impulse (TRIMP), possa essere utilizzato per prevedere i cambiamenti nelle prestazioni.
Questa e le loro successive osservazioni sembrano essere state interpretate erroneamente come una dimostrazione del fatto che i TRIMP costituiscono una misura valida di TL. Tuttavia, l'ipotesi che i TRIMP forniscano un mezzo valido per quantificare una dose di allenamento non è mai stata testata da Banister et al. nel loro lavoro originale (1975) e successivo (1980). Inoltre, Vermeire et al. (2022) sostengono che i valori dei parametri sono influenzati dai valori di partenza, dalla tecnica di modellizzazione e dall’input del modello; pertanto, devono essere utilizzati con molta cautela e interpretati correttamente.
Discussione e conclusione
Abbiamo visto come possa essere utile avere dei sistemi predittivi che permettano di predire la prestazione e monitorare il percorso dell’atleta attraverso degli algoritmi che raccolgono diversi dati provenienti da differenti dispositivi. Uno di questi algoritmi è quello che calcola il TL. Negli anni passati era considerato come il futuro, ma studi molto recenti (ad esempio quello di Passfield et al., 2022 e di Vermeire et al., 2022) hanno rivisto il concetto di TL e relativo calcolo e sono arrivati alla conclusione che questi sistemi non sono così precisi come si era pensato in tempi passati, ma presentano parecchie limitazioni, tra cui la loro validità ed eccessiva oggettivizzazione. Infatti, sono necessarie nuove metriche TL e approcci diversi alla loro convalida.
Pertanto, le metriche TL esistenti devono essere utilizzate e interpretate con cautela fino a quando la loro validità non è stata dimostrata e sono necessarie ulteriori ricerche per esplorare come modellare i rispettivi contributi dell'intensità e della durata dell'esercizio. Di conseguenza, l’approccio di utilizzo delle metriche del TL deve essere assolutamente critico. Concludendo, condivido una frase di Adetunji pubblicata sulla rivista The Conversation (2022):
“Objectivity here is more about morality than validity. Mechanical objectivity made suppression of self a duty, a triumph of abstemious will over the prideful claim of competence to judge and interpret. The contrast between mechanical objectivity and devotion to truth is subtle but important. A uniformly sharp photograph might well be confusing, masking the main point in irrelevant detail. It is easier to identify a flower or recognize a diseased kidney from an idealized drawing than from an unretouched photograph.”
Spesso si cerca un eccesso di oggettività, ‘condita’ da una marea di dati; talvolta però, un semplice disegno stilizzato può consegnarci più informazioni chiare su dove dobbiamo realmente concentrarci rispetto ad una foto in alta definizione e molto dettagliata in cui si fatica a distinguerne bene gli elementi essenziali. Questo non significa che il dato non è importante, ma piuttosto che esso è fondamentale solo se viene sapientemente filtrato da un attento ed esperto fruitore che conosce bene il contesto.
Da questa considerazione l’importanza del dato - e soprattutto il dato utile - come conferma o aiuto al preparatore o all’allenatore, piuttosto che come guida. Il dato può confermare le scelte attuate dall’esperto. Il dato è come un righello per aiutare a direzionare il tiro: se proviamo a disegnare una linea retta a mano libera con una matita, difficilmente saremo precisi; se invece ci aiutiamo con il righello, possiamo senza ombra di dubbio essere più precisi, ma alla fine chi traccia la linea è sempre la matita manovrata dalla mano umana e non viceversa. Nel ciclismo è proprio così, nonostante si commettano ancora tanti errori: i dati del monitoraggio continuo della potenza e relative predizioni hanno portato ad un passo avanti enorme nell’ambito, spesso però si riscontrano errori di interpretazione o errori dovuti ad un’eccessiva oggettivizzazione.
Ciò non toglie che l’oggettività espressa dal dato risulta comunque essere una forma di tutela per chi prepara nel ciclismo e, nonostante il TL non sia effettivamente un sistema validato, è comunque riconosciuto nell’ambito; pertanto, si può utilizzare per giustificare alcuni imprevisti successi nella preparazione (ad esempio plateau prestativi, miglioramenti, infortuni, ecc), dimostrando che non sono sempre errori del preparatore o dell’allenatore, ma che semplicemente hanno cause indotte da fattori esterni non controllabili.

Un’ultima domanda sorge spontanea: premesso che gli algoritmi e le metriche siano corrette in un mondo ideale, siamo davvero sicuri che i dispositivi portatili che raccolgono i dati per le successive equazioni siano davvero affidabili? Shei et al. (2022) sono molto cauti su questo, poiché i criteri di validazione e l’accuratezza di queste strumentazioni sono spesso molto deficitari; quindi, è opportuno prestare attenzione quando si interpretano le metriche e le equazioni riportate dai dispositivi indossabili dei relativi fruitori.
Personalmente utilizziamo gli indici di carico solamente per avere una doppia conferma della progressione di lavoro (non imprescindibile), mentre la risposta all’allenamento la misuriamo attraverso il monitoraggio di RPE, potenza e HR durante sedute simili (nella Figura 2 monitoraggio di tali parametri durante una seduta di allenamento indoor), attraverso i test di valutazione e lo scambio e il confronto diretto con l’atleta. Inoltre, grande importanza ha lo studio della cinetica dell’HR in risposta a determinate intensità-recupero durante una seduta di allenamento, sia in termini qualitativi che quantitativi, un dato che sicuramente garantisce molte informazioni utili.
Dott. Stefano & Matteo Nardelli
Bibliografia
Adetunji Jo (2022). Has the monitoring of professional athletes’ intimate information gone too far? The Conversation UK
Banister EW, Calvert TW (1980). Planning for future performance: implications for long term training. Can J Appl Sport Sci J Can Sci Appl Au Sport.; 5:170–176
Banister EW, Calvert TW, Savage MV, Bach TM (1975). A systems model of training for athletic performance. Aust J Sports Med.; 7:57–61
Bourdon PC, Cardinale M, Murray A (2017). Monitoring athlete training loads: Consensus statement. Int J Sports Physiol Perform
Hunter Allen, Andrew Coggan, Stephen McGregor (2019). Training and racing with a powermeter (Third Edition). Velopress
Impellizzeri FM, Marcora SM, Coutts AJ (2019). Internal and external training load: 15 years on. Int J Sports Physiol Perform.; 14(2):270–273
Jobson Simon A., Passfield Louis, Atkinson Greg, Barton Gabor, Scarf Philip (2009). The Analysis and Utilization of Cycling Training Data. Sports Med; 39 (10): 833-844
Kesisoglou A, Nicolò A, Passfield L (2021). Cycling performance and training load: effects of intensity and duration. Int J Sports Physiol Perform.; 16:535–543
Passfield L, Hopker JG (2017). A mine of information: can sports analytics provide wisdom from your data? Int J Sports Physiol Perform.;12(7):851–855
Passfield Louis, Murias Juan M., Sacchetti Massimo, Nicolò Andrea (2022). Validity of the Training-Load Concept. International Journal of Sports Physiology and Performance; 17, 507-514
Shei Ren‑Jay, Holder Ian G., Oumsang Alicia S., Paris Brittni A., Paris Hunter L. (2022). Wearable activity trackers–advanced technology or advanced marketing? European Journal of Applied Physiology
Skiba, P. F., W. Chidnok, A. Vanhatalo, A. M. Jones (2012). Modeling the Expenditure and Reconstitution of Work Capacity above Critical Power. Med. Sci. Sports Exerc., Vol. 44, No. 8, pp. 1526–1532
Vermeire Kobe, Ghijs Michael, Bourgois Jan G., Boone Jan (2022). The Fitness–Fatigue Model: What’s in the Numbers? International Journal of Sports Physiology and Performance; 17, 810-813
Commentaires