USE CASE
Il RL, grazie alla sua versatilità, trova applicazioni in numerosi scenari anche molto diversi fra loro. Alcuni esempi di interesse nel mondo delle telco sono:
• Risoluzione di task “classici” del Machine Learning: il problema in questo caso viene ristrutturato come un task di decision-making. Un esempio è la time series forecasting.
L’agente impara a predire valori futuri (azione) sulla base delle osservazioni passate (environment) e di una metrica di valutazione, come ad esempio l’accuratezza della predizione (reward).
• Routing optimization: sulla base di una metrica di interesse che si vuole ottimizzare (e.g. bandwidth, delay ecc.) l’agente, quando avviene una richiesta di comunicazione tra due nodi, sceglie il percorso ottimale in modo da ottimizzare nel lungo periodo la metrica.
Questo significa che l’ottimizzazione prenderà in considerazione anche possibili comunicazioni future seguendo un approccio proattivo
.