ci sono alcuni malintesi su cosa stia realmente accadendo in diversi allenamenti decentralizzati
RL Swarm non è solo generazione di rollout distribuiti, è un apprendimento basato sul gossip in cui la comunicazione stessa è un obiettivo di allenamento