Toledo, E. (2024). Stoix: Distributed Single-Agent Reinforcement Learning End-to-End in JAX (Version v0.0.1) [Computer software]. https://doi.org/10.5281/zenodo.10916258