Lyu, C., Gao, S., Gu, Y., Zhang, W., Gao, J., Liu, K., . . . Chen, K. (2025). Exploring the Limit of Outcome Reward for Learning Mathematical Reasoning.
Chicago-referens (17:e uppl.)Lyu, Chengqi, et al. Exploring the Limit of Outcome Reward for Learning Mathematical Reasoning. 2025.
MLA-referens (9:e uppl.)Lyu, Chengqi, et al. Exploring the Limit of Outcome Reward for Learning Mathematical Reasoning. 2025.
Varning: dessa hänvisningar är inte alltid fullständigt riktiga.