APA-referens (7:e uppl.)

Lyu, C., Gao, S., Gu, Y., Zhang, W., Gao, J., Liu, K., . . . Chen, K. (2025). Exploring the Limit of Outcome Reward for Learning Mathematical Reasoning.

Chicago-referens (17:e uppl.)

Lyu, Chengqi, et al. Exploring the Limit of Outcome Reward for Learning Mathematical Reasoning. 2025.

MLA-referens (9:e uppl.)

Lyu, Chengqi, et al. Exploring the Limit of Outcome Reward for Learning Mathematical Reasoning. 2025.

Varning: dessa hänvisningar är inte alltid fullständigt riktiga.