Qi, P., Liu, Z., Pang, T., Du, C., Lee, W. S., & Lin, M. (2025). Optimizing Anytime Reasoning via Budget Relative Policy Optimization.
Chicago-referens (17:e uppl.)Qi, Penghui, Zichen Liu, Tianyu Pang, Chao Du, Wee Sun Lee, och Min Lin. Optimizing Anytime Reasoning via Budget Relative Policy Optimization. 2025.
MLA-referens (9:e uppl.)Qi, Penghui, et al. Optimizing Anytime Reasoning via Budget Relative Policy Optimization. 2025.
Varning: dessa hänvisningar är inte alltid fullständigt riktiga.