Publications

2 results for Maohao Shen

Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search
- - Maohao Shen
  - Guangtao Zeng
  - et al.
- 2025
- ICML 2025
Conference paper
Post-hoc Uncertainty Learning using a Dirichlet Meta-Model
- - Maohao Shen
  - Yuheng Bu
  - et al.
- 2023
- AAAI 2023
Poster