Publications

2 results for Guangtao Zeng

BOAD: Discovering Hierarchical Software Engineering Agents via Bandit Optimization
- - Iris Xu
  - Guangtao Zeng
  - et al.
- 2026
- ICLR 2026
Poster
Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search
- - Maohao Shen
  - Guangtao Zeng
  - et al.
- 2025
- ICML 2025
Conference paper