AgentCPM-Explore: Realizing Long-Horizon Deep Exploration for Edge-Scale Agents
ArXiv 2026. First author. Open-source 4B agent model achieving SOTA on GAIA & HLE, surpassing GPT-5 and Claude-4.5-Sonnet.

陈颢天现任上海交通大学人工智能学院助理研究员,在 RethinkLab 与 严骏驰 教授合作开展研究。
他的研究目标是理解并发展能够自动完成长期、复杂、需要大量时间投入甚至创造性思考任务的人工智能系统,重点关注自主智能体、大语言模型与 AI4Research。
他于复旦大学获得数据科学博士学位,并在清华大学 THUNLP 开展博士后研究,与 刘知远 教授和 孙茂松 教授合作。他也曾在微软亚洲研究院担任科研实习生,参与研发的 RD-Agent 登上微软 Build 2025 全球 Keynote。
邮箱: htchen@tsinghua.edu.cn
GitHub: github.com/Hytn
Google Scholar: scholar profile
教育背景
上海交通大学
微软亚洲研究院
清华大学(交叉信息研究院)
复旦大学
大连理工大学
我的研究目标是理解并发展能够自动完成工程、科研、开发等复杂任务的人工智能系统。这些任务通常需要长期投入、大量努力,甚至依赖人类的创造性思考。围绕这一目标,我目前主要聚焦三个彼此关联的方向:
🧪 AI4Research —— 构建能够进行文献检索、实验设计、数据分析、假设生成与验证的 AI 科研助手。
🤖 自主智能体 —— 研究具备环境感知、长短期记忆、任务分解与规划、工具调用能力的智能体模型与系统,并以大语言模型作为核心智能引擎。
🧠 基础模型 —— 探索通用人工智能模型的预训练与适配,包括语言理解与生成、知识表征、多模态信息融合以及下游任务泛化。
ArXiv 2026. First author. Open-source 4B agent model achieving SOTA on GAIA & HLE, surpassing GPT-5 and Claude-4.5-Sonnet.
EMNLP 2025 Demo. GUI agents with reinforcement fine-tuning. 1,200+ GitHub Stars.
ArXiv 2025. Team contribution (led MCP agent capabilities). 8,300+ GitHub Stars.
ArXiv 2024. First author. RD-Agent for automatic R&D. Featured in Microsoft Build 2025 Keynote. 11,400+ GitHub Stars.
我的开源工作围绕 LLM 驱动的智能体 形成了较完整的生态链:数据(AgentCPM-GUI, ToolLLM)→ 算法(AgentRL, AgentCPM-Explore, MiniCPM4-MCP)→ 执行(RD-Agent, XAgent)→ 评测(ToLeaP)→ 应用(QingXiaoDa)。
🏆 **Project Lead** · Open-source 4B agent model achieving SOTA on GAIA & HLE benchmarks …
🏆 **Project Lead** · Fully asynchronous agent RL training infrastructure for the AgentCPM model family `100+ Tools` · `20+ Benchmarks` · `Full-cycle Visualization`
🏆 **Project Lead** · Edge-scale (8B) agent LLM mastering MCP tools [](https://github.com/OpenBMB/MiniCPM) …
📱 **Training Data Lead** · Multimodal LLM-based GUI agent for mobile & desktop …
🧑🏫 学生指导 —— 共同指导 7 名本科生、6 名博士生开展 LLM 智能体研究,以及 5 名硕士生开展数据挖掘研究。
📝 会议审稿 —— NeurIPS、ICLR、EMNLP、KDD、WWW、COLING 等。
📰 期刊审稿 —— TKDE、Science China、AI Open 等。
🎤 邀请报告 —— “Autonomous Agents and Tool Learning with LLMs”(RLChina 2025);“LLM-Driven Autonomous Agents”(Huawei OpenHarmony AI Agent TSG)。
💰 主持科研项目 —— 中国博士后科学基金面上资助(No. 2024M761689,8 万元);国家资助博士后研究人员计划 C 档(24 万元)。