Haotian Chen

陈颢天

陈颢天现任上海交通大学人工智能学院助理研究员，在 RethinkLab 与严骏驰教授合作开展研究。

他的研究目标是理解并发展能够自动完成长期、复杂、需要大量时间投入甚至创造性思考任务的人工智能系统，重点关注自主智能体、大语言模型与 AI4Research。

他于复旦大学获得数据科学博士学位，并在清华大学 THUNLP 开展博士后研究，与刘知远教授和孙茂松教授合作。他也曾在微软亚洲研究院担任科研实习生，参与研发的 RD-Agent 登上微软 Build 2025 全球 Keynote。

邮箱： htchen@tsinghua.edu.cn
GitHub： github.com/Hytn
Google Scholar： scholar profile

🎯 研究兴趣

自主智能体
大语言模型
AI4Research
智能体强化学习
工具学习

教育背景

复旦大学，数据科学博士（2018.09 – 2024.06）
大连理工大学，电气工程工学学士（2014.09 – 2018.06）

工作经历

助理研究员

上海交通大学

2026年4月 – 现在

人工智能学院，RethinkLab。导师：严骏驰教授。研究方向：自主智能体、大语言模型与 AI4Research。

博士后研究员

清华大学

2024年7月 – 2026年3月

计算机系，THUNLP。合作导师：刘知远教授、孙茂松教授。研究方向：自主智能体、大语言模型与智能体工具强化学习。荣誉：清华大学“水木学者”计划。

科研实习生

微软亚洲研究院

2023年11月 – 2024年6月

机器学习组。导师：杨骁、边江。研究方向：自主智能体与大语言模型。荣誉：微软“明日之星”。参与研发的 RD-Agent 登上微软 Build 2025 全球 Keynote。

科研实习生

清华大学（交叉信息研究院）

2021年6月 – 2023年4月

清华大学交叉信息研究院。导师：于洋教授。研究方向：大语言模型安全性审计与 AI 决策依据分析。

教育经历

数据科学博士

复旦大学

2018年9月 – 2024年6月

计算机科学技术学院。导师：周向东教授。研究方向：自然语言处理、数据挖掘与信息抽取。荣誉：复旦大学优秀学生、复旦大学优秀毕业生、学业优秀奖学金。

电气工程工学学士

大连理工大学

2014年9月 – 2018年6月

导师：岳前进教授、贺明峰教授。研究方向：水下机器人与图像识别。专业排名第 1/74，辽宁省优秀毕业生。

🔬 研究方向

我的研究目标是理解并发展能够自动完成工程、科研、开发等复杂任务的人工智能系统。这些任务通常需要长期投入、大量努力，甚至依赖人类的创造性思考。围绕这一目标，我目前主要聚焦三个彼此关联的方向：

🧪 AI4Research —— 构建能够进行文献检索、实验设计、数据分析、假设生成与验证的 AI 科研助手。

🤖 自主智能体 —— 研究具备环境感知、长短期记忆、任务分解与规划、工具调用能力的智能体模型与系统，并以大语言模型作为核心智能引擎。

🧠 基础模型 —— 探索通用人工智能模型的预训练与适配，包括语言理解与生成、知识表征、多模态信息融合以及下游任务泛化。

📄 代表性论文

Autonomous Agents

AgentCPM-Explore: Realizing Long-Horizon Deep Exploration for Edge-Scale Agents

ArXiv 2026. First author. Open-source 4B agent model achieving SOTA on GAIA & HLE, surpassing GPT-5 and Claude-4.5-Sonnet.

Haotian Chen

• 2月 1, 2026 • 1 分钟阅读时长

AgentCPM-GUI: Building Mobile-Use Agents with Reinforcement Fine-Tuning

EMNLP 2025 Demo. GUI agents with reinforcement fine-tuning. 1,200+ GitHub Stars.

zhong-zhang

• 9月 1, 2025 • 1 分钟阅读时长

Foundation Models

MiniCPM4: Ultra-Efficient LLMs on End Devices

ArXiv 2025. Team contribution (led MCP agent capabilities). 8,300+ GitHub Stars.

minicpm-team

• 6月 1, 2025 • 1 分钟阅读时长

Towards Data-Centric Automatic Research and Development

ArXiv 2024. First author. RD-Agent for automatic R&D. Featured in Microsoft Build 2025 Keynote. 11,400+ GitHub Stars.

Haotian Chen

• 6月 1, 2024 • 1 分钟阅读时长

📚 全部论文

Yuepeng Fu, Zhong Zhang, Xin Cong, Shengda Fan, Yesai Wu, Yaxi Lu, Haotian Chen

Corresponding author

, Yankai Lin, Chen Qian, Xiaoyin Che (2026). Learning from Human Demonstrations Enables Adaptive GUI Agents. ARR (pre-submission).

Shengda Fan, Xuyan Ye, Yupeng Huo, Zhi-Yuan Chen, Yiju Guo, Shenzhi Yang, Wenkai Yang, Shuqi Ye, Jingwen Chen, Haotian Chen

Corresponding author

, Xin Cong, Yankai Lin (2026). AgentProcessBench: Diagnosing Step-Level Process Quality in Tool-Using Agents. KDD 2026 (submitted).

Wentong Chen, Xin Cong, Zhong Zhang, Yaxi Lu, Siyuan Zhao, Yesai Wu, Qinyu Luo, Haotian Chen

Corresponding author

Corresponding author

, Zhiyuan Liu, Maosong Sun (2026). Test-Time Exploration in Unknown Environments. KDD 2026 (submitted).

Yupeng Huo, Yaxi Lu, Zhong Zhang, Haotian Chen

Corresponding author

, Yankai Lin (2026). AtomMem: Learnable Dynamic Agentic Memory with Atomic Memory Operation. ACL 2026 (submitted).

💻 开源项目

我的开源工作围绕 LLM 驱动的智能体 形成了较完整的生态链：数据（AgentCPM-GUI, ToolLLM）→ 算法（AgentRL, AgentCPM-Explore, MiniCPM4-MCP）→ 执行（RD-Agent, XAgent）→ 评测（ToLeaP）→ 应用（QingXiaoDa）。

Autonomous Agents

AgentCPM-Explore

🏆 **Project Lead** · Open-source 4B agent model achieving SOTA on GAIA & HLE benchmarks …

2月 1, 2026 • 1 分钟阅读时长

Reinforcement Learning

AgentRL

🏆 **Project Lead** · Fully asynchronous agent RL training infrastructure for the AgentCPM model family `100+ Tools` · `20+ Benchmarks` · `Full-cycle Visualization`

1月 1, 2026 • 1 分钟阅读时长

ToLeaP

📏 **Project Lead** · One-click evaluation platform for tool-learning agents …

1月 1, 2026 • 1 分钟阅读时长

MiniCPM4-MCP

🏆 **Project Lead** · Edge-scale (8B) agent LLM mastering MCP tools [![Stars](https://img.shields.io/github/stars/OpenBMB/MiniCPM?style=social)](https://github.com/OpenBMB/MiniCPM) …

10月 1, 2025 • 1 分钟阅读时长

AgentCPM-GUI

📱 **Training Data Lead** · Multimodal LLM-based GUI agent for mobile & desktop …

8月 1, 2025 • 1 分钟阅读时长

🎓 学术服务

🧑‍🏫 学生指导 —— 共同指导 7 名本科生、6 名博士生开展 LLM 智能体研究，以及 5 名硕士生开展数据挖掘研究。

📝 会议审稿 —— NeurIPS、ICLR、EMNLP、KDD、WWW、COLING 等。

📰 期刊审稿 —— TKDE、Science China、AI Open 等。

🎤 邀请报告 —— “Autonomous Agents and Tool Learning with LLMs”（RLChina 2025）；“LLM-Driven Autonomous Agents”（Huawei OpenHarmony AI Agent TSG）。

💰 主持科研项目 —— 中国博士后科学基金面上资助（No. 2024M761689，8 万元）；国家资助博士后研究人员计划 C 档（24 万元）。

📬 联系方式

欢迎就研究问题或合作想法与我联系。

✉️ 邮箱： htchen@tsinghua.edu.cn

🐙 GitHub： github.com/Hytn