我是东北大学计算机科学与工程学院的一年级博士生,导师为刘正皓教授。我在东北大学取得硕士学位,硕士期间导师为肖桐教授。我的研究方向包括大语言模型(LLMs)、参数化知识与基础模型。我的 Google Scholar 主页在这里 引用119。
🔥 动态
2026-04: 🎉 三篇论文被 ACL 2026 录用(2篇主会 1篇Findings)2026-01: 🎉 一篇论文被 ICLR 2026 录用2025-09: 🎉 一篇论文被 NeurIPS 2025 录用2025-09: 🎉 三篇论文被 EMNLP 2025 录用,其中一篇获 Oral 展示2025-08: 🎉 发布 UltraRAG 2.0,一个用于构建复杂 RAG 系统的低代码框架
2025-06: 🎉 一篇论文获得 YSSNLP 2025 杰出海报奖 🏆2024-05: 🎉 一篇论文被 CCL 2024 录用
💻 实习经历
- 2025.3 - 至今, THUNLP(清华大学自然语言处理实验室),北京
- 2025.3 - 至今, 面壁智能(ModelBest),北京。从事基础模型评测与通用agentic能力提升相关工作,如 OpenCLaw
- 2024.10 - 2025.3, 语言技术研究所(LTI),卡内基梅隆大学,远程
- 2024.05 - 2024.09, 淘天搜索(阿里巴巴集团),杭州
- 2023.12 - 2024.05, 字节跳动,抖音电商,北京
📝 论文发表
更多文章请参见我的 Google Scholar 主页。注:* 表示共同一作;\† 表示通讯作者。


Chunks as Arms: Multi-Armed Bandit-Guided Sampling for Long-Context LLM Preference Optimization
Shaohua Duan*, Pengcheng Huang*, Xinze Li*, Zhenghao Liu†, Xiaoyuan Yi, Yukun Yan, Shuo Wang, Yu Gu, Ge Yu, Maosong Sun
- 本文提出 LongMab,将长上下文分块视为多臂老虎机的臂,通过 UCB 引导的采样策略渐进识别最具信息量的分块组合,生成高质量多样化响应并构建偏好对用于 DPO 训练,在 Llama 和 Qwen 上平均提升超 4%。






ParamMute: Suppressing Knowledge-Critical FFNs for Faithful Retrieval-Augmented Generation
Pengcheng Huang, Zhenghao Liu†, Yukun Yan, Xiaoyuan Yi, Hao Chen, Zhiyuan Liu, Maosong Sun, Tong Xiao, Ge Yu, Chenyan Xiong
- 本文提出 ParamMute,通过识别并抑制与不忠实生成相关的前馈网络(FFN),并引入知识偏好适配模块,有效引导语言模型更好地利用检索到的证据,提升检索增强生成的忠实性。

Knowledge Intensive Agents
Zhenghao Liu†, Pengcheng Huang, Zhipeng Xu, Xinze Li, Shuliang Liu, Chunyi Peng, Haidong Xin, Yukun Yan, Shuo Wang, Xu Han, Zhiyuan Liu, Maosong Sun, Yu Gu, Ge Yu
- 本文从智能体视角对检索增强生成进行了全面综述,将知识密集型智能体分为知识获取和知识利用两类角色,并指出多智能体 RAG 系统联合优化的未来方向。


ClueAnchor: Clue-Anchored Knowledge Reasoning Exploration and Optimization for Retrieval-Augmented Generation
Hao Chen, Yukun Yan, Sen Mei, Wanxiang Che, Zhenghao Liu, Qi Shi, Xinze Li, Yuchun Fan, Pengcheng Huang, Qiushi Xiong, Zhiyuan Liu, Maosong Sun
- 本文发现 RAG 系统常因关键证据隐含、分散或被噪声掩盖而未能充分利用检索文档,ClueAnchor 通过提取关键线索、在不同知识配置下生成多条推理路径,再通过基于奖励的偏好优化选择最优路径,显著提升推理完整性和鲁棒性。

Position IDs Matter: An Enhanced Position Layout for Efficient Context Compression in Large Language Models
Runsong Zhao, Xin Liu, Xinyu Liu, Pengcheng Huang, Chunyang Xiao, Tong Xiao†, Jingbo Zhu
- 本文发现现有 LLM 上下文压缩方法(如 ICAE)在压缩词的位置编码布局上存在缺陷,提出将位置标识符均匀分布并引入专注记忆的”压缩损失”,将压缩比从 4 倍提升至约 15 倍,同时保持重建和下游任务性能。


Translate-and-Revise: Boosting Large Language Models for Constrained Translation
Pengcheng Huang, Yongyu Mu, Yuzhang Wu, Bei Li, Chunyang Xiao, Tong Xiao†, Jingbo Zhu
- 本文发现大语言模型在约束翻译中常忽略或违反指定的词汇或结构约束,提出 Translate-and-Revise,通过添加修订过程让模型识别未满足的约束并修正输出,约束翻译准确率提升约 15%,超越神经机器翻译基线。
🏆 荣誉奖项
- 2024.05 🥇优秀学生奖学金一等奖
- 2023.05 🥇优秀学生奖学金一等奖
- 2022.05 🥇优秀学生奖学金一等奖
📖 教育经历
- 2025.09 - 至今, 博士,计算机科学与工程学院,东北大学
- 2022.09 - 2025.07, 硕士,计算机科学与工程学院,东北大学
- 2018.09 - 2022.07, 学士,计算机科学与工程学院,东北大学