我是东北大学计算机科学与工程学院的一年级博士生，导师为刘正皓教授。我在东北大学取得硕士学位，硕士期间导师为肖桐教授。我的研究方向包括大语言模型（LLMs）、参数化知识与基础模型。我的 Google Scholar 主页在这里引用119。

最后更新：2026-04-10 · PcHuang_1031 · pengcheng.neu@outlook.com

🔥 动态

2026-04: 🎉 三篇论文被 ACL 2026 录用（2篇主会 1篇Findings）
2026-01: 🎉 一篇论文被 ICLR 2026 录用
2025-09: 🎉 一篇论文被 NeurIPS 2025 录用
2025-09: 🎉 三篇论文被 EMNLP 2025 录用，其中一篇获 Oral 展示
2025-08: 🎉 发布 UltraRAG 2.0 ，一个用于构建复杂 RAG 系统的低代码框架
2025-06: 🎉 一篇论文获得 YSSNLP 2025 杰出海报奖 🏆
2024-05: 🎉 一篇论文被 CCL 2024 录用

💻 实习经历

2025.3 - 至今, THUNLP（清华大学自然语言处理实验室），北京
2025.3 - 至今, 面壁智能（ModelBest），北京。从事基础模型评测与通用agentic能力提升相关工作，如 OpenCLaw
2024.10 - 2025.3, 语言技术研究所（LTI），卡内基梅隆大学，远程
2024.05 - 2024.09, 淘天搜索（阿里巴巴集团），杭州
2023.12 - 2024.05, 字节跳动，抖音电商，北京

📝 论文发表

更多文章请参见我的 Google Scholar 主页。注：* 表示共同一作；\† 表示通讯作者。

ACL 2026

Empirical Analysis of Decoding Biases in Masked Diffusion Models

Pengcheng Huang, Tianming Liu, Zhenghao Liu†, Yukun Yan, Shuo Wang, Tong Xiao, Zulong Chen, Maosong Sun

本文揭示了掩码扩散模型中基于不确定性解码的两个系统性偏差——刚性边界偏差和无意义词偏差，并提出 Uncode，一个通过位置轨迹先验和语义信息先验重塑解码优先级的轻量级校准框架，平均性能提升超过 7%，达到与同规模自回归模型可比的效果。

ACL 2026

Chunks as Arms: Multi-Armed Bandit-Guided Sampling for Long-Context LLM Preference Optimization

Shaohua Duan*, Pengcheng Huang*, Xinze Li*, Zhenghao Liu†, Xiaoyuan Yi, Yukun Yan, Shuo Wang, Yu Gu, Ge Yu, Maosong Sun

本文提出 LongMab，将长上下文分块视为多臂老虎机的臂，通过 UCB 引导的采样策略渐进识别最具信息量的分块组合，生成高质量多样化响应并构建偏好对用于 DPO 训练，在 Llama 和 Qwen 上平均提升超 4%。

ACL 2026

Revealing the Attention Floating Mechanism in Masked Diffusion Models

Xin Dai, Pengcheng Huang, Zhenghao Liu†, Shuo Wang, Yukun Yan, Chaojun Xiao, Yu Gu, Ge Yu, Maosong Sun

本文研究了掩码扩散模型的内部注意力行为，发现了独特的”注意力漂浮”机制——注意力锚点在层和去噪步之间动态漂移，为其优于自回归模型的上下文学习能力提供了机理层面的解释。

ArXiv

Causal Autoregressive Diffusion Language Model

Junhao Ruan, Bei Li, Yongjing Yin, Pengcheng Huang, Xin Chen, Jingang Wang, Xunliang Cai, Tong Xiao†, JingBo Zhu

本文提出因果自回归扩散模型（CARD），通过严格的因果注意力掩码和动态解码机制，将自回归模型的训练效率与扩散模型的高吞吐并行推理统一在一个框架中。

ArXiv

Teaching LLMs to Learn Tool Trialing and Execution through Environment Interaction

Xingjie Gao*, Pengcheng Huang*, Zhenghao Liu†, Yukun Yan, Shuo Wang, Zulong Chen, Chen Qian, Ge Yu, Yu Gu

本文提出 ToolMaster，通过将被动模仿专家轨迹转变为主动试错执行的范式，使大语言模型在与环境的直接交互中学习探索和自我纠正，从而掌握复杂工具使用。

ICLR 2026

Autoencoding-free context compression for llms via contextual semantic anchors

Xin Liu, Runsong Zhao, Pengcheng Huang, Xinyu Liu, Junyi Xiao, Chunyang Xiao, Tong Xiao†, Shengxiang Gao, Zhengtao Yu, Jingbo Zhu

本文提出语义锚点压缩（SAC），一种无需自编码训练的上下文压缩方法，通过直接选择并聚合信息到上下文”锚点词”中，实现高效的大语言模型上下文压缩。

IJCNN 2026

RLAIF-SPA: Optimizing LLM-based Emotional Speech Synthesis via RLAIF

Qing Yang, Zhenghao Liu†, Junxin Wang, Yangfan Du, Pengcheng Huang, Tong Xiao

本文提出 RLAIF-SPA，通过基于 AI 反馈的强化学习优化语义准确性和细粒度韵律对齐，提升大语言模型语音合成的情感表现力和韵律自然度。

NeurIPS 2025

ParamMute: Suppressing Knowledge-Critical FFNs for Faithful Retrieval-Augmented Generation

Pengcheng Huang, Zhenghao Liu†, Yukun Yan, Xiaoyuan Yi, Hao Chen, Zhiyuan Liu, Maosong Sun, Tong Xiao, Ge Yu, Chenyan Xiong

本文提出 ParamMute，通过识别并抑制与不忠实生成相关的前馈网络（FFN），并引入知识偏好适配模块，有效引导语言模型更好地利用检索到的证据，提升检索增强生成的忠实性。

AI Open 2025

Knowledge Intensive Agents

Zhenghao Liu†, Pengcheng Huang, Zhipeng Xu, Xinze Li, Shuliang Liu, Chunyi Peng, Haidong Xin, Yukun Yan, Shuo Wang, Xu Han, Zhiyuan Liu, Maosong Sun, Yu Gu, Ge Yu

📄PDF

本文从智能体视角对检索增强生成进行了全面综述，将知识密集型智能体分为知识获取和知识利用两类角色，并指出多智能体 RAG 系统联合优化的未来方向。

EMNLP 2025 Oral

ExpandR: Teaching Dense Retrievers Beyond Queries with LLM Guidance

Sijia Yao*, Pengcheng Huang*, Zhenghao Liu†, Yu Gu, Yukun Yan, Shi Yu, Ge Yu

本文提出 ExpandR，一个联合训练大语言模型和稠密检索器的统一框架，通过让 LLM 生成丰富的查询扩展，并同时优化扩展生成和检索排序性能，在检索基准上比强基线提升超 5%。

EMNLP 2025

ClueAnchor: Clue-Anchored Knowledge Reasoning Exploration and Optimization for Retrieval-Augmented Generation

Hao Chen, Yukun Yan, Sen Mei, Wanxiang Che, Zhenghao Liu, Qi Shi, Xinze Li, Yuchun Fan, Pengcheng Huang, Qiushi Xiong, Zhiyuan Liu, Maosong Sun

本文发现 RAG 系统常因关键证据隐含、分散或被噪声掩盖而未能充分利用检索文档，ClueAnchor 通过提取关键线索、在不同知识配置下生成多条推理路径，再通过基于奖励的偏好优化选择最优路径，显著提升推理完整性和鲁棒性。

EMNLP 2025

Position IDs Matter: An Enhanced Position Layout for Efficient Context Compression in Large Language Models

Runsong Zhao, Xin Liu, Xinyu Liu, Pengcheng Huang, Chunyang Xiao, Tong Xiao†, Jingbo Zhu

本文发现现有 LLM 上下文压缩方法（如 ICAE）在压缩词的位置编码布局上存在缺陷，提出将位置标识符均匀分布并引入专注记忆的”压缩损失”，将压缩比从 4 倍提升至约 15 倍，同时保持重建和下游任务性能。

EMNLP 2024

Forgetting curve: A reliable method for evaluating memorization capability for long-context models

Xinyu Liu, Runsong Zhao, Pengcheng Huang, Chunyang Xiao, Bei Li, Jingang Wang, Tong Xiao†, Jingbo Zhu

本文发现现有长上下文模型的记忆能力评估方法（如困惑度、”大海捞针”任务）不够可靠，提出遗忘曲线——一种基于拷贝准确率与语言模型准确率对比的无提示鲁棒指标，更忠实地衡量模型对长上下文的记忆能力。

CCL 2025

Translate-and-Revise: Boosting Large Language Models for Constrained Translation

Pengcheng Huang, Yongyu Mu, Yuzhang Wu, Bei Li, Chunyang Xiao, Tong Xiao†, Jingbo Zhu

📄PDF

本文发现大语言模型在约束翻译中常忽略或违反指定的词汇或结构约束，提出 Translate-and-Revise，通过添加修订过程让模型识别未满足的约束并修正输出，约束翻译准确率提升约 15%，超越神经机器翻译基线。

🏆 荣誉奖项

2024.05 🥇优秀学生奖学金一等奖
2023.05 🥇优秀学生奖学金一等奖
2022.05 🥇优秀学生奖学金一等奖

📖 教育经历

2025.09 - 至今, 博士，计算机科学与工程学院，东北大学
2022.09 - 2025.07, 硕士，计算机科学与工程学院，东北大学
2018.09 - 2022.07, 学士，计算机科学与工程学院，东北大学