两名交大安泰本科学子论文获顶会ICML接收 发布时间:2026-05-22

近日,ICML 2026录取结果揭晓。交大安泰2022级本科生卢嘉成、令狐宇轩分别作为第一作者与其他合作者共同完成的论文被ICML 2026接收。

ICML(International Conference on Machine Learning)是机器学习与人工智能领域的国际顶级学术会议,是机器学习领域历史最悠久的、规模最大、影响最广的顶级学术会议之一,也是中国计算机学会CCF推荐的A类会议。ICML 2026将在今年7月在韩国首尔召开,根据谷歌学术发布的全球学术期刊和会议影响力排名,ICML位列第17位,其h5指数高达268。ICML与NeurIPS、ICLR并称为人工智能领域难度最大、水平最高、影响力最强的“三大会议”。

卢嘉成.jpg 

论文题目:Echoes within the Reasoning: Stealth and Effective Watermarking via Chain of Thought

论文作者:Jiacheng Lu, Yiming Li, Tao Song, Weijian Wang, Wenjie Qu, Haibing Guan#(通讯作者), Jiaheng Zhang

作者单位:上海交通大学、新加坡国立大学、南洋理工大学

论文摘要:这篇论文提出BiCoT,一种面向大语言模型推理能力保护的新型水印框架:它不再把所有权信号附着在容易被改写或清洗的最终答案上,而是深入到Chain-of-Thought的内部表示空间,利用对推理过程具有高因果影响的structural anchor tokens注入几何签名,并通过bi-level optimization在保持任务性能的同时实现水印与推理能力的功能性绑定;进一步地,文章设计了Robust Subspace Registration, RSR验证器,用sentinel tokens校准攻击后产生的表示漂移,使模型即使经历微调、噪声、量化等扰动,仍能被稳定识别。整体而言,BiCoT将LLM水印从“表层输出标记”推进到“推理流形中的隐式产权签名”,为高价值推理大模型提供了一种更隐蔽、更鲁棒、且对模型能力影响更小的所有权验证方案。

第一作者简介:

卢嘉成,上海交通大学安泰经济与管理学院2022级金融学-计算机科学与技术双学位本科生,已被上海交通大学计算机学院计算机科学与技术专业直博录取(致远荣誉博士,导师:管海兵教授)。曾获国家奖学金、睿远红杉人才发展基金、新生入学奖学金、本科生优秀奖学金(A等)。入选上海交通大学第三期“思源计划”、上海交通大学第二批“伯乐计划”、深圳市鲲鹏创新人才计划。

研究方向:大模型训推优化,大模型安全对齐。参与管海兵教授领导下的上海市可扩展计算与系统重点实验室、上海交通大学鲲鹏昇腾科教创新卓越中心项目研究。4篇论文被ICML、ACL、INFORMS Annual Meeting接收。

令狐宇轩.jpg

论文题目:A Penalty Approach for Differentiation Through Black-Box Quadratic Programming Solvers

论文作者:Yuxuan Linghu, Zhiyuan Liu, Qi Deng# (通讯作者)

作者单位:上海交通大学、芝加哥大学

论文摘要:通过求解二次规划 (QP) 问题进行微分是可微优化中的核心问题。大多数现有方法通过 Karush-Kuhn-Tucker (KKT) 系统进行微分,但其计算成本和数值鲁棒性在大规模问题上会下降。为了解决这些局限性,这篇论文提出了 dXPP,一个基于惩罚的微分框架,它将 QP 求解与微分过程解耦。在求解步骤(前向传播)中,dXPP 与求解器无关,可以利用任何黑盒 QP 求解器。在微分步骤(后向传播)中,文章将解映射到一个光滑的近似惩罚问题,并通过该近似惩罚问题进行隐式微分,仅需求解一个关于原始变量的规模小得多的线性系统。这种方法绕过了显式 KKT 微分固有的困难,并显著提高了计算效率和鲁棒性。文章在各种任务上评估了 dXPP,包括随机生成的 QP 问题、大规模稀疏投影问题以及一个真实的多期投资组合优化任务。实验结果表明,dXPP 与基于 KKT 的微分方法相比具有竞争力,并且在大规模问题上实现了显著的速度提升。

第一作者简介:

令狐宇轩,上海交通大学安泰经济与管理学院2022级金融学专业本科生,被佐治亚理工学院工业与系统工程学院运筹学硕士项目录取。曾获上海交通大学本科生优秀奖学金、KPMG ESG案例大赛全国二等奖。

研究方向:人工智能与运筹优化、可微优化、决策导向学习和数据驱动决策。作为第一作者完成的论文被ICML 2026接收,另有论文正在European Journal of Operational Research修改阶段。参与可微黑盒优化求解器、多期投资组合决策学习、强化学习增强晶体生成等研究项目。