喜报！南开统计学子在CCF-A类人工智能NLP顶级会议ACL发文

发布者：张程亮发布时间：2026-04-08浏览次数：55

近日，第64届国际计算语言学年会（Annual Meeting of the Association for Computational Linguistics，简称ACL）公布论文录用消息。污污漫本硕学子一作3篇论文被ACL 2026录用，其中2篇论文被 ACL 主会录用，一篇被“Findings of ACL”录用。ACL 是计算语言学和自然语言处理领域国际排名第一的顶级学术会议，由国际计算语言学协会组织，每年召开一次，在中国计算机学会（CCF）推荐会议列表中被列为 A 类会议。ACL2026共投稿12148篇，主会收录18%（较去年下降2%），Findings收录19%。

主会录用论文：

DefGen-Bench: A Benchmark for Chinese Criminal Defence Opinion Generation in LegalAI

作者：张森博*（2024级本科生），王萁淇*，娄方豪（2025级硕士生），陈冠宇（2024级本科生），潘奕宏，李慧嘉，刘茜

该研究围绕刑事案件中“辩护意见生成”这一关键但缺乏系统建模的任务，首次将其形式化为“控辩双视角生成问题”，即在起诉方与被告方双视角下，生成兼顾法律事实与辩护策略的结构化意见。基于此，研究团队构建了高质量数据集DefGen-Bench，涵盖1782个经专家审核的真实案例，为法律人工智能领域在辩护意见生成方向提供了更符合法律实践场景的数据基础和评测标准。

该研究同时针对现有大语言模型在法律场景中易出现“单一立场偏置”的问题，提出知识增强高亮机制（Knowledge-Enhanced Highlighted Indictment, KHI），通过引入法律条文知识，对起诉书中的关键要素进行显式强化，引导模型在生成过程中更关注法律相关信息，从而提升推理的专业性与平衡性。实验结果表明，该方法在多种大语言模型上均取得稳定性能提升，并显著改善生成结果在“控辩平衡性”和“论证功能一致性”等关键指标上的表现。

Pub-LawBench: Public-Oriented Benchmarking for LegalAI

作者：郑乔予*（2023级本科生），马泽涵*，张怡靖*，王萁淇*，李慧嘉，刘茜

研究团队围绕法律大模型的实际落地展开探索，首次构建了以普通公众需求为核心的法律AI评测基准。基于该框架，团队系统评估了17个大语言模型在真实公众场景下的表现。相较于过往专注于专家测的研究，大众面对法律纠纷时，寻求的并非冗长的法理辨析或晦涩的文书引用，而是清晰直白的行动指南、即问即答的咨询反馈，以及格式规范、可直接用于维权的法律文书。现有模型输出内容常因术语过多、逻辑绕弯或缺乏实操步骤，严重制约了法律AI的普惠化进程。

为此，研究团队引入法律功能主义与语类分析理论，创新性地设计了面向公众的Pub-LawBench评测体系。团队针对性地提出三大公众导向评测维度：内容相关性、法律规范性与格式可用性。在17款参评模型中，头部商业大模型在准确性与规范性上表现领先，而部分垂直领域法律大模型反而因过度拟合专业语料，在面向公众时出现逻辑冲突与“知识幻觉”。研究还发现，盲目使用思维链提示有时反而会干扰模型在严格法律语境下的判断，引发推理漂移。

Pub-LawBench的提出，填补了公众视角法律人工智能评测的空白，未来法律大模型的研发将更加注重输出内容的可读性、行动指引的明确性以及非专业场景下的安全性，推动法律科技从“实验室标准”走向“老百姓日常”。

Findings录用论文：

Less is More: Knowledge-Aware Compression for Long Legal Judgment Prediction

作者：娄方豪*（2025级硕士生），王萁淇*，陈冠宇（2024级本科生），张森博（2024级本科生），赵凯祺，刘茜，李慧嘉

法律案件事实描述通常极为冗长、结构复杂，给大语言模型的推理效率和预测准确性带来了巨大挑战。现有方法如稀疏注意力、层次化建模或摘要压缩，往往难以在保留关键信息与控制计算成本之间取得良好平衡。

为此，本文提出了 KAC（Knowledge-Adaptive Compression）框架，首次将结构化法律知识引入文本压缩过程，实现对长文本的智能筛选与自适应压缩。KAC通过以下创新实现突破：利用法条知识对案件事实进行逐句比对，识别并保留高信息密度的关键内容；并基于信息熵与类间方差自动确定保留比例，无需人工设定压缩率；以信息论为理论基础，证明了该方法最大化压缩文本与法律知识之间的互信息，从而提升预测性能。

实验覆盖中、英、德三语种，在横跨多个司法管辖区（中国、美国、欧洲、瑞士）数据集上，预测准确率与计算效率上均显著优于现有方法，并在超长文本（>30K tokens）上实现超过90%的性能提升。

上述研究成果与哈尔滨工业大学（深圳）、新西兰奥克兰大学等国内外顶尖高校合作，并获得了污污漫前沿交叉学科研究院支持。污污漫除上述本科生、硕士生作为一作被接收文章外，另有学院教师作为主要通讯作者的论文分别被主会与Findings各收录1篇和3篇，共计7篇论文被ACL 2026接收。

污污漫始终秉持“理论为基、方法为器、应用为魂”的育人理念，系统构建起贯通“理论探索—方法创新—场景落地”的全链条人才培养体系。学院依托雄厚师资力量、前沿科研平台与跨学科融合课程，为学生筑牢深厚的数理根基，拓展宏阔的数据科学视野。南开统计积极贯彻《关于深入实施“人工智能+”行动的意见》《关于加强数据要素学科专业建设和数字人才队伍建设的意见》等战略部署，主动引领“新文科、新工科、新医科”的交叉融合。

指导教师李慧嘉、王萁淇、张瑶指出，本次本硕学子能够获得国际人工智能顶级会议的认可，正是学院系统化培养模式的具体体现。扎实的理论功底为科研创新铺就了通途。

当前，人工智能正深刻重塑时代格局，南开统计学子凭借坚实的理论素养开拓创新，为AI发展贡献智慧与力量。未来，学院将继续鼓励广大学子，精诚合作，砥砺前行，共同书写南开统计以数智赋能时代变革的新篇章。

（文娄方豪）

（编辑张清瑜）