澳大利亚联邦法院近日就在法律诉讼中使用生成式AI的潜在风险向法律界发出警告,并颁布了新的使用规范。一旦AI错误干扰司法程序,当事人将面临经济处罚或法律追责。
由于澳大利亚及全球各地法庭文书中出现AI生成虚假引用的案例激增,澳大利亚联邦法院于近日发布了一份新的实践说明,明确规范了生成式AI在司法案件中的使用方式。
联邦法院首席大法官德布拉·莫蒂默表示,向法庭提交虚假或不准确信息的行为"不可接受"。
"这与所有诉讼参与者不得误导法庭或其他当事方的责任相悖,"她在说明中指出。
"此类行为很可能妨碍案件依法、快速、低成本且高效地得到公正解决。"
莫蒂默提醒,在撰写诉状、书面陈述及提交法院的其他文件时,使用AI须保持审慎,因为AI可能生成虚构案例、错误引用、捏造引文和事实错误。
她还要求律师和事务律师在提交文件时,必须声明是否使用了AI辅助,并核实所引用的法律依据确实存在且能支持相关论点。
在誓词和专家报告方面,即便使用了生成式AI,相关内容仍须真实反映当事人的记忆、知识或实际经验。
若AI工具被用于信息摘要或分析、生成提交法庭的图像、视频或录音,或以任何其他可能影响证据可采性的方式使用,均须予以披露。
莫蒂默指出,对生成式AI使用情况的披露说明,应置于文件起始处,并注明具体的使用位置和方式。
她同时警告,在将保密、被限制披露或私人信息输入AI工具时,须格外谨慎。
"将信息输入生成式AI工具可能带来严重后果,即便并无意泄露该信息。"
莫蒂默表示,联邦法院"支持"在诉讼程序中运用技术手段,生成式AI也有潜力提升诉讼效率,但生成式AI"必须在适当且审慎的前提下使用"。
"否则,生成式AI将对司法公正的推进和公众对法律体系的信心构成威胁。"
这位首席大法官表示,若违规使用生成式AI,当事人将面临不利的费用裁定,以及违反法律和职业义务等相应后果。
目前,澳大利亚已有至少73个案例被发现因使用生成式AI而出现虚假引用、捏造引文或其他错误。
去年,一名维多利亚州律师因虚假引用问题成为澳大利亚首位受到处分的律师,被吊销了主任律师执照。西澳大利亚州和新南威尔士州的监管机构随后也在类似案件中展开了调查。
法院还注意到,虚假引用一旦未被发现,可能引发连锁反应,导致更多虚假引用出现。去年一份全庭判决中,法院发现上诉方所援引的案例根本不存在,判决书中指出:"我们认为,该引用可能是大语言模型产生幻觉的结果。"
澳大利亚高等法院首席大法官史蒂芬·盖勒去年11月表示,澳大利亚法官正在充当AI生成法律论点的"人工过滤器",AI生成内容的使用已进入"难以为继的阶段"。
Q&A
Q1:澳大利亚联邦法院对生成式AI的使用有哪些具体规定?
A:联邦法院要求,凡使用生成式AI辅助准备法庭文件,须在文件开头明确披露使用情况,注明使用位置和方式。律师还须核实所引用的法律依据真实存在且能支持相关论点。若AI被用于生成图像、视频、录音或影响证据可采性的内容,同样需要披露。违规者将面临不利费用裁定及违反职业义务的处罚。
Q2:生成式AI在法律文书中曾造成哪些具体问题?
A:澳大利亚已发现至少73起因使用生成式AI导致虚假引用、捏造案例或引文错误的案件。去年一名维多利亚州律师因此被吊销主任律师执照。法院还发现,未被及时察觉的虚假引用可能引发连锁错误,一份全庭判决中甚至发现上诉方援引的案例根本不存在,被认定为大语言模型的"幻觉"输出。
Q3:首席大法官为何说生成式AI的使用已进入"难以为继的阶段"?
A:高等法院首席大法官史蒂芬·盖勒指出,由于越来越多的法律论点由AI生成,法官不得不扮演"人工过滤器"的角色,逐一甄别AI内容的真实性与准确性。这不仅消耗大量司法资源,还对司法公正和公众对法律体系的信任构成威胁,因此他认为当前状况已难以持续。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。