哥伦比亚最高法院拒绝了抗诉,理由是判决由AI生成。但法院用来判断判决是否由AI生成的同一工具也显示其自身的裁决也得到了生成帮助。这是法院的双重标准,还是工具本身存在缺陷?“鉴于有充分理由怀疑律师提交的简报并非由其本人起草,法院将文本提交给了Winston AI工具,”法院辩称。“分析结果显示,该文件仅含7%的人工内容,明显受到自动写作的影响,因此得出结论:该文件是由人工智能生成的。”
在用其他提供类似结果的工具进行分析后,法院裁定“由于该文件不能视为正式提交的辩护状,必须予以驳回。”但当法院的裁决受到法律专家的类似质疑时,结果也显示出类似的情况。“我将最高法院的Auto AP760/2026判决文本提交给了裁决中引用的同一Winston AI软件,”律师Emmanuel Alessio Velasquez在星期二的X上写道。“结果:该文件含有93%的AI生成文本。”
我将最高法院的AP760/2026判决文本提交给了裁决中引用的同一Winston AI软件。结果显示:该文件含有93%的“由AI生成的文本”。https://t.co/xTm2jI4d70 pic.twitter.com/lpSHuRjEZ4
— Emmanuel Alessio Velásquez (@EmmanuVeZe) 2026年3月3日
“如果判决本身就对人工智能的使用打了高分,那么使用这些检测工具作为论据支持的方法论脆弱性就变得不言自明了,”他在随后的推文中指出。在法院在X上发布关于判决的讨论后数小时,律师们开始自己进行测试。Velasquez的帖子在法律圈内迅速传播,获得了数万次浏览。我们也对法院的裁决进行了测试,起初情况并不理想。当GPTZero只扫描法院文本的开头部分时,结果显示100%的AI。
当同一工具处理包含事实背景部分的较长版本时,结果完全反转:100%人为。该工具根本不够可靠,不能在法庭或需要高度确定性的场合信赖。
哥伦比亚律师迅速用自己的实验做出了反应。刑事辩护律师兼讲师Andres F. Arango G提交了一份2019年的法院文件,早在这些工具被训练检测大规模语言模型之前,结果显示95%的AI生成。“这些工具随后会建议你通过付费服务‘人性化’文章,”他在X上写道,指出检测业务模式中明显的商业动机。Nicolas Buelvas基于2020年的本科论文,研究了刑法中的信任原则。结果?100%AI。另一位哥伦比亚律师Dario Cabrera Montealegre指出,依赖技术试图对抗技术的做法本身就是虚伪的。“法院用AI判断是否存在AI,”他说。“从我的实际角度来看,这是自相矛盾的。”
La Corte usa IA para determinar si hubo IA…!? Algo contradictorio desde mi punto de vista práctico…Si se rechaza debe ser porque como humanos lo detectamos
— Darío Cabrera Montealegre (@dalcamont_daro) 2026年3月2日
在法律圈之外,技术熟练的个人也指出过度依赖AI检测工具的危险。“到目前为止,还没有任何公开可用的工具能准确判断一段文本中AI的使用比例,”Carlos Alejandro Torres Pinedo表示。“更糟糕的是:没有人能公开验证这些检测平台背后的源代码。它们怎么能用来否认某人的司法权利呢?”
这些失败的技术原因已有详细记录。AI检测器通过统计模式进行测量:句子长度、词汇的可预测性,以及研究人员称之为“突发性”的特性,即人类在写作中自然引入的节奏变化。问题在于,正式的法律文书、学术写作以及用第二语言写作的文本,往往具有许多相同的统计特征。
关于AI检测的研究 2023年发表在《Patterns》上的一项研究发现,超过61%的非母语英语使用者的托福作文被错误标记为AI生成。同年,Weber-Wulff进行的一项系统性综述得出结论:没有任何可用工具既精准又可靠。Turnitin在2023年6月承认,其检测器在文档中AI内容低于20%时,误报率更高。甚至OpenAI也不得不下架其AI检测工具,因为其频繁出现错误,无法完成其本职工作。
多年来,大学一直在应对这个问题。2023年,范德比尔特大学关闭了Turnitin的AI检测器,估计每年会产生约3000个误报。亚利桑那大学在一名学生因误报失去20%的成绩后,也取消了其抄袭软件中的AI检测功能。2024年,UC Davis的一起案件中,17名语言学学生被标记,其中15名非母语英语使用者。这个模式一直存在。检测工具偏向惩罚那些写作最正式、最重复或最谨慎的人群,也正是律师、学者和第二语言使用者的典型特征。
文化上的反应几乎变得荒谬。在写作和新闻界,人们开始避免使用破折号,不是因为风格指南,而是因为AI语言模型频繁使用它们,检测工具(以及人们)都注意到了。作家们出于对算法怀疑,自我编辑,去除自然标点。除了书面表达,艺术家们也因为创作出看似AI的作品而受到审查员和同行的谴责。
我们生活在一个真正的艺术家被惩罚的世界,因为他是这些被称为AI艺术家的窃贼的受害者?#拯救人类艺术家 #反对AI艺术 #反对AI #拯救未来艺术 pic.twitter.com/yTQAeyc8SR
— Benmoran艺术家 (@benmoran_artist) 2022年12月27日
哥伦比亚的两项裁决——AC739-2026(在其中民事庭在2月因引用10个不存在的AI生成先例而罚款律师)和AP760-2026——正逐渐成为该地区首批直接应对生成式AI在法律文件中滥用的司法判决。哥伦比亚司法部门在2024年12月制定了正式指南,规范法官和法院工作人员如何使用人工智能。这些规则允许在行政和支持任务中自由使用AI,比如起草电子邮件、整理议程、翻译文件或总结文本,但对于更敏感的用途,如法律研究或起草程序性文件,只允许在严格的人为审查下使用。指南明确禁止依赖AI评估证据、解释法律或作出司法判决,强调法官仍对所有裁决承担全部责任,并且必须披露在准备司法材料时是否使用了AI工具。这些指南(编号“PCSJA24-12243”)可以用来对抗此类判决。
最高法院尚未就其检测工具选择引发的反弹发表额外声明。该裁决也没有使用破折号。