
AI初创公司Rumi近日发布报告称,OpenAI最新发布的o3及o4-mini模型中,其生成的文本内嵌入了特殊Unicode字符“窄不换行空格”(NNBSP,U+202F),疑似用于标记AI生成内容的隐形水印。目前,OpenAI暂未对此公开置评。
Rumi指出,这些字符在普通文档中显示为标准空格,但通过SoSciSurvey、Sublime Text等专业工具可检测到其特殊代码。测试显示,这些符号仅出现在o3/o4-mini模型中,而此前发布的GPT-4o等版本并无同类设置。Rumi推测,此类符号可能是OpenAI有意植入的标识,但也可通过简单“查找替换”操作移除,安全性有限。
对于符号用途,Rumi提出两种可能:一是作为追踪AI生成内容的隐形水印;二是模型从训练数据中习得的排版习惯,用于避免货币符号或姓名缩写在换行时被截断。OpenAI此前已在图像生成领域测试多类水印技术,例如2024年为DALL·E 3添加C2PA元数据,2025年4月则在GPT-4o模型中测试可见的“ImageGen”标签。
当前,谷歌、微软、Meta等科技公司均布局AI内容溯源技术,如谷歌SynthID、微软元数据嵌入等,但研究表明多数水印方案易被篡改或剥离。此次争议再次凸显AI内容标识技术的脆弱性——即便如OpenAI采用隐蔽字符,仍难彻底解决滥用风险。
原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.com/article/715960.html