人工智能巨头 OpenAI 以准确率较低为由,谨慎地取消了其人工智能检测软件的销售。
OpenAI 开发的人工智能分类器于 1 月 31 日首次推出,旨在帮助教师和教授等用户区分人类书写的文本和人工智能生成的文本。
然而,根据宣布推出该工具的原始博客文章,AI 分类器已于 7 月 20 日关闭:
“自 2023 年 7 月 20 日起,AI 分类器由于准确率较低而不再可用。”
该工具的链接不再起作用,而该注释仅提供了该工具被关闭原因的简单推理。 然而,该公司解释说,它正在寻找新的、更有效的方法来识别人工智能生成的内容。
该说明中写道:“我们正在努力纳入反馈,目前正在研究更有效的文本来源技术,并承诺开发和部署机制,使用户能够了解音频或视觉内容是否是人工智能生成的。”
OpenAI 从一开始就明确表示,该检测工具容易出错,不能被视为“完全可靠”。
该公司表示,其人工智能检测工具的局限性包括在验证少于 1000 个字符的文本时“非常不准确”,并且可以“自信地”将人类编写的文本标记为人工智能生成的。
有关的: 苹果有自己的 GPT AI 系统,但没有公开发布的计划:报告
该分类器是 OpenAI 最新接受审查的产品。
7 月 18 日,斯坦福大学和加州大学伯克利分校的研究人员发表了一项研究,结果显示 OpenAI 的旗舰产品 ChatGPT 随着年龄的增长,性能明显恶化。
我们评估了 #ChatGPT随着时间的推移,我们发现了 GPT4 和 GPT3.5 的 6 月版本与 3 月版本之间对“相同问题”的回答存在很大差异。 新版本在某些任务上变得更糟。 与陈凌娇 @matei_zaharia https://t.co/TGeN4T18Fd https://t.co/36mjnejERy pic.twitter.com/FEiqrUVbg6
— 詹姆斯·邹 (@james_y_zou) 2023 年 7 月 19 日
研究人员发现,在过去几个月中,ChatGPT-4 准确识别素数的能力从 97.6% 骤降到只有 2.4%。 此外,ChatGPT-3.5 和 ChatGPT-4 生成新代码行的能力均显着下降。
人工智能眼: AI 训练的 AI 内容变得疯狂,Threads 是否会成为 AI 数据的亏损领导者?
在此处阅读全文。