您的位置: 首页 >科技 >

谷歌称重复关键词可让ChatGPT自曝训练数据 OpenAI:违反服务条款

2023-12-06 15:06:51 编辑:袁有功 来源:
导读 在2023年12月5日,谷歌公司旗下的研究人员表示,现在已经找到了获取OpenAI公司旗下人工智能聊天机器人ChatGPT的训练数据方法。在刚刚发布的...

2023年12月5日,谷歌公司旗下的研究人员表示,现在已经找到了获取OpenAI公司旗下人工智能聊天机器人ChatGPT的训练数据方法。在刚刚发布的论文中,谷歌公司的研究人员表示,有一些关键词能够让ChatGPT泄露在训练时所接受的训练及内容。

研究人员举例模型在重复诗歌这个词语以后给出的答案是一个真实存在的电子邮件地址和电话号码。研究人员表示,个人信息泄露经常会发生在他们向平台发动攻击的时候。此外,当研究人员要求模型重复公司这个词语的时候,也出现了类似的情况。研究人员表示,虽然这种攻击的方式看起来比较的简单,但是这种攻击却十分有效。

研究人员在论文中指出,仅仅只用价值200美元的查询,就能够提取出超过1万个逐字记忆的训练示例。根据研究人员的推断,如果有更多的预算,那么就可以获得更多竞争对手的训练数据。目前OpenAI公司正在面临着几个有关于ChatGPT秘密训练数据的诉讼。因为为 ChatGPT人工智能模型提供数据的是来自于互联网的文本数据库,据了解,目前ChatGPT已经接受了3,000亿个单词的训练。

有一项集体诉讼中指出OpenAI公司私自窃取了大量的个人数据,其中包括私人的医疗记录和儿童信息,这些信息全部都用来训练 ChatGPT人工智能模型,还有一些作家也在起诉OpenAI公司指控公司利用他们的作品来训练聊天机器人。对于谷歌公司研究人员的发现OpenAI公司已经做出了正面回应,表示重复使用一些指令,可能违反了公司的服务条款。目前还并不清楚这种行为违反了OpenAI公司内容政策的哪一部分,不过在OpenAI公司的使用条款中,确实规定用户不能够使用任何自动或者编程的方法提取数据。


免责声明:本文由用户上传,如有侵权请联系删除!

最新文章

精彩推荐

图文推荐

点击排行

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ   备案号:

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。

邮箱:toplearningteam#gmail.com (请将#换成@)