AI奇点网8月2日报道丨谷歌研究团队进行一项实验研究,他们使用 OpenAI 的 GPT-4聊天机器人来攻破其他机器学习模型的安全防护措施。这项实验证明了聊天机器人作为研究助手的价值。具体来说,谷歌 Deep Mind 的研究科学家 Nicholas Carlini在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了如何通过指导 GPT-4设计攻击方法并撰写攻击原理的文本,以欺骗 AI-Guardian 的防御机制。AI-Guardian 是一种防御对模型的攻击的系统,旨在检测可能被篡改的图像以欺骗分类器。
GPT-4会发出用于调整图像的脚本(和解释)来欺骗分类器——例如,让它认为某人拿着枪的照片是某人拿着无害苹果的照片——而不会引发 AI-Guardian 的怀疑。AI-Guardian 旨在检测图像何时可能**纵以欺骗分类器,而 GPT-4的任务是逃避该检测。
通过 GPT-4的帮助,攻击者能够成功地破解 AI-Guardian 的防御,使其从98% 的稳健性降低到仅8%。然而,AI-Guardian 的开发者指出,这种攻击方法可能在改进的版本中失效。
据AI奇点网了解到,GPT-4作为研究助手的价值在于它能够快速生成代码,并且不会分心或疲劳,始终可用于完成指定的任务。然而,依赖 GPT-4并不完全解除人类合作者的责任,因为它仍然需要人类提供正确的提示并修复生成的代码中的错误。虽然 GPT-4还存在一些限制,但随着大型语言模型的改进,它们将为计算机科学家提供更多时间来开展有趣的研究问题。
上一篇:AI一键总结 !YouTube测试新功能:利用AI自动生成视频概要
谷歌研究团队进行一项实验研究,他们使用 OpenAI 的 GPT-4聊天机器人来攻破其他机器学习模型的安全防护措施。结果GPT-4设计的攻击方法和撰写的攻击原理的文本骗过了 AI-Guardian 的防篡改系统。
根据谷歌支持页面的信息,YouTube 正在测试用人工智能(AI)自动生成视频摘要的功能,这是谷歌在探索生成型 AI 技术的最新尝试之一。
【AI奇点网2023年8月3日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
有没有那种能够精准到几分钟、几小时内的即时天气预测,还能告诉我上哪可以紧急避险的App呢?现如今,国内首款AIGC生成式交互天气预报App来啦!
阿里云今天升级旗下的“通义听悟”AI工具,推出提取 PPT、浏览器插件、小程序扩展三大功能。帮助用户随时随地听懂、理解、阅读各类音视频内容。
腾讯自研的 “混元大模型”已经进入应用内测阶段,多位腾讯员工已经收到了内部邮件邀请,可以通过网页或者小程序体验混元大模型。腾讯多个业务也已经接入混元大模型进行测试。
AI小聚
ZeroGPT
Aiundetect
WordfixerBot
Ai Sofiya
WriteAI.Tech
Cowriter
Seenapse AI
CreativAI
网站地图
AI击败AI!谷歌研究团队利用 GPT-4 击败 AI-Guardian 防篡改系统
AI奇点网8月2日报道丨谷歌研究团队进行一项实验研究,他们使用 OpenAI 的 GPT-4聊天机器人来攻破其他机器学习模型的安全防护措施。这项实验证明了聊天机器人作为研究助手的价值。具体来说,谷歌 Deep Mind 的研究科学家 Nicholas Carlini在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了如何通过指导 GPT-4设计攻击方法并撰写攻击原理的文本,以欺骗 AI-Guardian 的防御机制。AI-Guardian 是一种防御对模型的攻击的系统,旨在检测可能被篡改的图像以欺骗分类器。
GPT-4会发出用于调整图像的脚本(和解释)来欺骗分类器——例如,让它认为某人拿着枪的照片是某人拿着无害苹果的照片——而不会引发 AI-Guardian 的怀疑。AI-Guardian 旨在检测图像何时可能**纵以欺骗分类器,而 GPT-4的任务是逃避该检测。
通过 GPT-4的帮助,攻击者能够成功地破解 AI-Guardian 的防御,使其从98% 的稳健性降低到仅8%。然而,AI-Guardian 的开发者指出,这种攻击方法可能在改进的版本中失效。
据AI奇点网了解到,GPT-4作为研究助手的价值在于它能够快速生成代码,并且不会分心或疲劳,始终可用于完成指定的任务。然而,依赖 GPT-4并不完全解除人类合作者的责任,因为它仍然需要人类提供正确的提示并修复生成的代码中的错误。虽然 GPT-4还存在一些限制,但随着大型语言模型的改进,它们将为计算机科学家提供更多时间来开展有趣的研究问题。
上一篇:AI一键总结 !YouTube测试新功能:利用AI自动生成视频概要
AI击败AI!谷歌研究团队利用 GPT-4 击败 AI-Guardian 防篡改系统
谷歌研究团队进行一项实验研究,他们使用 OpenAI 的 GPT-4聊天机器人来攻破其他机器学习模型的安全防护措施。结果GPT-4设计的攻击方法和撰写的攻击原理的文本骗过了 AI-Guardian 的防篡改系统。
AI一键总结 !YouTube测试新功能:利用AI自动生成视频概要
根据谷歌支持页面的信息,YouTube 正在测试用人工智能(AI)自动生成视频摘要的功能,这是谷歌在探索生成型 AI 技术的最新尝试之一。
百度智能云「千帆大模型平台」升级丨阿里云通义听悟升级丨华为小艺语音助手升级支持AI大模型
【AI奇点网2023年8月3日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
夏季高温多地强降雨持续!国内首款AI天气预报App“彩云天气”发布,助你逃出生天
有没有那种能够精准到几分钟、几小时内的即时天气预测,还能告诉我上哪可以紧急避险的App呢?现如今,国内首款AIGC生成式交互天气预报App来啦!
阿里云AI应用“通义听悟”全新升级:三大实用新能力,教学视频一键转PPT大纲
阿里云今天升级旗下的“通义听悟”AI工具,推出提取 PPT、浏览器插件、小程序扩展三大功能。帮助用户随时随地听懂、理解、阅读各类音视频内容。
能写小红书能生成代码:腾讯自研“混元大模型”开始在员工群内测,多条业务线将接入
腾讯自研的 “混元大模型”已经进入应用内测阶段,多位腾讯员工已经收到了内部邮件邀请,可以通过网页或者小程序体验混元大模型。腾讯多个业务也已经接入混元大模型进行测试。
AI小聚
ZeroGPT
Aiundetect
WordfixerBot
Ai Sofiya
WriteAI.Tech
Cowriter
AI小聚
ZeroGPT
Aiundetect
WordfixerBot
Ai Sofiya
WriteAI.Tech
Cowriter
Seenapse AI
CreativAI