|
IT之家 2 月 24 日消息,微软近日发布了开源自动化框架 PyRIT,这是一款 Python 风险识别工具包,主要帮助安全专家和机器学习工程师识别生成式 AI 的风险,阻止他们的人工智能系统失控。
微软的 AI Red Team 已经使用该工具,检查包括 Copilot 在内生成式人工智能系统中风险。
微软强调通过向公众提供内部工具,以及分享 AI Red Team 方面的其他投资成果,其目的是推动人工智能安全民主化。
微软 AI Red Team 专门成立了一个跨学科的安全专家小组,管理复杂的攻击演习。PyRIT 框架的工作原理如下:
PyRit Agent 向目标 Gen AI 系统发送恶意提示词;当它收到 Gen AI 系统的回应时,就会向 PyRIT 评分引擎发送回应。
评分引擎将响应发送给 PyRit 代理;然后,代理根据评分引擎的反馈发送新的提示。
这一自动化过程一直持续到安全专家得到所需的结果为止。
微软已经将相关代码托管到 GitHub 上,感兴趣的用户可以深入阅读。
当前新闻共有0条评论 | 分享到: |
|
||||||||||
评论前需要先 登录 或者 注册 哦 |
24小时新闻排行榜 | 更多>> |
1 | “已经停不下来了” 中国漂亮成绩单,全球 |
2 | 这件事对习的打击超乎寻常 |
3 | 乱引“古人说” 小学生又出糗 |
4 | 珠海惨案性质变了 习下令被指有内情 |
5 | 掌握决定性证据!港媒:北京面临严重后果 |
48小时新闻排行榜 | 更多>> |
一周博客排行 | 更多>> |
1 | 外籍华人回国酒店随便住?你想 | 米笑 |
2 | 美国华人回国经历故事几则 | 马黑 |
3 | 川普解决当今世界纷乱局面的王 | 山蛟龙 |
4 | 川普总统先考验蓬佩奥 暗中准 | 胡亥 |
5 | 狗奶奶露营记 之二 | 野狼巴克 |
6 | 命 | 曾华 |
7 | 赵晓:反川者在川普大胜后的四 | 万维网友来 |
8 | 五律—诗友雅集 | 万沐 |
9 | 川普会不会在任期内死于暗杀? | 施化 |
10 | 《銀河補習班》——一場關於家 | Retro_Reel |
一周博文回复排行榜 | 更多>> |