国内首个大模型安全一体化解决方案亮相:蚂蚁集团发布“蚁天鉴”

baobeihu2023-09-11 14:54:45TechWeb.com.cn

9月11日消息,今日,蚂蚁集团发布大模型安全一体化解决方案“蚁天鉴”。该方案包含了大模型安全检测平台“蚁鉴2.0”、大模型风险防御平台“天鉴”两大产品,拥有AIGC安全性和真实性评测、大模型智能化风控、AI鲁棒和可解释性检测等多项功能。这也是大模型浪潮以来首个可实现产业级应用的大模型安全检测与防御一体化解决方案。目前这两项产品已对外开放。

蚂蚁工作人员表示,大模型安全问题产生的本源主要为“用于训练的数据源头有毒、推理过程不可控、外部恶意诱导”三个因素。此次发布的“蚁天鉴”,主要从大模型安全性检测度量、智能风险防控、数据去毒对齐等方面,来保障大模型在生产和使用过程中更加安全、可控、可靠。

据蚂蚁方面介绍,“蚁鉴2.0”是业内首个产业级支持文本、图像等全数据类型的AI安全检测平台。它相当于站在“黑产”角度,通过智能攻击对抗技术,自动生成数百万的诱导性问题,对生成式大模型进行诱导式问答,并对大模型的回答实时、自动化的检测计算,24小时不眠不休“找茬”大模型存在的弱点和安全问题。

“蚁鉴2.0”最新实现对AIGC生成图片、视频等多模内容的“真伪”辨别和安全性检测,基于生成模型构建的近千万深度伪造样本,可快速分辨内容是机器生成还是人工生成,及是否存在伦理道德等风险。

“天鉴”则相当于在大模型外围又加上了一个“防护盾”,通过智能化风控技术,帮助大模型挡住外界的恶意提问,同时对生成的回答内容进行风险过滤,保障大模型上线后从用户输入到生成输出的整体安全防御。

据了解,“天鉴”平台基于问(人类知识)、答(AI知识)环节不同的特点,构建了一套护栏防御的智能风控方案,支持风险内容识别、阻断、反制等全链路服务。通过该方案,不仅可以在用户输入阶段即对其意图做快速理解和风险判断,并输出拒绝回答、知识代答等不同的风控交互方式,还可以快速迭代大模型的风险认知和防御能力,在兼顾用户体验的同时,确保其输出的内容合规、健康。

据介绍,“天鉴”平台集大数据底座、AI计算平台、智能运营、应用场景为一体,可实现低成本、规模化快速应用,服务零售、金融、直播、游戏等提供生成式人工智能服务的业务场景。

此外,针对数据源头有毒、深度黑盒不可控等问题,蚂蚁集团结合“天鉴”平台在大模型的训练和应用过程中,也在通过数据去毒、对齐训练、可解释研究等手段保障模型安全。

AI一把火烧过来,谁会成为下一个诺基亚?

ChatGPT一把大火烧过来,消费电子厂商齐刷刷地望向AI。国内,全球最大的个人电脑(PC)制造商联想推出了AIPC;小度、天猫精灵、小爱同学等智能音箱开始了新一轮与AI的热恋;vivo将AI大模型装入智能手机,华为、小米...

“ChatGPT之父”剑桥演讲遭抵制,学术大佬激战AI安全

随着美国政府发布新的AI法规,关于监管AI大模型一事最近又起争议。北京时间11月2日凌晨,“ChatGPT之父”、OpenAICEO奥特曼(SamAltman)在英国剑桥参加活动时,遭到了反AI活动的激进分子的强烈抵制,在大礼堂里当面...

Canalys:今年AI手机出货占比16%,预测到2028年市场份额将达54%

5月29日消息,Canalys今日发布了一份关于《AI手机的现在和未来》的深度报告。报告指出,2024年全球16%的智能手机出货为AI手机,到2028年,这一比例将激增至54%。分析师认为,受消费者对AI助手和端侧处理等增强功能需...

蚂蚁数科发布新一代融合 AI 风控引擎 10月底将开源核心框架

6月25日消息,今日,蚂蚁数科旗下蚁盾发布新一代融合AI风控引擎“AIREngine(AIFUSERiskEngine)”,在原有的决策式AI架构上通过引入生成式AI,进一步提升风控智能化水平。蚁盾是蚂蚁数科的安全风控品牌,在近十年的...

谷歌增强安卓无障碍体验:用AI描述周围环境等

5月17日消息,谷歌公司为迎接第13个全球无障碍宣传日(GAAD),升级了旗下的Lookout、LooktoSpeak、Maps和ProjectRelateAndroid应用程序,改善了辅助功能体验。Lookout注:Lookout是谷歌推出的具有新辅助功能的Andro...

上一篇:微软、英伟达将同多家越南企业达成合作,涉及部署AI与开发解决方案
下一篇:英伟达称霸AI芯片领域致初创公司融资难 融资交易数下跌80%