2026-03-23 17:39:16

3377体育-权威体育赛事平台-中国官方网站- 如何给智能体装个「AI护栏」?英伟达有3项全新微服务

分享

  导语:统筹安全性、精准性及可扩大性的AI护栏才能解决AI部署刻不容缓的问题。

雷峰网(公家号:雷峰网)动静,纽约年夜学研究职员发明,假如一个给定语言模子的练习数据中有0.001%的数据 “中毒”(即存心植入过错信息),那末整个练习集将可能流传这些过错。

数据“中毒”影响练习成果,AI的现实部署,安全性一样至关主要。

咨询公司Gartner猜测,到2028年,AI智能体将完成至少15%的一样平常事情决议计划并被运用在33%的企业步伐。年夜量的AI智能体开发需求,让企业解决此中的信托、物理安全、收集安全以和合规性等问题显患上越发刻不容缓。

近日,英伟达发布了全新的保障代办署理式AI运用安全的NIM微办事,这将消弭企业部署天生式AI时的安全疑虑,而且为天生式AI的普和提供安全保障。

全新的NIM微办事是NeMo Guardrails软件东西系列的一部门,这些可移植且颠末优化的推理微办事可以帮忙企业提高天生式AI运用的安全性、精准性及可扩大性。

3项NIM微办事,统筹高安全性及低延迟

NVIDIA NeMo Guardrails是一个开源东西包,答应开发者将可编程护栏添加到基在LLM的会话体系中,从而保障人工智能体系的安全与合规。

NeMo Guardrails引入的三项全新微办事,可以或许帮忙AI智能体于年夜范围运行时能同时连结受控举动。

内容安全NIM微办事(Content Safety NIM)利用了质量较高的人工解释数据源Aegis内容安全部据集举行练习,该数据集包罗跨越35000小我私家工标志的数据样本,由英伟达收拾并开源,已经经于Hugging Face公然发布。高质量的数据集可以或许有用避免AI天生有成见或者有害的输出成果,确保回覆切合品德尺度。

英伟达的企业AI模子、软件与办事副总裁Kari Briski暗示:“这是同类数据集中质量最高的数据源之一。”

话题节制NIM微办事(Topic Control NIM)能将对于话聚焦于颠末审核的话题上,防止离题或者不妥内容。

逃狱检测NIM微办事(Jailbreak Detection NIM)增长了对于逃狱诡计( 指绕过模子的安全防护办法,让模子履行禁止的举动)的防护,帮忙于匹敌性场景中连结AI的完备性。

如何给智能体装个「AI护栏」?英伟达有3项全新微服务

来历:英伟达官方

因为“一刀切”的要领没法有用掩护及节制繁杂的代办署理式AI事情流,经由过程运用多个轻量级专业模子作为护栏,开发者可以填补于只采纳较为通用的全局计谋及掩护办法时可能呈现的缝隙。

可编程护栏数目的增长虽然能晋升保障能力,但也会致使延迟有所上升,NeMo Guardrails以最小延迟晋升保障能力,极具“性价比”。

当护栏数目为0(仅体系提醒)时,延迟约为0.75秒,合规性为1X(基准)。

当护栏数目为1时,延迟增长到约1秒,合规性晋升到1.1X。

当护栏数目为5时,延迟约为1.25秒,合规性到达1.5X。

增长到5个护栏,延迟仅增长约1.25秒。与增长1个护栏,延迟增长1秒对于比,实现显著的优化。这注解,NeMo Guardrails于晋升保障能力的同时,对于延迟的影响较小,可以或许于包管体系机能的条件下提高安全性及合规性。

给汽车、零售、电信等行业的安全、精准、可扩大的「AI护栏」

NeMo Guardrails已经向开源社区开放,其NIM微办事解决企业级客户的“后顾之忧”,使开发者可以或许构建越发安全、可托的AI智能体。智能体经由过程参考特定语境准则做出安全、适量的回覆,而且增强了对于逃狱诡计的抵御力度,实现了于汽车、金融、医疗、制造、零售等行业客户办事中的部署。

软件及办事解决方案提供商Amdocs推出的amAIz平台是一个创始性的电信天生式AI框架,经由过程集成NVIDIA NeMo Guardrails,加强了平台的可托AI功效,保障代办署理式体验的安全性、靠得住性及可扩大性,从而让办事提供商可以或许安全数署AI解决方案。

Amdocs技能集团总裁兼战略主管Anthony Goonetilleke暗示:“像NeMo Guardrails如许的技能对于在保障天生式AI运用的安全至关主要,可以或许帮忙AI安全、品德地运行。”

专注在为汽车行业提供AI解决方案的Cerence AI,经由过程NVIDIA NeMo Guardrails帮忙车载助手于其CaLLM系列年夜语言及小语言模子的撑持下提供切合语境的安全交互。

Cerence AI产物及技能履行副总裁Nils Schanz暗示:“NeMo Guardrails可以帮忙咱们为汽车制造商客户提供可托的情境感知解决方案,并作出明智、严谨且无幻觉的回覆。”

于面向客户的专业常识运用上,更需包管AI天生式回覆的安全性与靠得住性。

家居装饰零售商劳氏公司经由过程使用天生式AI巩固店员的专业常识,以此让员工于面临客户的问题时可以或许“对于答如流”。这暗地里,是NVIDIA NeMo Guardrails将AI的回覆“框定”于准确的规模内,确保输出的内容“不翻车”。

劳氏公司的数据、AI及立异高级副总裁Chandhu Nair则暗示:“咱们一直于寻觅要领帮忙员工为客户提供凌驾预期的办事。经由过程部署NVIDIA NeMo Guardrails,包管了AI天生式回覆的安全性与靠得住性,将对于话强行限定于相干及适量的内容规模内。”

值患上一提的是,NeMo Guardrails还有具有较好的开放性及可扩大性,可集成由AI安全模子及防护提供商构成的生态体系,以和AI可不雅察性及开发东西。撑持与ActiveFence的ActiveScore(AI安全办事)集成,避免对于话式AI运用呈现有害或者不妥内容,并提供可视化、阐发及监控功效。

区块链基础举措措施公司Hive以NIM微办事情势提供合用在图象、视频及音频内容的AI天生内容检测模子,经由过程利用NeMo Guardrails,Hive可将其模子集成到AI运用中并举行编排。

AI可不雅测性平台Fiddler与NeMo Guardrails集成,可加强其监控功效。端到端AI开发者平台Weights & Biases正于现有NIM集成组合基础上,经由过程增长与NeMo Guardrails微办事的集成来扩大W&B Weave的功效,以此晋升AI推理能力。

此外,NeMo Guardrails还有提供用在AI安全测试及缝隙扫描的开源套件NVIDIA Garak,用在LLM及运用缝隙扫描,借助Garak,开发者可以发明利用LLM中的体系中存于的缝隙,发明并解决AI模子中的潜于弱点,提高模子的稳健性与安全性。

今朝,NVIDIA NeMo Guardrails微办事以和用在编排rail的NeMo Guardrails及NVIDIA Garak套件已经向开发者及企业开放,开发者根据官网上的教程就能够利用NeMo Guardrails为AI客服智能体构建AI护栏。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-3377体育-权威体育赛事平台-中国官方网站