英伟达推出NeMo Guardrails AI安全套件防备大模型“越狱”

时间: 2025-04-19 18:38:06 |   作者: 按护栏类别分类

产品详情

  英伟达近来宣告推出名为“NIM”的AI护栏服务,现已以NeMo Guardrails套件的方式供给。该服务旨在为大言语模型(LLM)增加一系列护栏规矩,避免用户经过提示词“越狱”大模型,然后避免生成不符合预期的内容。

  NeMo Guardrails根据英伟达的Aegis内容安全数据集练习而成,该数据集包括3.5万个标示样本,并已在Hugging Face上揭露。这套AI护栏服务不只体积小、效率高,还能在多种场合中流通运转。公司可以直接将其嵌入AI模型开发中,提高医疗、轿车、制造业等范畴AI布置的安全性。

  此外,英伟达还发布了Garak缝隙扫描东西,用于检测模型安全性,避免输出错觉内容或走漏企业内部秘要信息。这一系列行动将有用改进AI使用的安全性和可靠性。

其他产品
热门产品