AWS的基礎模型(Foundation Model)服務Bedrock現(xiàn)在提供護欄(Guardrails)功能預覽,供企業(yè)根據(jù)自身對應用程序需求和負責任人工智能政策,制定保護措施。官方提到,借由Bedrock的護欄功能,將可促進最終用戶與生成式人工智能應用程序的安全互動。
護欄能夠評估最終用戶的輸入和基礎模型的回應,并根據(jù)特定使用案例政策提供額外保護層,跨不同的基礎模型,包括Anthropic Claude、Meta Llama 2、Cohere Command、AI21 Labs Jurassic和Amazon Titan Text,以及經(jīng)微調(diào)的模型發(fā)揮作用。
企業(yè)只要使用簡短的自然語言描述,就可以定義一組在應用程序上下文中避免的主題,護欄能夠偵測并封鎖受限主題的用戶輸入和基礎模型回應,像是在銀行助理中,企業(yè)可以通過護欄限制與投資建議相關的話題。
Bedrock護欄功能還提供內(nèi)容過濾器,通過自動評估最終用戶的查詢和基礎模型回應,封鎖屬于限制類別的內(nèi)容,企業(yè)可以經(jīng)由調(diào)整閾值,規(guī)范需要過濾的仇恨、侮辱、性和暴力等限制類別的內(nèi)容。另外,AWS接下來還會在護欄中添加個人數(shù)據(jù)刪除功能,借由偵測最終用戶輸入和基礎模型回應,拒絕包含個人數(shù)據(jù)的輸入,并從基礎模型的回應中刪除個人數(shù)據(jù)。