
AI大模型正在重構游戲世界。游戲中的NPC,不再是只按劇本走的道具,而是擁有情感、記憶和推理能力,更有“人味兒”了。
盛趣游戲旗下運營了22年的國民級游戲《傳奇世界》,就在2025年3月推出了智能NPC——“玄玄老人”。玩家可以與“玄玄老人”通過自然語言對話,獲取實時的游戲信息,也可以與他調侃互動,大大增強了游戲世界的沉浸感。
《傳奇世界》智能NPC“玄玄老人”
不過,大模型讓NPC擁有“自由意志”的同時,也放大了安全風險——如果NPC被玩家誘導輸出暴力粗俗、違背倫理道德的言論怎么辦?如果大模型被“越獄”,跨過合規邊界,被不法分子利用了怎么辦?如何在保障玩家體驗的同時,對智能NPC進行全面的安全防護?這是一道安全與性能必須兼顧的難題。
為此,盛趣游戲與火山引擎展開合作,通過部署火山引擎大模型應用防火墻,結合盛趣游戲內部的知識庫,打造了一站式、全鏈路安全防線,讓智能NPC既聰明靈動,又安全放心。同時,領先的低延時技術也令游戲玩家體驗更流暢。
好玩與合規如何兼顧?智能NPC面臨多重風險挑戰
游戲世界有著嚴格的內容合規邊界,AI大模型增強了游戲交互性、可玩性的同時,也讓劇情內容更加隨機,增大了合規隱患。智能NPC面臨著大模型領域所特有的安全風險,比如內容輸入與輸出合規、提示詞注入攻擊等。NPC不但需要嚴格避免輸出敏感、違規內容,在遇到玩家輸入違規指令時,NPC還需要第一時間攔截并對玩家做出正確引導。今年年初某游戲就因NPC生成包含暴力誘導的對話,被多個國家下架整改。
提示詞是讓AI執行任務的“鑰匙”,也成為攻擊者突破AI防線的關鍵。攻擊者通過角色扮演、對話模擬、越獄攻擊和目標劫持等方式設置“語言陷阱”,誘導大模型輸出風險信息,甚至導致模型“越獄”,繞過大模型安全機制,執行惡意操作。在某款游戲中,玩家讓NPC扮演“失去理智”的情緒,引導NPC輸出惡意辱罵、甚至泄露訓練數據。
盛趣游戲明確表示,游戲要在保持AI創造性的同時,確保內容符合國家合規要求。因此,盛趣游戲攜手火山引擎,圍繞大模型應用全鏈路安全防護構建起一道堅實的防火墻。
All in One 大模型應用防火墻,安全可靠低時延
盛趣游戲和火山引擎聯合打造的這道防火墻,不僅有效保障了NPC內容輸入和輸出合規,還針對大模型特有的攻防難點如提示詞注入、算力濫用、模型濫用等展開全面防護。截止目前,“火山引擎大模型應用防火墻”已成功攔截近10萬次攻擊。
火山引擎大模型應用防火墻
一、NPC輸入輸出更合規
針對敏感詞防護,“火山引擎大模型應用防火墻”提供了話題控制功能。基于《傳奇世界》的話題規劃,結合實際用戶與NPC“玄玄老人”的對話場景進行調優,大幅提升大模型泛化能力。在實際測試中,針對行業的“游戲裝備觸發敏感詞、誤被攔截”的現象,“火山引擎大模型應用防火墻”可基于游戲場景與內容調優,對敏感詞“加白”放行,大幅降低誤觸與誤報率。
二、攻擊防護更嚴密
針對游戲行業常見的“角色扮演”提示詞注入攻擊,比如,當玩家引導武俠NPC透露通關機密時,“火山引擎大模型應用防火墻”可快速識別風險,提出諸如“此乃門派機密,不如我們聊聊江湖趣聞”的回答,引導用戶提出正確問題,既保證角色一致性,又避免數據泄露風險。
三、游戲體驗更流暢
對于游戲場景來說,最重要的性能指標就是低延時,目前行業內普遍延時在200ms左右,任何安全防護產品的引入都需要平衡性能與體驗?;鹕揭嫱ㄟ^與盛趣游戲的打磨、模型調優,將延時降低至100+ms,在安全的基礎上保障了流暢絲滑的玩家體驗。
目前,盛趣游戲旗下《傳奇世界》、《熱血傳奇》已經部署了“火山引擎大模型應用防火墻”,未來還有3款待上線的游戲將會接入。“玄玄老人”等智能NPC的推出為用戶帶來了游戲新玩法和新驚喜,火山引擎也將持續守護盛趣游戲更多智能NPC的安全運行。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。