
近日,啟明星辰集團(tuán)自主研發(fā)的大模型應(yīng)用安全評(píng)估與加固系統(tǒng)(MAVAS)率先通過國家網(wǎng)絡(luò)與信息系統(tǒng)安全產(chǎn)品質(zhì)量檢驗(yàn)檢測(cè)中心(公安部第三研究所)的嚴(yán)格測(cè)試,首個(gè)獲大模型安全評(píng)估系統(tǒng)認(rèn)證(增強(qiáng)級(jí))證書。
當(dāng)前,人工智能大模型技術(shù)加速演進(jìn),已深入應(yīng)用于各行各業(yè)的核心業(yè)務(wù)場(chǎng)景。隨著2025年政府工作報(bào)告明確提出“持續(xù)推進(jìn)‘人工智能+’行動(dòng)”,大模型應(yīng)用迎來前所未有的政策機(jī)遇。然而,其在全生命周期中存在的安全問題也日益凸顯,主要表現(xiàn)為生成有害信息、敏感數(shù)據(jù)泄露,以及越獄攻擊、提示注入等惡意行為高發(fā)。此類風(fēng)險(xiǎn)隱蔽性強(qiáng)、復(fù)雜度高,正逐漸成為制約人工智能產(chǎn)業(yè)創(chuàng)新與可持續(xù)發(fā)展的關(guān)鍵瓶頸。
為響應(yīng)國家推動(dòng)大模型安全應(yīng)用的政策導(dǎo)向,有效化解大模型全生命周期的安全風(fēng)險(xiǎn),啟明星辰集團(tuán)MAVAS基于《生成式人工智能服務(wù)管理暫行辦法》《網(wǎng)絡(luò)安全技術(shù) 生成式人工智能服務(wù)安全基本要求》等相關(guān)標(biāo)準(zhǔn)要求,采用“以模型對(duì)抗模型”的創(chuàng)新方式,實(shí)現(xiàn)自動(dòng)化專業(yè)評(píng)估大模型在不同場(chǎng)景中生成內(nèi)容的安全性。
MAVAS具備六大核心能力,構(gòu)建全方位安全防護(hù)體系:
? 安全評(píng)估:基于內(nèi)置多樣化的對(duì)抗攻擊樣本(數(shù)量100000+)和大模型評(píng)測(cè)基準(zhǔn)模型能力,實(shí)現(xiàn)自動(dòng)化評(píng)估大模型生成內(nèi)容的安全性。
? 安全加固:基于內(nèi)置敏感詞庫和風(fēng)險(xiǎn)識(shí)別模型雙重策略配合,支持對(duì)大模型輸入輸出的不安全內(nèi)容實(shí)時(shí)檢測(cè)與安全治理,可與安全評(píng)估形成閉環(huán)方案。
? 資產(chǎn)發(fā)現(xiàn):利用主動(dòng)探測(cè)技術(shù),全面識(shí)別企業(yè)內(nèi)部私自搭建的大模型服務(wù)及相關(guān)資產(chǎn),實(shí)現(xiàn)統(tǒng)一可視化管理,消除“影子AI”帶來的安全風(fēng)險(xiǎn)。
? 漏洞檢測(cè):掃描主流大模型依賴的應(yīng)用組件、智能框架及開發(fā)工具,精準(zhǔn)識(shí)別緩沖區(qū)溢出、代碼注入等已知高危漏洞。
? 配置檢測(cè):自動(dòng)檢查大模型應(yīng)用組件的安全配置,識(shí)別如不必要端口/服務(wù)開放、弱密碼策略等風(fēng)險(xiǎn)配置,確保系統(tǒng)以安全基線運(yùn)行。
? Web檢測(cè):深度掃描大模型依賴的Web應(yīng)用組件,檢測(cè)SQL注入、XSS跨站腳本等常見Web攻擊漏洞,阻斷潛在攻擊路徑。
MAVAS廣泛適用于多類場(chǎng)景,為不同用戶提供針對(duì)性解決方案:
? 面向大模型應(yīng)用企業(yè):全周期防護(hù),保障安全合規(guī)
MAVAS為大模型應(yīng)用企業(yè)提供覆蓋上線前與上線后的常態(tài)化安全評(píng)估,并對(duì)輸入輸出內(nèi)容實(shí)施多策略精準(zhǔn)防護(hù),確保應(yīng)用全程安全、可靠、合規(guī)。
? 面向大模型開發(fā)企業(yè):前置安全,護(hù)航研發(fā)
MAVAS為大模型應(yīng)用研發(fā)企業(yè)能在產(chǎn)品研制與訓(xùn)練階段主動(dòng)發(fā)現(xiàn)潛在安全隱患,并輔助驗(yàn)證修復(fù)效果,規(guī)避大模型應(yīng)用上市后因安全問題引發(fā)的聲譽(yù)損害與法律合規(guī)風(fēng)險(xiǎn)。
? 面向政府與監(jiān)管機(jī)構(gòu):強(qiáng)化合規(guī)監(jiān)管,守護(hù)公共安全
MAVAS為政府與監(jiān)管機(jī)構(gòu)能提供強(qiáng)有力的監(jiān)管科技支撐,通過全面評(píng)估與持續(xù)監(jiān)測(cè)企業(yè)大模型應(yīng)用安全管理和風(fēng)險(xiǎn)防范體系,切實(shí)維護(hù)社會(huì)公共利益、國家安全與公民權(quán)益。
在人工智能深度融合與高質(zhì)量發(fā)展的關(guān)鍵階段,啟明星辰集團(tuán)將持續(xù)深耕大模型安全領(lǐng)域,推動(dòng)安全技術(shù)在各行業(yè)真實(shí)場(chǎng)景中的規(guī)模化應(yīng)用,不斷提升大模型安全產(chǎn)品與服務(wù)的標(biāo)準(zhǔn)化、體系化水平,為人工智能產(chǎn)業(yè)構(gòu)建牢固的安全基石,助力實(shí)現(xiàn)可信、可控、可持續(xù)的智能化未來。