
12 月 18 日,在 2024 冬季火山引擎 FORCE 原動力大會上,火山引擎數(shù)智平臺(VeDI)正式升級發(fā)布數(shù)據(jù)飛輪 2.0 模式。
延續(xù)去年 4 月發(fā)布的數(shù)據(jù)飛輪“以數(shù)據(jù)消費促資產(chǎn)建設,以數(shù)據(jù)消費助業(yè)務發(fā)展”的核心內(nèi)涵,此次升級后,數(shù)據(jù)飛輪 2.0 將 AI 視作數(shù)智化的核心競爭力,借助 AI 技術推動企業(yè)更普惠的數(shù)據(jù)消費。
火山引擎數(shù)據(jù)飛輪2.0模式圖
本次模式升級包括了:智能數(shù)據(jù)洞察DataWind ChatBI智能體、增長分析DataFinder智能分析助手、A/B測試DataTester智能實驗助手、客戶數(shù)據(jù)平臺VeCDP智能營銷助手、增長營銷平臺GMP創(chuàng)意助手、大數(shù)據(jù)研發(fā)治理套件DataLeap運維助手和E-MapReduce全模態(tài)數(shù)據(jù)處理引擎等,全系列火山引擎數(shù)智平臺產(chǎn)品AI能力的發(fā)布。
與此同時,兩大數(shù)據(jù)飛輪2.0核心解決方案首次公開亮相。
其一為 “DataFabric 驅(qū)動下的 ChatBI 智能體解決方案”,亮點在于賦予業(yè)務自定義的數(shù)據(jù)智能體能力,有效降低業(yè)務調(diào)用與理解數(shù)據(jù)的難度;
其二是 “多模態(tài)數(shù)據(jù)湖解決方案”,該方案專注于處理全模態(tài)數(shù)據(jù),擴容企業(yè)潛在數(shù)字資產(chǎn)規(guī)模。
至此,數(shù)據(jù)飛輪 2.0 實現(xiàn)數(shù)據(jù)生產(chǎn)、管理與應用各環(huán)節(jié)全方位 AI 能力深度融合,推動企業(yè)數(shù)據(jù)消費便捷化、資產(chǎn)建設低門檻化,加速企業(yè)數(shù)據(jù)價值實現(xiàn)進程。
數(shù)據(jù)消費的新體驗:ChatBI智能體
在2.0升級前,火山引擎數(shù)據(jù)飛輪已在近兩年的時間里,幫助眾多企業(yè)通過數(shù)據(jù)消費挖掘數(shù)據(jù)價值,助力業(yè)務增長:
領克汽車通過數(shù)據(jù)飛輪構(gòu)建用戶數(shù)據(jù)平臺,精準洞察消費者需求,實現(xiàn)差異化營銷,運營成本降低70%;德邦快遞通過數(shù)據(jù)飛輪解決數(shù)據(jù)"黑盒"問題,用戶識別和營銷效率顯著提升,月營銷活動峰值可達100場,效率提高5倍;瑪麗黛佳兩年內(nèi)完成數(shù)智化轉(zhuǎn)型,搭建的“數(shù)據(jù)找人”模式,讓數(shù)據(jù)自動生成并流向業(yè)務負責人,實現(xiàn)實時決策……
數(shù)據(jù)飛輪模式并非靜態(tài)技術框架,而是有生命力的生態(tài)系統(tǒng),其生命力源于數(shù)據(jù)消費。而,企業(yè)數(shù)據(jù)消費的廣度與深度,則直接決定企業(yè)數(shù)智化的程度。
上述企業(yè)在數(shù)據(jù)飛輪模式助力下,內(nèi)部數(shù)據(jù)消費水平顯著提升。
然而,在與更廣泛的客戶合作中,火山引擎數(shù)智平臺察覺到一個關鍵難點:企業(yè)內(nèi)部各崗位角色間的的數(shù)字化水平存在較大差異,數(shù)據(jù)分析與應用產(chǎn)品的使用往往局限在少部分專業(yè)角色中,這在一定程度上制約了企業(yè)級數(shù)據(jù)消費活力的釋放。
這也引發(fā)了火山引擎數(shù)智平臺的思考:如何確保企業(yè)各業(yè)務角色以及每一層級組織,都能便捷、高效地獲取和使用數(shù)據(jù)?
在AI涌現(xiàn)的趨勢下,他們摸索著找到了新解法——構(gòu)建業(yè)務自己的數(shù)據(jù)智能體,在經(jīng)由內(nèi)部多個產(chǎn)品實踐后,最終發(fā)布了“Data Fabric驅(qū)動下的ChatBI智能體”解決方案。
火山引擎Data Fabric驅(qū)動下的ChatBI智能體解決方案
事實上,在去年,圍繞大模型能力,火山引擎數(shù)智平臺已經(jīng)推出了智能數(shù)據(jù)洞察DataWind分析助手等功能。企業(yè)員工可以通過自然語言輸入,查收到對應的可視化圖表并實現(xiàn)下鉆分析,實現(xiàn)數(shù)據(jù)分析效率的提升。
但在企業(yè)具體的實踐中,重新學習輸入prompt(提示),并不能為專業(yè)的分析師“減負”;而對BI工具不精通的員工,在使用這類能力時,又會遇到如何選擇數(shù)據(jù)集等“專業(yè)”難題。
同時,籠統(tǒng)的分析助手無法理解不同行業(yè)與業(yè)務中的“黑話”,不理解使用者的真實意圖,從而大幅降低分析準確性。
“Data Fabric驅(qū)動下的ChatBI智能體”解決方案,正在試圖解決上述這些問題:通過構(gòu)建完整的智能數(shù)據(jù)服務體系,打破數(shù)據(jù)“專業(yè)”壁壘,幫助企業(yè)內(nèi)每個業(yè)務都能定制專屬智能體,持續(xù)降低數(shù)據(jù)使用門檻,提升大模型能力下的數(shù)據(jù)反饋效率和準確率。
在這套解決方案中, Data Fabric通過語義層和數(shù)據(jù)模型的整合,重構(gòu)了數(shù)據(jù)生產(chǎn)關系,在顯著降低數(shù)據(jù)存儲和計算成本的基礎上,讓數(shù)據(jù)服務變得更加敏捷;而ChatBI智能體則能更貼合業(yè)務個性化需求,通過交互理解、數(shù)據(jù)訪問、分析推理和結(jié)果生成四大模塊,極大提升業(yè)務員工的數(shù)據(jù)生產(chǎn)力,讓數(shù)據(jù)消費變得更加簡單直接。
數(shù)據(jù)顯示,在字節(jié)跳動內(nèi)部,這套方案已覆蓋超200個分析場景,每天處理10萬余次分析請求,平均分析時間降低了 80%,數(shù)據(jù)開發(fā)和運維成本也大幅下降。
數(shù)據(jù)資產(chǎn)的新生力:多模態(tài)數(shù)據(jù)湖
如果說“Data Fabric驅(qū)動下的ChatBI智能體”解決方案,是火山引擎數(shù)智平臺持續(xù)在服務企業(yè)過程中,不斷洞察新的業(yè)務需求,實現(xiàn)的“數(shù)據(jù)+AI”能力沉淀和升級。那么“多模態(tài)數(shù)據(jù)湖”解決方案的誕生,則更像他們洞見當下企業(yè)即將遇到的問題時,所作出的敏捷反應。
LLM的大熱,讓企業(yè)對于AI賦能的數(shù)字化滿懷憧憬,眾多企業(yè)投身大模型于業(yè)務場景的落地實踐。然而技術魅力與現(xiàn)實困境共生,大模型催生的圖像、視頻、音頻等海量多模態(tài)數(shù)據(jù)正在挑戰(zhàn)傳統(tǒng)湖倉技術。
傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)處理,無法滿足當下對多模態(tài)數(shù)據(jù)的存儲、計算,也無法挖掘出這部分數(shù)據(jù)背后的資產(chǎn)價值。
在深度參與大模型產(chǎn)業(yè)的同時,火山引擎數(shù)智平臺亦敏銳感知到了非結(jié)構(gòu)數(shù)據(jù)變現(xiàn)成企業(yè)核心數(shù)據(jù)資產(chǎn)的意義。
多模態(tài)數(shù)據(jù)湖解決方案,應運而生。
火山引擎多模態(tài)數(shù)據(jù)湖解決方案
火山引擎數(shù)據(jù)飛輪2.0所推出的多模態(tài)數(shù)據(jù)湖解決方案,可實現(xiàn)海量結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一精細化管理,全方位兼容各類數(shù)據(jù)格式,為LLM預訓練、持續(xù)訓練和微調(diào)全程各個環(huán)節(jié)提供更好的數(shù)據(jù)支持。
從數(shù)據(jù)源來看,火山引擎多模態(tài)數(shù)據(jù)湖方案可實現(xiàn)各類數(shù)據(jù)的統(tǒng)一管理;在算子處理方面,該方案提供了100多種開箱即用的非結(jié)構(gòu)數(shù)據(jù)處理算子;在多元異構(gòu)計算上,方案提供了CPU+GPU異構(gòu)計算,能讓數(shù)據(jù)計算提效3倍以上。
目前,該解決方案已廣泛應用在泛互聯(lián)網(wǎng)、汽車等行業(yè),并取得實效。
以聚焦于智能網(wǎng)聯(lián)汽車的某科創(chuàng)公司為例,最初該公司使用自建開源大數(shù)據(jù)平臺支撐車聯(lián)網(wǎng)數(shù)據(jù)采集、加工及分析,但存在實時離線數(shù)據(jù)割裂、數(shù)據(jù)膨脹、系統(tǒng)穩(wěn)定性低等問題。
通過引入火山引擎多模態(tài)數(shù)據(jù)湖解決方案,該公司將火山引擎E-MapReduce作為數(shù)據(jù)湖 OLAP 引擎,構(gòu)建兼具離線、實時的湖倉一體架構(gòu),并運用其存算分離架構(gòu)應對高膨脹增量數(shù)據(jù),在確保計算性能 SLA 穩(wěn)定的同時,成功將維護成本降為零;還進一步借助全域數(shù)據(jù)集成DataSail 實現(xiàn)OLAP、OLTP 兩種不同負載要求的任務分離,保障了服務的可用性。最終在數(shù)據(jù)處理實效性提升為秒級的基礎上,資源成本還降低了30%。
技術之外,能力的培養(yǎng)至關重要
數(shù)據(jù)飛輪2.0模式的誕生,不僅僅是火山引擎在當下技術變革的頂層設計進化。它更是來自字節(jié)跳動內(nèi)部的數(shù)據(jù)驅(qū)動、AI實踐經(jīng)驗的再次總結(jié)。
事實上,目前火山引擎數(shù)據(jù)飛輪2.0模式提供給企業(yè)客戶的能力,均已在字節(jié)跳動內(nèi)部進行了長期的沉淀與優(yōu)化。
比如,多個業(yè)務線搭建了專屬ChatBI智能體,數(shù)據(jù)顯示,基于ChatBI智能體,業(yè)務用戶可自閉環(huán)完成“從業(yè)務問題到數(shù)據(jù)問題”的診斷和分析,數(shù)據(jù)自助分析率達90%。
再比如,另一款數(shù)智產(chǎn)品增長營銷平臺GMP所提供的創(chuàng)意助手能力,生成營銷內(nèi)容80%可以無需人工干預直接投放。
經(jīng)由內(nèi)部的充分實踐,火山引擎數(shù)據(jù)飛輪2.0模式已經(jīng)積累豐富的場景經(jīng)驗。這些技術之外的經(jīng)驗能力,亦是飛輪2.0模式能運行良好的重要保障。
因此,除了能力與方案的發(fā)布外,火山引擎在本次大會上也發(fā)布了“數(shù)據(jù)飛輪2.0加速計劃”,不僅為想要嘗試新能力的企業(yè)提供為期3個月的免費試用,更為需要深度挖掘數(shù)據(jù)飛輪2.0場景的企業(yè),提供了最多3個月周期的免費項目制陪跑服務。
在為企業(yè)提供工具能力的同時,更要向企業(yè)傳遞方法與經(jīng)驗。
據(jù)了解,該陪跑服務涵蓋了企業(yè)大模型數(shù)據(jù)應用方案規(guī)劃、企業(yè)Data+AI能力培育、業(yè)務陪跑等多個方面,目的是幫助企業(yè)用更短時間,更快構(gòu)建并高效運行數(shù)據(jù)飛輪2.0,實現(xiàn)業(yè)務價值提升。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據(jù)。