
大模型能力的發(fā)展和成熟,催生出新一代智能化 BI—— ChatBI,即通過(guò)自然語(yǔ)言處理(NLP)與大型語(yǔ)言模型(LLMs)的結(jié)合,極大簡(jiǎn)化數(shù)據(jù)分析過(guò)程,提高效率并降低分析門檻。
近期,火山引擎數(shù)智平臺(tái)旗下的智能數(shù)據(jù)洞察DataWind宣布上線ChatBI能力,其對(duì)接豆包大模型實(shí)現(xiàn)推理回答,能為用戶提供智能修復(fù)、多語(yǔ)法適用等支持,在性能上實(shí)現(xiàn)秒級(jí)響應(yīng)、一鍵生成。過(guò)去業(yè)務(wù)人員需要具備專業(yè)的分析和代碼能力,才能生成各類圖表分析所需的指標(biāo)?,F(xiàn)在,傳統(tǒng)指標(biāo)開(kāi)發(fā)模式將被自然語(yǔ)言輸入的智能生成方式所替代。用戶只需要通過(guò)文字描述需求, 就能生成指標(biāo),快速實(shí)現(xiàn)數(shù)據(jù)獲取、分析計(jì)算與圖表搭建,大幅降低數(shù)據(jù)消費(fèi)門檻。
在實(shí)際應(yīng)用中,用戶與 ChatBI 進(jìn)行交互時(shí),期望能夠快速得到數(shù)據(jù)分析結(jié)果和回答。如果分析引擎性能不足,處理數(shù)據(jù)的速度緩慢,將導(dǎo)致響應(yīng)時(shí)間過(guò)長(zhǎng),影響用戶體驗(yàn)。因此,完善的大數(shù)據(jù)架構(gòu)及高性能查詢是DataWind高效數(shù)據(jù)分析的基石。
火山引擎DataWind相關(guān)負(fù)責(zé)人進(jìn)一步介紹道:“我們不僅持續(xù)提升企業(yè)級(jí) BI 功能性,比如引入AI能力,更專注于解決系統(tǒng)的性能和伸縮性問(wèn)題。隨著B(niǎo)I在企業(yè)組織中落地推廣,并逐漸深入業(yè)務(wù),用戶數(shù)量、計(jì)算量和數(shù)據(jù)量會(huì)迅速增加,從長(zhǎng)期維護(hù)的角度出發(fā),我們必須確保系統(tǒng)能夠應(yīng)對(duì)未來(lái)大規(guī)模帶來(lái)的壓力?!?/p> 而DataWind選擇將云原生數(shù)據(jù)倉(cāng)庫(kù)ByteHouse作為OLAP架構(gòu),為上層ChatBI的快速響應(yīng)提供高性能、高擴(kuò)展、高彈性支持。 ByteHouse 是火山引擎基于ClickHouse 進(jìn)行深度自研優(yōu)化的云原生數(shù)據(jù)倉(cāng)庫(kù),能夠?qū)﹄x線和實(shí)時(shí)數(shù)據(jù)進(jìn)行統(tǒng)一分析處理,并通過(guò)彈性擴(kuò)展的計(jì)算層、分布式存儲(chǔ)層加速企業(yè)分析和決策。在性能方面,ByteHouse推出了自研HaMergeTree解決ZooKeeper依賴大的問(wèn)題,通過(guò)建立索引對(duì)記錄進(jìn)行快速更新、標(biāo)記、刪除,也在分布式j(luò)oin上進(jìn)行大量?jī)?yōu)化器方面優(yōu)化,整體提升性能表現(xiàn)。 除此之外,DataWind還基于 ByteHouse 的冷熱數(shù)據(jù)分層能力,在實(shí)現(xiàn)查詢高性能的同時(shí),有效節(jié)約資源成本。 隨著數(shù)據(jù)量不斷增長(zhǎng)積累,數(shù)據(jù)的訪問(wèn)熱度會(huì)呈現(xiàn)出巨大的差異。部分?jǐn)?shù)據(jù)的訪問(wèn)頻率會(huì)明顯高于其他數(shù)據(jù),例如近期寫入數(shù)據(jù)的訪問(wèn)頻率會(huì)比歷史數(shù)據(jù)高很多。 針對(duì)數(shù)據(jù)冷熱情況,ByteHouse 采用了不同的存儲(chǔ)策略和查詢策略:對(duì)于熱數(shù)據(jù),進(jìn)行特殊處理以實(shí)現(xiàn)高性能分析;對(duì)于冷數(shù)據(jù),實(shí)現(xiàn)低成本存儲(chǔ)。從整體上提高訪問(wèn)和查詢效率,減少資源浪費(fèi)。 DataWind基于ByteHouse的數(shù)據(jù)冷熱分層架構(gòu) 從數(shù)據(jù)架構(gòu)上看,DataWind與ByteHouse緊密結(jié)合,一方面,數(shù)據(jù)存儲(chǔ)在 ByteHouse 內(nèi),無(wú)數(shù)據(jù)冗余,無(wú)需數(shù)據(jù)搬遷,讓多個(gè)服務(wù)可以共享一份數(shù)據(jù);另一方面也保持較高靈活性,除了用 DataWind 直接進(jìn)行數(shù)據(jù)訪問(wèn)之外,也可以直連 ByteHouse 做自定義的接入和分析查詢,在確保靈活取數(shù)的情況下,保障了數(shù)據(jù)的可訪問(wèn)性和主權(quán)。 大模型的推理、檢索和生成能力,使數(shù)據(jù)的使用門檻在交互方式和分析技能方面都大幅降低,BI+AI 的場(chǎng)景變得更加具體、可實(shí)現(xiàn)。而在ByteHouse高性能、彈性伸縮特性加持下,ChatBI在資源成本可控的情況下,實(shí)現(xiàn)響應(yīng)速度進(jìn)一步提升,持續(xù)為用戶提供極致的數(shù)據(jù)分析體驗(yàn)。
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。