
火山引擎總裁 譚待
“截至到9月,豆包大模型的日均 tokens 使用量已經超過1.3萬億,4個月的時間里 tokens 整體增長超過了10倍。在多模態方面,豆包·文生圖模型日均生成圖片5,000萬張,此外,豆包目前日均處理語音85萬小時。”火山引擎總裁譚待表示。
9月24日,2024火山引擎 AI 創新巡展在深圳舉辦,帶來豆包大模型最新進展。豆包大模型家族迎來新成員,全新發布豆包·視頻生成模型以及豆包·音樂模型、豆包·同聲傳譯模型。豆包通用模型pro 和文生圖模型、語音合成模型等垂類模型大幅升級,不斷增加的各類模態以及規模化的調用量,讓豆包大模型“更強模型、更低價格、更易落地”的優勢持續凸顯。其中,主力模型“豆包通用模型pro”最新版本在各維度上國內領先,模型效果持續增強。
火山引擎正式發布豆包·視頻生成模型
全面加速 AIGC 應用創新
精準的語義理解
多動作多主體交互
豆包·視頻生成模型能遵從復雜 prompt,解鎖時序性多拍動作指令與多個主體間的交互能力。
強大動態與酷炫運鏡
告別PPT動畫
可以讓視頻在主體的大動態與鏡頭中炫酷切換,擁有變焦、環繞、平搖、縮放、目標跟隨等多鏡頭語言能力,靈活控制視角,帶來真實世界的體驗。
一致性多鏡頭生成
10秒講一個完整故事
成功攻克多鏡頭切換時一致性的技術挑戰,在一個 prompt 內實現多個鏡頭切換,同時保持主體、風格、氛圍的一致性。
高保真高美感
多風格多比例
支持包括黑白、3D 動畫、2D 動畫、國畫等多種風格,包含1:1、3:4、4:3、16:9、9:16、21:9 六個比例,適配于各種終端,以及電影、手機豎屏等不同畫幅。
強大畫面效果的背后,是字節跳動在視頻大模型技術研發的不斷投入。
視頻生成能力,為眾多企業場景帶來創新。例如在電商營銷場景,豆包·視頻生成模型不僅快速把商品變成 3D 動態多角度展示,還能配合中秋、七夕、春節等節點替換背景和風格,生成不同尺寸快速上架;在動畫教育場景,豆包·視頻生成模型可以大幅降低動畫的制作成本,生動的呈現童話故事情節。
此外,還有城市文旅、音樂 MV、微電影、短劇等應用場景,都可以通過豆包·視頻生成模型實現降本提效和創意合規。
豆包·音樂模型演示
豆包·同聲傳譯模型演示
豆包大模型家族成員更加豐富,模型能力持續升級,為大模型在多模態、多元化方面的落地應用打下了良好的基礎。火山引擎將繼續推進模型能力的不斷升級與迭代,探索模型能力在更多場合的應用,持續為企業借助大模型實現云上智能化注入動力。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。