4月18日,字節跳動旗下火山引擎在其舉辦的“原動力大會”上發布自研DPU等系列云產品,并推出新版機器學習平臺:支持萬卡級大模型訓練、微秒級延遲網絡,彈性計算可節省70%算力成本;谧匝蠨PU的GPU實例,相比上一代集群性能最高提升三倍以上。
會上,火山引擎宣布與字節跳動國內業務并池;趦韧饨y一的云原生基礎架構,抖音等業務的空閑計算資源可極速調度給火山引擎客戶使用。簡單來說就是,讓用戶在更小的資源池內調度資源,提高整體資源利用率的效果,從而達到降本增效。
字節跳動副總裁楊震原認為,業務創新需要試錯,試錯要大膽、敏捷,但試錯也一定要控制成本。通過潮汐、混部等方式,火山引擎實現資源的高利用率和極低成本。以抖音推薦系統為例,工程師用15個月的樣本訓練某個模型,5小時就能完成訓練,成本只有5000元;鸨W的抖音“AI繪畫”特效,從啟動到上線只用一周多時間,模型由一名算法工程師完成訓練。
據MiniMax聯合創始人楊斌介紹,MiniMax與火山引擎合作建立了超大規模實驗平臺,實現千卡級常態化訓練;超大規模推理平臺有萬卡級算力池,支撐單日過億次調用。在火山引擎的云上,MiniMax大模型業務實現快速突破。
火山引擎總裁譚待透露,“國內大模型領域的數十家企業,超過七成已經在火山引擎云上”。
除了像MiniMax這類AI技術公司,火山引擎也在尋求與傳統企業合作的機會。譚待對《鳳凰周刊》記者表示,這是一個很有挑戰性的事,不僅要有技術的升級,也要考慮到組織、機制等方面。目前火山引擎的做法是,找到行業內的標桿客戶,加強彼此的了解,推出落地方案。比如和吉利在營銷、座艙、自動駕駛等方面都在努力做深度共創。
圖:火山引擎總裁譚待
同時,譚待也表示,火山引擎作為ToB服務和ToC服務很不一樣,它需要一個漫長的積累過程,但在積累過后會有很強的連續性。所以短期內,火山引擎的目標是怎么面向客戶創造更多價值,長期目標最終會回歸商業本質,成為一個盈利的業務。而以目前全球領先的云計算公司盈利性作為參考,他認為這是一個很好的賽道。