
-
新聞專員 發達公司課長
-
來源:財經刊物
發佈於 2025-08-23 17:14
百度蒸汽機2.0大模型發布,多人有聲視頻一體生成
2025-08-22 12:50:28 新聞中心 發佈
綜合陸媒及港媒報導,百度(BIDU.US;9888.HK)舉行發布會並宣布,其音視頻一體化模型「百度蒸汽機(MuseSteamer)」完成2.0版本升級,在行業內首次實現「多人有聲視頻一體化生成」。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索「百度蒸汽機」或登錄「繪想」平台體驗,企業用戶可在千帆平台享受高性能視頻生成服務。
據悉,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,首創多模態潛在空間規劃技術(Latent Multi-Modal Planner),能夠自主協調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超過98%的還原度精準呈現中文語音細節與情感表達。百度表示,該系列大模型已在百度搜索、營銷等多個場景落地應用,且定價低至行業70%。
此外,百度蒸汽機於7月2日正式發布,發布首日平均每分鐘超過百人申請,2週內註冊用戶超過30萬。業內人士認為,除了質量提升,百度蒸汽機2.0也帶來了創作成本大幅下降。知名視效指導姚騏在此次發布會現場,展示了其用百度蒸汽機2.0製作的科幻短片《歸途》,並指出「蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算」。