「1圖就能生成逼真視頻」字節跳動推AI模型增深偽影片憂慮

人類發達集團副總裁: 來源：財經刊物發佈於 2025-02-09 12:28

「1圖就能生成逼真視頻」字節跳動推AI模型增深偽影片憂慮

編譯廖振堯／即時報導 2025-02-08 20:30 ET

總部在北京的科技公司「字節跳動」日前推出僅靠一圖片，就可生成完整視訊的AI模型「OmniHuman-1」，引發界內注意。(路透)

熱門短影音平台TikTok在美國命運生死未卜之際，其在北京的母公司「字節跳動」(ByteDance)本周悄悄發布了一種堪稱先進的視訊生成人工智慧(AI)模型「OmniHuman-1」，只要一張圖片就能生成影片，專家稱是「所見過最厲害的」，卻也引發新的深偽影片(deepfakes)擔憂。

美國廣播公司新聞網(ABC News)報導，字節跳動在報告中稱該模型以超過1萬8700小時的真人影片進行訓練，達到前所未見的準確性和個性化。

在示範影片中，著名的愛因斯坦肖像活了起來、栩栩如生地說話；或是Ted演講者發表演講、音樂家邊彈鋼琴邊唱歌，顯示此模型只要單一影像和音訊片段，就能產生任意高寬比的逼真影片。

AI專家阿傑德(Henry Ajder)表示這使得人們更容易淪為目標。「以前可能需要數百甚至數千張圖片來訓練，才能製作有趣且幾可亂真的影片。現在只要一張圖，用戶就可以創造缺乏AI生成跡象(AI往往在手部動作或口型同步露餡)的影像，還可能躲過AI偵測工具的法眼…這可能是我見過最厲害的模型，它將所有不同的多模式活動合而為一。能夠生成與自訂音訊相配的影片非常引人注目，且不失真實度，它們非常令人印象深刻。」雖然OmniHuman尚未向公眾發布，但阿傑德預測可能很快就會在字節跳動的產品上推出，包括TikTok。

ABC新聞撰稿人、前國安部情報主管科恩(John Cohen)稱，AI生成的高品質影片，恐導致威脅急劇擴大，「美國正處於一個動態而危險的威脅環境中，這種威脅很大程度上是由外國情報機構、恐怖組織、犯罪集團、家暴者故意放置在網上的內容所推動，目的是煽動和告知犯罪及暴力活動。」而OmniHuman這種技術恐讓不肖分子「更高效、更快速、更便宜」地製造深偽影片。



2.8k 次閱讀 ⋅ 0 條評論 ⋅ 舉報

認同 (0) 打賞 (0) 轉發 (0) 收藏 (0)

評論請先登錄或註冊

「1圖就能生成逼真視頻」字節跳動推AI模型增深偽影片憂慮

熱門資訊

人類的粉絲

發達資訊

發達社區

關於我們

關註我們

官方客服

「1圖就能生成逼真視頻」字節跳動推AI模型 增深偽影片憂慮

熱門資訊

人類 的粉絲

發達資訊

發達社區

關於我們

關註我們

官方客服

「1圖就能生成逼真視頻」字節跳動推AI模型增深偽影片憂慮

人類的粉絲