編譯廖振堯/即時報導 2025-02-08 20:30 ET
![](https://pgw.worldjournal.com/gw/photo.php?u=https://uc.udn.com.tw/photo/wj/realtime/2025/02/09/31463677.jpg&x=0&y=0&sw=0&sh=0&sl=W&fw=800&exp=3600&q=75)
總部在北京的科技公司「字節跳動」日前推出僅靠一圖片,就可生成完整視訊的AI模型「OmniHuman-1」,引發界內注意。(路透)
熱門短影音平台
TikTok在美國命運生死未卜之際,其在北京的母公司「字節跳動」(ByteDance)本周悄悄發布了一種堪稱先進的視訊生成人工智慧(
AI)模型「OmniHuman-1」,只要一張圖片就能生成影片,專家稱是「所見過最厲害的」,卻也引發新的深偽影片(deepfakes)擔憂。
美國廣播公司新聞網(ABC News)報導,字節跳動在報告中稱該模型以超過1萬8700小時的真人影片進行訓練,達到前所未見的準確性和個性化。
在示範影片中,著名的愛因斯坦肖像活了起來、栩栩如生地說話;或是Ted演講者發表演講、音樂家邊彈鋼琴邊唱歌,顯示此模型只要單一影像和音訊片段,就能產生任意高寬比的逼真影片。
AI專家阿傑德(Henry Ajder)表示這使得人們更容易淪為目標。「以前可能需要數百甚至數千張圖片來訓練,才能製作有趣且幾可亂真的影片。現在只要一張圖,用戶就可以創造缺乏AI生成跡象(AI往往在手部動作或口型同步露餡)的影像,還可能躲過AI偵測工具的法眼…這可能是我見過最厲害的模型,它將所有不同的多模式活動合而為一。能夠生成與自訂音訊相配的影片非常引人注目,且不失真實度,它們非常令人印象深刻。」雖然OmniHuman尚未向公眾發布,但阿傑德預測可能很快就會在字節跳動的產品上推出,包括TikTok。
ABC新聞撰稿人、前國安部情報主管科恩(John Cohen)稱,AI生成的高品質影片,恐導致威脅急劇擴大,「美國正處於一個動態而危險的威脅環境中,這種威脅很大程度上是由外國情報機構、恐怖組織、犯罪集團、
家暴者故意放置在網上的內容所推動,目的是煽動和告知犯罪及暴力活動。」而OmniHuman這種技術恐讓不肖分子「更高效、更快速、更便宜」地製造深偽影片。