人類 發達集團副總裁
來源:實力養成   發佈於 2025-02-05 00:38

DeepSeek震撼美股!將威脅NVIDIA地位?究竟是曇花一現還是真有威脅!?曲博科技教室 Dr. J Class




00:00 開場 | Introduction
02:13 人工智慧的訓練(Training)與推論(Inference)
03:41 人工神經網路(ANN)與大型語言模型(LLM)的開發流程
08:10 第一代推論模型:DeepSeek-R1和R1-Zero有哪些特色?
13:42 DeepSeek-R1的訓練方法與群體相對策略優化(GRPO)
15:18 DeepSeek-R1的推論能力為何大幅躍進?
21:08 實驗結果分析:DeepSeek-R1的模型表現
23:02 實驗結果分析:DeepSeek-R1蒸餾模型的表現
25:33 DeepSeek-R1結論與後續應用觀察
26:55 結論 | Conclusion

評論 請先 登錄註冊