00:00 開場 | Introduction
02:13 人工智慧的訓練(Training)與推論(Inference)
03:41 人工神經網路(ANN)與大型語言模型(LLM)的開發流程
08:10 第一代推論模型:DeepSeek-R1和R1-Zero有哪些特色?
13:42 DeepSeek-R1的訓練方法與群體相對策略優化(GRPO)
15:18 DeepSeek-R1的推論能力為何大幅躍進?
21:08 實驗結果分析:DeepSeek-R1的模型表現
23:02 實驗結果分析:DeepSeek-R1蒸餾模型的表現
25:33 DeepSeek-R1結論與後續應用觀察
26:55 結論 | Conclusion