DeepSeek:效率、突破與隱憂
用淺白嘅語言解釋一個中國開源模型點樣揭示AI發展嘅新方向
TL;DR:
中國AI公司DeepSeek新推出嘅R1模型成功挑戰OpenAI嘅地位,效能媲美o1。佢哋透過創新嘅技術優化,大幅降低訓練成本。雖然DeepSeek喺中國監管下要加入言論審查,但佢哋完全開源嘅做法獲得業界認可。最重要嘅係,R1證實咗強化學習係實現AI進階智能嘅關鍵路徑,為整個AI領域帶來重大啟示。
上星期,DeepSeek推出咗佢哋最新嘅模型DeepSeek-R1。呢間鮮為人知嘅中國AI公司,利用極低嘅成本訓練出嚟嘅呢個模型,效能竟然可以媲美OpenAI最先進嘅模型o1,一石激起千重浪,除咗登上各地App Store no.1,仲衝擊埋股市,甚至動搖到中美台關係。但呢幾日喺各個社交平台同新聞媒體上,我見到好多人對呢件事存好深嘅誤解。我知好多人都唔係相關背景出身,就算係都未必有時間睇哂啲pap…
Keep reading with a 7-day free trial
Subscribe to Chocology to keep reading this post and get 7 days of free access to the full post archives.


