日期:2025/02/07

DeepSeek強敵來了!被譽為「AI教母」的知名華裔美籍科學家李飛飛領導的團隊,以低於50美元(約台幣1,600元)的雲端運算成本,成功訓練出名為「s1」的人工智慧推理模型。此模型在數學和編碼能力測驗中的表現,據稱媲美OpenAI o1和DeepSeek R1等尖端推理模型。

科創板日報、新浪科技報導,李飛飛團隊的s1模型並非從頭訓練,而是建立在阿里巴巴的Qwen2.5和 Google DeepMind的Gemini 2.0 Flash Thinking的基礎之上。他們蒐集了1,000個精心挑選的問題及其解答,並透過記錄Gemini 2.0 Flash的思考過程,建立訓練資料集,利用這些資料,微調了Qwen2.5-32B-Instruct模型,創造出s1。

大陸某知名大模型公司CEO表示,李飛飛團隊的成就實際上是利用從Google模型中擷取的1,000個樣本來微調通義千問模型。這種微調的成本固然低廉,但其優異表現仍有賴於既有模型的基礎。

阿里雲證實,李飛飛團隊透過利用阿里開源的Qwen2.5-32B-Instruct模型進行監督微調,在16個輝達H100 GPU上僅花費26分鐘就訓練出s1-32B模型,其數學和編碼能力與OpenAI o1和DeepSeek R1等尖端推理模型不相上下。


DeepSeek強敵來了!被譽為「AI教母」的知名華裔美籍科學家李飛飛領導的團隊,以低於50美元(約台幣1,600元)的雲端運算成本,成功訓練出名為「s1」的人工智慧推理模型。圖/美聯社

|原文網址|