DeepSeek小模型AI技術震撼全球科技界

1878157819359


——在IBM 院士 Kush Varshney 看來,全球AI競賽中的地緣政治差異,可能沒有人們想象的那麼重要,他說:「一旦模型開源,它源自何處在很多方面就不再重要了。」

作者: Aili McConnon,IBM

2025年1月27 日發表與IBM官網Think頻道,點擊閱讀英文原文

香港2025年2月11日 /美通社/ — DeepSeek-R1是中國初創公司 DeepSeek 推出的人工智能模型,不久前,在人工智能開源平台 Hugging Face上發佈數小時後,便躍居下載量和活躍度最高模型的榜首。這也給金融市場帶來了震蕩,因為它促使投資者重新考慮英偉達(NVIDIA)等芯片製造商的估值,以及美國人工智能巨頭為擴大其人工智能業務規模而進行的巨額投資。

為何掀起如此大的波瀾?DeepSeek-R1 是一款所謂 “推理模型 “的數字助理,在某些數學和編碼任務的人工智能基準測試中,它的表現與 OpenAI 的 o1 不相上下;而據該公司稱,訓練該系統所使用的芯片數量卻要少得多,使用成本低約 96%。

IBM AI 硬件部門的一位首席研究科學家兼經理 Kaoutar El Maghraoui 說:「DeepSeek 無疑正在重塑人工智能的格局,它以開源的雄心和最先進的創新技術向巨頭們發起挑戰。」

與此同時,TikTok 的母公司、中國科技巨頭字節跳動(ByteDance)最近發佈了自己的推理型代理(智能體)UI-TARS,並聲稱該智能體在某些基準測試中優於 OpenAI 的 GPT-4o、Anthropic 的 Claude 和谷歌的 Gemini。ByteDance 的智能體可以讀取圖形界面,進行推理,並採取自主和一步接一步的行動。
(内文照片来自GOOGLE)