华盛顿 — 深Seek是中国一家新兴的科技公司,其推出的全新人工智能模型在美国的硅谷和华尔街引发了广泛关注。专家指出,DeepSeek能够在较低端的硬件和低成本下打造出高质量的产品,成功的关键在于其对“模型蒸馏”技术的娴熟掌握。同时,其他专家表示,考虑到DeepSeek在敏感话题上的严格审查,这可能会影响其AI模型在国际市场的拓展。
据了解,DeepSeek的人工智能新模型在美国造成了震撼效应,不仅影响了华尔街的市场表现,还在硅谷引发了各界关注。根据DeepSeek提供的数据,公司使用了约2000台英伟达特别为中国市场出口的较低阶H800型GPU进行模型训练。整个开发过程持续约两个月,总成本为约558万美元,明显低于其他西方竞争对手在AI模型开发上的投入。
新美国安全中心的助理研究员卢比·斯坎伦表示:“DeepSeek真正掌握了‘模型蒸馏’这一技术。所谓模型蒸馏,就是只对模型中最有用的部分进行训练,仅占5%的模型部分实际上承担了大部分的任务。DeepSeek将所有计算能力和训练资源集中在这最有用的5%上,从而在有限的硬件条件下取得最优的计算效果。”该方法是DeepSeek技术能力的体现,使其能够在资源有限的情况下得到更好的结果。
值得注意的是,在DeepSeek的应用登上苹果应用商店的下载榜首时,美国的纳斯达克指数科技板块却在1月27日暴跌超过3%。当天英伟达的股价在美国下跌近17%,市值蒸发了5890亿美元,创下美股单日市值损失的纪录。目前尚不清楚DeepSeek的崛起将会对美国AI产业带来怎样的影响。然而,一些试用者注意到,对涉及中国的敏感话题,DeepSeek的AI模型会进行内容审查。
多伦多顾问公司 Geopolitical Business 的创始人阿比舒尔·普拉卡什表示:“我认为,DeepSeek在全球市场中将面临不小的挑战。在西方世界,用户可能会询问有关天安门广场的问题,而在其他地区如印度、日本和俄罗斯,也会遇到各自的敏感话题。这不仅是西方才会遇到的问题,而是一个全球性的挑战。现在我们仍不清楚模型内部的审查机制是如何运作的,也不知道它会如何影响国际社会。”
换言之,尽管DeepSeek在其AI技术上取得了突破性进展,但其在全球化扩展中仍需要克服一些文化和政治上的障碍。无论如何,DeepSeek的技术革新值得业界持续关注,同时也提出了关于AI模型的全球适用性以及跨文化交互的深层次问题。Amy Li报道。
(内文照片来自GOOGLE)