DeepSeek 爆火全球，掀起 AI 领域轩然大波，背后争议不断

发布时间：2025-02-02 人气：0

在当下人工智能领域，DeepSeek 的名字如同一颗耀眼的新星，在全球范围内掀起了一阵前所未有的热潮，一举一动都备受关注。今年春节期间，DeepSeek 创始人梁文锋回到家乡广东省湛江市吴川市覃巴镇米历岭村过年，热闹喜庆的氛围中，这位如今在 AI 界赫赫有名的人物也为家乡增添了一抹别样的色彩。

DeepSeek 图片生成

最近，DeepSeek 的火爆程度堪称全网刷屏。前几天发布的 V3 带来的震撼还未消散，R1 的登场又再次引爆了全球 AI 社区。实测数据显示，DeepSeek v3 智商表现卓越，而最新发布的 R1 更是实力惊人，在 AIME2024 数学基准测试中，以 79.8% 的成绩直接踢走 OpenAI 的 o1；在标准化编码测试中，DeepSeek-R1 也展现出 “专家级” 水平，在 Codeforces 平台上取得了 2029 Elo 评级，超越了 96.3% 的人类竞争者。而且，R1 不仅以 MIT 许可（最宽松的规格）完全开源，成本优势也十分显著，每百万 token 的查询成本仅为 0.14 美元，相较于 OpenAI 的 7.50 美元，成本骤降 98%。这一成绩的取得，无疑如同在平静的硅谷投下了一枚震撼弹，让美国对其人工智能领域的霸主地位产生了焦虑。

DeepSeek 的成功在全球掀起了一股 “复现” 浪潮，也将硅谷的焦虑推向了顶峰。Meta 的员工在美国匿名职场社区 teamblind 发布公开帖子，称 Meta 生成式 AI 团队对低成本和高性能的 DeepSeek V3 的出现感到非常担忧，因为 DeepSeek-V3 在性能基准测试中已领先于 Llama 4，而这款模型竟来自一家 “训练预算仅 550 万美元的中国公司”。这让 Meta 的工程师们全力以赴地分析 DeepSeek，试图从中找到突破口，管理层也面临着如何证明高昂的生成式 AI 部门成本的难题。

面对这一情况，Meta 的首席科学家 LeCun 在 X（推特）上发帖称，目前的焦虑方向是错的，与其关注霸主地位，不如关心开源与闭源的胜负。他认为，DeepSeek 得益于开源研究和开源项目，在他人工作的基础上提出新想法并进行构建，因为其工作是公开且开源的，所以每个人都能从中受益，这体现的是开放研究与开源的力量。不过，LeCun 的评论区中，仍有不少人在讨论美国和中国谁先达到 AGI，甚至还有美国网友阴阳怪气地称中国是靠吃掉美国的 AI 模型才变强的。就连 Meta 的 CEO 扎克伯格也在关注这场 “战斗”，在 LeCun 发言不久后，他就在 Facebook 上宣布加速研发 Llama 4，计划投资 650 亿美元扩建数据中心，并部署 130 万枚 GPU，以确保 2025 年 Meta AI 成为全球领先模型。

而在 DeepSeek V2 模型发布之际，DeepSeek CEO 梁文锋就曾驳斥过美国的偏见。他认为，随着经济发展，中国也要逐步成为技术创新的贡献者，而不是一直搭便车。过去中国在 IT 浪潮中基本没有参与到真正的技术创新里，但现在中国企业已经在以创新贡献者的身份加入到全球的游戏中，硅谷的震惊恰恰印证了他们对中国科技创新抱有的偏见。

除了在技术层面引发热议，DeepSeek 在市场上的表现也十分亮眼。据彭博社当地时间 1 月 31 日报道，DeepSeek 的人工智能软件在全球 140 个市场中的移动应用下载量排行榜上位居榜首，其中印度的新增用户占比最大。自 1 月 26 日 DeepSeek 最新推出的 AI 聊天机器人登上苹果应用商店下载量榜首后，便在全球范围内保持领先地位。数据显示，自新款 AI 模型发布以来，印度贡献了 15.6% 的跨平台下载量。这款应用软件在 18 天内的下载量达到 1600 万次，几乎是 OpenAI 的 ChatGPT 首次发布时 900 万次下载量的两倍。

全球各大顶尖科技企业也纷纷加入到这股 “DeepSeek 热潮” 之中。尽管一些人对 DeepSeek 训练方法和隐私保护的审查日益严格，但美国科技界却仍在争相利用围绕 DeepSeek 产生的热潮来谋取利益。英伟达、英特尔、AMD、亚马逊以及微软等美国科技巨头，或在自家平台上线 DeepSeek 服务，或针对 DeepSeek 进行深度优化。当地时间 2 月 1 日，美国芯片巨头英特尔表示，DeepSeek 近日发布的 Janus Pro 模型，其超强性能和高精度引起业界关注，英特尔 Gaudi 2D AI 加速器现已针对该模型进行深度优化；AMD 早在一周前就宣布，已将新的 DeepSeek-V3 模型集成到 Instinct MI300X GPU 上；英伟达在当地时间 1 月 30 日宣布推理模型 DeepSeek-R1 正式登陆 NVIDIA NIM 微服务；亚马逊在 Amazon Bedrock 和 SageMaker AI 中上线了 DeepSeek-R1 模型；微软也抢先把 DeepSeek-R1 部署在了自家的云服务 Azure 上。

不过，DeepSeek 的发展也并非一帆风顺。到目前为止，其总用户数还不及 OpenAI 推出的 ChatGPT，且随着一些国家的政府和企业开始不断设限，炒作渲染所谓 “潜在的网络安全影响”，其进一步发展可能面临障碍。彭博社本周报道称，出于所谓 “预防措施”，一些公司和政府承包商屏蔽了 DeepSeek。此外，连日来，一些美国政客妄称 DeepSeek 等中国 AI 模型 “威胁美国国家安全”，鼓吹对 “AI 基础设施的关键技术” 实施更严格的出口管制，还有人甚至妄称 DeepSeek “窃取美国知识产权”。美国国防部以及美国国会众议院层面，已对工作人员发布了禁用 DeepSeek 的相关指令。不仅如此，在意大利之后，荷兰隐私监管机构表示，将对中国人工智能公司 DeepSeek 的数据收集行为展开调查，并敦促荷兰用户谨慎使用该公司的软件，爱尔兰和法国也都要求 DeepSeek 提供其数据处理实践方面的信息。美国海军已要求人员避免以任何形式使用 DeepSeek 的 AI 模型，美国国务院一名发言人表示，将限制任何使国务院数据面临风险的工具和科技，美国联邦众议院的相关委员会也对白宫发出警告，指出 DeepSeek 的资安风险。

尽管面临诸多争议和阻碍，但 DeepSeek 的出现无疑已经打破了美国科技寡头的傲慢，加剧了全球竞争格局，甚至可能造就 “中国创新、美国模仿” 的全新局面。它的成功也为全球 AI 发展带来了新的思考，让人们看到了开源模式的巨大潜力。在未来，DeepSeek 能否突破重重障碍，继续在 AI 领域大放异彩，我们拭目以待。