当前位置:首页 > 动态资讯 > 行业新闻

DeepSeek 爆火全球,掀起 AI 领域轩然大波,背后争议不断

发布时间:2025-02-02 人气:0

在当下人工智能领域,DeepSeek 的名字如同一颗耀眼的新星,在全球范围内掀起了一阵前所未有的热潮,一举一动都备受关注。今年春节期间,DeepSeek 创始人梁文锋回到家乡广东省湛江市吴川市覃巴镇米历岭村过年,热闹喜庆的氛围中,这位如今在 AI 界赫赫有名的人物也为家乡增添了一抹别样的色彩。

DeepSeek 图片生成


最近,DeepSeek 的火爆程度堪称全网刷屏。前几天发布的 V3 带来的震撼还未消散,R1 的登场又再次引爆了全球 AI 社区。实测数据显示,DeepSeek v3 智商表现卓越,而最新发布的 R1 更是实力惊人,在 AIME2024 数学基准测试中,以 79.8% 的成绩直接踢走 OpenAI 的 o1;在标准化编码测试中,DeepSeek-R1 也展现出 “专家级” 水平,在 Codeforces 平台上取得了 2029 Elo 评级,超越了 96.3% 的人类竞争者。而且,R1 不仅以 MIT 许可(最宽松的规格)完全开源,成本优势也十分显著,每百万 token 的查询成本仅为 0.14 美元,相较于 OpenAI 的 7.50 美元,成本骤降 98%。这一成绩的取得,无疑如同在平静的硅谷投下了一枚震撼弹,让美国对其人工智能领域的霸主地位产生了焦虑。


DeepSeek 的成功在全球掀起了一股 “复现” 浪潮,也将硅谷的焦虑推向了顶峰。Meta 的员工在美国匿名职场社区 teamblind 发布公开帖子,称 Meta 生成式 AI 团队对低成本和高性能的 DeepSeek V3 的出现感到非常担忧,因为 DeepSeek-V3 在性能基准测试中已领先于 Llama 4,而这款模型竟来自一家 “训练预算仅 550 万美元的中国公司”。这让 Meta 的工程师们全力以赴地分析 DeepSeek,试图从中找到突破口,管理层也面临着如何证明高昂的生成式 AI 部门成本的难题。


面对这一情况,Meta 的首席科学家 LeCun 在 X(推特)上发帖称,目前的焦虑方向是错的,与其关注霸主地位,不如关心开源与闭源的胜负。他认为,DeepSeek 得益于开源研究和开源项目,在他人工作的基础上提出新想法并进行构建,因为其工作是公开且开源的,所以每个人都能从中受益,这体现的是开放研究与开源的力量。不过,LeCun 的评论区中,仍有不少人在讨论美国和中国谁先达到 AGI,甚至还有美国网友阴阳怪气地称中国是靠吃掉美国的 AI 模型才变强的。就连 Meta 的 CEO 扎克伯格也在关注这场 “战斗”,在 LeCun 发言不久后,他就在 Facebook 上宣布加速研发 Llama 4,计划投资 650 亿美元扩建数据中心,并部署 130 万枚 GPU,以确保 2025 年 Meta AI 成为全球领先模型。


而在 DeepSeek V2 模型发布之际,DeepSeek CEO 梁文锋就曾驳斥过美国的偏见。他认为,随着经济发展,中国也要逐步成为技术创新的贡献者,而不是一直搭便车。过去中国在 IT 浪潮中基本没有参与到真正的技术创新里,但现在中国企业已经在以创新贡献者的身份加入到全球的游戏中,硅谷的震惊恰恰印证了他们对中国科技创新抱有的偏见。


除了在技术层面引发热议,DeepSeek 在市场上的表现也十分亮眼。据彭博社当地时间 1 月 31 日报道,DeepSeek 的人工智能软件在全球 140 个市场中的移动应用下载量排行榜上位居榜首,其中印度的新增用户占比最大。自 1 月 26 日 DeepSeek 最新推出的 AI 聊天机器人登上苹果应用商店下载量榜首后,便在全球范围内保持领先地位。数据显示,自新款 AI 模型发布以来,印度贡献了 15.6% 的跨平台下载量。这款应用软件在 18 天内的下载量达到 1600 万次,几乎是 OpenAI 的 ChatGPT 首次发布时 900 万次下载量的两倍。


全球各大顶尖科技企业也纷纷加入到这股 “DeepSeek 热潮” 之中。尽管一些人对 DeepSeek 训练方法和隐私保护的审查日益严格,但美国科技界却仍在争相利用围绕 DeepSeek 产生的热潮来谋取利益。英伟达、英特尔、AMD、亚马逊以及微软等美国科技巨头,或在自家平台上线 DeepSeek 服务,或针对 DeepSeek 进行深度优化。当地时间 2 月 1 日,美国芯片巨头英特尔表示,DeepSeek 近日发布的 Janus Pro 模型,其超强性能和高精度引起业界关注,英特尔 Gaudi 2D AI 加速器现已针对该模型进行深度优化;AMD 早在一周前就宣布,已将新的 DeepSeek-V3 模型集成到 Instinct MI300X GPU 上;英伟达在当地时间 1 月 30 日宣布推理模型 DeepSeek-R1 正式登陆 NVIDIA NIM 微服务;亚马逊在 Amazon Bedrock 和 SageMaker AI 中上线了 DeepSeek-R1 模型;微软也抢先把 DeepSeek-R1 部署在了自家的云服务 Azure 上。


不过,DeepSeek 的发展也并非一帆风顺。到目前为止,其总用户数还不及 OpenAI 推出的 ChatGPT,且随着一些国家的政府和企业开始不断设限,炒作渲染所谓 “潜在的网络安全影响”,其进一步发展可能面临障碍。彭博社本周报道称,出于所谓 “预防措施”,一些公司和政府承包商屏蔽了 DeepSeek。此外,连日来,一些美国政客妄称 DeepSeek 等中国 AI 模型 “威胁美国国家安全”,鼓吹对 “AI 基础设施的关键技术” 实施更严格的出口管制,还有人甚至妄称 DeepSeek “窃取美国知识产权”。美国国防部以及美国国会众议院层面,已对工作人员发布了禁用 DeepSeek 的相关指令。不仅如此,在意大利之后,荷兰隐私监管机构表示,将对中国人工智能公司 DeepSeek 的数据收集行为展开调查,并敦促荷兰用户谨慎使用该公司的软件,爱尔兰和法国也都要求 DeepSeek 提供其数据处理实践方面的信息。美国海军已要求人员避免以任何形式使用 DeepSeek 的 AI 模型,美国国务院一名发言人表示,将限制任何使国务院数据面临风险的工具和科技,美国联邦众议院的相关委员会也对白宫发出警告,指出 DeepSeek 的资安风险。


尽管面临诸多争议和阻碍,但 DeepSeek 的出现无疑已经打破了美国科技寡头的傲慢,加剧了全球竞争格局,甚至可能造就 “中国创新、美国模仿” 的全新局面。它的成功也为全球 AI 发展带来了新的思考,让人们看到了开源模式的巨大潜力。在未来,DeepSeek 能否突破重重障碍,继续在 AI 领域大放异彩,我们拭目以待。