简体 - 正體 - 手机版 - 电子报

人民报 
首页 要闻 内幕 时事 幽默 国际 奇闻 灾祸 万象 生活 文化 专题 寰宇 维权 视频 杂谈
 
 
 
 
 

DeepSeek V4 与中共 AI 神话的崩解
 
【人民报消息】(人民报记者丽君编译报导)2025年初,中国 AI 公司 DeepSeek 凭借 R1 模型迅速打开国际知名度,一度引发美国科技与政界对中国 AI 追赶速度的高度关注。然而,一年多后,当 DeepSeek 于上周推出新一代旗舰模型 DeepSeek V4 预览版时,市场反应却远不如外界预期。 原先被部分中国媒体形容为“再次震撼全球 AI 产业”的新模型,最终并未展现足以改变全球 AI 格局的突破性能力。相反,DeepSeek V4 的表现,更反映出中国 AI 产业在美国高端晶片限制、算力不足,以及原创能力受限等压力下,逐渐走向“低成本追赶”与“技术蒸馏”的发展模式。 一、技术现实:中国 AI 与美国顶尖模型仍存在明显差距 DeepSeek 此次推出的 V4 系列,包含拥有 1.6 兆参数的 V4-Pro 以及主打轻量化的 V4-Flash。官方宣称,新模型在程式生成、推理能力与 Agent(代理型 AI 任务)方面取得重大提升,但多家第三方测试机构与开发者社群的实际评价,则显得相对保留。 1. 核心能力仍落后美国第一梯队 在多项软体工程与推理测试中,DeepSeek V4 虽然已接近部分美国主流模型先前水准,但与 OpenAI、Google 等公司最新一代大型模型相比,仍可看出差距。 尤其在复杂推理、多步骤逻辑处理、长文本稳定性,以及高阶 Agent 任务上,V4 的表现仍不够稳定。部分测试者指出,模型在面对模糊指令与高复杂度问题时,仍容易出现推理断裂、重复输出或内容失焦等情况。 这也反映出,中国目前最先进的大模型,虽然已能在部分标准化测试接近美国产品,但在真正代表前沿能力的通用推理与创造性任务上,仍未追上美国第一梯队。 2. “冗长输出”暴露模型精炼度不足 部分 AI 评测机构也指出,DeepSeek V4 存在明显的“高冗长度”现象。 简单来说,模型往往透过大量文字铺陈来提高命中率,而非以更精准、更高效的推理方式直接完成任务。这种现象在大型模型领域,通常被视为底层推理架构与训练品质尚未完全成熟的表现。 虽然这类模型在部分考试型测试中可能取得不错分数,但在真实世界应用中,过度冗长不仅增加运算成本,也容易降低实用性与可靠性。 二、 “技术蒸馏”争议:中国 AI 的敏感灰色地带 DeepSeek 能够在短时间内、以极低预算开发出高性能模型,也让外界持续关注其训练方式。 近年来,美国 AI 产业与政府部门多次警告,中共国部分 AI 公司可能透过大规模调用美国模型输出结果,再进行“知识蒸馏”(Knowledge Distillation)训练,以低成本模仿美国模型的推理能力。 所谓“知识蒸馏”,原本是 AI 领域常见的技术手段,但若涉及未经授权、大规模抓取商业模型输出内容,便可能牵涉智慧财产权、服务条款与商业伦理问题。 1. 2.4 万个假帐号背后的数据窃取疑云 根据 OpenAI 与 Anthropic 向美国众议院提交的证词,DeepSeek 及其关联实体被指控动员大规模“数位民兵”,借助逾 2.4 万个虚假帐号及复杂的身份规避手段,对美国顶尖 AI 系统发动工业级数据收割行动。据称,相关人员透过数以千万计的对话,系统性地萃取 GPT 系列与 Claude 模型的推理逻辑、思维链路(Chain-of-Thought)以及对复杂任务的应对模式。 2. “搭便车”式跃进:创新还是镜像? 这意味著,DeepSeek 的技术路径,在相当程度上并非奠基于底层算法的原创突破,而更像是对美国研究成果的高度系统性挪用。矽谷业界人士毫不讳言:DeepSeek 并非在自主研发 AI,而是在“镜像复制”美国 AI 的核心能力。这种依附式的研发路径,或许能带来短期的性能跃升,却难以积累真正从零到一的原创实力。一旦美国各大模型强化访问管控,中方 AI 的进步动能恐将迅速消退。 三、 硬体限制下的技术选择:国产替代与现实落差 在美国对高阶 AI 晶片(如 Nvidia Blackwell 与 H200)出口限制持续收紧的背景下,DeepSeek V4 被认为转向以华为升腾(Ascend)系列为核心的运算平台。这一策略在中共官方语境中被视为“自主可控”,但也引发外界对其技术代价的讨论。 1. 性能与功耗的代价 尽管官方声明强调针对国产硬体进行了“深度优化”,业界普遍评估的现实却大相径庭:华为升腾晶片在记忆体频宽与互联效率(Interconnect)上,仍与 Nvidia 顶尖产品存在显著差距。为在此硬体条件下支撑超大规模参数模型的运行,DeepSeek 被迫对模型架构进行大幅压缩与简化。这一取舍在实际表现上留下了明显印记:超长上下文(Long-context)处理的稳定性不足,训练过程中的故障率也明显高于美国顶尖实验室的同类系统。 2. 制裁压力下的“被动自主” DeepSeek 据报婉拒了美国晶片供应商的预测试邀请,转而优先向华为、寒武纪等中国本土厂商开放早期访问权限。这种战略脱钩表面上是“技术自主”,实则是面对制裁的无奈之举。缺乏全球最顶尖运算资源支撑的情况下,中共国 AI正逐渐走向内部闭合、与全球主流技术体系渐行渐远的“孤岛化”格局。 四、 商业现实:以价格换市场的突围困境 面对技术上的代差,DeepSeek祭出了一套典型的市场切入策略:以激进定价换取规模扩张。 1. 价格战的本质与局限 DeepSeek 轻量版本的 API 定价,据报仅为 OpenAI 同级产品的一小部分。这种定价策略并非源于技术效率的优势,而更像是在竞争中暂居劣势时的市场生存策略。在无法以纯粹技术实力争夺高端市场的情况下,中共国企业只能以低价路线或依赖政府补贴的方式,来吸引对价格敏感、对性能要求不高的低端开发者。 2. 矽谷与华盛顿的审慎乐观 据报导,DeepSeek 新版本发布后,美国科技与政策圈普遍流露出一种谨慎的宽慰情绪。其背后的逻辑在于:此次发布的实际表现,在业界看来并未构成对美国 AI 核心优势的根本性挑战。DeepSeek 固然是一个不容小觑的商业竞争者,但要撼动全球 AI 实力的既有格局,实现真正意义上的“代际超越”,目前的证据尚不充分。 五、 结论:“国产之光”的光环与局限 综合以上各面向的分析,DeepSeek 的最新进展并未如官方宣传所称,实现真正意义上的“弯道超车”。它的出现,更像是中国 AI 发展现状的一个高解析度切片: 技术层面: 它仍是一个追赶者,且追赶的步履因硬体短板而愈发沉重。 伦理层面: “知识蒸馏”与大规模数据抓取的指控挥之不去,国际社会的审查压力与潜在制裁风险正在持续升高。 战略层面: 它所开辟的,是一条“低价可用、难以领先”的竞争路径——在这条赛道上,性价比是唯一的筹码,而非技术实力。 对于北京而言,DeepSeek或许足以完成“国产替代”的政策目标,但对于真正代表人类文明前沿的通用人工智慧(AGI)竞赛中,一款在技术来源存疑、硬体掣肘明显的条件下产生的模型,距离真正的竞争制高点,仍有相当长的路要走。 (人民报首发) https://www.bloomberg.com/news/articles/2026-04-24/deepseek-s-long-awaited-new-model-fails-to-narrow-us-lead-in-ai 本篇改写源自彭博社(Bloomberg)的资深记者 Edwin Chan2026年4月24日的报导,原文标题“DeepSeek’s Long-Awaited New Model Fails to Narrow US Lead in AI”( DeepSeek 备受期待的新模型,未能缩小与美国在AI领先地位的差距)△
文章网址: http://www.renminbao.com/rmb/articles/2026/4/29/95030.html
打印机版


分享至: Facebook Twitter Google+ LinkedIn StumbleUpon Pinterest Email 打印机版
 
 
 
 
 
 
 
 
  近期最受欢迎的文章 
2026年4月29日
 
 
本报记者
 
 
专栏作者
 
首页 要闻 内幕 时事 幽默 国际 奇闻 灾祸 万象 生活 文化 专题 寰宇 维权 视频 杂谈
 
 
Copyright© RMB Public Foundation Inc. All Rights Reserved