全球AI大模型真相:只有中美能独立研发,美国优势正在缩小

admin AI新闻 1

大家好,这里是科技知新 TechEasy。

在当下谈论全球人工智能发展的情况时, 不少人脑海中的印象呈现出一种“百花齐放”的态势, 具体表现为欧洲存在着备受瞩目的创业公司, 日本和韩国致力于研发本土化的模型, 中东地区的富豪们投入大量资金来囤积算力, 似乎整个世界都处于同一条起跑线上。

然而, 一旦把目光从表面的应用上移开, 转向从无到有自己研发通用大模型的这个关键赛道, 实际的情况其实是格外明晰无误的:

真的具备那种能够独立自主去打造极为顶级的基座, 搭建起一整套完整的研发体系, 并且还可以持续不断地进行迭代更新的国家, 自始至终就仅仅只有中国和美国这两个。

剩余的那些国家, 有的仅仅就只靠着一两家孤零零的单点选手来撑起场面了, 而有的压根就没有底层的那种能力, 只能去拿海外的模型来搞套壳操作。要说硬核技术的实力状况, 和中国以及美国那根本就不在同一个量级上面。

一、美国:还是综合第一,但已经不是碾压级领先

美国, 依旧是大模型行业里的综合标杆, 这一点, 是没必要去否认的, 然而, 它所具备的优势, 正在迅速地缩水。

处于闭源模型范畴之中, GPT、Claude、Gemini这三者, 依旧是在全球被广泛认可的处于第一梯队的存在。当遭遇到具备超长链路特征的复杂工程, 以及多模态深度融合这种类型的硬核任务时, 它们的综合表现仍旧是行业内堪称天花板级别的表现。

关于开源这一方面, Meta所推出的Llama系列, 在过去的几年时间当中, 始终都是全球范围内开发者们的默认基础支撑, 与之相配套的各类工具开云真人app官方版入口,开云真人app官网入口,以及教程, 还有二次开发生态, 都是最为成熟的状态, 这就等于是给整个的开源圈子确定了技术发展路线。

可是话又说回来, 美国的领先早就不是往昔那种“把别人轻易甩下好几条街”的情形了。在编写代码、数学领域、长上下文这些细分的赛道方面, 国产模型屡屡追平甚至争得第一;哪怕是更新迭代的速率, 好些国内厂商也已然追了上来。

二、中国:追得最快的玩家,开源赛道已经和美国并肩

全球范围内, 中国是那独一无二的, 能于大模型领域同美国展开体系化对标之国家。数年前尚处于跟跑状态, 如今在开源领域已然齐头并进, 且诸多单项领域更是跑到了前列。

最有说服力的不是跑分榜单,是真实的使用数据。

望向OpenRouter最新的月度调用量排名情况, DeepSeek V4 Flash凭借18.2T token的成果位居第一位, 相较于第二名超出了一大截;在前十名当中具备好几个国产模型位于其中, DeepSeek V4 Pro、V3.2全部都在这些名次里。

全球AI大模型真相:只有中美能独立研发,美国优势正在缩小-第1张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

OpenRouter月度大模型调用量的榜单之中, 国产模型在榜首位置占据了一席之地, 并且在多个前排席位上也有国产模型的身影。

这并非是依靠营销而刷出来的情况, 而是全球范围内的开发者, 以实际行动所投出的选票而产生的结果。当下在海外, 存在着数量众多的个人开发者以及小公司, 在进行项目操作时, 径直将国产开源模型用作基础支撑, 根本就不再使用Llama了。

于代码生成、数学推理、长文本处理以及工具调用所在这类细分方向处, 国产开源模型已多次摘得世界第一;并非仅用中文的「区域模型」那般, 是切实于全球开源圈稳稳站住了脚跟。

在闭源这一方面, 与海外那些顶级模型之间的差距已然缩小到了非常小的程度。在日常进行写代码的操作时, 在查找资料的过程当中, 以及处理中文相关场景的时候, 众多国产模型所带来的实际体验并不比海外旗舰模型差, 而且更新的频率还更加频繁。

极为关键的是, 这些均为实实在在的自主研发, 从底部基座架构起, 经过训练方法, 直至推理优化, 全都是依靠自身努力完成的, 并非拿海外模型稍作修改而成的徒有其表之物。技术自主权掌握在本身手中, 能够随心所欲地进行迭代。

三、其他国家:单点选手撑场面开云正版app下载开云app在线入口,核心技术差一个量级

除开中国和美国, 其余的国家基本上都未曾触及到「顶级通用大模型」的关口, 各个国家都存在着各自不同的局限性。

欧洲:全靠Mistral撑门面,架构还被指参考国产模型

在欧洲, 唯一能被提及且有一定影响力的自主研发厂商, 是法国的Mistral, 它主要致力于打造轻量化、高效率的小型模型, 在开源领域具备一定的知名度。

然而, 其家的旗舰产品Mistral 3 Large发布之后, 在业内引发了极大的争议, 原因在于, 其核心架构和比它更早发布的DeepSeek V3/R1高度重合。

把两张架构图摆在一起对比,相似度高到很难用「巧合」解释:

全球AI大模型真相:只有中美能独立研发,美国优势正在缩小-第2张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

DeepSeek V3/R1, 与Mistral 3 Large核心架构, 高度重合开云真人app官网登录app,开云真人app在线登录,具有分层设计, 此外专家模式, 多处撞型。

业内普遍认为, 是深度参考了国产模型的架构设计, 所以Mistral才这样, 而在时间线上DeepSeek发布更早。

以前, 都是中国的模型去参考海外的情况, 而现在, 情形相互颠倒了过来, 海外的头部厂商反而去对标中国的设计, 这也算得上是一个具有标志性意义的变化了。

即便存在Mistral给予支撑, 然而欧洲整体状况仍旧相差甚远, 既不存在能够与GPT、Claude相对标的全能且强大的顶尖产品, 同时也不存在可涵盖全部参数跨度线段范围的产品阵列, 欧洲其余各个国家基本上不存在进行自主研发基础架构的能力, 其领土范围内的AI一类产品大多是借助调用美国的API从而进行上端层次的包装处理, 并没有什么具备关键意义的技术。

英国、日韩、中东:各有各的短板

英国存在DeepMind这个极为顶尖的科研团队, 然而其早就被谷歌给收购了, 算作美国公司的研发部门, 并非英国本土的、可不依赖外部的独立力量, 英国自己本土并没有具备较强竞争力的大模型方面的公司。

韩国和日本那就更不必说了, 通用的大型模型基本上处于空白状态。本土所拥有的模型都是将重点放在特定行业, 仅仅适用于本国语言的小型模型, 其通用能力差得非常远, 在市面上大部分的人工智能应用, 其底层连接的依旧是海外的接口。

那些中东的土豪国家境况较为单一, 有钱, 具备购买算力的能力, 能够对海外公司进行投资, 然而自身缺乏技术、缺少人才, 无法开展自研基座工作, 其本质属于花钱买技术的买家。

四、为什么偏偏只有中美能跑出来?

大模型的产出, 并非仅依靠一两位天才便可达成, 其比拼的乃是关乎所有方面的国家实力, 此门槛之高足以致使绝大部分国家根本无法触及。

首先存在的是算力方面的门槛, 训练一个处于顶级水平的大模型, 需要用上万片高端的GPU来组建集群, 并且还要有与之配套的机房, 以及电力供应、运维保障, 其投入简直就是天文数字, 对于小国而言, 不要说进行研发了, 就连算力方面的成本都承受不起。

其次, 是数据以及市场门槛。大模型, 得依靠海量语料来喂养, 并且, 还要有足够大的本土市场, 以便去落地, 然后去迭代。那些人口数量少、语言圈子小的国家, 就连足够的训练数据都凑办不齐, 根本就支撑不起通用大模型。

最后的是人才以及产业链门槛, 从底层架构开始, 到训练算法, 再到推理优化, 直至工程落地, 这需要一整条链路的技术人才, 只有中国和美国具备如此大规模的人才储备以及完整的产业链, 然而其他国家最多仅在某个单点上表现出色, 根本凑不齐完整的队伍。

最后

说到底, 这场关于大模型的竞赛, 实际上是一场大国之间在科技话语权方面的对抗。

通用大模型并非一款平常的互联网产物, 它可是下一代数字经济的基础设施, 向上而言, 它对AI应用的生态走向起着决定性作用, 向下来说, 它与芯片、算力、基础软件这整条核心产业链紧密相连。究竟是谁掌握了自研大模型的核心能力, 谁便能在新一轮产业革命当中拥有主动权, 而不会轻易被他人卡住脖子。

现下, 全球AI的格局已然极为清晰, 核心赛道之中, 仅存中美两国是真正的参与者, 其他国家, 有的处于细分领域, 安稳守着自己的小天地, 有的则纯粹变成了技术输入的一方, 早就从第一梯队的竞争里退了出来。

美国凭借着历经几十年所积攒的技术, 仍旧维持住了综合实力方面的领先地位;中国则运用极为短暂的时间, 达成了从跟跑状态直至并跑的一种跨越情形, 在开源这一竞赛轨道之上, 更是塑造凸显出了自身于全球范围之内的影响力, 顽强地在由西方占据主导地位的科技领域当中立定了脚跟。

这场博弈, 远远尚未结束, 接下来展开的比拼, 将会从表层的跑分以及参数方面, 进而深入到包含底层架构进行创新、实现自主算力突破、构建全球生态的深水区里面的。

我们已然获取了决赛圈的入场凭证, 至于未来所要达成的目标, 乃是从处于一同奔跑的状态, 切实朝着引领他人奔跑的方向迈进。

留意科技知新TechEasy, 在最先的时间里, 去跟踪那些有着趣味的前沿科技方面的动态, 以及实用的AI教程。

标签: AI大模型 中美竞争 开源赛道 技术实力 科技博弈

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~