公众号

关注微信公众号

移动端

创头条企服版APP

商标注册云服务办公孵化推广通双创地图

Lmarena模型排名中国占4/10，斯坦福称中美AI对战临界点到来

2025-02-06 15:48 抢发第一评

全球最硬核的Lmarena模型竞技榜刚刚更新，前10名里国产模型直接占了4席。

DeepSeek R1以89.7分与GPT-4o并列第三，Qwen Max以0.4分优势反超DeepSeek V3，智谱ChatGLM稳守第九。

要知道去年这时候，国产模型还在榜单20名开外“苟着”，美国网友甚至调侃“中国AI在玩单机游戏”。

结果短短一年，情况发生了大转变。

DeepSeek率先上演逆袭神话。

去年10月，V3版初露锋芒挺进前十，今年R1版本仅用三个月便登顶第三，其核心推理能力评分飙至89.7，与GPT-4o差距缩至0.3分！更震撼的是其成本控制——开源文档显示，R1单位性能算力消耗较Llama 3降低34%，这种"暴力计算美学"直接惊动美国参议院科技委员会，其2月13日听证会上首次将DeepSeek列入"战略技术观察清单"。

硅谷精英集体破防。

YC创始人Paul Graham凌晨发推："当中国团队开始重定义参数效率时，旧金山该响起防空警报"；

Anthropic技术总监在内部备忘录警告："DeepSeek的MoE架构设计至少领先行业路线图半年" ；

GitHub数据显示，DeepSeek-Coder周下载量暴涨300%，马斯克在X平台转发相关代码仓库时配文"这不该被忽视"......

阿里Qwen展现更强攻势。

Max版本代码生成单项92分创历史新高，Qwen1.5-110B在AGIEval评测中以84.1分超越GPT-4的83.7。

Meta首席科学家Yann LeCun在2月10日学术会议上直言："Qwen的跨模态架构正在改写游戏规则"。Hugging Face平台见证Qwen系列下载量突破180万次，衍生出47个垂直领域微调版本。

2024 年初，斯坦福HAI研究所预测报告称，“2024将是中美AI实力交叉的临界点”。

信然。

白宫最新《AI竞争力报告》首次用12页篇幅分析中国大模型进展，直指“开源战略正在瓦解技术壁垒”。

a16z等顶级风投紧急启动中国AI专项尽调，某硅谷基金合伙人私下承认：“我们误判了中国团队的迭代速度”。

OpenAI被曝将中国院校毕业生招聘配额提升3倍，马斯克旗下xAI团队更是在浙大、上交大连续举办5场闭门宣讲。

在大模型落地场景方面，双方的差别更加明显。

在程序员聚集的Reddit板块，一篇《为什么Claude 3.5仍统治编码榜？》的深度分析引发热议：该模型虽在LeetCode Hard级题目保持82%通过率，但其训练数据截止2023年Q3的现实，让网友质疑“这更像一场刻意维持的技术景观”。

反观中国阵营，国产大模型已覆盖金融（38%）、政务（27%）、医疗（19%）三大核心领域。

比如：DeepSeek金融代码模型已部署至招商银行等23家机构，实时监控2.6万亿资管产品；

腾讯混元帮助国家电网搭建的电力调度系统，在寒潮期间将故障响应速度提升40%；

华为盘古气象大模型提前7天预测到本次广东龙卷风，误差范围仅3公里；

Qwen已接入菜鸟物流系统，日均处理200万件跨境包裹的关税计算，在东南亚市场，其多语言版本服务7国央行反洗钱监测......

值得玩味的是，在2月22日华盛顿AI安全峰会上，中美两国代表就大模型监管展开激烈交锋，而会议茶歇期间，超过半数硅谷CEO主动与中国团队交换联系方式——这场静默的技术权力转移，或许比榜单数字更具历史重量。

.END.

图片来源｜网络

您也可以关注我们的官方微信公众号（ID：ctoutiao），给您更多好看的内容。

声明：本文由创头条企业号发布，依据企业号用户协议，该企业号为文章的真实性和准确性负责。创头条作为品牌传播平台，只为传播效果负责，在文章不存在违反法律规定的情况下，不继续承担甄别文章内容和观点的义务。

您阅读这篇文章花了0秒

转发这篇文章只需要1秒钟哦

13人分享了该篇文章：

赏

Lmarena模型排名中国占4/10，斯坦福称中美AI对战临界点到来

打赏一下 0

喜欢这篇 17

评论一下 0

凯派尔知识产权全新业务全面上线

蓝月亮离“中国宝洁”还有多远？

蓝月亮离“中国宝洁”还有多远？

2020-12-18 16:14 抢发第一评

25倍股欧普康视遭实控人减持持股已质押近两成

25倍股欧普康视遭实控人减持持股已质押近两成

2020-12-18 16:35 抢发第一评

极狐阿尔法 T：续航和驾驶体验均衡的北汽新能源之子

极狐阿尔法 T：续航和驾驶体验均衡的北汽新能源之子

2020-12-18 16:38 抢发第一评

沾上疫苗就涨停！常铝股份收关注函：疑似蹭热点配合股东减持

沾上疫苗就涨停！常铝股份收关注函：疑似蹭热点配合股东减持

2020-12-18 16:48 抢发第一评

隆基股份遭股东李春安减持4033万股超计划减持数量

隆基股份遭股东李春安减持4033万股超计划减持数量

2020-12-18 16:53 抢发第一评

评论

试试以这些内容开始评论吧

数据可视化数据可视化数据可视化

登录后发表评论

游客

热文

1

第五届国际科创节暨新质生产力峰会在京举行，数智赋能韧性增长

2

使用未授权数据训练大模型，这家 AI “六小龙”被爱奇艺告了

3

复旦“史上最严AI新规”引争议

4

Tik Tok“难民潮”与抖音国际化幻象

5

AI会促进就业，还是造成失业？这份覆盖33个国家的调研报告有答案

6

全国整治“俄罗斯商品馆”

7

AI造富神话！英伟达一半员工净资产近两亿元

8

特朗普全家发币圈钱

9

紧急！美国拟全面对华禁售GPU？

10

迎接“tiktok 难民”，这些中国品牌已在小红书布局抢流量

最新视频

重磅嘉宾寄语｜加拿大工程院院士杜如虚为2023中国创交会打Call！

1.7万次播放

重磅嘉宾寄语｜加拿大工程院院士杜如虚为2023中国创交会打Call！

抢发第一评

18600040560

【视频精彩回顾】科技创新与成果转化大会暨聊城概念验证中心合作签约仪式

2.6万次播放

【视频精彩回顾】科技创新与成果转化大会暨聊城概念验证中心合作签约仪式

2

18600040560

中国科技创业数字地图3.0数字化服务支持创新创业

3.9万次播放

中国科技创业数字地图3.0数字化服务支持创新创业

抢发第一评

18600040560

最新专题

TOP “科创中国”创新创业联合体

12 43.0万 2

2 2023中国创新创业成果交易会

18 63.8万 3

3 2023阿里云创峰会暨长三角（镇江）数字经济发展高峰论坛

9 58.1万 0

4 科技创新与成果转化大会暨聊城概念验证中心合作签约仪式

8 54.0万 0

5 颂扬中国制造精神，寻访隐形冠军

7 48.7万 0

凯派尔知识产权全新业务全面上线

宁波城市站

金华城市站

热文

1

第五届国际科创节暨新质生产力峰会在京举行，数智赋能韧性增长

2

使用未授权数据训练大模型，这家 AI “六小龙”被爱奇艺告了

3

复旦“史上最严AI新规”引争议

4

Tik Tok“难民潮”与抖音国际化幻象

5

AI会促进就业，还是造成失业？这份覆盖33个国家的调研报告有答案

6

全国整治“俄罗斯商品馆”

7

AI造富神话！英伟达一半员工净资产近两亿元

8

特朗普全家发币圈钱

9

紧急！美国拟全面对华禁售GPU？

10

迎接“tiktok 难民”，这些中国品牌已在小红书布局抢流量

资讯

政策

活动

100特色空间

×

#热门搜索#

精选双创服务

历史搜索清空

创头条是创兴动力旗下的创新创业资讯和企服产品，国家高新技术企业。平台汇聚百万级企业用户，基于企业号、双创地图、政策通、融资报、活动工具、企服市场等产品，提供资讯、数据、线上对接等企业服务，并以路演、产业大赛、峰会、培训、产业对接等方式提供线下赋能服务。

创兴动力

北京| 上海| 杭州| 郑州| 大连| 金华| 石家庄| 邢台| 济南| 深圳| 佛山

关于我们

APP下载

Android & IOS

微信公众号

扫码关注

©2015-2025 创头条版权所有京ICP备15013664号-2

京公网安备 11010802029378号站长统计 RSS

Tel：18514777506

关注微信公众号

创头条企服版APP