开云(中国)Kaiyun·体育官方网站-登录入口-开云(中国)Kaiyun·体育官方网站-登录入口这阐发就算好意思国对中国搞全面断供-开云(中国)Kaiyun·体育官方网站-登录入口

开云(中国)Kaiyun·体育官方网站-登录入口这阐发就算好意思国对中国搞全面断供-开云(中国)Kaiyun·体育官方网站-登录入口

发布日期:2025-08-09 07:21  点击次数:130

开云(中国)Kaiyun·体育官方网站-登录入口这阐发就算好意思国对中国搞全面断供-开云(中国)Kaiyun·体育官方网站-登录入口

‍‍‍开云(中国)Kaiyun·体育官方网站-登录入口

DeepSeek 开源动作仍在握续,激勉了 AI 圈又一轮颠簸。

2 月 21 日 12 点,DeepSeek 团队在 X 平台发布了一段英文施行。浅易讲明一下,其实说的便是:"从下周启动,我们将开源 5 个代码仓库,以完全透明的面容共享我们轻微但针织的进展。"

紧接着在 2 月 24 日,DeepSeek 就开源了首个代码库 FlashMLA。

用我们得到 App AI 学习圈主持东谈主快刀青衣憨厚的话说,能作念出这样的活动,曲直常有风格的。他打了一个比喻:之前开源的是职责后果,就像一个憨厚傅,把他悉数的训导忘我传授给你。而目下,你不但能拿到憨厚傅的隐痛,还能看到憨厚傅在历程中是若何干活儿的。这对好多东谈主来说,会比收尾更有价值。

诚然,列国网友对 DeepSeek 这一动作皆不乏讴颂之辞,反响十分热烈。

今天我们先不细究代码库 FlashMLA 的职责旨趣,而是想来聊一下,从 DeepSeek R1 发布以来许多东谈主在想考的一个问题:果然具有"开源精神"的DeepSeek 加上华为,能弗成超越英伟达和 Open AI?

正巧前不久,我们得到的万维钢憨厚,在他的专栏里花大篇幅回复了这个问题。本文选自《万维钢 · 精英日课 6》,文中万憨厚用更全面、更永久的视角,探讨了为什么 AI 需要越来越强的算力,以及中国为什么要冲突芯狭小候收尾、坚握永远参加通用东谈主工智能研发等问题。

底下,请万维钢憨厚为你共享:

作者:万维钢

来源:《万维钢 · 精英日课6》

01

对算力的需求永无异常

DeepSeek 选择了一些奥秘的优化设施,或者用比拟少的算力竣事 o1 级别的功能,这异常了不得,这对中国——也对好意思国——的大模子研发者皆是天大的好音信。

但这毫不是说以后英伟达那种高档芯片就没用了,咱国产芯片就够用了。目下 AI 缩放定律远远莫得看到尽头,更高的智能条件更高的算力这个根柢原则并莫得变。

要知谈就算莫得 DeepSeek,别家公司和科研团队,包括 OpenAI 我方,也在优化模子性能,再磋商到英伟达芯片升级,用山姆 · 奥特曼的话说便是"模子输出资本每年皆会镌汰十倍"(即降至蓝本的十分之一)。

假定 DeepSeek 冲突之前那一刻,OpenAI 用 100 的算力得到 100 的智能,DeepSeek 冲突了,群众用 10 的算力就能得到 100 的智能——但你的设计不是 100 的智能,而是一万、致使一百万的智能,是以你仍然需要比目下逾越百倍千倍的算力。

是以对算力的需求目下来说如故无异常的。

但英伟达并非安枕而卧,好意思国有好几家公司在作念我方的 AI 芯片,中国也有包括华为、寒武纪、百度、壁仞科技等等正在追逐。那么国产 AI 芯片的水平相关于英伟达来说到底如何呢?国产最强的是华为昇腾。

我让 ChatGPT Deep Research 调研况且制作了底下这张表格,把华为昇腾和英伟达近几年的主流 GPU 作念了个对比——

这个收尾不错说是既不让东谈主悲不雅,又不让东谈主乐不雅。现时能用的最强国产 GPU 是 2022 年发布的华为昇腾 910B,它的性能在某种真理上依然稍稍突出目下仍然被好多 AI 公司平淡使用的、英伟达 2020 年发布的 A100。这很热切,这阐发就算好意思国对中国搞全面断供,中国也能接续检修 AI。

但 910B 比英伟达目下确方丈芯片,2023 年发布的 H200 和 24 年发布的 B100,就差距比拟大了,算力约莫异常于英伟达的二分之一到四分之一。华为 2025 年行将量产昇腾 910C,基础算力与 910B 差未几,推感性能传闻达到英伟达之前 H100 的 60%。但英伟达 2025 年会推出 GX200,算力预估是 910C 的五倍。

02

高档智能一定是通用智能

为什么英伟达在接续突飞大进,而华为有点接近极限的真理?

这里最热切的原因便是光刻制程。

英伟达 A100 和华为昇腾系列皆是 7 纳米制程,在这个要领上中芯海外能作念。只是在 910C 这个级别条件 N+2 制程,中芯海外的良率传闻很低,这意味着坐蓐资本高。而英伟达 H 系列、B 系列、GX 系列差异是 5 纳米、4 纳米、3 纳米制程,中芯海外作念不了。

因为中国大陆莫得极紫外光刻机。《精英日课》讲《芯片来去》一书的时候说过,极紫外光刻机极其不可能靠一个国度完全自力新生造出来,目下看至少明天十年之内可能性不大。

是以现时最可行的意见,如故从英伟达买。

那你说目下 DeepSeek 依然很好用,我们就在这个基础上擢升性能行不行,何苦非得追求最高的性能呢?我以为那是万万不行的。

要知谈 DeepSeek 是个相对比拟小的模子,它是不错跟 o1 对标,但 o1 也不是超大模子。

就在 2025 年下半年,也许更早,OpenAI 会推出 GPT-5,那将是一个超大的模子。它会像目下 GPT-4o 一样领有端对端检修出来的多模态,它将不但能阅读图像,而且能阅读视频和音频,它将能处理海量的数据——是以它需要好多张 GPU。DeepSeek 不会废弃这种模子。

再者,更热切的是,AGI、以及紧接着更热切的 ASI,便是需要超大的算力—— 因为高档智能一定是通用智能。

DeepSeek R1 的遵守高,有好多草创性的时候,然则我们也弗成否定,其中有一定以捐躯宽度疏通遵守的身分。

R1 和之前的 V3 皆是「夹杂众人(mixed experts)」形状,是可能最早法国的 Mistral 模子先选择的,是把智能踱步开成些许个众人模块,每次遭遇新任务就只调用联系的模块,而无谓「全脑」全部想考,这就大大浅显了算力。

这个作念法异常于你问我数学题我就用数学模块,问我古诗词我就用古诗词模块。但我们设想,关于更复杂的问题,也许便是需要同期调用几个边界的常识和想维形状本领治理。

特别是创造力老是来自不同想法的结合,那么这个模块分割法就会收尾推崇。再者,DeepSeek 专注于数学、编程和言语处理这几个边界,亦然为了浅显算力不得不为之。

就在最近,斯坦福大学李飞飞的团队发明了一个更激进的作念法,堪称只用不到 50 好意思元(有个说法是 6 好意思元)的检修用度就弄出一个数学解题水平跟 R1、o1 差未几的推理模子,叫 S1。他们是若何作念的呢?

第一,从开源的通义千问(qwen)的一个小版块言语模子启动,省去前期大边界的检修;

第二,用一千谈精选数学题挑升检修数学解题智商,且只检修数学智商;

第三,用 Google Gemini 的一个推理版块的推理历程的蒸馏数据来检修我方的推明智商。

这个作念法,就如同找个脑子快的孩子,给他一套精选习题集,让他背诵别东谈主的解题套路。这样检修作念题家诚然快,然则这除了快莫得别的孝敬。这个作念法不会像 R1 那样涌现出任何新智商,不会给你任何惊喜。

这不是通往 AGI 之路。

03

更多的参数 + 更长的想考时分 = 更好的谜底

梁文锋襟怀大志,齐全不单是想提供一个低廉的作念题家,而是想作念 AGI。接下来的情形,我意想,差未几是底下这样的——

关于一般的日常任务,比如一般编程、搞个会议纪要、写个申诉职责的发言稿、弄个报表之类,只有用普通模子就不错,中国不但没问题而且可能有价钱和服务上的上风,也许中国的模子是最佳的。

但关于科研任务,特别是探索最前沿冲突,你需要能想得很广而且很深,你需要尽可能地堆积算力。我有个说法是淌若一个科研团队怡悦花 5000 好意思元问 ChatGPT 一个问题,而另一个雷同水平的科研团队怡悦花一万好意思元,那么后者将得到更好的谜底——只是是因为模子怡悦为他们想考更万古分。

只有缩放定律仍然有用,那么,更多的参数 + 更长的想考时分 = 更好的谜底

亦然更值钱的谜底。接下来 AI 在科研边界会技艺非常,科研发现的速率会加速,是以争夺会异常热烈。一种新药只可被发现一次,谁先作念出来便是谁的。

还有一个在我看来最热切的磋商,是谁先达到 ASI。

我们这里不妨界说ASI 是「我方不错检修我方」的超等东谈主工智能。那么谁先达到 ASI,谁就等于是获取了一个齐全的起头上风。这就异常于政策游戏里谁先造出「奇不雅」来,能大大加强我方的政策上风。

试想淌若好意思国率先达到 ASI,那就意味着以后的路全买通了,剩下的事只是给 AI 喂芯片喂电力良友,不需要东谈主类科学家再有奇想妙想,可谓是安枕而卧——那到时候中国若何办呢?还靠一帮东谈主发愤追逐吗?

走时的是中国有个 DeepSeek。就在 DeepSeek 的论文中,依然披流露少量迹象,模子我方给我方漠视了一个算力优化策略。你不错说梁文锋依然看到了 ASI 的晴明。我们设想 OpenAI 详情也有雷同的东西,但他们从未公开过。

DeepSeek 震撼好意思国这段时分,Anthropic CEO 达里奥 · 阿莫迪(Dario Amodei)有一些公开言论,很耐东谈主寻味。他说淌若不收尾中国发展 AI,那会对全东谈主类皆有公道,我们会迎来突飞大进的十年——然则中国会把 AI 用于军事,而这对好意思国很不利,是以他命令好意思国政府加强对中国 AI 的收尾。他还说,真但愿 DeepSeek 团队到好意思国来为他们公司职责。

这些言论在 X 上遭到了好意思国网友的围攻。起头你四肢一个科技公司 CEO 去强调地缘政事,这自身便是错的:科技应该为全东谈主类服务。再者你咋这样会想呢?东谈主家 DeepSeek 凭啥到好意思国来帮你干?

这些言论进一步阐发了 DeepSeek 的政策真理。接下来好意思国政府有可能加强对中国 AI 的收尾,致使完全脱钩,但也有可能松动英伟达的出口料理,毕竟跟特朗普什么皆不错谈。岂论如何,我们必须认准 ASI 这个大主义,而齐全弗成称心于解解数学题、日常编程那些任务。

总想四两拨千斤、少费钱多服务儿、以 20% 的参加治理 80% 的问题,那是走不远的。

中国必须有东谈主宁可选择贫乏又费钱的路。

万憨厚是前物理学家,现科学作者,得到 App《万维钢 · 精英日课》主持东谈主。万憨厚从 2016 年起,在得到 App 开设《精英日课》年度专栏,于今已更新到第 6 季,累计突出 70 万东谈主次订阅奴婢。接待你加入正在更新的《万维钢 · 精英日课 6》。



相关资讯
热点资讯
  • 友情链接:

Powered by 开云(中国)Kaiyun·体育官方网站-登录入口 @2013-2022 RSS地图 HTML地图