中国AI的算力到底从哪儿来的?
中国AI算力获取渠道多元且受限,国产替代加速但生态与性能仍存瓶颈。
关键信息与渠道分析
- 转口与中转渠道扩展:除新加坡、马来西亚外,阿联酋等地雨后春笋般的公司成为新的中转节点 #26 #30;台湾也被提及可能通过非传统方式转手 #32;近期传闻海外已放开中国公司购买GB300等高端芯片 #33。
- 大厂数据中心布局:阿里、字节等大厂的IDC分区情况被指能清晰反映算力来源,暗示其拥有多元化的硬件获取能力 #31。
- 国产替代方案细化:除华为昇腾(NPU)及CANN架构外,国内还有DP U等其他国产芯片方案在运行 #36 #37 #39;华为早在2012实验室期间就开始自研类似CUDA的软件栈,但早期版本Bug较多且开发强度极大 #44。
- 租赁模式补充:针对无法直接购买高端硬件的情况,存在通过海外租用算力作为替代方案的讨论 #46。
争议与不同意见
- 禁运目的质疑:部分用户认为GPU限制并非为了真正切断供应,而是作为政治谈判筹码(类比福岛核污水事件)#29;另有观点指出美国政策反复(如被指“砸自己的脚”)反而让中国看清局势并加速自研 #30 #35。
- 技术差距与算力瓶颈:尽管有突破手段,但Pre-train阶段仍高度依赖NVIDIA等高端芯片,Post-train或可用国产卡替代 #27;有观点认为过去一年中美模型差距未缩小反而增大,主因是算力不足 #27。
- 生态垄断的质疑:有用户指出NVIDIA难以实现绝对垄断,因为TPU/JAX等其他技术路线依然存在,暗示生态并非铁板一块 #40。
经验与数据点
- 算力性能评估:针对国产或受限算力的实际效能,有观点认为其撑死也就5-10 FLOPS(此处可能指代特定单位下的相对效率或估算值),反映了当前硬件在大规模训练中的性能局限 #41。
- 模型迭代趋势:美国模型发展近期呈现“硬吃算力”的趋势,模型大小快速扩张,对底层算力资源的需求急剧增加 #42。
风险/限制/注意事项
不是找NVIDIA买的(明面上),总不能一直是存货吧?如果存货就够用,那为啥美国要花几千亿一年买算力呢?算力需求差别那么大吗? edit:很多人说转手,小规模可以,大到几百亿上千亿是很难逃过长臂管辖的,问题就在于为什么不需要上千亿的算力建设
新加坡data center,马来西亚data center 这玩意儿又不是打fps,训练的时候租用一下没什么问题,加上以前也屯了不少。说白了全世界各个国家所谓长臂管辖都是假的,想买总有漏洞的,要不朝鲜后来怎么突破禁运的呢?中俄都非铁板一块,何况那些地缘政治中随时摇摆的小国。
一开始可以买的,买了很多。然后之后就找新加坡马来西亚转一手。 现在又可以买了吧?
好像美国让了中国不让?老黄白去了
/uploads/short-url/5kgMHwoXWfcfJ3V0STGLarbA0GP.jpeg?dl=1 /uploads/short-url/oMGPKMPgbSZxuVpL6L8cQBAhJry.jpeg?dl=1
上份财报说了是0
陈平不等式秒了,2000人刀>3000美刀
国产的虽然不如nv,又不是不能用?
说了是转手啊,就和伊朗的油一样
超威的老板现在是不是被放出来了? 单他一家皮包公司就用吹风机走私了25亿芯片 搞不懂这家期权交易量每天都这么多,纯粹0护城河,不好好卖水冷整体想着走私女大
SMCI不是有几个高管被起诉偷偷卖了几个B的chip给中国
insane-nexus: 纯粹0护城河 坐牢不就是护城河吗
我一直觉得GPU 禁运什么的完全不可能实现 数据中心建哪里不是建,无非是可能中国基建水电便宜点?但是大头本也是 GPU 本身
人家的护城河就是和老黄的关系
人脑算力完爆淫威大
貌似当年原子弹就是算盘搞出来的?
库斯尼兹: GPU 禁运什么的完全不可能实现 但是像苹果那样弄设备锁那是完全可行的
國內要自產研發 不想要被NV綁死 之後按照基建的倍速10X datacenter直接世界第一 搭配無上限的電力 以後1億token也就1rmb
/uploads/short-url/tCipU6HCnCMgl4eLuUgnG9BtAeg.jpeg?dl=1
国产芯片能效比差一些,但是便宜的电价又弥补了这一块
现在都靠升腾的吧,国产替代
不现实啊 完全可以在老挝建个数据中心,然后training 的时候用就行了 所以现在有规定说,中资直接投资的数据中心也要禁运 但这也太容易绕过了。反正找个中间人 GPU 又不是手机,算力都是远程访问,通过禁运 GPU 限制 AI 训练也太没道理了。 谁知道你 GPU 上面跑的一个任务到底是中国人跑还是美国人在跑------只要这个事情分辨不出,GPU 禁运就毫无意义
training还真是不能用
国产模型普遍是美国最先进模型大小的1/5甚至1/10。国产芯片/库存NV芯片差不多性能也在最新一代NV卡的这个水平。 总体上AI模型还是需要力大飞砖 (当然后训练和agent调教也很重要)
单位能耗下
美国的这个 GPU 限制就是个笑话。 尤其是这里面的利益比卖毒品还高的时候。 只能说明面上中国不进口这些,但是你管得着新加坡,阿联酋各种雨后春笋的公司背后训练和推理着是谁家的模型? 最后 AI 发展靠的是持续的投入,你能玩这些招式恶心对手,但是别人也不是傻子,一方面各显神通突破你的限制 + 灰色地带绕过限制 + 本土研发策底替代你的东西。这条路太阳能光伏,风力走过,手机,智能家电和 EV 走过。GPU 和火箭自研自造虽难,但是也不是走不通。最多就是成本效率低,但是你封锁是基本无用的
Pre-train 还是需要 NV 之类的吧,post-train 之类的也许可以用国产的卡?但的确感觉过去一年中美模型的差距没有在缩小而是在增大,应该就是算力不足。
走量的商业产品成本高其实是走不通的,但是美国的基建成本电费腐败的地方政府和贪婪的nvda弥补了这一点
有没有想过 privater: 美国的这个 GPU 限制 也许本来就不是为了真限制,而是凭空创造一个政治谈判筹码? like 福岛核污水
Yangff: 贪婪的https://finance.yahoo.com/quote/NVDA NVIDIA 非常贪婪,但是不傻,也非常能过苦日子。它的政策会根据实际情况快速调整。但是被懂王把这盘大计搅黄,属实过于心急最终搬石头砸自己的脚。 泥潭萌新: 也许本来就不是为了真限制,而是凭空创造一个政治谈判筹码? 如果不是因为 18 年对华为围剿到贸易战乃至禁运以及后来一系列骚操作。NVIDIA 再耕耘 3-5 年可以让 CUDA 成为事实上的铁律,渗透进入 AI 训练和执行的方方面面,如今反而过早引起了中国的警惕,再到后面制定实际的脱钩政策和替代性产业政策,NVIDIA 已经没有可能再垄断整个生态链。
去查一下阿里字節的datacenter 都有哪些區 很明瞭的
台湾…说不定也可以想不到的方法转一手
大都是东南亚转口的,现在听说海外也放开中国公司买 GB300 了
就算中国用cuda,美国还有google tpu等。
美国最喜欢砸自己的脚,并且让中国看到
国内除 cuda 外,还有华为 gpu 用昇腾 CANN 架构
国内还有DP U
我来发个关于学术圈的言,国内某些组没那么多算力,也没啥钱。然后搞了些挺需要算力的工作,hhhhh,所以我也好奇。还有某些pi 直接在网上晒出又8张h200(也不是大组,也不是top)。 大公司什么的我觉得水平没那么大。
华为叫自己npu。
感觉垄断不了啊,还有tpu/jax啥的
这算力撑死了也就5 - 10 FLOPS
倒真的是,美国现在模型大小最近一年发展有点快,硬吃算力
海外数据中心或者直接用云服务之前都是合规的
covid 期间好像华为就开始做自己的cuda?我学弟在2012 实验室说的,然后bug多到飞起,然后忙到drop 课都没时间
但是算盘也只是存储工具和极其有限的算力帮助。。
不能买,但是可以去海外租