中国正在悄悄赢得AI竞赛吗?
中国AI模型在开源社区异军突起,以高性价比和工程优化能力吸引全球关注,部分模型在Hugging Face下载量和热度上领先,斯坦福报告指出中国AI能力和使用人数已赶上或超越全球对手,硅谷公司也开始默认采用中国大模型,显示中国在AI竞赛中正悄然取得优势。
1. 关键信息
- (之前已归纳)中国AI模型因性能高(准确度高出30%)且成本极低(便宜九成),被美国公司(如缤趣、爱彼迎)采用。
- (之前已归纳)中国模型在Hugging Face下载量和热度领先,千问曾超越Llama。
- (之前已归纳)中国研究人员在LLM的工程和数理优化方面基础扎实,并在N卡受限下开发出高效模型。
- (之前已归纳)完善的电网和巨型APP软件生态系统被认为更适合AI落地。
- (之前已归纳)斯坦福报告称中国AI能力和使用人数已赶上或超越全球对手。
- (之前已归纳)Meta Llama 4未达预期,正与中国公司合作开发新模型;硅谷Kilo Code默认首选MiniMax M2.1。
- (之前已归纳)讨论延伸至语言学领域,提及“官话辅音多”可能与蒙元入侵有关,并认为“XYZ这种送气擦音”符合蒙古话听感(此信息与AI竞赛主题关联较弱,作为语言学插曲提及)。
- (之前已归纳)用户“假节钺”感叹“见到这一天也老了”,并提及可以提前欣赏AI预测的下一个马年新年的中国(视频需手动切换到中文音轨原声)。
- 新增:用户awaken01641提及“汉语拼音的设计问题”,并暗示这可能与AI模型的训练数据或语言处理能力有关,但具体细节未展开。
2. 羊毛/优惠信息
- 无
3. 最新动态
- (之前已归纳)斯坦福报告指出,中国的AI模型在能力和使用人数上已赶上甚至超越全球对手。
- (之前已归纳)Meta的Llama 4发布后未达预期,据报正与阿里巴巴、谷歌、OpenAI合作训练新模型,预计春季发布。
- (之前已归纳)硅谷新贵Kilo Code宣布默认首选中国大模型MiniMax M2.1。
4. 争议或不同意见
- (之前已归纳)讨论了“中国赢了”的定义,华人背景人才的贡献与“中国赢了”的区别,以及潜在的政治风险。
- (之前已归纳)对“开源肯定笑到最后”的观点提出质疑,认为CUDA等闭源技术仍重要。
- (之前已归纳)有用户调侃中国在“捏数据”时不够“大胆”。
- (之前已归纳)讨论中穿插了关于汉语辅音与蒙古语听感关联的语言学观察。
- 新增:用户awaken01641提出的“汉语拼音的设计问题”可能引发关于语言模型训练数据偏见或设计局限性的讨论。
5. 行动建议
- (之前已归纳)企业和开发者应关注Hugging Face上热门的中国开源模型,利用其成本和效率优势进行定制化开发。
- (之前已归纳)关注中国在电力基础设施和巨头APP生态对AI落地的潜在推动作用。
- 新增:鉴于awaken01641的评论,开发者和研究者或许可以进一步探讨汉语拼音设计对AI语言模型性能的影响,并考虑如何在数据处理和模型训练中优化这一环节。
每个月都有数以亿计的使用者涌入缤趣(Pinterest),寻找最新的流行风格。
其中一个名为“最荒谬的事物”的页面充满了各种古怪点子,足以启发创意人士:被改造成花盆的Crocs洞洞鞋、汉堡造型的眼影还有以蔬菜打造的姜饼屋。
但准买家可能不知道的是,驱动这些功能的技术并不一定是美国制造。缤趣正在试验中国的AI模型,以优化其推荐引擎。
“我们有效地把缤趣打造成了一位AI驱动的购物助理。”公司执行长比尔·瑞迪(Bill Ready)告诉我。
当然,这家位于旧金山、以潮流品味闻名的公司,也能选择任何一家美国AI实验室来提供幕后技术支持。
然而,自从中国的深度求索(DeepSeek)在2025年1月推出R-1模型以来,中国的AI技术便愈来愈多地出现在缤趣的系统中。
瑞迪称这个所谓的“DeepSeek 时刻”是一项突破。
“他们选择将模型开源,引发了一波开源模型的浪潮。”他说。
来自中国的竞争者包括阿里巴巴的千问(Qwen)、Moonshot的Kimi,而TikTok母公司字节跳动也正在开发类似技术。
缤趣技术长麦特·马德里加尔(Matt Madrigal)表示,这些模型的强项在于企业能自由下载并定制——这是来自美国的竞争者(如开发ChatGPT的OpenAI)的大多数模型无法做到的。
“我们用来训练自家模型的开源技术,比市面上最顶尖的现成模型准确度高出30%,”马德里加尔说。
他补充,这些更精准的推荐功能成本却更低,有时比美国AI开发商偏好的专有模型便宜九成。
“又快又便宜”
缤趣不是唯一一家依赖中国AI技术的美国企业。
这些模型正在越来越多《财富》500 强企业中获得采用。
爱彼迎(Airbnb)执行长布莱恩·切斯基(Brian Chesky)在 10 月接受彭博采访时表示,公司“非常”依赖阿里巴巴的千问来支援其AI客服系统。
他给出的三个简单理由是——“非常好”、“非常快”且“非常便宜”。
更多证据可在Hugging Face找到。该平台是下载现成AI模型的主要场所,其中包括 Meta和阿里巴巴等主要开发者的模型。
在平台开发产品的杰夫·布迪耶(Jeff Boudier)表示,成本因素让许多初创公司更倾向选择中国模型而非美国模型。
他告诉我:“如果你查看Hugging Face上最热门的模型——下载最多、社群最喜欢的那些——通常,中国实验室的模型占据前十名中的许多位置。”
“有些星期,Hugging Face上前五名的热门训练模型中,有四个来自中国。”
9 月,千问超越Meta的Llama,成为Hugging Face平台上下载量最多的大型语言模型工具。
Meta在 2023 年推出其开源Llama AI模型。在深度求索与阿里巴巴模型推出之前,它们一直被视为开发定制应用的首选。
但Llama 4去年发布后让开发者感到失望,而据报导,Meta已开始与阿里巴巴、谷歌和 OpenAI的开源模型合作训练一套新的模型,预计在今年春季发布。
爱彼迎也使用多个模型,包括美国开发的模型,并将它们安全地部署在公司自有的基础架构中。根据它的说法,用户数据不会提供给任何AI模型的开发者。
中国式胜利
进入2025年时,普遍共识是:尽管美国科技公司投入了数十亿美元,中国企业依然有可能领先。
“现在情况已非如此,”布迪耶说,“如今,最好的模型是一个开源模型。”
斯坦福大学上月发布的一份报告指出,中国的AI模型“似乎已赶上甚至超越”全球对手——无论是在能力方面,还是在使用人数方面。
在近期接受BBC采访时,英国前副首相克莱格(Nick Clegg)表示,他认为美国公司过于专注于追求某种未来可能超越人类智慧的AI。
去年,克莱格从Meta(Llama 的开发者)全球事务主管一职离任。执行长扎克伯格已承诺投入数十亿美元,追求他所称的“超级智慧”。
一些专家现在称这些雄心暧昧且定义不清——这让中国有机会主导开源AI领域。
“具有讽刺意味的是,”克莱格说,在“世界上最伟大的威权国家”与“世界上最伟大的民主国家”——中国和美国——的竞争中,中国“在做更多事去让他们争夺的这项技术走向民主化”。
斯坦福的报告也指出,中国在开发开源模型方面的成功,部分可由政府支持来解释。
在地球另一端,美国的OpenAI等公司则承受巨大压力,需要提升营收并达到获利,甚至开始转向广告帮助达成目标。
该公司去年夏天发布两款开源模型,这是它多年来首度推出。但其大部分资源仍投入在专有模型上,以便创造收益。
OpenAI执行长山姆·阿特曼去年10月告诉我,公司已大举投资于更多运算能力及与合作伙伴签署基础设施协议。
“营收会快速成长,但你应该预期我们会投入大量资金进行训练、开发下一代模型、再下一代、再下一代、再下一代。”他说。
BBC News 中文 – 25 Jan 26
中国正在悄悄赢得 AI 竞赛吗? - BBC News 中文
斯坦福大学上月发布的一份报告指出,中国的AI模型“似乎已赶上甚至超越”全球对手。
pins能有这么多流量吗
中国ai和御三家差了不止一点吧 但是得承认对开源的贡献确实大
怎么讲,open-weight还是猛,不过openrouter统计中国模型也就15-20%的call
这也赖政府支持
搜了一下好像月活5B,不知道是个什么标准,可能Google search不小心点到也算吧
作为llm领域内的在读phd
当时deepseek在朋友圈疯转的时候我内心很质疑
觉得不过又是国内又一个噱头
时间证明在开源社区qwen和deepseek确实碾压了llama
甚至百度的glm也开始追上
没有国内的开源模型
学术界的llm研究得倒退半年
(ps 上一个研究是攻击llm reviewer问为什么要攻击llama这种老旧模型 我回因为我写这paper的时候deepseek / qwen还没被公认为开源标杆)
实际上国内能做出deepseek的突破回头看非常自然
本质就是attention和feedforward的tricks用来低维近似和几十年前就有的混合专家模式
属于本科生都可以轻松理解的概念
国内的研究者数理基础都打的很好 工程只要实现了deepseek也就有了
【引用自 transformer_88】:
属于本科生都可以轻松理解的概念
国内的研究者数理基础都打的很好 工程只要实现了deepseek也就有了
可以给外行解释下为啥美国人搞不出吗 如果概念不难的话?工程不行?
美国人资源多呗 都拿钱去非洲买电买数据了 主打大力出奇迹 懒得想tricks 国内N卡被禁了 所以要优化算力。只是国内搞出了个省钱又好用的,我要是企业里的我也喜欢。
一点浅见:比如deepseek属于另外的技术路线,工业界完全没有动力去探索更多的新技术路线,因为这通常涉及到公司政治和内部资源分配。另外美国公司工程水平进入了瓶颈期,质量问题层出不穷。这是当前经济环境下公司投入不足、方向不明确导致的瞻前顾后。deepseek不以此作为利润来源,也不以此分配资源,又有充足的人才供给,也就不受影响。
大家本以为它会顺理成章地接入 GPT 或 Claude ,结果 Kilo 极其高调地宣布:我们的默认模型,首选中国大模型 MiniMax M2.1。
news.qq.com – 18 Jan 26
深度丨硅谷新贵、Cursor最强对手高调宣布:MiniMax是默认的首选模型_腾讯新闻
硅谷开源圈的固有格局正在经历一场静默的剧变。如果你关注编程领域,一定听过这个Kilo Code这个名字。这家新晋硅谷宠儿被公认为 AI 编程一哥 Cursor 的最强挑战者,上个月收到 General Catalyst 等顶级 VC 投进来的 800 万美元。工具发布仅9个月,累计 token 量突破恐怖的 20 万亿,使用热度一度超过 Cursor 与 Claude Cod...
美国最缺的就是电力
【引用自 bravefilm】:
每个月都有数以亿计的使用者涌入缤趣(Pinterest)
如果这是真的,股价也不至于几年都没涨了
但不管是哪边的公司都是老中深度参与,某种意义上中国确实赢了。
xAI直接全华班,MSL也差不多全华班,其他的不是全华班但也比例很高了。ML顶会论文绝大部分都带着中国名字。
如果单纯比人才积累的话,目前遥遥领先
全世界才六十亿人 有50亿用pins?
【引用自 lch04】:
全世界才六十亿人
你终于醒了, 现在是2026年, 你睡了30年…
中国人赢了和中国赢了还是有区别的
本质上就是中国老中vs美国老中,媒体天天搞这种宏大叙事,然而这些人没准就在小红书 微信群里讨论
以后撕破脸了就没区别了,大部分这些AI研究员都没法短期内一下加入美籍,美国如果开始排华,最后就会和德国的犹太科学家一样跑路
而且我想大部分人其实都是想着在美国捞一大笔钱就走,根本没那么高归属感,比如姚顺雨国内有公司给高职位就马上跑了
—————-
至于为什么人才值钱,可以跑路。还不是因为现在AI时代代码写起来效率太高了。天天有人嘲讽manus怎么怎么样,他们多久就能复刻一个。说明代码作为资产其实是在AI时代大幅贬值中,你的屎山代码库没有那么值钱了。在代码不值钱的情况下,脑子里的知识反而变得更加值钱,也就是让AI研究员这个人本身变得值钱了。
所以Meta愿意买Manus,其实是打包买走团队。而Windsurf的结局也说明了,人本身很值钱,所谓的产品和用户积累没那么值钱(公司打包30亿,核心团队打包24亿,等于说产品用户和小兵加起来也就值6亿)
和以传统印度人强势的云计算行业对比一下,那边挖人没什么用,从AWS挖一个两个资深IC,甚至挖一个团队都不可能帮你复刻一个AWS出来,但从OpenAI挖几个核心人物或者一个小团队,真能做点名堂出来
【引用自 xxxyyy】:
传统印度人强势的云计算行业
印度人在云方向很强??
能不能告诉我啥是ai竞赛/革命?不要牛吹的震天响,到时候要盈利了一看还是插入广告
【引用自 qwaszx】:
插入广告
虎嗅网 – 25 Dec 25
OpenAI计划在ChatGPT中引入广告优先展示机制
OpenAI员工正在开发ChatGPT广告系统,计划在用户查询时优先显示赞助内容。该举措源于AI行业商业化压力,预计2026年将成为AI广告普及关键节点。
【引用自 tomandjerry】:
印度人在云方向很强??
数量很多很多,AWS,Oracle都扎堆印度人。学术界里很多做云,infra,分布式的也是印度人,至少比AI里面印度人比例高很多。
印度可以产出大量的coding machine,适合云这个行业,人多,写代码多就是王道。但是这套在AI时代好像有点行不通,中国大学比印度的大学更能产出大量的AI论文,一大堆中国大学的硕士手里都有顶会论文,国内AI组基本愿意招硕士进去,不像美国主要靠PhD
没问题啊。开源AI肯定笑到最后。
LLM和编程语言差不多。你能想象一个编程语言是闭源的吗?
【引用自 争取多活两年】:
你能想象一个编程语言是闭源的吗?
Oracle Java:在想我的事?
CUDA:那我呢?
看比例啊兄弟。
【引用自 xxxyyy】:
人本身很值钱
但人是个会贬值的东西。只有30以下未婚未育的童子人才比较值钱。
美国AI目前唯一竞争优势是算力。但这个不会领先太久。
所以串串去搞全球石油和矿产大整合是对的,这才是美国未来的立国之本。
当然本老年纪大了,说的时间跨度都是20年起的。
我觉得今后AI也会逐渐越来越细分,有不同功能的细分领域,各个公司会把资源投入到某个细分市场。
【引用自 争取多活两年】:
但人是个会贬值的东西。
Nay。做AI的话优质训练数据才值钱,要的不是专家还是专家脑子里的知识,small position domain比谷歌搜出来或者AI自己generate出来的一千亿个样本都值钱。
你说的对。童子人才值钱是这两年的短暂现象,如同多年N95。
卧槽 作为老登 确实落伍了
个人意见,
未来至少10-20年是AI天下
简单讲结果
中国赢麻了
美国赚翻了
coding machine,对
research,不对
偏偏AI是一个research性质比较强的东西,算法和模型架构上的改进带来的提升你写多少代码都有用。
当然现在很多人跑去蹭大模型搞AI Infra,这些方向还是更需要coding machine的。不过AI进展本身就在代替只会写码的程序员
商业公司在世界上才是大头这要怎么解释
中国人多,聪明人也多,算法好,数据多,基建好,所以AI强
这有什么好解释的。用的也是linux不是windows啊。
美国人搞出来了呀,没有开源而已
【引用自 mrmiywj】:
美国人搞出来了呀
谁搞出来的?如果搞出来了为啥还对于DeepSeek这么震动?
东大如果要赢,早就铺天盖地赢麻了,绝对不可能悄悄的
百度的glm?
哈哈哈哈是
糟糕 我就是只会写码的程序员
【引用自 salvere1214】:
铺天盖地赢麻
其实在cctv节目上面确实是赢麻了,但是坛友不屑于相信
类似的还有,CCTV说中国2025年用电量相当于美国+欧盟+印度+俄罗斯+日本2024年用电量的总和,照样有很多坛友不屑于相信。
是的我觉得是
赶紧学点ai上车吧
简单来说,20年后人能会发现ai能更精准的投放广告
理论和实践结合是最难的事情
到时候看广告的是人还是AI就不好说了
如图所示
IMG_81981170×2532 412 KB
可惜我们生太早,见到这一天也老了
I have never seen so many X’s, Y’s and Z’s on a page.
image977×685 120 KB
这说明LLM就是劳动密集型产业。那你说中国能不赢嘛?
为什么中国人的名都是XYZ开头为主
御三家技术肯定更领先啊,但是价格贵不说,还有各种限制,不如开源模型自己搞来得灵活
老中还是谦虚,捏个数据都不敢搞个大点的,跟烙印CEO的Bilt那83%差远了
首先电方面,中国的优势太大了,特别是完善的电网。其次个人认为软件生态比US这边更适合AI落地,因为有各种巨无霸APP ,相关功能可以在一个软件,或者一家公司内完成。
看不懂标题,“悄悄”在哪里
官话辅音多好像和蒙元入侵有关。感觉XYZ这种送气擦音也挺符合蒙古话的听感的。
【引用自 假节钺】:
见到这一天也老了
可以提前欣赏AI预测的下一个马年新年的中国 (视频需手动切换到中文音轨原声)
【引用自 transformer_88】:
百度的glm
这是啥?
主要还是法律监管开绿灯,能当巨无霸的主因是南山必胜客
汉语拼音的设计问题