泥潭日报 uscardforum · 每日精选

Fields Medalist Timothy Gowers说chatgpt 20秒证明了他要1小时完成的工作,那paper的理论分析部分是不是引导chatgpt做就好了?Vibe papering :thinking:

内容摘要

AI能否加速数学研究引发广泛争议

1. 关键信息

  • AI在数学证明中作用:加速查文献、生成候选证明,辅助人类专家(#20、#24、#48)。
  • 能力边界:普通PhD任务可被替代,顶尖问题仍需人类洞察(#8、#43)。
  • 争议焦点:判断AI答案正确性需人类先掌握知识(#25、#32)。
  • 数学本质:逻辑自洽即可,但真正难点在于原创想法(#16、#30)。

2. 羊毛/优惠信息

3. 最新动态

  • 讨论热度持续:引用Reddit及Mathstodon链接(#44、#62)。
  • 计算机形式化验证:New Scientist报道用计算机验证500页证明(#62)。

4. 争议或不同意见

  • 观点分化:支持派认为可替代平庸PhD(#7、#8),反对派指出错误纠正耗时且不可控(#36、#38)。
  • 信任问题:人类可能丧失独立判断力(#25、#28)。

5. 行动建议

  • 人类主导:聚焦insight与约束AI行为,而非完全依赖AI(#31、#34)。
原始内容
--- 第 1 楼来自 jnnksn 的回复 (2025-11-05 02:35:45 PST) ---

这样写出来的论文还是我自己的论文吗?


不是

0
投票人

https://www.reddit.com/r/singularity/comments/1ol6ag2/fields_medalist_timothy_gowers_tweets_about_how/

投票统计

是的比例65%->61%(45人)->70%(56人)->66%(59)->68%(62)->68%(69)->69%(74)->66%(85)->67(87%)

--- 第 2 楼来自 jnnksn 的回复 (2025-11-05 02:37:48 PST) ---

就算我是研究弦论的,某一天chatgpt给出了我问题的答案,读懂它的理论应该比自己想出来理论简单太多了吧,可是总有一个时间点chatgpt能超过所有博士生的水准?

我把课上教授想了五分钟回答不出来的同学的问题放到chatgpt里,它思考了三分钟给出了100%正确的答案,感觉后背发凉

评论区里学到了一个十几年前的老概念:人类+计算机能打败国际象棋大师或者国际象棋求解器

Centaur Chess Shows Power of Teaming Human and Machine | HuffPost Life.

--- 第 3 楼来自 kaion 的回复 (2025-11-05 03:18:31 PST) ---

终于可以光速证明望月新一是bullshit吗

--- 第 4 楼来自 jnnksn 的回复 (2025-11-05 03:20:25 PST) ---

理论上形式化数学证明的成功率足够高的时候就能知道对错了?话说Google搜到的他那个theory是经常用在geometry and dynamics里,完全不知道dynamics跟数论有什么关系啊

--- 第 5 楼来自 咕的鹦鹉宁 的回复 (2025-11-05 03:25:05 PST) ---

工科需要工程背景的GPT就没戏

或者叫奥特曼投钱在美国大基建

--- 第 6 楼来自 jnnksn 的回复 (2025-11-05 03:26:18 PST) ---

【引用自 咕的鹦鹉宁】:
工科需要工程背景的GPT就没戏
为啥啊,现在应该每个学科都能做了吧

--- 第 7 楼来自 richardfatman 的回复 (2025-11-05 03:27:31 PST) ---

快进到ai替代phd学生

--- 第 8 楼来自 jnnksn 的回复 (2025-11-05 03:32:36 PST) ---

o3的时候Tao就说可以替代平庸的博士生了,被喷了之后火速解释说培养年轻数学家很重要,但让人感觉是没办法了才承认看人下围棋比alpha go有意义一样

现在GPT-5有进步,没publish的model估计已经替代所有博士生了吧?那些本科就发十几篇顶会的除外

--- 第 9 楼来自 咕的鹦鹉宁 的回复 (2025-11-05 03:35:53 PST) ---

我需要十根南极冰芯研究气候变化

GPT能弄出来?

--- 第 10 楼来自 jnnksn 的回复 (2025-11-05 03:37:18 PST) ---

或许现在已经替代了吧,我们努力50年也赶不上这位菲尔兹奖得主,甚至一部分教授也是

--- 第 11 楼来自 richardfatman 的回复 (2025-11-05 03:41:50 PST) ---

以后只有实验学科招phd学生了

直到被机器人取代

--- 第 12 楼来自 jnnksn 的回复 (2025-11-05 03:46:22 PST) ---

以后的数学家是不是比谁读ChatGPT的结果读的快,然后发表类似他们解读佩雷尔曼的证明的那种review paper ?那感觉我学五年也能搞了

--- 第 13 楼来自 richardfatman 的回复 (2025-11-05 04:02:03 PST) ---

那就不需要数学家了,让chatgpt读chatgpt结果

--- 第 14 楼来自 jnnksn 的回复 (2025-11-05 04:15:03 PST) ---

人类只能欣赏ChatGPT的作品了,Reddit上说正确理论多到人类读不完怎么办

--- 第 15 楼来自 richardfatman 的回复 (2025-11-05 05:12:00 PST) ---

这太正常了,如果把数学看作是客观存在的规律的话,本来就不太可能全探索完。

不然就是科学的终结了

--- 第 16 楼来自 Jkil 的回复 (2025-11-05 05:24:09 PST) ---

数学这东西不本来就是编出来的。只要逻辑自洽没什么不可以。

--- 第 17 楼来自 猎户葱 的回复 (2025-11-05 07:43:04 PST) ---

如果一个问题GPT就能搞定,大概是不值得想的问题。

--- 第 18 楼来自 jnnksn 的回复 (2025-11-05 10:47:11 PST) ---

emmmm IMO和code forces都能搞定的话,日常中任务拆解成小步骤不一定比这两个难吧

--- 第 19 楼来自 jnnksn 的回复 (2025-11-05 10:48:33 PST) ---

ChatGPT可以多出几百本书,然后让本科生和PhD看,开讨论班给系里讲 听起来不错的

--- 第 20 楼来自 baimi 的回复 (2025-11-05 10:54:43 PST) ---

看上去chatgpt主要是帮他检索到了一条他不知道已经被证明的引理,相当于加速了查文献的过程

--- 第 21 楼来自 jnnksn 的回复 (2025-11-05 10:56:53 PST) ---

我倾向于这种大佬的工作从引理到证明也不trivial,所以也很复杂了

--- 第 22 楼来自 Shtuka 的回复 (2025-11-05 11:00:32 PST) ---

那只是加速而已,就像从纸质书到电子书加快检索。本质上还没有达到主动证明的地步。至少现在是。

--- 第 23 楼来自 jnnksn 的回复 (2025-11-05 11:03:17 PST) ---

谢谢,所以是人类专家指导下能证明很多新定理?那感觉比PhD做的快太多了,快速学到能看懂文献然后指导它做算了

--- 第 24 楼来自 Shtuka 的回复 (2025-11-05 11:07:21 PST) ---

那需要人去指导它。谁会去呢?指导电脑和指导PHD是2种概念,至少我作为PHD是这样认为的。我尝试过指导GPT推论简单的关于root system的定理,failed。确实能加快很多东西,比如帮我画图,给一些intuition。Again, I’m just a math PHD student knowing nothing about AI.

--- 第 25 楼来自 Forlorner 的回复 (2025-11-05 11:12:20 PST) ---

总有一个临界点

你需要能力去判断gpt给的答案是不是100%正确的

而这个能力的培养不能依赖ai,否则在某个时间你会开始质疑自己的判断到底是不是对的

--- 第 26 楼来自 jnnksn 的回复 (2025-11-05 11:14:51 PST) ---

【引用自 Forlorner】:
你需要能力去判断gpt给的答案是不是100%正确的
感觉只要能像这位菲尔兹奖得住一样能判断引用的source是不是正确的就好,但是像coding这种没有source的就没办法了?

--- 第 27 楼来自 YYssYY 的回复 (2025-11-05 11:17:45 PST) ---

机器人可以啊

--- 第 28 楼来自 Forlorner 的回复 (2025-11-05 11:34:55 PST) ---

我认为可能是一个更深层次的事情

就是当你不断使用ai去推导新的定理的时候,在某个节点你很可能会没办法相信自己的判断,除非你可以完全掌握这些知识

当然,推导过程肯定会加快,但人类需要先理解才能再更进一步

--- 第 29 楼来自 猎户葱 的回复 (2025-11-05 11:44:23 PST) ---

【引用自 Forlorner】:
当然,推导过程肯定会加快,但人类需要先理解才能再更进一步
对。我感觉AI主要能帮我减少一些杂活儿的负担。比如写个bit-masked的fortran程序来算binary rank,或者帮我搭一个Markov Chain 模拟器啥的。

真正的想法还是来自于人。

--- 第 30 楼来自 猎户葱 的回复 (2025-11-05 11:53:28 PST) ---

真正难的地方在于想法,搞技术细节上人肯定是拼不过LLM的。

我一直觉得LLM只是一种高效的 encode/decode 知识的办法,它只是看起来会思考而已。

--- 第 31 楼来自 Forlorner 的回复 (2025-11-05 12:12:51 PST) ---

是的,尤其是当深度使用ai之后

如何更好的约束ai的行为会成为一个议题

ai的产出虽然快,但同时他也不受控

约束力弱

--- 第 32 楼来自 Lightbringer 的回复 (2025-11-05 12:54:24 PST) ---

AI只知道语料库里有的知识,未知的东西只能根据概率random输出。能说对属于瞎猫撞死耗子

--- 第 33 楼来自 哈耶克 的回复 (2025-11-05 14:01:26 PST) ---

数学家一小时能完成的工作llm20秒能完成;但是数学家蹲坑20秒获得的灵感作为本质统计学模型的llm 20年都不一定能生成出来

--- 第 34 楼来自 乔采矶 的回复 (2025-11-05 14:08:30 PST) ---

感觉可以做出来,但要耗费一点时间扔给AI做出来。

但是“感觉可以做出来”这个事情AI是不能帮你做的。

Gowers的情况甚至可能是“感觉可以用这个方法做出来”,那这就更nontrivial了。

--- 第 35 楼来自 Double-Z 的回复 (2025-11-05 14:17:33 PST) ---

动力系统和数论有密不可分的关系, 简单例子比如continued fractions和dynamics on hyperbolic manifolds

--- 第 36 楼来自 zetaw 的回复 (2025-11-05 14:33:06 PST) ---

chatgpt用来做研究就是狗屎,让他算得东西就没算对过几次,我给他纠正错误还嘴硬,必须得慢慢看他写的狗屎证明把错误指出来他才承认错误,一整套下来速度远小于我自己做,给我气坏了。让他查文献我寻思应该没问题了,结果他经常编一些不存在的章节号和equation编号。唯一有用的地方是如果你需要学一些新东西可以问他来入门、文献里有的东西他说的还行。

--- 第 37 楼来自 老瓢虫 的回复 (2025-11-05 15:11:08 PST) ---

查文献的问题2个月前的更新已经解决了吧,现在开会员不会编文章了,都是真的

--- 第 38 楼来自 zetaw 的回复 (2025-11-05 15:51:38 PST) ---

怎么可能,我上个月问他他还刚刚瞎编了reference给我,给我一个不存在的章节名 这种问题还能完全解决的吗,我觉得最多说让问题不要出现的不那么频繁。我的经验是不要问chatgpt任何小众的问题(比如自己研究里遇到的问题)有没有reference,经常会甩出一个莫名其妙的reference。

--- 第 39 楼来自 老瓢虫 的回复 (2025-11-05 16:09:16 PST) ---

奇怪,以前确实一直是假的,但是自从之前的更新过后就全是真的了,我特意为了这个又把会员开了,从那之后再也没有假的了

--- 第 40 楼来自 jnnksn 的回复 (2025-11-05 17:05:05 PST) ---

我跟这个楼主一样,最新版本好多了,起码能做出来课后题了 查reference都是给link,点开看看确实有这些
【引用自 未知】:
Fields Medalist Timothy Gowers说chatgpt 20秒证明了他要1小时完成的工作,那paper的理论分析部分是不是引导chatgpt做就好了?Vibe papering 学术
奇怪,以前确实一直是假的,但是自从之前的更新过后就全是真的了,我特意为了这个又把会员开了,从那之后再也没有假的了

--- 第 41 楼来自 Nokuno 的回复 (2025-11-05 17:08:53 PST) ---

不是chatgpt 用20秒证明了Timothy 1小时的工作,而是Timothy认为这个工作只要自己1小时才会给chatgpt做。

--- 第 42 楼来自 jnnksn 的回复 (2025-11-05 17:09:53 PST) ---

所以普通phd一小时能做完的活扔给chatgpt做更没问题了?

--- 第 43 楼来自 zinechant 的回复 (2025-11-05 17:15:49 PST) ---

【引用自 jnnksn】:
可是总有一个时间点chatgpt能超过所有博士生的水准?
Not necessarily.

--- 第 44 楼来自 jnnksn 的回复 (2025-11-05 17:20:14 PST) ---

为什么啊,AlphaEnvolve解决的那些组合数学题数学家都没做出来,还改进了4 by 4矩阵乘法complexity,Tao的文章说同事也解决了convex optimization的open problem

Mathstodon – 22 Oct 25

Terence Tao (@[email protected])

Yet another recent example of AI assistance in mathematics: my colleague Ernest Ryu here at UCLA was able to solve an open problem in optimization theory (roughly speaking, an asymptotic convergence result for a certain class of ODEs) in large part...

--- 第 45 楼来自 里见光钻 的回复 (2025-11-05 17:24:00 PST) ---

【引用自 richardfatman】:
以后只有实验学科招phd学生了
厂里这叫technicians

--- 第 46 楼来自 richardfatman 的回复 (2025-11-05 17:33:50 PST) ---

学校里也有,不过phd学生工资要低不少吧

最廉价劳动力

--- 第 47 楼来自 mirageY 的回复 (2025-11-05 17:48:04 PST) ---

前两天有一个UCLA的Professor在反复和ChatGPT纠正后以后得到了一个关于Nestrov Accelerated Gradient Point Convergence的证明,总结在这个manuscript里,https://arxiv.org/abs/2510.23513,还挺有意思的。

--- 第 48 楼来自 richardfatman 的回复 (2025-11-05 17:57:50 PST) ---

The authors’ contribution was to filter out incorrect arguments, consolidate a consistent set of valid facts, identify promising lines of reasoning, and determine when a particular approach had been fully explored. ChatGPT’s contribution was to generate candidate arguments, substantially accelerate the exploration of potential avenues, particularly by quickly ruling out unproductive directions, and ultimately produce the final proof argument.

lol 感觉就是大牛在带学生

--- 第 49 楼来自 mirageY 的回复 (2025-11-05 18:38:38 PST) ---

一个24小时保持高效的,情绪稳定的,虽然废话连篇但是不停输出的PhD,想想就可怕 可能唯一的大缺点还是memory不够

--- 第 50 楼来自 jnnksn 的回复 (2025-11-05 18:52:26 PST) ---

【引用自 mirageY】:
可能唯一的大缺点还是memory不够
读过世界上所有文献也算是无限memory了吧

--- 第 51 楼来自 Frankish 的回复 (2025-11-08 17:26:03 PST) ---

【引用自 jnnksn】:
总有一个时间点chatgpt能超过所有博士生的水准?
大部分phd,yes;all phd,might not,应该总有一些outlier在某些领域是不被chatgpt超越的

--- 第 52 楼来自 huaweiping 的回复 (2025-11-08 17:38:52 PST) ---

是这样没错…但是专家也是phd读上来的?

--- 第 53 楼来自 jnnksn 的回复 (2025-11-08 18:49:18 PST) ---

确实,那要是有一天不需要人类指导了,是不是没人读PhD了

--- 第 54 楼来自 huaweiping 的回复 (2025-11-08 18:50:34 PST) ---

不需要人类指导的话那大概就是ai超过人类的那天吧,也无所谓phd什么的了…感觉还是有点遥远

--- 第 55 楼来自 jnnksn 的回复 (2025-11-08 18:52:01 PST) ---

AGI定义不是这个吗,大佬们似乎都觉得五到十年内,那时候我刚工作几年

--- 第 56 楼来自 huaweiping 的回复 (2025-11-08 18:54:10 PST) ---

感觉仅限于商业互吹了…好比听Musk讲的话感觉就是什么都是五到十年

核聚变还一直五十年呢(虽然最近说有突破)

往最坏的说能源问题没解决之前怎么看都不乐观

--- 第 57 楼来自 002 的回复 (2025-11-09 01:09:43 PST) ---

训练的时候不把答案喂给他他肯定想不出来

LLM就是个大号的抄答案机器

--- 第 58 楼来自 jnnksn 的回复 (2025-11-09 01:25:56 PST) ---

老模型上测2025的题应该也比普通PhD分数高吧

--- 第 59 楼来自 002 的回复 (2025-11-09 10:26:42 PST) ---

那肯定啊,搜答案效率杠杠的。好比人眼看log vs grep看log。如果这算“人工智能”的话,grep也可以号称是“人工智能”。

--- 第 60 楼来自 jnnksn 的回复 (2025-11-09 13:04:25 PST) ---

我说只用2024之前数据训练的老模型

--- 第 61 楼来自 002 的回复 (2025-11-09 14:01:43 PST) ---

嗯,我知道的。老答案也有参考价值啊。新题大都是老题derive出来的,老答案可以derive一下用在新题上。

--- 第 62 楼来自 jnnksn 的回复 (2025-11-13 04:51:53 PST) ---

竟然有人在做

New Scientist

The biggest controversy in maths could be settled by a computer

For over a decade, mathematicians have failed to agree whether a 500-page proof is actually correct. Now, translating the proof into a computer-readable form may finally settle the matter

--- 第 63 楼来自 kaion 的回复 (2025-11-13 04:59:01 PST) ---

有没有全文

--- 第 64 楼来自 jnnksn 的回复 (2025-11-13 06:01:54 PST) ---

同问zs

--- 第 65 楼来自 Small-Potato 的回复 (2025-11-13 06:44:25 PST) ---

可控核聚变好像在五十年前就开始说再五十年就能实现了

--- 第 66 楼来自 let 的回复 (2025-11-13 06:57:38 PST) ---

确实可以取代很多工作啊,但是你得有insight啊

--- 第 67 楼来自 jnnksn 的回复 (2025-11-17 12:46:29 PST) ---

话说基本上上人类做的科研也是抄答案?99%是已有方法的堆砌吧,能凑出点新东西就发文章,发明完全创新的概念的屈指可数

--- 第 68 楼来自 002 的回复 (2025-11-17 16:52:16 PST) ---

是呀,绝大多数是没用的灌水文章。真牛逼的东西都自己拿来挣钱了,不会发论文的。

--- 第 69 楼来自 richardfatman 的回复 (2025-11-18 17:02:22 PST) ---

没办法 极有天赋的就那么几个 科研领域就是要靠大浪淘沙把这些人挑出来

--- 第 70 楼来自 jnnksn 的回复 (2026-02-19 19:10:52 PST) ---

经济学家不懂你们还没实现

https://mp.weixin.qq.com/s/9A0tv7Z44GXwg4B7rPf37A

--- 第 71 楼来自 jnnksn 的回复 (2026-04-11 16:58:40 PDT) ---

是的 https://www.newscientist.com/article/2522687-the-secret-project-to-settle-controversial-maths-proof-with-a-computer/ https://www.newscientist.com/article/2522687-the-secret-project-to-settle-controversial-maths-proof-with-a-computer/ Working in secret for more than two years, a group of mathematicians has set out to resolve of the longest and most bitter battles in modern mathematics