Fields Medalist Timothy Gowers说chatgpt 20秒证明了他要1小时完成的工作,那paper的理论分析部分是不是引导chatgpt做就好了?Vibe papering :thinking:
AI能否加速数学研究引发广泛争议
1. 关键信息
- AI在数学证明中作用:加速查文献、生成候选证明,辅助人类专家(#20、#24、#48)。
- 能力边界:普通PhD任务可被替代,顶尖问题仍需人类洞察(#8、#43)。
- 争议焦点:判断AI答案正确性需人类先掌握知识(#25、#32)。
- 数学本质:逻辑自洽即可,但真正难点在于原创想法(#16、#30)。
2. 羊毛/优惠信息
无
3. 最新动态
- 讨论热度持续:引用Reddit及Mathstodon链接(#44、#62)。
- 计算机形式化验证:New Scientist报道用计算机验证500页证明(#62)。
4. 争议或不同意见
- 观点分化:支持派认为可替代平庸PhD(#7、#8),反对派指出错误纠正耗时且不可控(#36、#38)。
- 信任问题:人类可能丧失独立判断力(#25、#28)。
5. 行动建议
- 人类主导:聚焦insight与约束AI行为,而非完全依赖AI(#31、#34)。
这样写出来的论文还是我自己的论文吗?
是
不是
0
投票人
https://www.reddit.com/r/singularity/comments/1ol6ag2/fields_medalist_timothy_gowers_tweets_about_how/
投票统计
是的比例65%->61%(45人)->70%(56人)->66%(59)->68%(62)->68%(69)->69%(74)->66%(85)->67(87%)
就算我是研究弦论的,某一天chatgpt给出了我问题的答案,读懂它的理论应该比自己想出来理论简单太多了吧,可是总有一个时间点chatgpt能超过所有博士生的水准?
我把课上教授想了五分钟回答不出来的同学的问题放到chatgpt里,它思考了三分钟给出了100%正确的答案,感觉后背发凉
评论区里学到了一个十几年前的老概念:人类+计算机能打败国际象棋大师或者国际象棋求解器
Centaur Chess Shows Power of Teaming Human and Machine | HuffPost Life.
终于可以光速证明望月新一是bullshit吗
理论上形式化数学证明的成功率足够高的时候就能知道对错了?话说Google搜到的他那个theory是经常用在geometry and dynamics里,完全不知道dynamics跟数论有什么关系啊
工科需要工程背景的GPT就没戏
或者叫奥特曼投钱在美国大基建
【引用自 咕的鹦鹉宁】:
工科需要工程背景的GPT就没戏
为啥啊,现在应该每个学科都能做了吧
快进到ai替代phd学生
o3的时候Tao就说可以替代平庸的博士生了,被喷了之后火速解释说培养年轻数学家很重要,但让人感觉是没办法了才承认看人下围棋比alpha go有意义一样
现在GPT-5有进步,没publish的model估计已经替代所有博士生了吧?那些本科就发十几篇顶会的除外
我需要十根南极冰芯研究气候变化
GPT能弄出来?
或许现在已经替代了吧,我们努力50年也赶不上这位菲尔兹奖得主,甚至一部分教授也是
以后只有实验学科招phd学生了
直到被机器人取代
以后的数学家是不是比谁读ChatGPT的结果读的快,然后发表类似他们解读佩雷尔曼的证明的那种review paper ?那感觉我学五年也能搞了
那就不需要数学家了,让chatgpt读chatgpt结果
人类只能欣赏ChatGPT的作品了,Reddit上说正确理论多到人类读不完怎么办
这太正常了,如果把数学看作是客观存在的规律的话,本来就不太可能全探索完。
不然就是科学的终结了
数学这东西不本来就是编出来的。只要逻辑自洽没什么不可以。
如果一个问题GPT就能搞定,大概是不值得想的问题。
emmmm IMO和code forces都能搞定的话,日常中任务拆解成小步骤不一定比这两个难吧
ChatGPT可以多出几百本书,然后让本科生和PhD看,开讨论班给系里讲 听起来不错的
看上去chatgpt主要是帮他检索到了一条他不知道已经被证明的引理,相当于加速了查文献的过程
我倾向于这种大佬的工作从引理到证明也不trivial,所以也很复杂了
那只是加速而已,就像从纸质书到电子书加快检索。本质上还没有达到主动证明的地步。至少现在是。
谢谢,所以是人类专家指导下能证明很多新定理?那感觉比PhD做的快太多了,快速学到能看懂文献然后指导它做算了
那需要人去指导它。谁会去呢?指导电脑和指导PHD是2种概念,至少我作为PHD是这样认为的。我尝试过指导GPT推论简单的关于root system的定理,failed。确实能加快很多东西,比如帮我画图,给一些intuition。Again, I’m just a math PHD student knowing nothing about AI.
总有一个临界点
你需要能力去判断gpt给的答案是不是100%正确的
而这个能力的培养不能依赖ai,否则在某个时间你会开始质疑自己的判断到底是不是对的
【引用自 Forlorner】:
你需要能力去判断gpt给的答案是不是100%正确的
感觉只要能像这位菲尔兹奖得住一样能判断引用的source是不是正确的就好,但是像coding这种没有source的就没办法了?
机器人可以啊
我认为可能是一个更深层次的事情
就是当你不断使用ai去推导新的定理的时候,在某个节点你很可能会没办法相信自己的判断,除非你可以完全掌握这些知识
当然,推导过程肯定会加快,但人类需要先理解才能再更进一步
【引用自 Forlorner】:
当然,推导过程肯定会加快,但人类需要先理解才能再更进一步
对。我感觉AI主要能帮我减少一些杂活儿的负担。比如写个bit-masked的fortran程序来算binary rank,或者帮我搭一个Markov Chain 模拟器啥的。
真正的想法还是来自于人。
真正难的地方在于想法,搞技术细节上人肯定是拼不过LLM的。
我一直觉得LLM只是一种高效的 encode/decode 知识的办法,它只是看起来会思考而已。
是的,尤其是当深度使用ai之后
如何更好的约束ai的行为会成为一个议题
ai的产出虽然快,但同时他也不受控
约束力弱
AI只知道语料库里有的知识,未知的东西只能根据概率random输出。能说对属于瞎猫撞死耗子
数学家一小时能完成的工作llm20秒能完成;但是数学家蹲坑20秒获得的灵感作为本质统计学模型的llm 20年都不一定能生成出来
感觉可以做出来,但要耗费一点时间扔给AI做出来。
但是“感觉可以做出来”这个事情AI是不能帮你做的。
Gowers的情况甚至可能是“感觉可以用这个方法做出来”,那这就更nontrivial了。
动力系统和数论有密不可分的关系, 简单例子比如continued fractions和dynamics on hyperbolic manifolds
chatgpt用来做研究就是狗屎,让他算得东西就没算对过几次,我给他纠正错误还嘴硬,必须得慢慢看他写的狗屎证明把错误指出来他才承认错误,一整套下来速度远小于我自己做,给我气坏了。让他查文献我寻思应该没问题了,结果他经常编一些不存在的章节号和equation编号。唯一有用的地方是如果你需要学一些新东西可以问他来入门、文献里有的东西他说的还行。
查文献的问题2个月前的更新已经解决了吧,现在开会员不会编文章了,都是真的
怎么可能,我上个月问他他还刚刚瞎编了reference给我,给我一个不存在的章节名 这种问题还能完全解决的吗,我觉得最多说让问题不要出现的不那么频繁。我的经验是不要问chatgpt任何小众的问题(比如自己研究里遇到的问题)有没有reference,经常会甩出一个莫名其妙的reference。
奇怪,以前确实一直是假的,但是自从之前的更新过后就全是真的了,我特意为了这个又把会员开了,从那之后再也没有假的了
我跟这个楼主一样,最新版本好多了,起码能做出来课后题了 查reference都是给link,点开看看确实有这些
【引用自 未知】:
Fields Medalist Timothy Gowers说chatgpt 20秒证明了他要1小时完成的工作,那paper的理论分析部分是不是引导chatgpt做就好了?Vibe papering 学术
奇怪,以前确实一直是假的,但是自从之前的更新过后就全是真的了,我特意为了这个又把会员开了,从那之后再也没有假的了
不是chatgpt 用20秒证明了Timothy 1小时的工作,而是Timothy认为这个工作只要自己1小时才会给chatgpt做。
所以普通phd一小时能做完的活扔给chatgpt做更没问题了?
【引用自 jnnksn】:
可是总有一个时间点chatgpt能超过所有博士生的水准?
Not necessarily.
为什么啊,AlphaEnvolve解决的那些组合数学题数学家都没做出来,还改进了4 by 4矩阵乘法complexity,Tao的文章说同事也解决了convex optimization的open problem
Mathstodon – 22 Oct 25
Terence Tao (@[email protected])
Yet another recent example of AI assistance in mathematics: my colleague Ernest Ryu here at UCLA was able to solve an open problem in optimization theory (roughly speaking, an asymptotic convergence result for a certain class of ODEs) in large part...
【引用自 richardfatman】:
以后只有实验学科招phd学生了
厂里这叫technicians
学校里也有,不过phd学生工资要低不少吧
最廉价劳动力
前两天有一个UCLA的Professor在反复和ChatGPT纠正后以后得到了一个关于Nestrov Accelerated Gradient Point Convergence的证明,总结在这个manuscript里,https://arxiv.org/abs/2510.23513,还挺有意思的。
The authors’ contribution was to filter out incorrect arguments, consolidate a consistent set of valid facts, identify promising lines of reasoning, and determine when a particular approach had been fully explored. ChatGPT’s contribution was to generate candidate arguments, substantially accelerate the exploration of potential avenues, particularly by quickly ruling out unproductive directions, and ultimately produce the final proof argument.
lol 感觉就是大牛在带学生
一个24小时保持高效的,情绪稳定的,虽然废话连篇但是不停输出的PhD,想想就可怕 可能唯一的大缺点还是memory不够
【引用自 mirageY】:
可能唯一的大缺点还是memory不够
读过世界上所有文献也算是无限memory了吧
【引用自 jnnksn】:
总有一个时间点chatgpt能超过所有博士生的水准?
大部分phd,yes;all phd,might not,应该总有一些outlier在某些领域是不被chatgpt超越的
是这样没错…但是专家也是phd读上来的?
确实,那要是有一天不需要人类指导了,是不是没人读PhD了
不需要人类指导的话那大概就是ai超过人类的那天吧,也无所谓phd什么的了…感觉还是有点遥远
AGI定义不是这个吗,大佬们似乎都觉得五到十年内,那时候我刚工作几年
感觉仅限于商业互吹了…好比听Musk讲的话感觉就是什么都是五到十年
核聚变还一直五十年呢(虽然最近说有突破)
往最坏的说能源问题没解决之前怎么看都不乐观
训练的时候不把答案喂给他他肯定想不出来
LLM就是个大号的抄答案机器
老模型上测2025的题应该也比普通PhD分数高吧
那肯定啊,搜答案效率杠杠的。好比人眼看log vs grep看log。如果这算“人工智能”的话,grep也可以号称是“人工智能”。
我说只用2024之前数据训练的老模型
嗯,我知道的。老答案也有参考价值啊。新题大都是老题derive出来的,老答案可以derive一下用在新题上。
竟然有人在做
New Scientist
The biggest controversy in maths could be settled by a computer
For over a decade, mathematicians have failed to agree whether a 500-page proof is actually correct. Now, translating the proof into a computer-readable form may finally settle the matter
有没有全文
同问zs
可控核聚变好像在五十年前就开始说再五十年就能实现了
确实可以取代很多工作啊,但是你得有insight啊
话说基本上上人类做的科研也是抄答案?99%是已有方法的堆砌吧,能凑出点新东西就发文章,发明完全创新的概念的屈指可数
是呀,绝大多数是没用的灌水文章。真牛逼的东西都自己拿来挣钱了,不会发论文的。
没办法 极有天赋的就那么几个 科研领域就是要靠大浪淘沙把这些人挑出来
经济学家不懂你们还没实现
https://mp.weixin.qq.com/s/9A0tv7Z44GXwg4B7rPf37A
是的 https://www.newscientist.com/article/2522687-the-secret-project-to-settle-controversial-maths-proof-with-a-computer/ https://www.newscientist.com/article/2522687-the-secret-project-to-settle-controversial-maths-proof-with-a-computer/ Working in secret for more than two years, a group of mathematicians has set out to resolve of the longest and most bitter battles in modern mathematics