发布日期:2026-01-20 14:34点击次数:97

梦晨 发自 凹非寺安阳罐体保温
量子位 | 公众号 QbitAIAI解说数学猜念念,此次来真的了。
OpenAI新模子GPT-5.2 Pro刚刚立解说了谈埃尔德什猜念念。
论证流程经菲尔兹得主陶哲轩考证劝诱,还被评价为“迄今浪漫明确的类后果(AI主要孝顺)”。
这谈题是埃尔德什问题库中的281号,由听说数学保罗·埃尔德什(Paul Erdős)与罗纳德·格雷厄姆(Ronald Graham)于198年共同提议,触及同余掩盖系统与当然密度的层干系。
45年来,这谈题直静静躺在问题库里,恭候解答。
直到226年1月17日,位名叫Neel Somani的研究者把这谈题扔给了GPT-5.2 Pro。
解说只用到GPT 5.2 Pro
埃尔德什问题网站已收录AI证后光果。
整个这个词论证在穷阿德尔整数环上张开,借助哈尔测度和点态遍历定理,联结紧致论证完成了从逐点持续到致持续的跃迁。
按陶哲轩的话说,它是“Furstenberg对应旨趣”的个变体,这是遍历表面与组合数学交叉域的圭臬器用。
但GPT-5.2 Pro的用法又有些不同,它比经常的论证依赖伯克霍夫定理。
研究词真实让陶哲轩印象刻的不是解说法自己安阳罐体保温,而是AI莫得犯错。
让我诧异的是它避了过失,比如限交换或量词章程的不实,这恰是这谈题容易踩的坑。前几代大说话模子简直确定会在这些微妙之处栽跟头。
为了考证这份解说,陶哲轩切身先,把整套遍历论论证翻译成了组合学说话,用哈代-利特尔伍德大不等式替代伯克霍夫定理,再行走了遍沿途。
论断:解说劝诱。
个未的发现正大大盘考GPT-5.2 Pro的解说时,位网名KoishiChan的用户在接洽区抛出了个令东谈主未的发现:
这谈题其实有简便的解法,况且所需的两个定理早在1936年和1966年就还是存在了。
个是达文波特(Harold Davenport)与埃尔德什本东谈主在1936年谐和解说的密度持续定理。
二个是罗杰斯定理,次发表于1966年的哈尔伯斯塔姆-罗斯著《序列》五章。把这两个经典后果拼在起,281号问题简直是平直论。
这就奇怪了。埃尔德什我方即是1936年那篇论文的合著者,而他在198年提议这谈题时,管道保温施工皆莫得领悟到谜底近在目下。
陶哲轩就此事门写邮件请问了法国数学特南鲍姆(Tenenbaum)。
特南鲍姆阐发“只须自恃你提到的两个经典后果(达文波特-埃尔多斯定理和罗杰斯定理),问题就能立即获得科罚”,但他也臆想“问题的表述可能在某个门径被转换过”。不外目前莫得东谈主找到任何其他版块的表述,是以只可按原样处理。
有真谛的是,27年菲拉塞塔、福特、科尼亚金、波默朗斯和余等五位顶在科罚另谈埃尔德什问题时,一样不知谈罗杰斯定理的存在,直到特南鲍姆教导他们才补上了援用。
陶哲轩感触:“罗杰斯定理莫得获得它应有的传播。它只出当今哈尔伯斯塔姆-罗斯那本书里,莫得单发表,文件援用寥寥几。大约这场盘考能让多研究筛法和同余掩盖的东谈主小心到这个后果。”
终当今这谈题有了两份解说:份来自GPT-5.2 Pro的遍历论旅途,份来自KoishiChan挖出的经典文件组合。
陶哲轩阐发两者是“不同的解说”,诚然在观点上有些重复。
奈何评估AI数学的真实告成率
音信传开后,各路AI模子纷繁被拉来交叉考证。
Gemini 3 Pro默示解说莫得问题。另位研究者用GPT-5.2 Pro反复查验论证细节,AI以为唯需要补充严格的地在二步,不错用法图引理绕过遍历论平直完成。
不外陶哲轩指出这里法图引理的向用反:我刚教完研究生测度论,这类过失见得太多了。
随后又阐发其实是对补集愚弄法图引理,向没问题,论证劝诱。
但陶哲轩同期发出了幽静的教导。他写谈:
评估AI器用真实告成率时,大的统计偏差来自浓烈的论说偏差,负面后果简直不会被暴露。
若是某东谈主或某AI公司把器用用在通达问题上但莫得崇,他们莫得能源论说这个负面论断;即使论说了,也不太可能像正面后果那样在酬酢媒体上传播开来。
尽管大多量齐集在难度谱系的简便端,远不成表现中等难度的埃尔德什问题还是参预AI的射程畛域。
他荐了Paata Ivanisvili和Mehmet Mars Seven发起的个开源神志,系统纪录前沿大说话模子在埃尔德什问题上的正面和负面后果。
数据示,这些器用在埃尔德什问题上的真实告成率苟简唯有百分之到二。
但酌量到问题库里有过6谈未解清苦,这个比例仍然意味着批数目可不雅且非粗鄙的AI孝顺。
参考连续:
[1]https://www.erdosproblems.com/forum/thread/281联系人:何经理[2]https://x.com/neelsomani/status/212695714187325745[3]https://mathstodon.xyz/@tao/11591192186528812相关词条:罐体保温