Recoleta Item Note

The AI that taught itself: Researchers show how AI can learn what it never knew

这项研究表明，AI 不必完全受限于见过多少训练数据；只要给它一个明确、可验证的外部反馈回路，它就能在极低资源领域显著提升表现。作者用一种冷门编程语言 Idris 证明了这一点，把 GPT-5 的解题成功率从很低的水平大幅推高。

llm-code-generationcompiler-feedbacklow-resource-learningiterative-refinementprogram-synthesis

Summary

研究者选择了极其冷门的编程语言 Idris 作为测试对象；其公开代码仓库约 2,000 个，而 Python 超过 2,400 万，数据量相差约 10,000 倍。
他们让 GPT-5 在 Exercism 上完成 56 道 Idris 编程练习，先测原始能力，再比较多种增强方式。
简单提供文档、错误手册和参考资料只能带来有限提升，说明“多给点说明材料”不是关键突破口。
核心机制是 compiler feedback loop：把编译器返回的精确报错信息直接喂回模型，让它针对错误修复后重新提交；每题最多迭代 20 次。
用最简单的话说，这个方法就是：让 AI 先尝试，再把机器能客观指出的错误逐轮告诉它，直到它改对为止。

Built with Recoleta

Turn arXiv, Hacker News, OpenReview, Hugging Face Daily Papers, and RSS into local Markdown, Obsidian notes, Telegram digests, and a public site.