大模型基础

Test-Time Compute（推理时计算）

Test-Time Compute

让 AI 答题时多花点时间「想一想、打个草稿、验算一遍」，而不是凭直觉脱口而出，答案就更靠谱。⏳

先打个比方

考试遇到一道难题，有两种学霸。一种凭直觉「秒选」，写完就交卷；另一种会先在草稿纸上列步骤、试几种思路、再回头验算一遍。后者明显更不容易翻车。🧮

Test-Time Compute 说的就是这件事：让 AI 在「答题的当下」多花点时间、多用点脑力，而不是张口就来。

过去想让 AI 变强，主要靠「训练」——也就是平时拼命刷题、把模型做得更大、喂更多数据。这相当于花在「考前复习」上的功夫。

而 Test-Time Compute 是另一条路：在 AI 回答（推理）的那一刻，让它多想几步、多试几个方案、反复检查再给结论。说白了，就是用「当场多烧的那点算力」，换一个更准的答案。⚙️

「Test-Time」就是「答题时」，「Compute」就是「算力/动脑」，连起来就是答题当场多动脑。

现在新闻里天天说的「推理模型」（o1、DeepSeek-R1 这些），核心法宝之一就是它。它们答题前会先「想一大段」（你能感觉到它在打草稿），这就是在多花推理时计算。

所以你会发现：这类模型回答更慢、更贵，但难题答得更准。慢不是卡了，是它真在「验算」。和单纯把模型做大不一样，这是「现场多想」换准确率。

让 AI 别急着答，给它时间打草稿、验算，答案就更靠谱——慢一点，但对得多。✅

本文为 AI 整理的科普解读，可能有误，仅供入门参考。

没看懂？让 AI 再讲一遍：

延伸阅读：可在公众号「数字生命卡兹克」「Datawhale」搜同名概念的科普文章。