Harness(执行框架)
Harness
大模型只是一颗会思考的"大脑",Harness 就是装在它外面的那套"手脚 + 发动机"——负责真的去点鼠标、读文件、跑工具,还盯着"想一步、做一步、看结果、再想"这台循环机器,直到事干完才喊停。
先打个比方
想象你雇了一个超聪明的军师 🧠,他脑子特别好,但有个毛病:手脚不能动,而且记性只有一句话——你问一句,他答一句,转头就忘,也不会自己起身去办事。
光有这么个军师,啥也干不成。于是你给他配了一套班子:有人帮他翻文件、有人帮他打电话、有人记下刚才聊到哪了,还有个工头盯着进度,一遍遍催"想下一步、去办、回来汇报、再想下一步",直到事真办完才喊收工。
这套班子,就是 Harness(执行框架)。
它到底是什么
记住来源里那句金句:Scaffolding 管"怎么想",Harness 管"怎么跑"。 🏃
大模型本质上就是"文字进、文字出"的一颗大脑(也就是我们说的 LLM)。它自己没有跨次记忆,不会自己循环,更不会动手。
那么——谁真的去点开网页、读取文件、调用 API、运行工具?谁把工具跑出来的结果再喂回给模型?谁来判断"行了,这事干完了,停"?
全是模型外面这套系统干的。这套系统,就叫 Harness。
一句话:模型是大脑,Harness 是手脚 ✋ + 那台"想一步→做一步→看结果→再想一步"的循环发动机 ⚙️。
为什么和你有关
你看到的"AI Agent 自己上网查、自己跑代码、自己一轮轮把任务做完",听起来像模型成精了,其实那股推着它往前跑的劲儿,全来自 Harness。
模型负责"理解和决策",工具(Agent 的"手")负责"行动",而 Harness 就是把这俩串起来、一圈圈转下去的那台机器。没有它,再聪明的模型也只是个只会聊天、动不了的军师。
一句话记住
大模型负责想,Harness 负责跑。 让 AI 从"会说话"变成"会干活"的,就是它。
本文为 AI 整理的科普解读,可能有误,仅供入门参考。
没看懂?让 AI 再讲一遍: