造物栈

文章

造物栈为什么要分工:ChatGPT 做军师,Codex 写代码,newtype-os 打磨内容

ChatGPT 做军师,Codex 写代码,newtype-os 打磨内容——这不是理论推演,而是一次真实项目推进后得出来的结论。

造物栈为什么要分工:ChatGPT 做军师,Codex 写代码,newtype-os 打磨内容

前段时间,造物栈推进到第一篇文章和标签页功能时,出现了一个之前没预料到的问题。

内容打磨、代码修改、项目判断——这三件事混在一起之后,效率没有变高,反而变乱了。

具体表现很直接:第一篇文章在打磨过程中,风格反复摇摆。ChatGPT 直接大段改写正文,文章变硬了,读起来不像同一个人写的。description 一度写成了内部项目说明,读者看起来会很不自然。后来我也意识到,用 PowerShell 大段替换正文,本质上是把表达问题当成工程问题处理。结果并不理想。还有一次,文章备份被放进了 src/content/posts,Astro 差点把旧备份当成正式内容读取。

这些问题的共性不是某个人做错了什么,而是工具没有放到合适的位置

这篇文章不是工具评测,也不是教你选哪个 AI 更好。它是一次真实项目推进后形成的分工规则记录。

不是所有任务都适合同一个 AI

回头看,问题的根源很简单:我们试图用一个工具做所有事。

内容、代码、判断,是三类性质完全不同的任务。内容追求表达准确、语气自然,有人的温度。代码追求逻辑正确、可执行、不报错。判断追求经验、优先级和边界感。

这三件事的处理方式不一样,验收标准不一样,需要的工具也不一样。混在一起的结果是:文章像说明书,内容修改被脚本化,项目推进缺少清晰的方向判断。

所以不是 AI 不行,而是分配方式有问题。找到每个工具适合做的事,比找”最强”的工具更重要。

ChatGPT 适合做军师,不是写手也不是程序员

在造物栈的协作体系里,ChatGPT 被放在了项目军师的位置。

这意味着它更擅长:方向判断、任务拆解、边界设置、验收标准制定、工具选择、风险提醒。什么时候继续推进、停下来检查、交给 Codex、交给 newtype-os——这些判断类的工作更适合 ChatGPT。

它不适合做的事也很清楚:不负责全部代码,不负责最终文章质量,更不能替代用户的判断。

把 ChatGPT 放在军师位置后,最明显的变化是:任务书更清楚了,边界更明确了,验收标准不再模棱两可。它不再大段改文章正文,而是在更高层面把控方向和风险。

Codex 适合做工程执行,但需要清晰的边界

Codex 在造物栈里负责工程执行

具体来说:改文件、写代码、创建页面、修改路由、运行 build、跑状态检查。这些任务有一个共同特点——有明确的对错标准:代码能跑通就是能跑通,build 不报错就是不报错。

之前把标签页功能交给 Codex 后,执行确实更稳定。任务书给了,边界划清楚了,验收标准说清楚了,Codex 产出质量很高,build 和状态检查都一次通过。

但这里面有一个前提:Codex 需要清楚的任务书、边界和验收标准。目标不清楚的时候,不能让 Codex 自由发挥。这就像给一个工程师下达需求——越模糊,结果越不可控。

newtype-os 适合打磨内容,因为文章质量不是工程问题

newtype-os 在造物栈里的角色是内容质量打磨

这个定位是后来才明确的。之前我们尝试过用 ChatGPT 直接改文章,也用 PowerShell 做过大段替换,效果都不好。原因在于:文章质量不是工程问题,不能靠脚本替换解决。

newtype-os 擅长做的事包括:去 AI 腔、压缩表达、调整语气、找重复、优化标题和摘要——让文章更像人说话。它不做代码修改,不做工程判断,只聚焦在表达层面。

把内容质量明确交给 newtype-os 之后,文章打磨不再是”谁有空谁改”的状态,而是有了专门的工具和流程。

用户必须保留最终判断

这个原则贯穿造物栈所有协作规则。

AI 可以放大能力,但不能替代判断。工具只是放大器,不是方向盘。方向盘必须在人手里。

项目值不值得做,文章像不像自己,风格对不对,优先级怎么排——这些最终由用户决定。ChatGPT 可以给建议,Codex 可以执行代码,newtype-os 可以优化表达,但按下确认键的那个人,始终是用户自己。

这件事看起来是常识,但在实际推进中很容易被忽略。当一个 AI 工具太顺手的时候,人会不自觉地减少思考,默认接受 AI 的输出。造物栈的规则明确了这一点:AI 是协作方,不是决策方。

这次分工留下的规则

经过这一轮磨合,造物栈形成了几条明确的分工规则:

  1. 内容类任务优先 newtype-os——去 AI 腔、调整语气、优化表达
  2. 代码类任务优先 Codex——改文件、写代码、运行 build
  3. ChatGPT 做任务书、边界、验收和工具判断——不直接改正文,不代替用户做决定
  4. 用户做最终判断——不把确认权交给任何 AI 工具
  5. 文章备份不能放进 content/posts——这是一个具体的教训,备份和正式内容必须物理隔离

这些规则不是凭空想出来的,每一条背后都有一个”这样做不行”的真实经历。它们可能不适用于所有项目,但对造物栈来说,这套分工是一个已经被验证过的协作基础。

分工也是一种生产资料

最后想说的是:造物栈不只是沉淀文章和代码,也在沉淀流程、规则和协作方式。

一套清晰的分工规则,本身就是生产资料。以后做新专栏、新功能、新项目,不需要从头摸索每个工具该干什么,直接套用已经验证过的分工体系就行。这套规则可以反复使用,而且会随着项目推进不断迭代。

不是所有项目都需要这套分工。但如果你也在用多个 AI 工具做项目,遇到”工具混在一起反而乱了”的情况,不妨试试把它们放到各自适合的位置。不是所有工具都适合内容,不是所有工具都适合代码,也不是所有工具都适合做判断。

放在正确位置,比堆叠更多工具更重要。