[AI辅助创作]组织、管理、控制论、Agent:它们其实是一回事
一个很小的契机:代理记账
最近我在重新审视公司的财务报表。
因为之前请了代理记账,所以过去我其实并不太关注这些东西。更准确地说,不是不关注,而是看不懂。
在 AI 时代来临之前,对于大部分普通人来说,很多专业服务其实都存在巨大的信息不对称(information asymmetry)。
你无法判断:
- 对方到底专业不专业
- 有没有偷工减料(cut corners)
- 有没有遗漏
- 什么算合理
- 什么算行业惯例
于是你只能基于“身份”去信任。
比如:
- 他是会计
- 他有证
- 他在专业公司上班
所以默认认为:
“他应该比我懂。”
但最近很有意思的一件事情是,我只是简单地借助 AI 去检查了一下财务报表,就发现了很多明显的问题。
比如:
- 科目挂错
- 数据对不上
- 逻辑不一致
- 明显遗漏
我突然意识到:
AI 最先摧毁的,
可能不是“劳动”,
而是“信息不对称”。
它让普通人第一次拥有了“低成本审计能力(low-cost auditing ability)”。
AI 正在摧毁“信息不对称”
过去很多行业真正的护城河(moat),并不是能力本身。
而是:
用户不懂。
包括:
- 财务
- 咨询
- 中介
- 外包
- 代运营
- 某些程序员岗位
- 某些法律服务
过去的问题是:
普通人根本无法验证(verify)这些人的劳动成果。
于是:
只能相信:
- 证书
- 公司
- 身份
- 经验
- 头衔
但 AI 出现之后,一个变化开始发生:
普通人第一次拥有了“低成本交叉验证(cross-validation)能力”。
注意:
AI 不一定让你瞬间成为专家。
但它会让你:
- 开始提出正确的问题
- 开始发现异常
- 开始拥有审计视角(audit mindset)
而一旦用户拥有了这种能力,很多低质量服务就会迅速暴露。
因为他们过去真正的优势,并不是专业能力。
而是:
客户缺乏判断能力。
然后我突然意识到:AI Agent 也会犯同样的问题
最近 AI Agent 领域有一个词我觉得特别有意思:
harness。
最开始我把它理解成:
“如何让 Agent 更稳定”。
但后来我发现:
它本质上其实是在解决:
如何让一个不完全可靠的执行体,
长期稳定地产出符合预期的结果。
因为 AI Agent 并不是一个“完美执行机器”。
它也会:
- drift
- hallucination
- silently fail
- tool misuse
- 假装完成任务
- 无限循环
- 误解目标
- 编造结果
于是:
整个 harness engineering 开始出现。
包括:
- verifier
- rollback
- sandbox
- retry
- evaluator
- observability
- feedback loop
- human approval
这些东西本质上都在解决:
“Agent 偏了怎么办?”
我突然发现:这和公司管理几乎一模一样
然后我意识到一件非常有意思的事情。
公司管理学,其实一直都在研究同一个问题:
“人偏了怎么办?”
员工偷懒怎么办?
目标不一致怎么办?
部门打架怎么办?
信息失真怎么办?
执行跑偏怎么办?
于是:
公司里出现了:
- KPI
- SOP
- 审批流
- QA
- 绩效
- 权限系统
- 汇报链
- 内控(internal control)
- 审计系统
然后我发现:
这些东西和 Agent 世界里的概念,几乎一一对应。
| 公司管理 | Agent 系统 |
|---|---|
| KPI | reward signal |
| SOP | workflow |
| 审批流 | human approval |
| QA | verification |
| 审计 | observability |
| 权限控制 | sandbox |
| 绩效考核 | evaluator |
| 中层管理 | orchestrator |
| 复盘 | feedback loop |
我开始意识到:
管理学、组织学、控制论、Agent Engineering,
可能本来就在研究同一个东西。
控制论、组织学、Agent,正在融合
控制论(cybernetics)最开始研究的是:
- 反馈(feedback)
- 调节(regulation)
- 稳定(stability)
- 目标维持(goal maintenance)
比如:
- 恒温器
- 导弹
- 自动驾驶
- 工业控制系统
核心问题其实是:
“系统偏了怎么办?”
后来管理学研究的是:
“人偏了怎么办?”
而现在 Agent Engineering 研究的是:
“AI 偏了怎么办?”
这三者看似不同。
但它们其实都在研究:
如何约束一个具有自主性(autonomy)的系统,
在不确定环境(uncertain environment)下,
持续地产出符合目标的结果。
AI Agent 最大的特殊性
传统机器的问题是:
没有自主性。
传统人的问题是:
自主性太强。
但 AI Agent 卡在中间。
它同时具备:
- 一定的自主性
- 一定的创造性
- 一定的不可预测性
- 一定的可编程性
于是:
它既不能完全用“传统软件工程”的方式管理。
也不能完全用“人类组织管理”的方式管理。
所以:
一个新的领域可能正在出现。
它既像:
- 控制论
- 系统工程
- 组织学
- 管理学
- 博弈论(game theory)
又和它们都不完全一样。
真正商业化的 AI,核心不是 Intelligence
我现在越来越觉得:
很多人低估了 AI 真正难的问题。
大家都在讨论:
- 模型聪不聪明
- 能不能写代码
- 能不能调用工具
- 上下文多长
- 多 Agent workflow
但真正进入生产环境(production environment)之后,
核心问题会迅速变成:
- 是否稳定
- 是否可恢复(recoverable)
- 是否可观测(observable)
- 是否可审计(auditable)
- 是否长期可靠(reliable)
- 是否抗漂移(drift-resistant)
现实世界其实不缺:
“偶尔很聪明”的系统。
现实世界真正缺的是:
“长期稳定不作妖”的系统。
所以:
真正商业化(commercializable)的 AI,
核心不是:
intelligence。
而是:
controllability。
一个更恐怖的想法
后来我甚至开始产生一个更奇怪的想法。
人类公司,
会不会本身就是一种“生物 Agent 系统”?
公司:
- 有目标
- 有 memory
- 有 hierarchy
- 有 feedback
- 有 reward
- 有 resource acquisition
- 有 self-preservation
甚至:
它会利用“人类”来维持自己的存在。
从这个角度来看:
公司本身,
就像一种“超个体(superorganism)”。
我开始重新理解“系统”
我发现自己最近越来越少关注:
“功能能不能实现”。
而越来越关注:
- 系统是否长期稳定
- 是否可恢复
- 是否可审计
- 是否可观测
- 是否能抗低质量执行
- 是否能抗 Agent 漂移
- 是否能降低错误面(error surface)
包括:
- GhostVM
- AI Agent
- workflow
- 组织管理
- 自动化系统
它们背后,
似乎都开始指向同一个问题:
如何让一个具有自主性的系统,
长期稳定地运行。
而我感觉:
这可能只是一个开始。
AI 创作声明
本文的核心观点、案例素材和最终判断由作者提供;AI 参与了文字整理、结构梳理和表达润色。文章发布前已由作者审核确认。