一个很小的契机:代理记账

最近我在重新审视公司的财务报表。

因为之前请了代理记账,所以过去我其实并不太关注这些东西。更准确地说,不是不关注,而是看不懂。

在 AI 时代来临之前,对于大部分普通人来说,很多专业服务其实都存在巨大的信息不对称(information asymmetry)。

你无法判断:

  • 对方到底专业不专业
  • 有没有偷工减料(cut corners)
  • 有没有遗漏
  • 什么算合理
  • 什么算行业惯例

于是你只能基于“身份”去信任。

比如:

  • 他是会计
  • 他有证
  • 他在专业公司上班

所以默认认为:

“他应该比我懂。”

但最近很有意思的一件事情是,我只是简单地借助 AI 去检查了一下财务报表,就发现了很多明显的问题。

比如:

  • 科目挂错
  • 数据对不上
  • 逻辑不一致
  • 明显遗漏

我突然意识到:

AI 最先摧毁的,
可能不是“劳动”,
而是“信息不对称”。

它让普通人第一次拥有了“低成本审计能力(low-cost auditing ability)”。


AI 正在摧毁“信息不对称”

过去很多行业真正的护城河(moat),并不是能力本身。

而是:

用户不懂。

包括:

  • 财务
  • 咨询
  • 中介
  • 外包
  • 代运营
  • 某些程序员岗位
  • 某些法律服务

过去的问题是:

普通人根本无法验证(verify)这些人的劳动成果。

于是:

只能相信:

  • 证书
  • 公司
  • 身份
  • 经验
  • 头衔

但 AI 出现之后,一个变化开始发生:

普通人第一次拥有了“低成本交叉验证(cross-validation)能力”。

注意:

AI 不一定让你瞬间成为专家。

但它会让你:

  • 开始提出正确的问题
  • 开始发现异常
  • 开始拥有审计视角(audit mindset)

而一旦用户拥有了这种能力,很多低质量服务就会迅速暴露。

因为他们过去真正的优势,并不是专业能力。

而是:

客户缺乏判断能力。


然后我突然意识到:AI Agent 也会犯同样的问题

最近 AI Agent 领域有一个词我觉得特别有意思:

harness。

最开始我把它理解成:

“如何让 Agent 更稳定”。

但后来我发现:

它本质上其实是在解决:

如何让一个不完全可靠的执行体,
长期稳定地产出符合预期的结果。

因为 AI Agent 并不是一个“完美执行机器”。

它也会:

  • drift
  • hallucination
  • silently fail
  • tool misuse
  • 假装完成任务
  • 无限循环
  • 误解目标
  • 编造结果

于是:

整个 harness engineering 开始出现。

包括:

  • verifier
  • rollback
  • sandbox
  • retry
  • evaluator
  • observability
  • feedback loop
  • human approval

这些东西本质上都在解决:

“Agent 偏了怎么办?”


我突然发现:这和公司管理几乎一模一样

然后我意识到一件非常有意思的事情。

公司管理学,其实一直都在研究同一个问题:

“人偏了怎么办?”

员工偷懒怎么办?
目标不一致怎么办?
部门打架怎么办?
信息失真怎么办?
执行跑偏怎么办?

于是:

公司里出现了:

  • KPI
  • SOP
  • 审批流
  • QA
  • 绩效
  • 权限系统
  • 汇报链
  • 内控(internal control)
  • 审计系统

然后我发现:

这些东西和 Agent 世界里的概念,几乎一一对应。

公司管理 Agent 系统
KPI reward signal
SOP workflow
审批流 human approval
QA verification
审计 observability
权限控制 sandbox
绩效考核 evaluator
中层管理 orchestrator
复盘 feedback loop

我开始意识到:

管理学、组织学、控制论、Agent Engineering,
可能本来就在研究同一个东西。


控制论、组织学、Agent,正在融合

控制论(cybernetics)最开始研究的是:

  • 反馈(feedback)
  • 调节(regulation)
  • 稳定(stability)
  • 目标维持(goal maintenance)

比如:

  • 恒温器
  • 导弹
  • 自动驾驶
  • 工业控制系统

核心问题其实是:

“系统偏了怎么办?”

后来管理学研究的是:

“人偏了怎么办?”

而现在 Agent Engineering 研究的是:

“AI 偏了怎么办?”

这三者看似不同。

但它们其实都在研究:

如何约束一个具有自主性(autonomy)的系统,
在不确定环境(uncertain environment)下,
持续地产出符合目标的结果。


AI Agent 最大的特殊性

传统机器的问题是:

没有自主性。

传统人的问题是:

自主性太强。

但 AI Agent 卡在中间。

它同时具备:

  • 一定的自主性
  • 一定的创造性
  • 一定的不可预测性
  • 一定的可编程性

于是:

它既不能完全用“传统软件工程”的方式管理。

也不能完全用“人类组织管理”的方式管理。

所以:

一个新的领域可能正在出现。

它既像:

  • 控制论
  • 系统工程
  • 组织学
  • 管理学
  • 博弈论(game theory)

又和它们都不完全一样。


真正商业化的 AI,核心不是 Intelligence

我现在越来越觉得:

很多人低估了 AI 真正难的问题。

大家都在讨论:

  • 模型聪不聪明
  • 能不能写代码
  • 能不能调用工具
  • 上下文多长
  • 多 Agent workflow

但真正进入生产环境(production environment)之后,

核心问题会迅速变成:

  • 是否稳定
  • 是否可恢复(recoverable)
  • 是否可观测(observable)
  • 是否可审计(auditable)
  • 是否长期可靠(reliable)
  • 是否抗漂移(drift-resistant)

现实世界其实不缺:

“偶尔很聪明”的系统。

现实世界真正缺的是:

“长期稳定不作妖”的系统。

所以:

真正商业化(commercializable)的 AI,

核心不是:

intelligence。

而是:

controllability。


一个更恐怖的想法

后来我甚至开始产生一个更奇怪的想法。

人类公司,

会不会本身就是一种“生物 Agent 系统”?

公司:

  • 有目标
  • 有 memory
  • 有 hierarchy
  • 有 feedback
  • 有 reward
  • 有 resource acquisition
  • 有 self-preservation

甚至:

它会利用“人类”来维持自己的存在。

从这个角度来看:

公司本身,
就像一种“超个体(superorganism)”。


我开始重新理解“系统”

我发现自己最近越来越少关注:

“功能能不能实现”。

而越来越关注:

  • 系统是否长期稳定
  • 是否可恢复
  • 是否可审计
  • 是否可观测
  • 是否能抗低质量执行
  • 是否能抗 Agent 漂移
  • 是否能降低错误面(error surface)

包括:

  • GhostVM
  • AI Agent
  • workflow
  • 组织管理
  • 自动化系统

它们背后,
似乎都开始指向同一个问题:

如何让一个具有自主性的系统,
长期稳定地运行。

而我感觉:

这可能只是一个开始。


AI 创作声明

本文的核心观点、案例素材和最终判断由作者提供;AI 参与了文字整理、结构梳理和表达润色。文章发布前已由作者审核确认。