数值策划 Agent

parents: Economy Agent

form: Business Plan

status: 进行中

Q: 你在做什么？
- 游戏数值策划 agent，更快更好更便宜的完成符合用户要求的数值工作
Q: 你的用户是谁？
- 游戏类型：重度商业化的免费游戏，经济数值比较复杂
- 早期目标用户：有经验的主策 + 没有数值策划的小团队
  - 主策知道要什么体验，但没人能把体验转化成精确配置
Q: 解决了什么问题？
- 用更低的成本、更短的时间、更高的准确性完成数值策划的执行工作
- 成本（对比劳动力成本）
  - 员工的薪资成本显著高于 agent 成本，Agent 365 天 24 小时在线打工
  - 免费游戏的需求大，足够好的数值策划不够多。招聘花时间（面试），花钱（买简历、猎头），可能招错人，人员还有流失风险
  - 大量数值策划工作是不饱和的，工作量是一波一波的，不是平均的。Agent 可以按需付费，用多少给多少。
- 数值策划问题
  - 速度：传统数值策划从头算一遍数值需要数天到数周，做一版重大改动需要数天到一周，做一个微调需要数分钟到数小时。而 Agent 可以把这些时间压缩到几小时，几十分钟，几分钟。
    - 数值策划慢在哪？
      - 数值策划的工具箱是 excel+vba 或 python，不是一个一站式工具，不是专门为游戏经济模拟而设计的工具，管理、调整起来就会比较麻烦
      - 无法建立一个从“设计目标”到“最终结果”的清晰、可靠、可验证的闭环。需要在混乱的 Excel 文件里进行手工统计和验证，再进行额外的沟通
      - 大一点的项目需要多个数值策划一起计算，而 excel 的版本管理是噩梦，这中间有很多沟通成本和时间成本
    - Agent 快在哪？
      - 新的数值工作模式，目标-模拟-验证，以及一个专门为游戏领域模型而设计的一站式工具
      - 省去多个数值策划之间沟通、等待时间
  - 准确度：传统数值策划几乎很难为多个不同用户画像都分别计算一遍详细体验，只能用一些统计和近似的方式，做一个大概估算。这在很多时候是不准确的。
  - 更准确的满足要求
    - 沟通：游戏体验的最终负责人和数值策划沟通时，需要花比较大力气对齐。因为行业内没有一套公认的语言。
    - 和 agent 沟通就简单很多，agent 会详细列出设计意图和验证计划，完全可量化。
- 案例：某个线上游戏运营后期，运营人员想加快节奏，给新服多开了几个福利活动。但是研发期间的数值策划已经离职了（劳动力问题），现在的数值要从头算一遍模拟，很花时间（可能 2-3 周）。而如果用 agent，就可以在几十分钟内，拿到一套完整的符合要求的数值配置。
Q: 产品
- 数值策划 agent，完全替代劳动力
- 工作流：目标 → 建模 → 模拟 → 验收
  - 量化目标 (预设验证点)
  - 建立模型 (游戏规则 + 用户画像)
  - 运行模拟 (行为路径)
  - 验收结果 (仪表盘)
    - 模拟结束后，仪表盘会清晰地亮灯：哪些验收点通过了（绿色），哪些失败了（红色），具体差了多少。
Q: 你的解决方案有什么新意？
- 重塑工作流：设定目标 → 建立模型 → 运行模拟 → 验收结果
  - 所有数值工作都是为了实现预期体验，所以量化预期体验是第一步，验证体验是最后一步，这是一个闭环
  - 每一个设计体验，都应该被量化成一个清晰的“验收点”。
  - 验证这些验收点的最可靠的方法，就是通过模拟玩家在游戏中的真实行为路径，每一步操作和状态
    - 工作上常用的统计学估算方法是一种近似，没有模拟真实行为路径准确，但是胜在更加快速
- 通过可验证的计算内核，建立反馈闭环
  - 编程 Agent 之所以有效，是因为代码可以运行、报错、验证。
  - GitHub Copilot 更早，但 Cursor 更成功。核心差异是什么？
    - Copilot 的模式：
      - 写代码 → 交给人类验证 → 人类修改
      - AI 不知道自己写的代码对不对
    - Cursor 的模式：
      - 写代码 → 自动 lint/type check → 发现错误 → 自己修复 → 再检查
      - AI 可以自我验证、自我修复
  - 我们的产品不是提供一套 ai 觉得好的数值配置，而是提供一套模拟结果满足用户要求的数值配置
  - 效果
    - 避免幻觉
      - 不确定的语言处理由 LLM 负责；而严谨的、必须 100% 准确的数值计算则由专用工具完成
    - 加速收敛
      - 挑战: LLM 无限制的调整而不收敛
- 为 agent 提供专门为数值策划设计的特定工具
  - 对比通用 agent：edit_file 需要输出多得多的 token，编辑效果差，无关上下文多，很容易漏改
  - 专用工具：拉线，整体压缩，交替搞点新鲜感，制造波峰等
    - 这些工具本身就包含数值策划的实践经验和上下文
  - 案例：某种资源产多了，需要压缩
    - Edit_file: 找 N 个产出、关卡表，依次修改，调用 N 次工具。很容易漏改，token 消耗多，时间长
    - 特定工具：调用 1 次，改全部，一步到位
- 用户完全可控
  - 所有内容都以 csv/yaml 格式保存，高级用户可以精确修改，没有黑盒
  - 无 agent 模式下，本身也是一个好工具，用户可以自己修改、运行模拟、验收
Q: 你有什么护城河？
- 品牌：第一个 AI 数值策划
- 技术：计算引擎和工具集，能跑出真实结果，能由 ai 调用，处理复杂数学问题
- 数据飞轮：根据用户行为，训练特定小模型、做微调
- 网络效应：模板生态形成的网络效应（未来做模版）
  - 提供大量不同类型游戏数值框架，降低使用门槛
  - 用户可以轻松的导入对标的产品数值模型，然后按需对其进行微调乃至直接使用
Q: 有哪些竞争对手？
Q: 怎么知道用户需要这个？
Q: 怎么赚钱？
Q: 为什么是我们？
- 我有数值策划、AI、开发、创业的经验，刚好处于一个交集
- 我的抽象思维很发达，很擅长创造新的模式和工具来解决问题，适合做这件事
Q: 为什么是现在？
- AI 的爆发，Software Is Eating Labor
- 游戏行业目前和未来很长时间都是深耕效率和品质的阶段，对提效工具有旺盛需求。
Q: 市场有多大？
- 全球大约 2 万名数值策划，人均薪资 5 万美元，总薪资 10 亿美元
- Agent 替代数值策划 50% 的工作，只需要 20% 的价格
- TAM 约 1 亿美元
- 此外市场还可能会扩大，因为更低的成本就能做出更好的游戏
Q: 你现在做到什么程度了？
- 在做工具
- 现在还没有模版，未来会有，一键导入热门游戏的数值体系，然后按要求进行微调。
Q: 下一步要做什么？
Q: 其他行业有类似产品吗？
Q: 面临的挑战？
- AI 没法为出问题负责
  - 这是决策风险，不是钱的问题
- 效果做不到人类那么好
- 对于那些”能招到人”或”能自己做”的团队，便宜不足以说服他们
- 你需要证明”为什么 AI 比人类更好”，不只是更便宜
- 现在初始化整个数值框架是最大的门槛。
  - 现在还做不到一键建立整个模型，需要一个初始化过程，ai 问问题，人类用户回答，然后 ai 给人类展示结果，人类指出问题，ai 修改。把一个中等规模的游戏的数值配置、数值模型、游戏规则搬到工具里面，大概需要半天到一天时间。如果是熟练工，可以缩短到 2 小时。如果从模版开始建，可以更快。这个工作任何系统策划都可以完成，独立开发者也可以完成。
  - 对于早期用户，我打算手动帮他们上手，建立模型，导入规则。后面就可以交给他们自行完善和调整测试。
  - 之后可以用 agent 读整个代码库，从而完成初始化。AI 在读大代码库方面是很强的。
- 相比于直接运行游戏，这个方式存在一定的抽象
  - 存在误差
    - 只要有抽象，就会存在误差
  - 制造了额外的工作
    - 需要额外的工作，来对游戏进行抽象
    - 模拟结果的准确性依赖于抽象的准确度
- 需要真实获得各厂家的数据，包括数值设计和用户数据，才能够形成飞轮。但这是各个厂商的隐私，很难获取。
Q: 对比人类的优势？
- 容易接手，不会留下烂摊子
- 便宜得多，效果还凑合
Q: 最痛的用户是什么？
- 测试数据很差，必须快速调整
- 数值策划离职，项目没人接
- 对标产品要快速反推数值（这一点目前解决不太了，需要等我们的模版市场上线）
- 独立开发者做数值导向的游戏
- 小团队第一次做复杂数值
- 预算紧张的创业团队
End game？
- 向上下游延伸，做商业化，基于实际用户数据，对参数进行调整，提高商业化潜力。乃至于做到千人千面，每个用户的数值都不同。
- 一大堆 agent 合作，全自动做游戏
  - 用户只需要嘴炮一下，定期体验，提出方向、意见
  - 这种情况下，必须要一个专门的数值 agent，否则无法跑通闭环，实现全自动
Q: 做工具还是 agent？
- 如果数值策划还需要在 Excel 里算，然后再用你的工具验证，那你只是在增加复杂度。
- 工具思维：
  - Excel 计算 → 导入工具 → 验证 → 发现问题 → 回 Excel 改 → 再验证
  - 这是两套系统，有摩擦。
- Agent 思维：
  - 描述需求 → Agent 生成+验证 → 导出配置表 → 完成
  - 这是一套系统，无缝。
Q: 起因？
- 做这个工具的起因是，有个朋友的团队，下周就上线测试了，还没开始做数值，他们是个 10 人团队，没招专门的数值策划，本来主策划想自己兼一下，但是做到临近上线才发现没时间了，人力不够了。
- 找我过去帮忙，2 天赶工了一版数值，然后测试调整了几天。
之间做复杂了，简化一下
- action
  - 前置条件
  - 结果判定
    - 和战斗力、技巧水平相关
  - 效果
- strategy
  - 上线时间
  - 资源分配策略
  - 行动顺序
第一性原理
- 这个工作肯定会被 agent 代替，而不是人类
- Agent 做这个，最大的痛点是
  - 可控性
    - 人类如何控制 ai，如何设定指标
    - AI 绘图领域，这是最大难题
  - 幻觉，一致性
    - 填这些数字，真的能达到效果吗？不是 ai 感觉可以达到效果，而是通过计算发现确实能达成
  - 收敛
    - 如果要计算，ai 能不能在有限调整步数内，将结果收敛到一个足够小的范围，而不是无限横跳
- 要解决这几个问题，必然需要
  - 新的工作流，可设定指标
  - 对应的计算引擎
    - 对游戏进行模拟或抽象
Roadmap
- 计算引擎
- 仪表盘，运行，看结果
- 易用的配置工具
- 接入 Agent
  - 如果有 agent，那么配置工具不重要，但是查看配置重要

Gameplay Lab

数值策划 Agent - BP

Backlinks

Graph View