04 · 动作效率

为什么动作效率，决定 AI 像不像同事

很多 AI 演示都只展示“最后有没有做出来”，但 ARC-AGI-3 的方法学更进一步，把动作效率纳入了正式评分。这个变化非常重要，因为用户感受到的协作质量，很多时候就是效率差异。

为什么 ARC-AGI-3 不满足于“答对就行”

ARC Prize 的方法学把 Solve Success Rate 和 Relative Human Action Efficiency 放在一起，目的就是避免出现“虽然能做对，但过程极其低效”的假象。

这比单看正确率更接近真实使用，因为用户真正付出的成本来自交互过程，而不只是最终结果。

同样是写一份方案，有的 AI 要来回 8 轮，有的 AI 3 轮就能稳定落地。两者在技术演示里可能都算“完成任务”，但在真实工作里体验完全不同。

效率高的 AI 会让你感觉自己在被推进，效率低的 AI 则像一个需要你不断管理的实习生。

当你比较两个 AI 工具时，不要只看谁的文案更漂亮，也要看谁让你的工作流更短、更顺、更省认知负担。

ARC-AGI-3 带来的启发是：协作式 AI 的价值，很大一部分来自它让你少做了多少多余动作。

02 · 保持上下文

多轮对话里，它能不能稳稳接住前文。

06 · 选型判断

用这 6 个维度，重新判断谁更适合成为你的 AI 伙伴。

Turn insight into action

当你已经知道自己更看重任务理解、上下文、探索能力还是动作效率，再去选工具，会比追热门模型更有效。