你这个观察非常敏锐——而且点中了当前大模型(包括很多“世界模型”)的一个核心缺陷:

如果这个步骤都需要海量的算力这不是浪费电这是什么 === GPU Memory Bandwidth Test …