很多团队到项目后半段才发现,自己没有一个被全员接受的基线环境。结果是 demo 能跑、报告能写,但任何一次版本比较都很难成立。
为什么要进热门
因为它影响的不只是测试质量,还影响销售演示、客户预期和工程排期。基线不固定,整个交付过程就会不断产生解释成本。
至少先固定四个要素
- 评测设备型号、功耗模式和散热条件。
- 输入样本、批大小和运行时参数。
- 时延、吞吐、温度和稳定性各自的采集方式。
- 哪组结果可以进入对外汇报,哪组只能留在内部观察。
HDRP 判断
边缘 AI 的难点常常不在第一次跑通,而在之后能不能稳定复现。先固定基线设备与测法,通常比继续追单次最佳结果更值得优先处理。