如果团队准备比较多块板卡、多种模型或多版编译结果,那么一张统一的评测记分卡模板几乎是必需品。它的目标不是排版漂亮,而是保证结果可以横向比较。
模板里至少要有的字段
- 模型名称、版本、精度和导出方式。
- 输入分辨率、样本集版本、前后处理是否计入总延迟。
- 冷启动结果与热稳态结果。
- 平均值、P95、异常样本和失败现象。
- 板卡、驱动、固件、功耗和环境温度。
为什么值得放进资源区
很多团队其实不是不会测,而是每次都换一套测法。模板的价值就在于逼着大家先统一口径,再输出结论。
使用建议
这类模板最好和实验日志一起使用。记分卡负责对比,日志负责解释,两者分工清晰,后续复盘会轻松很多。