边缘 AI 板卡选型，不要只看 TOPS

边缘 AI 板卡选型最容易犯的错误，是把营销页上的 TOPS 当成采购结论。算力指标当然重要，但在实际项目里，更常见的失败原因其实是显存不够、I/O 不匹配、热设计留白不足，或者软件栈在关键算子上不稳定。

Open Table of contents

先把需求拆成四层

在拿任何板卡做横向比较之前，先把需求拆成四层：

只有把这四层写清楚，TOPS 才有解释空间。

很多边缘项目卡住，不是因为 MAC 不够，而是因为模型权重、中间激活和输入缓存挤爆了内存层级。看板卡时至少要确认：

如果这些问题答不清，所谓高 TOPS 通常只能停留在宣传场景里。

项目从 demo 走向部署时，I/O 和热设计经常成为真正的门槛。常见的失配包括：

所以板卡评估表里一定要有接口清单、热设计余量和持续功耗曲线，而不是只放一行 FP16 或 INT8 峰值。

一个能跑通 demo 的 SDK，不等于能支撑半年后的维护。建议把下面几个问题前置：

在硬件 AI 项目里，软件栈的不确定性往往比芯片本身更贵。

选板卡时先做减法：先排除内存、I/O、热设计和软件栈不合格的方案，再比较算力。这样得到的结论通常比“谁的 TOPS 更大”更接近真实交付结果。