Skip to content
HardMind
Go back
Technical Discussion

开放芯粒生态能否进入可配置时代:从 SI 约束吞吐优化看设计自动化的下一步

这篇工作把芯粒放置与布线建模成分层 MDP,并用 SI 感知 P2R 专家轨迹训练 GAT 代理,在保持吞吐的同时显著压缩互连长度与布局面积。

内容出处 designcon.com

如果把“开放芯粒生态”只理解成供应链层面的模块拼装,就会错过真正决定系统可落地的那一层问题:跨厂商芯粒可以接起来,不代表信号完整性与吞吐目标能同时满足。Towards A Fully Customizable Chiplet Ecosystem 的价值,正在于它把这个系统级矛盾显式建模了。

Chiplet ecosystem SI throughput optimization loop

图示:根据论文的方法链路重绘,重点展示“分层决策 -> SI 约束判定 -> 学习代理 -> 面积压缩”的闭环。

这篇论文真正解决的不是“排版”,而是“可行 + 高吞吐”联合优化

论文关注的是开放异构芯粒场景下的放置与布线联合优化。与固定架构系统不同,这里需要在多厂商芯粒与不同接口混用条件下动态组合系统,目标并非单纯找到一个布局,而是在 SI 约束下最大化吞吐(token/s)。

作者把问题拆成两级 Markov Decision Process:

  • 第一级做 placement,保证不重叠、边界可行、拓扑可行。
  • 第二级做 routing,在接口规范约束下判定链路是否 spec-in。

这个拆分的工程意义很明确:把传统后验 SI 检查,前移成决策过程的内生约束。

方法核心:用“可解释专家策略”喂给学习代理,而不是让 RL 从零撞墙

论文没有让强化学习从稀疏奖励硬学,而是先用确定性 P2R(Place-to-Route)启发式生成专家轨迹,再做 imitation learning。这是一个很务实的路线:

  • P2R 提供满足硬约束的高质量可行轨迹。
  • GAT(Graph Attention Network)学习这些轨迹中的结构化决策规律。
  • 对专家数据做 symmetricity 增广(旋转、镜像、置换等),提升泛化。

同时,论文使用 SI-aware LUT 把“布线长度 -> eye aperture -> spec-in/spec-out”映射嵌入奖励计算。LUT 基于 UCIe 链路在 4 到 32 Gbps 的仿真曲线构建,使 SI 评估可在优化过程中快速调用,而不是每次都回到重仿真。

结果最值得关注的三条信号

第一条信号是可行率。论文在 100 个测试问题中报告学习方法达到 100% valid solution,而 P2R 在同组实验下更容易出现 spec-out 或路由冲突。

第二条信号是吞吐收益。表格给出平均吞吐从 P2R 的约 27.87 token/s 提升到学习方法的约 299 token/s,说明优化目标并非“只求合法”,而是“合法前提下显著提升系统效率”。

第三条信号是后处理压缩能力。论文的 refinement 阶段在保持吞吐 299 token/s 不变的前提下,将总互连长度从 32.8 降到 19.3(40.4%),并将 bounding area 从 714.3 降到 576.1(17.0%)。这对应真实封装实践里非常关键的一点:性能目标达成后,仍可继续向面积与布线效率要收益。

为什么这件事对 PI/SI 方向重要

PI/SI 语境里,很多流程仍把 SI 看作后验签核门槛。论文给出的路径是反过来:

  • 先把 SI 合规性转成优化内核可调用的快速代理(LUT)。
  • 再把系统吞吐、数据搬运和链路合规统一进同一个奖励函数。
  • 最后让布局压缩与性能保持并行推进。

这比单独讨论“芯粒模块化”更接近工程现实,因为真正拖慢项目的往往不是是否能拼起系统,而是拼起来后能否以可控迭代成本达标。

边界同样需要说清

这篇工作也有明确边界,不能过度外推。

  • SI 评估精度依赖 LUT 与其底层仿真拟合质量,超出建表空间时需要再校准。
  • 目标函数主要聚焦吞吐与 SI,热、成本、良率和制造约束仍需进一步多目标耦合。
  • 结果验证主要在论文设定任务分布内完成,跨工艺、跨封装平台的泛化仍需更多公开基准。

HardMind 判断

这篇论文释放的真正信号不是“又一个学术优化器”,而是芯粒系统设计正从静态架构决策转向可学习、可迭代、可约束注入的自动化流程。对 PI/SI Powered by AI 来说,下一阶段的关键竞争点会是:谁能把 SI 约束、吞吐目标和后处理压缩稳定串成生产级管线,而不是停留在离线 demo。

Discussion Comments

留言与评论

欢迎围绕这篇讨论稿补充问题、不同判断、参考资料和实验经验。已配置时支持游客直接留言。

所属技术专题
PI/SI Powered by AI
关联 5 条覆盖 4 栏
Next Post
PDN 阻抗矩阵进入毫秒级预测:这篇 DesignCon 工作对 PCB 电源完整性流程意味着什么