芯片设计预备役
作为过来人,我觉得你提的看论文和开源项目是必要的,但不够系统。AI加速器架构知识可以分三层:硬件层(计算单元、存储、互联)、架构层(数据流、并行策略)、算法层(模型压缩、量化)。你当前最需补中间那层。具体来说:1. 数据流方面,掌握weight stationary和output stationary的优缺点,以及现代加速器如何混合使用;2. 精度支持,了解INT8/FP16/BF16的硬件实现差异,比如乘法器结构和精度转换电路;3. 内存系统,包括bank冲突避免、数据重排技巧。学习路径:先看Coursera上相关课程(如“Hardware for AI”),然后精读TPU、Eyeriss等几篇经典论文,最后用VTA或类似框架做实验,尝试修改调度策略。注意:消费电子芯片的经验在低功耗和时序收敛上有用,但AI芯片更关注计算效率和带宽,面试时突出你的可迁移能力。
