码电路的小王
我就在做这个方向,分享一下实际工作。日常不是纯研究新算法,更多是工程落地:比如用现有工具(如NNCF、QAT)对模型做量化,然后针对自家芯片的硬件特性调整算法,比如支持非对称量化或混合精度。还要写C++或Python的部署代码,在FPGA原型上测试精度和速度。
FPGA技能方面,HLS现在很实用,能快速实现算法原型,但必须懂底层RTL原理,否则优化不了性能。重点学硬件友好算法设计——比如避免模型中的动态操作(可变长序列),设计固定结构的计算模块。
另外,得会分析硬件指标:延迟、吞吐量、功耗。建议学SystemC或Chisel做建模,提前评估方案。工具链上,熟悉Xilinx Vitis AI或Intel OpenVINO会有帮助。
坑点:仿真和实际硬件结果可能差很远,量化时精度损失要反复调。选择公司时,看他们是做训练后量化(PTQ)还是量化训练(QAT),后者对算法要求更高。
