2026年,全国大学生FPGA创新设计大赛,如果选择‘基于FPGA的实时视频H.265/HEVC编码器硬件加速’作为题目,在实现变换量化、熵编码等模块时,如何设计流水线和并行结构以在有限资源下达到实时4K@30fps的性能?
准备参加2026年的FPGA创新设计大赛,想挑战视频编码方向,选题是HEVC编码器硬件加速。知道这个算法非常复杂,资源消耗大。核心难点在于如何将变换量化、帧内预测、熵编码等模块用硬件高效实现。特别是面对4K实时编码的要求,该如何设计全局的流水线架构和计算单元的并行度?在Intel或Xilinx的中端FPGA上,有哪些资源优化策略(比如复用计算单元、优化存储器访问)是必须考虑的?希望有做过类似项目的大神给些架构设计上的建议。