负责开发针对神经网络推理和训练任务进行优化的指令集架构(ISA),重视性能和能效。
职责:
•开发专为神经网络推理和训练应用定制的ISA。
•与硬件和软件团队紧密合作,为高效的神经网络处理定义ISA的需求和约束。
•设计专门的指令、数据格式和内存访问模式,以优化神经网络计算。
•为ISA开发规范、文档和性能模型。
•对ISA设计进行性能分析、仿真和验证。
•与编译器和软件工程师合作,优化为设计的ISA生成代码。
资格要求:
经验:
•熟悉CUDA微架构和ptx指令集,熟悉GPU架构、有CUDA编程或类似GPU编程模型的实践经验。
•在设计用于硬件加速的指令集架构(ISA)方面有丰富经验(X年),最好是在神经网络处理或类似领域。
•熟悉RISC-V或其他指令集。
•在神经网络架构、深度学习框架和并行计算技术方面具有扎实背景。
•熟悉微体系结构设计、优化技术和硬件加速器的性能分析。
•熟练掌握硬件描述语言(HDLs)如Verilog、VHDL或SystemVerilog。
• 在神经网络加速器的硬件/软件协同设计方面有实践经验。