工作职责:
o 针对架构和算法特征开发汇编级或者CUDA代码
o 优化cuBlas、cuDNN、TensorRT的核心kernel
o 针对未来GPU架构开发原型代码,推进下一代架构的设计和优化
基本要求:
o 严谨的逻辑思维和分析能力
o 较强编程能力(C/C++)、算法分析和实现
o 熟悉计算机体系结构 优先
o 有CUDA代码调优经验(或者SIMD等架构的调优经验) 优先
o 熟悉矩阵计算的优化和加速优先
3. 机器学习算法工程师 – 上海,北京,深圳
工作职责:
o 基于深度学习技术进行图像/视频处理,语音识别,推荐算法领域相关前沿问题的研究
o 运用最新机器学习(深度学习)技术,解决制造,金融,通信,医疗等行业中遇到的实际问题
o 与计算团队合作,对机器学习(深度学习)中的计算问题进行研究(包括但不限于低精度,定点计算,网络裁剪和压缩,异步协同多节点训练等)
o 针对人工智能中各个垂直应用领域,与计算团队合作进行解决方案或者SDK的开发工作
o 对内为其他团队提供技术支撑
o 依托与NVIDIA有合作关系的顶尖学术研究单位,消化吸收最新的学术研究成果,结合NVIDIA的战略规划,提前储备相关领域的新技术
基本要求:
o 电子、自动化、计算机等相关专业,硕士及以上学历
o 理解,熟练掌握和运用机器学习的基础理论和方法
o 在一个或多个垂直领域有过深入研究(包括但不限于图像处理,语音识别,语义理解,推荐算法等)