设计机器学习平台的基础架构,搭建领先的AI设施负责机器学习框架开发参与模型训练,模型服务,预测,资源调度等问题的研发
1.Lightgbm 训练加速:解决跨 numa 节点的训练加速问题;解决大数据量时,显存的占用优化;
2.训练框架优化:优化研究员训练模型的整个 pipeline,加速研究员开发迭代。
【任职要求】
1.有扎实的 C++ 基础,对模板元编程,编译器,汇编等有较深入理解; 有x86比较深入的优化经验 ;
2.熟悉 CPU 微架构,熟悉 CUDA;
3.熟悉主流的深度学习框架的底层结构和实现机制
4.熟悉深度学习算法
5.熟悉计算机底层
Telephone: 18518517673