职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
【岗位职责】
1、负责公司AI管理平台相关子系统的设计、开发和优化工作,包括:模型训练、模型推理、资源调度、任务调度、模型管理、工作流编排等;
2、负责多种异构资源如GPU、CPU等z优化的编排调度,提升集群的整体资源利用率(包含国产化CPU、GPU的兼容和统一调度)。
【任职要求】
1、统招本科及以上学历,计算机相关专业,3年以上AI软件开发经验。
2、熟悉Linux开发环境,具备良好扎实的算法基础、良好的编程风格和系统设计能力。
3、具有优秀的编码能力,熟练掌握Golang/Python/C/C 至少一门语言;熟悉kubernetes架构和基本原理,有自定义Operator相关开发经验。
4、熟悉至少一种主流的机器学习框架(TensorFlow、Pytoch等)和一种大模型的训练和推理过程,有AI Agent研发经验优先;
5、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分;有强烈的工作责任心,较好的学习能力、沟通能力、有良好的团队合作精神。