职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
1. 参与百亿 参数量的大模型(语言与多模态)在人工智能领域(语言生成、机器人控制等)研发的全流程工作
2. 在大模型方向的基础网络架构、训练优化算法、效率及稳定性提升、数据集建设等方面持续优化迭代
3. 紧跟前沿技术进展,与学术界紧密合作,参与关键创新、突破与积累(专利、论文等)
任职资格
1. 博士学历优先,计算机、人工智能、软件、机器人等相关专业,4年以上(博士2年以上)AI领域工作经验
2. 具备扎实的 Python 、C/C 开发功底,熟练掌握 PyTorch 等主流 DL 框架;掌握规范 git 工作流、敏捷开发能力、代码提效工具者优先
3. 熟悉 SOTA 的模型架构与训练方法,如多模态模型、自监督学习、迁移学习等
4. 有大模型搭建(如 >1B 参数量)、多模态模型开发全流程(数据采标清洗、模型设计调优、性能评测诊断等)、分布式训练及部署等经验者优先
5. 有语言大模型、机器人、自动驾驶等方向开源项目维护/贡献经历或相关方向高水平论文发表者优先
6. 有创新的想法,乐于接受技术挑战,具备一定的英文读写能力、较好的沟通能力、良好的团队合作精神