工作职责:
1、负责大规模预训练模型(LLM)的架构设计、训练、调优与部署工作;
2、参与数据清洗、数据增强、样本构建等数据处理流程,提升训练数据质量;
3、优化分布式训练框架,提升训练效率与资源利用率;
4、跟踪前沿大模型技术动态,探索模型压缩、蒸馏、微调等方向;
5、负责模型效果评估、问题定位及迭代优化
职位要求:
1、学历专业:全日制本科及以上学历,985或211院校毕业生优先;人工智能、智能科学与技术、软件工程(AI方向)等相关专业优先;
2、工作经验:具有2-3年大模型训练、自然语言处理或深度学习相关工作经验;
3、语言能力:大学英语六级(CET-6)或同等水平,能够熟练阅读英文技术文献;
4、技术能力:
熟悉Python,掌握PyTorch/TensorFlow等深度学习框架;
了解Transformer、GPT、BERT等主流模型结构及训练原理;
具备分布式训练(如DeepSpeed、Megatron-LM)或模型微调实践经验者优先;
5、综合素质:具备优秀的逻辑思维、沟通表达、团队协作与问题解决能力。
福利待遇:
上班时间:8:30-12:00 , 13:30-18:00 , 周末双休。
购买五险一金,补充商业险,享有餐费补贴、住房补贴、全勤奖、年终奖、节日慰问、工会福利,节假日齐全,带薪年假。定期体检、定期团建、定期培训。
联系我们:
发送简历至邮箱:hshr0757@163.com,合则约见
投递简历