工作职责:
-负责大模型的设计、训练以及优化工作,特别是在面向业务和落地应用方向
-探索和开发大模型在多模态交互中的前沿应用
-负责数据挖掘、数据增强等算法工具的研发,并针对大模型进行专项优化
-参与自然语言处理技术的平台化开发,推动大模型技术在文本领域的创新应用
-跟踪大模型在NLP领域的最新研究进展,并研究和实施应用
任职要求:
-具有深入的大模型研发背景,熟悉Transformers、BERT、GPT等现代NLP模型架构
-熟悉Linux平台下的数据处理,精通Python、perl、C、C++等编程语言,对数据结构和算法设计有深入理解
-优秀的逻辑思维和问题分析能力,对数据敏感,能够快速定位和解决核心问题
-具备扎实的数学基础,尤其在统计学和线性代数方面
-较强的沟通能力和逻辑表达能力,具有持续学习的热情,良好的团队合作态度,良好的沟通能力,以及强烈的责任心
-对文本方向应用有浓厚兴趣,有相关的大模型应用经验者优先
-加分项
-在ACL、NeurIPS、ICML等顶级会议或期刊上有大模型或NLP相关领域的论文发表
-具有知识图谱、对话系统或其他高级NLP任务的研发经验
