南京高级自然语言处理与大模型算法工程师 - 外包人才简历详情

高级自然语言处理与大模型算法工程师

驻场外包人员

工作年限：9年意向城市：北京浏览：3次发布时间：近期

技能标签

大模型训练 RLHF强化学习 LoRA微调文本摘要知识蒸馏 NLP算法模型量化 RAG技术多语言模型序列标注依存句法分析文本分类意图识别实体识别模型部署国产化适配

专业技能

精通大模型全栈技术，包括增量预训练、全量微调、LoRA轻量化训练及RLHF强化学习框架。掌握DeepSeek、Qwen、ChatGLM等主流大模型的训练推理优化及国产化部署方案。熟悉国产算力平台适配（昇腾/智凯/曙光等）及大模型在公文写作、Text2SQL、标书生成等场景的工程化落地。精通NLP核心算法：序列标注（NER/CRF）、依存句法分析、文本摘要（PEGASUS）、知识蒸馏等。熟练使用fairseq、HuggingFace等框架，具备模型量化（GPTQ）、推理加速（vLLM）及RAG技术实战经验。擅长多语言模型（XLM-R/MBART）研发及翻译系统构建。

工作履历（脱敏处理）

主导公文领域大模型研发，完成数据清洗、模型预训练及领域微调，构建自动化评测体系。设计基于BERT的意图识别与问答系统，实现虚拟偶像对话机器人及手机商城导购系统。开发多语言翻译模型，通过知识蒸馏提升翻译质量。完成音频文件智能分割系统，支持多种格式及动态token校验。优化大模型推理流程，采用vLLM和量化技术降低显存占用，提升推理效率30%以上。

项目经验（脱敏处理）

1. 公文智能生成系统：基于Baichuan/Qwen/ChatGLM进行领域预训练，构建包含3万条数据的摘要训练集，采用PEGASUS架构实现关键句抽取与文本摘要，模型准确率提升至89%。

2. 多模态音频处理平台：集成demucs/spleeter模型实现多轨道分离，支持MP3/WAV等格式，开发基于时间戳的动态token校验系统，分割精度达98%。

3. 翻译增强系统：基于fairseq构建多语言翻译框架，设计word/sentence/sequence级知识蒸馏方法，结合XLM-R/MBART模型提升跨语言翻译质量。

4. 虚拟偶像对话引擎：开发包含意图识别、问答、闲聊生成的完整架构，采用BERT预训练模型实现多轮对话理解，支持复杂查询与知识图谱检索。

5. 大模型推理优化：实施vLLM量化方案，降低显存占用40%，构建RAG检索增强系统，提升生成内容相关性达35%。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

9年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求，欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

扫描二维码添加商务对接

立即申请人才对接

IT人力外包人才简历库