IT人力外包人才简历库

返回列表

高级自然语言处理与大模型算法工程师

驻场外包人员
工作年限:9年 意向城市:北京 浏览:3次 发布时间:近期

技能标签

大模型训练 RLHF强化学习 LoRA微调 文本摘要 知识蒸馏 NLP算法 模型量化 RAG技术 多语言模型 序列标注 依存句法分析 文本分类 意图识别 实体识别 模型部署 国产化适配

专业技能

精通大模型全栈技术,包括增量预训练、全量微调、LoRA轻量化训练及RLHF强化学习框架。掌握DeepSeek、Qwen、ChatGLM等主流大模型的训练推理优化及国产化部署方案。熟悉国产算力平台适配(昇腾/智凯/曙光等)及大模型在公文写作、Text2SQL、标书生成等场景的工程化落地。精通NLP核心算法:序列标注(NER/CRF)、依存句法分析、文本摘要(PEGASUS)、知识蒸馏等。熟练使用fairseq、HuggingFace等框架,具备模型量化(GPTQ)、推理加速(vLLM)及RAG技术实战经验。擅长多语言模型(XLM-R/MBART)研发及翻译系统构建。

工作履历(脱敏处理)

主导公文领域大模型研发,完成数据清洗、模型预训练及领域微调,构建自动化评测体系。设计基于BERT的意图识别与问答系统,实现虚拟偶像对话机器人及手机商城导购系统。开发多语言翻译模型,通过知识蒸馏提升翻译质量。完成音频文件智能分割系统,支持多种格式及动态token校验。优化大模型推理流程,采用vLLM和量化技术降低显存占用,提升推理效率30%以上。

项目经验(脱敏处理)

1. 公文智能生成系统:基于Baichuan/Qwen/ChatGLM进行领域预训练,构建包含3万条数据的摘要训练集,采用PEGASUS架构实现关键句抽取与文本摘要,模型准确率提升至89%。

2. 多模态音频处理平台:集成demucs/spleeter模型实现多轨道分离,支持MP3/WAV等格式,开发基于时间戳的动态token校验系统,分割精度达98%。

3. 翻译增强系统:基于fairseq构建多语言翻译框架,设计word/sentence/sequence级知识蒸馏方法,结合XLM-R/MBART模型提升跨语言翻译质量。

4. 虚拟偶像对话引擎:开发包含意图识别、问答、闲聊生成的完整架构,采用BERT预训练模型实现多轮对话理解,支持复杂查询与知识图谱检索。

5. 大模型推理优化:实施vLLM量化方案,降低显存占用40%,构建RAG检索增强系统,提升生成内容相关性达35%。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

9年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接