技能标签
专业技能
精通大模型全栈技术,包括增量预训练、全量微调、LoRA轻量化训练及RLHF强化学习框架。掌握DeepSeek、Qwen、ChatGLM等主流大模型的训练推理优化及国产化部署方案。熟悉国产算力平台适配(昇腾/智凯/曙光等)及大模型在公文写作、Text2SQL、标书生成等场景的工程化落地。精通NLP核心算法:序列标注(NER/CRF)、依存句法分析、文本摘要(PEGASUS)、知识蒸馏等。熟练使用fairseq、HuggingFace等框架,具备模型量化(GPTQ)、推理加速(vLLM)及RAG技术实战经验。擅长多语言模型(XLM-R/MBART)研发及翻译系统构建。
工作履历(脱敏处理)
主导公文领域大模型研发,完成数据清洗、模型预训练及领域微调,构建自动化评测体系。设计基于BERT的意图识别与问答系统,实现虚拟偶像对话机器人及手机商城导购系统。开发多语言翻译模型,通过知识蒸馏提升翻译质量。完成音频文件智能分割系统,支持多种格式及动态token校验。优化大模型推理流程,采用vLLM和量化技术降低显存占用,提升推理效率30%以上。
项目经验(脱敏处理)
1. 公文智能生成系统:基于Baichuan/Qwen/ChatGLM进行领域预训练,构建包含3万条数据的摘要训练集,采用PEGASUS架构实现关键句抽取与文本摘要,模型准确率提升至89%。
2. 多模态音频处理平台:集成demucs/spleeter模型实现多轨道分离,支持MP3/WAV等格式,开发基于时间戳的动态token校验系统,分割精度达98%。
3. 翻译增强系统:基于fairseq构建多语言翻译框架,设计word/sentence/sequence级知识蒸馏方法,结合XLM-R/MBART模型提升跨语言翻译质量。
4. 虚拟偶像对话引擎:开发包含意图识别、问答、闲聊生成的完整架构,采用BERT预训练模型实现多轮对话理解,支持复杂查询与知识图谱检索。
5. 大模型推理优化:实施vLLM量化方案,降低显存占用40%,构建RAG检索增强系统,提升生成内容相关性达35%。
驻场外包优势
服从性高
严格遵守甲方管理制度
技术扎实
9年项目实战经验
可长期驻场
接受异地项目外派
快速响应
24小时内可到岗
企业人才对接
专业IT人力外包服务
如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。
合作热线
18969108718
商务邮箱
ntit@163.com
微信扫码咨询
扫描二维码添加商务对接