IT人力外包人才简历库

返回列表

大数据平台开发工程师

驻场外包人员
工作年限:5年 意向城市:北京 浏览:2次 发布时间:近期

技能标签

Hadoop Spark Hive Kafka Java Scala SQL优化 数据迁移 集群部署 流式处理 ETL开发 OLAP引擎 容器化技术 调度系统 数据建模

专业技能

精通Hadoop生态体系(HDFS/Hive/HBase/Spark),擅长SparkSQL/Scala开发与调优,具备复杂ETL流程设计能力。熟练掌握数据迁移工具(Sqoop/DataX/Kettle)及调度系统(Azkaban/DolphinScheduler),精通Hadoop集群部署与资源调度,熟悉Kerberos安全认证及K8s/Docker容器化技术。精通Java/Scala开发,具备UDF/UDTF函数开发经验,熟悉Canal/Maxwell/FlinkCDC流式数据同步方案。掌握Presto/Impala/Kylin/ClickHouse等OLAP引擎,具备Shell/MySQL/FineReport等工具链整合能力。

工作履历(脱敏处理)

长期从事大数据平台架构设计与开发工作,主导构建企业级数据仓库体系,实现PB级数据的高效处理与分析。设计并实施基于Hadoop的实时数据处理方案,通过Spark Streaming与FlinkCDC实现日均千万级数据同步。优化Hive/Spark查询性能,通过分区裁剪、列式存储等技术使查询效率提升300%。搭建数据调度体系,实现DataX/Sqoop与Azkaban的自动化数据采集流程。主导开发多个OLAP分析引擎,支持业务部门进行多维数据分析与可视化展示。

项目经验(脱敏处理)

项目名称:数智营销数据平台(2022年3月-2023年1月)

项目描述:构建企业级实时数据处理平台,支持营销数据的采集、清洗、分析与可视化展示。采用Hadoop生态体系搭建数据仓库,通过SparkSQL实现多维度数据建模,利用FlinkCDC实现数据库增量同步,结合Kafka构建实时数据管道。项目涉及PB级数据处理,日均处理数据量达10TB,支持百万级并发查询。

技术挑战:数据延迟问题、计算资源调度优化、数据一致性保障。

解决方案:设计基于Kafka+Spark Streaming的实时计算架构,通过动态资源调度实现计算资源弹性扩展,采用Canal+Maxwell实现数据库双流同步,结合Hive ACID特性保障数据一致性。项目上线后数据处理时效提升80%,查询响应时间缩短至500ms以内。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

5年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接