高级智驾大数据工程师_XC

  核心职责
    智驾数据平台架构与开发
      负责智驾大数据平台架构设计、开发和优化,支撑PB级数据存储与计算
      构建高可靠、高性能的数据处理流水线,支持自动驾驶算法训练和验证
      设计并实现智驾数据湖分层模型,将各种来源的数据抽象为标准化数据表
    数据处理与计算
      负责单表TB级别以上的大规模数据分布式计算和特征工程
      开发和维护离线计算(Spark)和实时计算(Flink)任务
      优化数据处理性能,降低计算成本,提升数据处理效率
    数据体系建设
      设计并搭建智驾领域特有的标签(tag)计算框架体系
      建立数据质量监控和治理体系,确保数据准确性和一致性
      实现数据血缘追踪、元数据管理和数据版本控制

行业经验
    必须具有智驾(智能辅助驾驶)行业相关工作经验
    熟悉智能辅助驾驶数据特点,包括感知、预测、规划、控制等模块数据
    理解智驾领域动静态元素, 轨迹,特征等含义,有能力抽象为数据模型
  技术栈要求
    精通大数据相关生态系统(Hadoop, HDFS, YARN, Ray, Iceberg等)
    精通大数据计算框架:Spark、Flink等离线和实时计算框架, 能独立完成单个复杂任务的设计,开发,测试和部署
    熟练掌握消息中间件:Kafka、RocketMQ,Pulsar等
    熟练编程语言:Scala、Python
    熟悉数据湖技术(Iceberg/Hudi/Delta Lake至少一种), 熟悉常见OLAP数据库, 如Doris, Clickhouse, Greeplum等
    以上技术栈都需要有实际生产应用经验
  项目经验要求
    有单表TB级别以上数据进行聚合计算的实战经验
    具备PB级别数据管理和治理经验
    有从0到1构建数据标签(tag)计算框架的经验
    有智驾数据湖各层(ODS/DWD/DWS/ADS)表设计经验
加分项
  熟悉自动驾驶数据格式:Rosbag、Mcap, HDF5等
  了解并处理过各种2D/3D标注、场景标注、事件标注数据
  有云原生大数据平台(K8s + 大数据组件)经验
  有高精地图数据、传感器数据(激光雷达、摄像头、毫米波雷达)处理经验
  熟练使用 Copilot 或其他 AI 开发工具,能够通过高质量 Prompt 引导 AI 辅助开发,并对结果进行严格验证
  具备很强的工程质量意识,擅长 Code Review,有良好的单元测试和交付习惯
  对复杂系统开发中的边界条件、稳定性风险和可维护性问题有较强判断力

Similar jobs