数据集成

千桐科技2025/8/27大约 6 分钟

定义

本模块用于配置与执行数据集成（ETL）任务，支持多源数据的接入、转换与写出，是构建数据流、数据处理链路的核心组件。通过节点式图形化配置，用户可完成从数据读取、清洗、转换到落地的完整流程。

注意事项

请合理配置数据源权限及执行频率，避免对源系统产生过高负载；流式任务应结合 Kafka 消费策略和 Flink 执行计划进行稳定性评估。

适用于结构化、半结构化及流式数据的集成处理场景，广泛应用于数据归集、数据治理、数据入湖入仓等关键链路中。适配多种数据源与目标端，支持规则驱动的数据转换及清洗。

点击【数据研发】-> 【任务管理】下的【数据集成】，进入数据集成页面。页面采用左右布局：左侧以树形结构展示数据集成类目，右侧展示任务列表包含任务名称、任务描述、任务类目、任务状态、调度状态等字段。

点击页面中【新增】按钮，在出现的弹出框内填写主题信息，并点击【确定】按钮，完成新增数据集成任务新增。

选择需配置转化数据集成任务，在操作列中点击【配置转化】按钮，在出现的页面中编辑转换规则，并点击【保存】按钮，完成配置转化数据集成任务。

选择需删除数据集成任务，点击操作列中的【更多】->【删除】按钮，并点击【确定】按钮，系统将删除该数据集成任务。

选择需查看数据集成任务详情，点击操作列中的【详情】按钮，进行数据集成任务详情查看。

选择需任务调度与执行的数据集成任务，点击操作列中的【更多】->【调度周期】按钮，在弹出框内填写相关信息，并点击【确定】按钮，系统将调度执行该数据集成任务。

选择需上线/下线的任务状态，在状态列中点击【开关】按钮，即可完成上线/下线操作。

选择需上线/下线的调度状态，在状态列中点击【开关】按钮，即可完成上线/下线操作。

选择需查看运行实例的数据集成任务，点击操作列中的【更多】->【运行实例】按钮，在出现的弹出框内查看。

选择需执行一次的数据集成任务，点击操作列中的【更多】->【执行一次】按钮，系统将执行一次该任务，并提示相关信息。