软件简介

Dagster 是一个用于机器学习、分析和 ETL 的数据编排器

Dagster 让你以可重复使用的逻辑组件之间的数据流来定义管道,然后在本地测试并在任何地方运行。通过对管道和它们产生的资产的统一视图,Dagster 可以调度和编排 Pandas、Spark、SQL 或任何其他 Python 可以调用的东西。

Dagster 是为数据平台工程师、数据工程师和全堆栈数据科学家设计的。用 Dagster 构建数据平台,使你的利益相关者更加独立、系统更加强大。用 Dagster 开发数据管道可使测试更容易,部署更快。

特性:

  • 笔记本电脑上开发和测试,随处部署

  • 对每个步骤产生和消耗的数据进行建模和输入

  • 将数据链接到计算

  • 搭建自助数据平台

  • 避免依赖噩梦

  • 从丰富的 UI 调试管道

转载自: https://www.oschina.net/p/dagster