CSDN热搜
3.2.3.1.1. 应用层内的数据创建(事务数据库、点击流、日志、物联网传感器等)
3.2.3.2.1. 从源头批量或实时采集数据,并存储在数据湖中
3.2.3.3.1. 目录中可用的数据,记录了数据的属性以及元数据属性,如值分布、枚举等
3.2.3.4.1. 将数据转换为派生的属性或聚合,作为指标或特征提供
5.1.4.4.1. 建立在Apache Spark之上,并且可以扩展以处理海量数据
5.1.4.4.2. 提供了约束验证,允许用户定义质量报告的测试用例
5.1.4.4.3. 提供了内置功能用于识别测试的约束,并根据测试计算指标
5.1.4.4.4. 支持有状态的指标计算,提供了一种验证增量数据加载的方法
使用道具 举报
本版积分规则 回帖并转播 回帖后跳转到最后一页
程序园优秀签约作者
0
粉丝关注
7
主题发布