CSDN热搜
4.3.2.1.1. 识别那些被证明是错误的或可能是不正确或默认的数据
4.3.2.2.1. 确保数据内容符合标准参考数据值(如国家代码)、标准的格式(如电话号码)或字段(如地址)
4.3.2.3.1. 添加可以改进实体解析服务的属性
4.4.3.2.1. 不代表同一实体的两个对象被关联在一个标识符下
4.4.3.2.2. 假阳性导致一个标识符指向多个现实世界的实体实例
4.4.3.3.1. 代表同一实体的两个对象没有关联在一个标识符下
4.4.3.3.2. 假阴性导致多个标识符指向同一个现实世界的实体,但一个实体本应该有且只有一个标识符
4.4.3.5.1. 依赖于训练数据的采集能力,训练是需要观察全部记录的一个子集的预期结果,再进行匹配器调优,实现匹配器基于统计结果的自我调整
4.4.5.3.1. 标识可能与主记录相关的记录,只建立交叉引用关系而不更新这些被交叉引用的记录的内容
4.4.5.4.1. 重点关注记录的匹配,并将这些记录中的数据合并为单一、统一、协调且全面的记录
4.4.7.2.1. 通过程序逻辑提供了最大的灵活性,父子层次结构的数据也可以用该类型关系来展示
4.4.7.3.1. 因为导航结构是隐含的,故父子关系需要较少的程序逻辑
4.4.7.4.1. 虽然大部分主数据管理工作可以借助工具实现自动化,从而处理大量记录,但仍然需要一些管理工作来解决数据错误匹配的情况
使用道具 举报
本版积分规则 回帖并转播 回帖后跳转到最后一页
程序园优秀签约作者
0
粉丝关注
14
主题发布