DB41/T 2847-2025 商品源数据 数据质量控制规范
- 文件大小:880.24 KB
- 标准类型:地方标准规范
- 标准语言:中文版
- 文件类型:PDF文档
- 更新时间:2025-06-16
- 下载次数:
- 标签:
资料介绍
《DB41/T 2847-2025 商品源数据数据质量控制规范》主要内容的详细总结:
标准核心目标: 规范商品源数据(以全球贸易项目代码为关键字的商品数字化信息)的质量控制过程,确保数据的完整性、规范性、准确性符合相关标准(特别是GS1全球数据模型)和可用性要求。
适用范围: 适用于在河南省进行的商品源数据采集、处理、管理过程中的数据质量控制活动。
主要内容结构及要点:
-
规范性引用文件:
- 核心依据:GB 12904《商品条码 零售商品编码与条码表示》
- 采集依据:DB41/T 2215《商品源数据采集规范》
-
关键术语定义:
- 商品源数据: 商品实物的数字化信息,以全球贸易项目代码(GTIN)为关键字,包括商品图片、标签文字、包装尺寸、商品重量等,符合GS1全球数据模型(GS1 GDM)的数据结构和规则。
- 数据质量: 指商品源数据在完整性、规范性、准确性方面符合GS1 GDM及相关技术特性的程度。
-
基本要求 (第4章):
- 依据: 必须严格按照 GB 12904 和 DB41/T 2215 的要求进行数据质量控制,涵盖数据规范性、准确性、完整性、可用性。
- 具体要求:
- 规范性: 字段格式、命名规则、编码体系必须符合标准;数据结构和元数据必须与行业规范一致。
- 准确性: 商品属性(尺寸、重量等)必须使用标准化工具(测量仪、电子秤)验证,误差范围需符合行业标准。
- 完整性: 数据记录应覆盖所有必需项,无多余、重复、缺失现象。
- 可用性: 数据字段值应在不同应用场景下有效可用。
- 评价报告: 要求生成的评价报告必须客观、准确反映质量状况,为数据改进和优化提供依据。
-
数据质量检查 (第5章):
- 检查方式:
- 全量检查: 适用于批量 ≤ 1 的情况(即样本量=批量),对所有数据逐一检查。
- 抽样检查: 适用于批量 ≥ 2 的情况,依据标准提供的抽样方案表 (表1) 确定样本量、接收数(Ac)和拒收数(Re)。
- 示例:批量 500001 及以上时,样本量=1250,接收数=21,拒收数=22(即样本中不合格数 ≤21 可接收该批,≥22 则拒收)。
- 检查指标: 必须严格按照 附录A (规范性) 检查指标表 进行。该表结构为5级指标,非常详细:
- 一级指标: 条码符合性、图片、测量、文字信息采编、数据完整性、数据一致性。
- 二级~五级指标: 逐级细化要求(例如在“图片”一级指标下,有“图片数量及顺序”、“默认正面”、“图片质量”、“背景像素分辨率大小”、“边缘轮廓抠图痕迹”、“边界距离”等二级指标,并继续细化)。
- 具体示例要求 (部分):
- 条码: 系统成员名称必须与产品责任主体一致;使用集团公司条码的子公司必须备案。
- 图片:
- 数量:规则商品需6张图(必须含正、背面),不规则商品需2张图。
- 默认正面:必须设置正确。
- 质量:真实、全面、清晰、正立、无杂物、角度误差≤10°(可用量角器测量主轴线与边框夹角)。
- 背景:纯白 (RGB: 255,255,255)。
- 像素:2400x2400 至 4800x4800。
- 分辨率:300 dpi。
- 大小:≈7MB。
- 边缘:完整清晰,无明显修图痕迹。
- 边界距离:商品居中,最长边顶点距图片边界的距离占该边长总长的2%-5%。
- 测量:
- 默认正面的高宽深判断必须正确。
- 高宽深逻辑关系必须正确。
- 尺寸和重量数值的数量级必须与实际商品相符,并按规则修约。
- 文字信息: 录入数据需逐字检查无误,内容准确。涉及内容包括但不限于:营养成分表分类、生产企业信息、有机标识、地理标识、税务编码、内装中包数量、GPC分类、包装类型、酒品分类、品牌、净含量、配料等。
- 检查方式:
-
数据质量评价 (第6章):
- 数据收集: 由相关技术机构依据抽样方案(参照表1)收集评价样本。
- 评价实施:
- 数据审查: 评价人员依据 附录B (规范性) 评价指标表 对样本各项指标进行审查并记录结果。
- 评分计算:
- 使用公式计算每个样本的综合得分:
T = Σ(一级指标得分t * 对应权重m) - 附录B 提供了详细的评价指标表,包含一级指标、权重、二级指标和具体的评分细则(按项扣分制)。
- 一级指标及权重:
- 条码符合性 (20%)
- 图片质量 (20%)
- 测量准确性 (15%)
- 文字信息准确性 (20%)
- 数据完整性 (15%)
- 数据一致性 (10%)
- 评分细则示例:
系统成员与责任主体一致性:完全一致50分;有差异但有备案证明25分;不一致且无证明0分。图片数量及顺序:符合要求25分;每缺少一张关键图或顺序错误扣5分。默认正面正确性:正确25分;错误0分。图片背景像素等:全部符合25分;每一项不符合扣5分。录入数据准确性:完全准确50分;每出现一个错别字或信息错误扣10分。各类信息填写:全部正确50分;每项错误扣5分。数据项完整性:覆盖所有关键项50分;每缺失一个关键项扣20分;无多余重复50分;每出现一次扣10分。数据格式/内容一致性:格式全部一致50分;每处不一致扣10分;内容全部一致50分;每次不一致扣10分。
- 使用公式计算每个样本的综合得分:
- 评价结果判定:
- 合格判定: 设定合格分数线为80分(可调整)。样本综合得分 ≥80分 判定为合格;<80分 判定为不合格。
- 合格率计算: 使用公式
M = (n / N) * 100%计算样本总体合格率(n:合格样本数,N:样本总数)。
- 评价报告: 须编制详细报告,包含评价目的、范围、依据、过程、结果(样本得分、合格率)、存在问题等。
-
纠正与控制措施 (第7章):
- 不合格数据处理:
- 标识不合格数据。
- 能改善的数据:进行纠正 → 重新检查 → 使其符合要求。
- 无法改善的数据:予以剔除。
- 过程控制措施: 对采集全过程(人、机、料、法、环)进行控制,出现不符合时采取纠正措施:
- 人员: 能力再确认,关键环节(如审核)采取双人复审。
- 设备: 重新溯源,确保准确性。
- 样品: 采取替代采样机制,确保样品完整。
- 环境: 实时监控(如贮藏室环境),制定应急预案。
- 方法与流程: 对采集完成的数据进行初审。发现不合格数据时:查找根本原因 → 消除原因 → 防止再发生。
- 不合格数据处理:
-
规范性附录:
- 附录A (检查指标表): 定义了进行质量检查时必须遵循的具体指标内容和要求(5级结构)。
- 附录B (评价指标表): 定义了进行质量评价时必须遵循的指标、权重和评分细则。
总结: DB41/T 2847-2025 为河南省商品源数据的质量控制提供了一个全面、具体、可操作的框架。它明确了质量控制的基本要求、检查方法(全检/抽检)、检查内容(通过详细的附录A)、评价方法(量化评分、权重分配、合格判定,依据附录B)以及对不合格数据的处理和改进措施。该标准的核心在于确保商品源数据的高质量,以满足其在供应链、电子商务、市场监管等场景下的可靠应用。附录A和附录B是实际操作中不可或缺的工具性内容。
