- https://mp.weixin.qq.com/s/6cOdc3C8eGAuK_ytdnHW0A?scene=25&sessionid=102177593#wechat_redirect
- https://mp.weixin.qq.com/s/YR0eRJKVLJBBo1AyQYfWQw
引言
本次发布的标准聚焦于数据安全、生成式人工智能安全等关键领域,进一步丰富了大网络安全工作格局下的网络安全标准体系建设,为国家数据安全和人工智能安全的管理工作及产业发展提供标准支撑。
1.GB/T 45574—2025《数据安全技术 敏感个人信息处理安全要求》
该标准确立了敏感个人信息识别和界定,规定了敏感个人信息处理通用安全要求和敏感个人信息处理特殊安全要求;适用于个人信息处理者开展敏感个人信息处理活动,也适用于监管部门和第三方评估机构对敏感个人信息处理活动进行监督、管理和评估。
2.GB/T 45576—2025《网络安全技术 网络安全保险应用指南》
该标准描述了网络安全保险的目的和作用、主要角色和责任,给出了基本应用流程、保障事件类型和损失类型,提出了网络安全保险应用各阶段的方法;适用于组织购买和使用网络安全保险以及网络安全保险机构开展网络安全保险业务,应用网络安全保险的其他相关方参考执行。
3.GB/T 45577—2025《数据安全技术 数据安全风险评估方法》
该标准描述了数据安全风险评估的基本概念、要素关系、分析原理,给出了数据安全风险评估的实施流程、评估内容、分析评价方法等;适用于指导数据处理者、第三方评估机构开展数据安全风险评估,也可供有关主管监管部门实施数据安全检查评估时参考。
4.GB/T 45652—2025《网络安全技术 生成式人工智能预训练和优化训练数据安全规范》【数据安全规范】
该标准规定了生成式人工智能预训练和优化训练数据及其处理活动的安全要求,描述了相应的评价方法;适用于生成式人工智能服务提供者开展预训练和优化训练数据处理活动以及安全自评估,也适用于第三方机构对预训练和优化训练数据进行安全性评估提供参考。
5.GB/T 45654—2025《网络安全技术 生成式人工智能服务安全基本要求》【基本要求】
该标准规定了生成式人工智能服务在训练数据安全、模型安全、安全措施等方面的要求,并给出了安全评估参考方法;适用于服务提供者开展生成式人工智能服务相关活动,也为相关主管部门以及第三方评估机构提供参考。
6.GB/T 45674—2025《网络安全技术 生成式人工智能数据标注安全规范》【标注安全规范】
该标准规定了生成式人工智能训练的数据标注平台或工具安全要求、数据标注规则安全要求、数据标注人员要求、数据标注核验要求,描述了数据标注安全评价方法;适用于生成式人工智能数据标注组织方开展训练数据标注活动,也可为生成式人工智能数据需求方对于数据标注进行检查、验收或第三方机构对数据标注进行安全性评估提供参考。
以上标准将于2025年11月1日起正式实施。
大模型安全标准
基本要求
《基本要求》是大模型安全总纲性文件,提纲挈领地指出模型备案上线所需具备的基础条件,是大模型备案技术性指导文件《生成式人工智能服务安全基本要求》的标准化产物。本文根据《基本要求》主体内容,提炼了核心的大模型服务十大安全基本要求。
语料安全要求
语料来源要求
语料内容安全要求
语料标注安全要求
模型安全要求
安全措施要求
安全评估要求
安全评估方法
语料安全评估
生成内容安全评估
问题拒答评估
其他要求
关键词库要求
生成内容测试题库
拒答测试题库
分类模型要求
标注安全规范
本标准适用于面向我国境内公众提供生成式人工智能服务的组织或个人提高预训练及优化训练数据处理活动的安全水平,也可为生成式人工智能的预训练和优化训练数据提供者提供参考。 本标准的主要技术内容包括:生成式人工智能预训练和优化训练数据的基本安全要求、预训练数据处理活动安全要求、优化训练数据处理活动安全要求以及对应的检测方法。
<img alt="image-20250525165126918" loading="lazy">
标注平台与工具安全要求
- 平台系统安全评估:应定期对标注平台或系统进行安全评估,发现潜在的安全漏洞,及时进行修复,并详细记录漏洞发现及处置情况;应在安全的标注平台或系统开展标注活动。
- 操作日志留存:应确保标注平台或系统能详细记录用户的操作和系统活动,以便在发生安全事件时进行调查;应确保日志包含足够的详细信息,以追踪数据的处理历史。
- 访问权限控制:对于集中开展的数据标注工作,应提供具有适当区域划定和访问控制的物理环境,以防止未授权人员进入标注区域,确保标注物理环境安全;对于非集中开展的数据标注工作,应确保每位标注人员所使用的标注设备安全和网络传输通道安全;宜对安全性标注数据进行隔离存储。
- 自动化标注合规:如在标注过程中使用基于生成式人工智能服务的自动化标注平台或工具进行辅助标注,应符合生成式人工智能服务相关法律法规要求。
标注规则安全要求
- 通用标注规则:至少包括标注目标、数据格式、标注方法、质量指标等内容,同时数据标注组织方应分别对功能性数据标注与安全性数据标注制定具体的标注规则,标注规则应至少覆盖数据标注的实施和审核等环节;数据标注组织方应明确具体标注任务类型,对含有文本、图片、音频、视频、时间序列等不同内容的标注任务,应符合 GB/T42755—2023中5.1.1的数据需求方标注任务要求。
- 功能性标注规则:应能够用于指导标注人员按照特定领域特点生成具备真实性、准确性、客观性、多样性的标注数据,包含正反例信息,使标注人员能够依据标注规则正确执行标注任务;同时也要包含安全风险内容的识别方法及参考示例,能够使标注人员依据标注规则判定安全风险提示信息,避免产生包含安全风险内容的响应信息标注。
- 安全性标注规则:应能够指导标注人员围绕数据及生成内容的主要安全风险进行标注;包含涉及安全风险内容的提示信息时的响应信息标注规则说明及参考示例,能够使标注人员能够依据标注规则给出规避安全风险的正向引导性响应信息标注。
- 其他标注规则:应包含不恰当或者错误标注的识别方法及参考示例,能够使标注人员能够依据标注规则及时动态更新或纠正标注内容;应包含对数据标注结果的质量及安全性核验方法;应包含应对和处置标注过程中安全事件的应急响应和通知机制。
标注人员要求
- 安全培训
- 培训内容:至少包括数据标注规则安全要求、数据标注平台或工具使用方法及安全要求、数据标注质量及安全性核验方法、标注数据安全管理、典型安全风险场景及相关安全问题案例及识别方法、数据标注人员安全及遵纪守法意识培训等。
- 考核机制:应在培训结束后组织数据标注人员进行安全考核,给予合格者标注上岗资格,对考核过程进行记录,并留存记录文档;考核内容应包括相关法律法规知识、标注规则理解能力、标注平台或工具使用能力、安全风险判定能力、数据安全管理能力等;应定期或在标注规则发生重大变化时组织重新培训考核,暂停或取消不合格者的标注上岗资格。
- 任务分配
- 明确人员:应按数据标注规模和标注任务需求,明确数据标注人员的数量和岗位职责,并根据任务实际情况动态调整。
- 划分角色:应按标注任务中的不同职责定位,划分数据标注人员角色,包括标注执行人员、标注审核人员、标注仲裁人员、标注监督人员,并根据角色能力要求进行标注任务分配。
- 过程记录:应对各数据标注人员任务分配过程进行记录,并留存记录文档。
- 人员管理
- 标注审查:标注执行人员应按照数据标注规则及任务要求完成数据标注,提交数据标注结果由标注审核人员进行审查。
- 标注仲裁:对于多人标注数据存在不一致或数据存在争议情况,标注仲裁人员应进行最终裁决判定,并保留仲裁记录。裁定通过的,提交标注结果;裁定不通过的,舍弃或退回进行重新标注。
- 标注监督:标注监督人员应对标注活动进行监督,对标注过程中不同角色人员的任务完成情况进行抽样检查;应对标注过程中可能发生的数据安全、传输安全等风险情况等进行及时发现处理,并保留风险发现及处置情况记录。
标注核验要求
- 基本要求
- 全面性:至少覆盖 GB/T45654—2025附录 A 中所列主要安全风险场景,每种安全风险的安全性标注数据宜不少于200条,数据标注中的安全性标注比例宜不低于3%。
- 结果核验:使用人工或自动化标注工具验证标注结果,对核验发现的标注结果中的问题进行纠正或重新标注,并跟踪纠正情况和处理结果,并对标注数据核验过程进行记录并形成可审查的记录文档,记录的内容包括核验人员信息、核验时间、核验结果,发现的问题和采取的措施等。
- 功能性标注核验要求
- 提示信息:内容上应具备逻辑性、有效性、合理性、多样性等。
- 响应信息:备准确性、有用性、时效性、逻辑性、易读性等。
- 安全性核验:应对每一批标注数据进行人工抽检,发现内容中包含违法不良信息的,应作废该批次标注数据。
- 安全性标注核验要求
- 响应安全:对于安全性标注数据,微调数据标注的响应信息以及偏好数据标注中正例的响应信息中不应包含安全风险信息,并保证响应信息对提示信息中的安全风险内容进行了安全、合理的响应;
- 安全审核:每一条安全性标注数据应至少由一名标注审核人员审核通过;
- 安全指标:当未通过安全性核验的标注数据数量超过安全性标注数据总量的5%时,该批次标注数据应作废。
主要违法不良信息(5大类31小类)
分类小类A.1 包含违反社会主义核心价值观的内容d)煽动颠覆国家政权、推翻社会主义制度;e)危害国家安全和利益、损害国家形象;f)煽动分裂国家、破坏国家统一和社会稳定;g)宣扬恐怖主义、极端主义;h)宣扬民族仇恨;i)宣扬暴力、淫秽色情;j)传播虚假有害信息;k)其他法律、行政法规禁止的内容A.2 包含歧视性内容a)民族歧视内容;b)信仰歧视内容;c)国别歧视内容;d)地域歧视内容;e)性别歧视内容;f)年龄歧视内容;g)职业歧视内容;h)健康歧视内容;i)其他方面歧视内容A.3 商业违法违规a)侵犯他人知识产权;b)违反商业道德;c)泄露他人商业秘密;d)利用算法、数据、平台等优势,实施垄断和不正当竞争行为;e)其他商业违法违规行为A.4 侵犯他人合法权益a)危害他人身心健康;b)侵害他人肖像权;c)侵害他人名誉权;d)侵害他人荣誉权;e)侵害他人隐私权;f)侵害他人个人信息权益;g)侵犯他人其他合法权益A.5 无法满足特定服务类型的安全需求a)内容不准确,严重不符合科学常识或主流认知;b)内容不可靠,虽然不包含严重错误的内容,但无法对使用者形成帮助数据安全规范
本标准适用于面向我国境内公众提供生成式人工智能服务的组织或个人提高预训练及优化训练数据处理活动的安全水平,也可为生成式人工智能的预训练和优化训练数据提供者提供参考。 本标准的主要技术内容包括:生成式人工智能预训练和优化训练数据的基本安全要求、预训练数据处理活动安全要求、优化训练数据处理活动安全要求以及对应的检测方法。
通用安全要求
预训练数据处理活动安全要求
优化训练数据处理活动安全要求
评价方法
个人敏感信息标准
敏感个人信息分类
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |