转载学习:面向多方数据融合分析的隐私计算技术综述,建议看原文
背景与核心问题
随着数据时代的发展,泛在共享环境下个人隐私面临严峻威胁,如App超范围采集信息、大数据杀熟等。跨系统数据融合需求迫切,但需确保隐私数据在共享、传播与协同计算中的安全性。隐私计算技术旨在通过多方协作,实现数据安全共享与受控传播。
泛在共享环境是一种基于泛在计算技术(Ubiquitous Computing)构建的数字化生态系统,旨在通过无缝整合物理空间、社会网络、信息技术和智能设备,实现资源、数据和服务的无处不在、按需共享与协同交互。其核心目标是打破传统信息孤岛,构建一个开放、智能、动态的共享网络,支持用户在任何时间、任何地点以自然方式获取所需资源或服务
核心研究方向与技术要点
- 多方隐私计算
- 全生命周期保护:基于李凤华提出的隐私计算理论,构建涵盖隐私抽取、场景描述、控制、操作和效果评估的五步框架,提供全生命周期保护。微软、HP实验室等提出服务全流程方案,集成加密、策略绑定等技术。
- 隐私流转控制:基于访问控制模型(如RBAC、CBAC、ABAC)提供细粒度权限管理,结合策略推荐系统(矩阵分解、深度学习)优化策略设置效率。
- 敏感数据交换:区块链技术用于可审计的共享(如医疗、电网数据),零知识证明、不经意传输等技术确保交易隐私,但存在匿名性滥用、计算开销大的缺陷。
- 多方隐私信息共享控制
- 本地控制:联邦学习通过“数据不动模型动”保护本地隐私,分为横向(不同地区的银行)、纵向(相同地区的银行和超市)与迁移学习(特征和用户重复度低),适配不同数据分布场景。
- 延伸控制:基于数据起源的访问控制(追踪传播路径)与策略粘贴技术(将策略绑定到数据),结合加密保护策略完整性,支持跨域传播权限管理。
- 脱敏控制
- 匿名技术(k-匿名、l-多样性)泛化或抑制敏感位置轨迹,平衡隐私与数据可用性。
- 差分隐私通过添加噪声实现全局或本地(如苹果iOS、Google RAPPOR)保护,结合联邦学习优化模型训练。
- 信息论方法利用熵度量隐私泄露,应用于位置服务、数据发布等场景。
- 多方数据协同安全计算
- 安全多方计算(SMC):保护各参与方输入隐私,应用于位置查询、医疗诊断,但存在高通信开销问题。
- 同态加密:支持密文运算,应用于外包学习(如加密神经网络推理),但面临计算效率与存储成本挑战。
- 性能瓶颈:SMC频繁交互、加密算法的模运算复杂度限制了其在大规模场景的应用。
传统技术的局限性
- 匿名/脱敏方案:环节单一、易损可用性;
- 密码学方案(SMC、同态加密):高计算/通信开销;
- 联邦学习:需暴露模型(参数),模型隐私保护不足。
未来发展展望
隐私计算理论的全生命周期框架需结合场景优化:
- 深化跨域频繁脱敏场景的保护机制;
- 融合区块链、零知识证明等技术解决策略冲突与追溯难题;
- 探索轻量化密码算法与联邦学习的结合,突破性能瓶颈;
- 完善隐私效果评估指标(如信息熵、模糊综合评估),提升量化能力。
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |