论文解读--大数据平台数据的安全管理体系架构设计--胡志达(电信)
-
摘要:
-
引出问题:数据的安全管理存在数据传输不可靠、数据丢失、数据泄露等问题
-
大数据平台的安全管理体系:数据安全采集层、存储层、使用层
-
数据安全采集层:从数据分类、数据分级、敏感数据识别、数据脱脱敏、多类型加密机制,5个维度保障数据安全
-
数据安全存储层:从多维度数据安全存储机制、基于网络安全等级保护制度的安全评测两个维度保障数据安全
-
数据安全使用层:采用细粒度访问控制、基于区块链的数据保护、基于联邦学习的数据共享、全过程安全审计 4中技术保障数据使用安全
-
通过设计基于区块链的数据保护模型和基于联邦学习的数据共享模型,进一步提升数据安全管理体系架构的可靠性和可用性
-
引言:
-
举例1:
-
为解决隐私信息被泄露的问题,陈天莹等提出智能数据脱敏系统,实现了低耦合和高效的数据脱敏功能
-
为解决数据隐私保护中效率低的问题,黄亮等采用计算技术对数据安全保护的关键环节进行处理,提升了数据隐私处理的效率
-
魏富国等分析了人工智能技术在数据安全管理领域的应用情况,总结了人工智能技术进行数据治理的成果
-
针对生物医疗领域的数据隐私泄露问题,肖瑷等从数据采集、存储、使用、共享等环节设计了数据安全使用和管理规范
-
为解决多种类型数据的隐私泄露问题,刘峰等提出了基于区块链技术的泛用型数据隐私保护协议,并且证明和验证了协议的效率和便捷性
-
综上:
-
已有的研究已经从访问控制、安全审计、容灾备份、数据加密等维度对数据进行安全管理。
-
但已有的研究不能很好的保障数据的安全存储和使用。
-
抛出问题
-
数据采集问题
-
数据理解分析不深
-
数据来源于多个部门或者单位,数据具有多种业务逻辑、数据类型多样
-
数据采集过程不安全两个问题。
-
产生数据的终端多样,这些终端接入网络的方式包括无线和优先,网络的提供方也多种多样。
-
如何实现数据来源的可信,数据的传输安全是急需解决的问题
-
数据存储安全
-
存在数据丢失
-
由于网络、计算机、数据库等软硬件出现故障,导致存储的数据或者正在保存中的数据出现丢失
-
数据平台被攻击
-
由于近年来网络攻击活动越来越多,抵御难度大
-
数据使用安全
-
数据泄露
-
不同企业间数据流转
-
数据权限管理
-
数据。。
-
模型
-
安全采集层:数据分类、数据分级、敏感数据识别、数据脱敏、多类型加密机制
-
数据分类
-
优先按照业务类型进行数据分类
-
采用业务属性、保密级别、所有者属性等对数据进行分类
-
数据分级
-
从数据安全性需求的角度进行管理
-
要素:所有者、数据不安全导致的灾害程度,数据不安全涉及的相关范畴
-
敏感数据识别
-
根据数据的关键词、数据特征、数据隐私性对数据的敏感情况进行识别
-
数据脱敏
-
从业务的需求角度:数据置换算法、数据加密算法
-
多类型加密机制
-
根据数据安全级别,制定不同的加密方式
-
可验加密、多方加密、同态加密
-
数据安全存储层:从多维度数据安全存储机制、基于网络安全等级保护制度的安全评测两个维度保障数据安全
-
数据存储安全
-
根据数据的分级特性以及数据的属性对数据采取合适的存储方式
-
将数据存储平台的安全检查作为常规的工作
-
数据安全使用层:采用细粒度访问控制、基于区块链的数据保护、基于联邦学习的数据共享、全过程安全审计 4中技术保障数据使用安全
-
基于区块链的数据保护模型:
-
解决数据在使用中被篡改
-
区块链技术的去中心化,去信任特征可以比较好地实现数据的安全管理
-
实现区块链的技术包括:分布式数据存储、共识机制、智能合约等。通过各项关键技术,可以是此案数据的防篡改、可追溯等特性
-
基于联邦学习的数据共享模型
-
解决数据孤岛导致数据价值不能有效发挥的问题
-
联邦学习是谷歌公司提出的数据共享机制,通过联邦学习技术,可以有效解决数据共享存在的数据泄漏问题,不能共享导致的数据孤岛问题
-
数据的使用包括:事前的资源申请,事中的数据处理,使用后的数据归档等全过程的工作,全过程安全审计策略
-
关键技术
-
基于区块链的数据保护模型
-
该模型包括数据相关方、系统服务接口、区块链模型、数据存储平台4个方面
-
数据相关方:参与数据采集、数据存储、数据使用的相关单位或部门
-
系统服务接口:采用通用性较高的restful接口技术,方便各个参与方的操作。
-
区块链模块采用以太坊联盟技术实现,从而提升数据相关方对数据的操作
-
数据存储平台使用分布式存储技术,实现数据的高可用和安全存储功能
-
考虑到数据管理的安全性和便捷性,在区块链模块定义用户管理合约、数据采集合约、数据使用合约,从而实现数据管理的智能化和自动化
-
基于联邦学习的数据共享模型
-
该模型包括数据共享的相关参与方,数据共享接口,3中联邦学习策略
-
相关参与方:需要共享数据的相关部门或公司
-
数据共享接口:各参与方实现数据共享的通道
-
3种联邦学习策略:横向联邦学习、纵向联邦学习、联邦迁移学习
-
横向联邦学习:适合业务类型相同,但客户区域不同的参与者之间共享数据
-
纵向联邦学习:适合用户类型和区域相同,单是业务类型不同的参与者之间共享数据
-
联邦迁移学习:适应业务类型不同、用户类型不同的参与者之间进行合作研究而进行数据共享的场景