区块链是一种分布式的数据库,通过利用加密算法、共识机制等技术构造的信任机制,使其存储的数据安全可靠且防篡改。联邦学习不仅保护了数据隐私的安全,还利用这些数据在可信、安全的环境下构建了机器学习模型。联邦学习和区块链的相同点主要如下。
- 分布式结构,每个参与方在其中一个节点中进行数据操作,不同节点之间相互独立。
- 强调参与节点的地位对等
- 不管是联邦学习还是区块链,通过明文数据进行运算或交易,都存在数据隐私泄露的风险。因此,在联邦学习和区块链场景中,数据的操作都需要与密码学的安全机制,例如同态加密、安全多方、零知识证明等技术相结合,以保护用户的数据隐私。
联邦学习和区块链的本质并不相同,主要体现在:
(1)本质不同
联邦学习的核心是数据不能被移动或复制到其他节点上,每个节点都不知道其他节点的数据。
区块链则相反,为了保证数据的一致性,形成多方共识,需要把数据复制到不同节点上,形成统一账本,所有节点都保留一份相同的账本数据。
(2)所属范畴不同
区块链是一个分布式账本,属于数据结构的范畴;
联邦学习是一种分布式的机器学习模型训练方法,属于机器学习范畴
(3)解决的问题不同
联邦学习要解决小数据、数据割裂、数据孤岛而形成的训练样本数量不足、质量低的问题,在保护数据隐私安全的前提下联合各参与方构建高质量的机器学习模型;
区块链的目标是希望构建一个去中心化、防篡改、公开透明的可信计算平台。
当然,区块链可以与联邦学习优势互补、强强联合。
(1)区块链赋能联邦学习激励机制
为推动联邦学习成为一种可持续的发展模式,必须要激励数据持有者分享其数据集,对模型贡献大的参与方进行激励,从而保证联邦学习的良性生态且可持续发展。
而要激励参与者需要评估每个参与者的贡献
(2)区块链实现联邦学习利益的自动分配
借助区块链的共识机制和智能合约,可以利用激励机制计算得到的收益,并自动分配给各参与方。
(3)区块链提升联邦学习防御能力
利用区块链记录不可篡改的特点,提升联邦学习防御能力。由于联邦学习当前面临的一个问题是对抗攻击问题,例如本地数据的篡改,模型参数的篡改等,都会导致模型性能的下降。而当前的方案,如通过异常检测等发现异常的数据或客户端,均很难有效解决这个问题。
结合区块链的不可篡改性,可以将每个参与方的数据和模型参数都存储在区块链中。这样,只要有一方的数据或参数被篡改,其信息会被判定为无效
(4)区块链帮助追踪联邦学习的攻击来源
区块链可以帮助联邦学习识别并低于潜在攻击,还可以结合区块链可追溯的特点,对发起恶意攻击的参与方进行追溯和惩罚