据不完全统计,国内个人数据隐私泄露数达55.3亿条左右,平均每人就有4条相关的个人数据泄露,这些信息最终的命运,是在黑市中反复倒手,直至被榨干价值。其中,80%的数据泄露自企业内鬼,黑客仅占20%。直到2017年6月《网络安全法》出台,各类灰色和黑色数据产业才逐渐收敛,但依然暗流涌动。
加密学的几种加密技术盘点
其实,我们认为数据行业交易的应该是数据的使用权,而不是数据本身。数据由于本身易复制和可传播的特性,在现行的科技手段下,不能有效地防止数据在分享和使用的过程被泄露。
从企业端来看,大数据分析一般由第三方对各类数据源进行合并、分析和建模。数据集中化收集导致隐私数据泄露等风险,导致目前只有1%的企业数据向第三方如大数据公司、AI公司分享。拥有数据的公司无法安全的将数据共享或变现,进而产生一个个数据孤岛。从用户端来看,大数据公司、开发者和科学家仅能接触到有限的数据集,并且费用高昂。与运营商等大数据源的合作需要开发人员现场部署模型于数据源的服务器上,模型算法存在泄露风险,且效率低下。
而要想找到数据隐私的保护手段,其实是可从可信硬件和密码学两个方向入手。硬件手段主要是可信执行环境,而密码学手段主要有同态加密,零知识证明,以及安全多方计算。
同态加密
同态加密是一种支持密文运算的加密方式。数学上,同态描述了将一个数据集合转换为另一个集合的对应关系,同时保持了两个集合中元素之间的运算结构。由于同态加密中的明文与密文满足同态性,因此对应的数学运算, 无论是对加密数据还是明文数据执行,都将得到相同的结果。从而,可在不暴露明文的情况下,利用密文运算获得数据计算结果,实现了数据隐私和数据处理的并存。
同态加密有望在云计算中发挥重要作用,允许公司将加密数据存储在公共云中,并利用云提供商的分析服务。目前由于理论基础和技术发展的限制,同态加密的效率距实用差距很大,在短期内难以进行大规模的商用。
零知识证明
零知识证明可简单描述为,证明者能够在不向验证者提供任何有用信息的情况下,使验证者相信某个论断是正确的证明方法。零知识证明被大量密码学协议用作基本模块,但在构建隐私计算方面仍有多方面技术难点需要突破,包括一般性函数的计算,运行效率,多方数据隐私,可信初始化等问题。
可信执行环境
可信执行环境通过在硬件计算平台上引入安全软硬件协同设计架构来提高系统的安全性。通过基于硬件密钥的安全代码加载,强制硬件环境中计算行为不可作恶。其优点是速度较快,缺点是过于中心化,需要信任硬件提供方,并且存在设计漏洞,易被侧信道攻击等安全风险。
安全多方计算
安全多方计算研究的是在无可信第三方的情况下,几个相互不信任的参与方如何安全地计算一个约定函数的问题。安全多方计算可在明文数据不离开各自节点的前提下,完成多方协同分析、处理和结果发布,适合以下应用场景:多个机构之间想共享数据以供信息联合查询,但又互不信任,每个机构都需要防止数据泄露。利用安全多方计算技术,可以实现数据的安全查询,即在不泄漏任何一方数据的情况下对数据整合和分析,如此,企业可以在我们的技术的帮助下打通这一原本不可能的场景,并且满足法律合规的需求。