近日,由PCview隐私计算研究院主办的《数据隐领未来:隐私计算应用于发展的论坛》邀请到融安数科创始人兼CEO李登峰分享了在基于隐私计算的数据价值流通中,关于合规监管和隐私度量等方面技术上的研究和探讨。

01

数据价值流通的合规监管

李登峰表示,在2020年之前,数据应用是野蛮生长的阶段,随着《数据安全法》《网络安全法》《个人信息保护法》,包括一些行业的条例的推出,央行的《个人征信管理办法》要求18个月“断直联”的要求等,数据应用进入合规化的阶段。

融安数科前瞻性生态化布局的巨大市场机会及合规数据链接管道产品的先发优势,将成为数据合规应用市场的有力推手。通过数据价值合规流通的管道、连接市场的数据方、应用方、监管方等,打造数据流通的生态,最终保障数据的安全流通,促进数字经济的健康发展。

对于数据价值合规流通未来设想,他提出,数据的特点是可复制、非标品和价值流通,数据流通将来会有数据方、应用方以及流通枢纽。数据方包含有自然人数据、法人数据、政务数据和其他数据,应用方需要懂业务、强技术、有数据源,枢纽的特点是合规监管、授权链路、计量收费。

他介绍,数据价值安全合规流通各方都有诉求,数据方的诉求是合法合规、业务降本增效,枢纽节点诉求是密文流通计量计费和合规待监管的决策,包括合法合规、公平公正和争议处理。应用方诉求是合法合规和数据价值收益。

其中,数据价值合规流通的监管需求包括数据合法、合规、有序流通。当前,监管存在困境,包括明文数据不能直接流通,密文数据看不见等。李登峰表示,通过事前监管,包括接入审查、算法审查;事中监管,包括授权核验、算法参数及数据一致性核验;事后监管包括计量计费、争议处理,可以满足监管需求。

他指出,密文流通监管相关技术包括:1、目标函数隐私度量技术;2、授权完整性核验技术;3、模型一致性核验技术;4、数据一致性核验技术;5、计量计费技术技术;6、存证及争议处理技术等。

02

目标函数隐私度量技术

他以多方计算为例,解释为什么会有隐私度量的问题。

多方安全计算(Secure Multi-Party Computation)的研究主要是针对无可信第三方的情况下,如何安全地计算一个约定函数的问题。MPC特点有两个:一、输入的隐私性:除了函数输出的信息外,不能从发送的信息中推断出各参与方的私有数据;二、计算的正确性:多个串通敌手无法迫使诚实的参与方输出错误的结果,衍生出半诚实模型和恶意模型区分。

他认为MPC本质上是一个交互式的图灵机的模型,采用等价电路(代数、布尔电路)模型模拟图灵机操作,具有图灵完备性;如果从程序指令的角度考虑,支持循环、分支、判断等指令。

在多方安全计算的信息熵模型中,他表示,多方计算一个最简单的例子和艾丽斯和鲍勃,计算流程(以两方MPC为例说明),输入数据:Alice输入X,Bob输入Y,输出数据:Bob获得输出Z,约定函数:F(x,y)=z。

示例:Alice和Bob输入各自薪水,约定函数F计算平均薪水,即F=(X+Y)/2,由于加法存在反函数,Bob根据 Y和Z直接反推出X。所以,如果约定函数F存在反函数,则没有隐私保护空间。因此这种情况下,即使MPC能够保护计算过程,计算结果仍然会泄露信息。

针对多方安全计算的隐私泄露问题,可以约定函数F之后增加不确定性函数(如比较函数),缩小函数结果空间,增大隐私保护空间。至于多方安全计算的隐私损耗问题,可以通过如下方法处理:一、禁止多次访问同一用户的数据?缺点:现实场景中很难实现,使用方需要重复访问同一用户;二、在MPC计算中增加参数检查,筛选特殊参数,缺点:无法过滤所有的特殊参数;三、在结果增加差分隐私保护,缺点:存在一定比例的误差,影响可用性;四、Alice增加隐私预算及度量校验,量化控制确保过程和结果的信息损耗,缺点:增加新的计算流程。

接着他介绍了隐私损耗及防范应用示例—逻辑回归预测,以及自动化隐私度量方法。他认为, 数据流通应该是“最小的隐私损耗,最大的数据价值”,而不是“可用不可见”。度量是数据流通的前提,而通用性的、演绎性的、多项式时间可计算的度量方法不存在的。归纳性的度量方法相对比较容易实现,要考虑平均情况、最坏情况、组合情况及中间明文交互情况;演绎性的度量方法:参考差分隐私的思路,对每个算子和算子组合做度量,计算最终度量结果。

最后他表示,在监管方面,不仅包括度量,度量是前提,同时还应该包括恶意模型、数据安全性和一致性,可验证计算、沙盒方案、TEE方案等。