6月29日,在上海现代服务业联合会的指导下、上海市银行同业公会的支持下,朋湖网联合圆石金融研究院举办的陆家嘴产业金融论坛2022系列线上公益活动——数字经济下的“隐私计算应用产业发展论坛”于线上隆重召开。

本次论坛邀请到了上海市银行同业公会钱钧秘书长、上海交大计算法学与伦理研究中心执行主任刘志毅,富数科技、洞见科技、光之树科技、蓝象智联等来自隐私计算领域的先锋企业以及中国工商银行股份有限公司、中银金融科技有限公司等金融领域应用场景方专家代表,共同探讨数字经济时代下的隐私计算技术应用及产业发展方向,并从金融行业角度全方位解读隐私计算应用场景落地的实际案例,对隐私计算技术的发展模式及未来趋势进行了深刻的解析。

上海现代服务业联合会会长特别助理、汽车产业金融服务专委会秘书长,兼上海国际航运中心发展促进会金融与保险工作委员会常务副主任兼秘书长沈颐辰出席,并作了主办方致辞。

富数科技智能决策分析VP吴海斌出席并带来了题为《解决外部数据赋能金融机构的新范式》的精彩演讲。

以下为演讲实录

大家下午好!感谢主办方的邀请。今天我主要给大家阐述一下富数科技与金融机构合作中所做隐私计算应用落地的相关案例以及对金融机构实际需求的理解。

富数科技是2018年开始进入隐私计算领域,这四年间我们从纯技术的研发走向了场景的深耕落地,从金融行业起步向运营商、政务等领域也不断地进行了渗透,在此之中也获得了很多市场的反馈与实际落地经验。

今天主要以金融行业作为案例展开,特别是以个人银行、零售银行。此前,我们和与金融机构做了一些具体的落地方案,会发现银行对数据的需求其实相当大,但需求比较复杂,和以往也发生了不少的变化:,最常见的问题有 “我需要和某个数据源进行合作,但是我们银行是不允许数据出库”、“我通过联邦学习建了一个模型,但是,我后期调用模型的时候我不能让对方知道我调用的是哪个客户信息,信息需要隐藏。”还比如“查询外部标签,需要隐藏客户信息”等。还有,就是一些比较大的集团企业,里面有各类独立主体,包括银行、保险、消费、金融信用卡等,这些企业之间如何才能进行信息共享?比如如何共同统计授信额,共享黑名单,测算客户精致,甚至统计员工绩效等。 

上述所说的都是现在非常常见的问题,目前也都有了相应的解决方案——就是借助隐私计算。所以我今天就想给大家分享一下,基于刚才提到的这几个问题,隐私计算如何助力解决的。

首先,体系化的隐私解决方案主要分为两层,下面一层是密文传输底层逻辑,比如说秘密分享、混淆电路、盲签名等;上面一层是隐私计算应用层,隐私计算厂商的产品都是这些应用的集成的,比如富数科技的阿凡达安全计算平台。举几个例子,就像PSI,我们称之为多方隐私集合求交,这个是最基本的功能,能让两组数据进行交互做一些运算;MPC(多方安全计算)也分为狭义和广义的多方安全计算。

此外,我们还有联邦学习(FL),还有联邦学习和MPC之间共有的应用,我们还有可信执行环境(TEE)。三种大的应用也会交织在一起,每一个交织都会定义一个新的产品,能够支撑到某一个特定的需求。

下面,我再分讲一下常见的加密应用。先说一下安全求交,我刚提到这个是一个非常基本的功能,我们在做联盟学习或做这个数据交互的时候,如果你不做这一步的话,两个数据就没法 “握手”,也就没法把模型建立起来,那这安全求交达到的效果是什么?

比如说,甲方有十万条数据,乙方有一亿的数据,十万和一个亿数据求交的时候,双方仅能求交到那个大家共有的部分,假设是八万条,那甲方的两万条数据是不会被乙方所获取,乙方的大部分非交集部分数据也不会把被甲方给拿走。这样的话就会形成一个共识的部分,同时也能保护到其他任何对方没有的信息,这是安全求教的基本功能。

第二是匿踪查询,也称隐私信息检索,是指查询方在获取查询结果同时可以隐藏被查询对象关键词,数据提供方提供匹配查询结果却无法获知具体对应哪个查询对象。

匿踪查询运用了不经传输技术,不经意传输(Oblivious Transfer - OT)最早在1981年被 Michael O. Rabin提出,1985年S. Even, O. Goldreich, and A. Lempel 提出了1-out-2 OT, 在此方案中发送者Alice每次发送2个信息m_0 和m_1,而接收者Bob每次输入一个选择b, 当协议结束的时候,发送者Alice无法获得关于接收者Bob的任何有价值的信息,而接收者Bob只能获得m_b,对于m_(b-1), 接收者Bob也一无所知。

第三是多方安全计算,也称“基于秘密共享的MPC”,即每个参与计算数据方都没有暴露自己的真实数据,但是却得到了准确的计算结果。

为什么叫做秘密分享?我打一个比方,假设有三个人,这三个人兜里分别有十块、七块、五块钱,我们想需要知道这三个人一共有多少钱,但同时又不想让对方知道每人分别有多少钱。那怎么办?秘密分享的原理比较简单,就是每人的金额分成3片,并加上一个随机数。比如需要把10 分成“2”、“35”、“73”,把5分为“24”、“11”、“70”,把7分为“60”、“23”、“24”,这分别的三个数字都有一个特点,那就是他们的个位数上面的数字相加等于原数,然后再把这各三个数字分别分配,再进行分片计算,最后得到的总数是322,去掉“300”,即这三人一共拥有的总额。

通过这个计算,就可以得到我想要的信息,但同时也不会泄露数据分析方的具体信息,这是多方安全计算的一个具体的计算方式。

第四是同态加密,经过同态加密的数据进行处理得到一个输出,将这一输出进行解密,其结果与用同一方法处理未加密的原始数据得到的输出结果是一样的话。

在刚才提到来自银行的需求,比如“银行数据不出库”的问题就有了解决方案,特征数据不出库,与外部数据联合模型便是隐私求交。

匿踪查询+联邦学习便可以解决“联合建模后,调用模型隐藏客户信息以及数据查询隐藏客户信息”的问题。

我再给大家分享一个实际案例,是上述算法的组合。这个客户有以下三点需求:一、他们集团中有不同的业务,不同业务主体中共有客户授信额、风控表现、资产等信息,但是由于主体独立,没有办法交互使用,相互验证和业务支持;二、查询方金融机构不希望让第二方机构知晓自己客户的具体信息;三、参与计算的法人机构也不愿意将自有的申请数据对外输出。

为了满足以上需求,我们就给这位客户做了一个基于匿踪查询的多方安全计算的解决方案。例如我这里有银行、保险证券等等机构参与了联盟(如下图所示),我现在想知道这个人在我银行所有的资产情况到底多少,比如说投资情况、存款情况、购买保险的情况等等。需求方首先把身份证信息输入进来后,信息会被传送到协调方,协调方是一个中心方,中心方可以是一个黑盒子,可以是一个中心节点,它不参与任何数据计算,但负责发送信息。中心方收到查询信息后,在联盟里进行并发查询,查询的方式是通过匿踪的查询。这个方式的概念是指最后查询到了信息结果,但中心方并不会知道查询人是谁。

然后它就通过上述所讲到的多方安全计算中的分片方式把它的信息拆成四片、分配,最后效果就是会知道客户这个ID的总共资产情况,但各方并不会知道其他的主体到底有多少资产情况,同时,服务方也不会知道到底是谁来查询的,这样整个链条下来就会达到数据都不出库,然后查询方就获得了他想要的信息的目的。

最后,我跟大家简单介绍一下富数科技,富数科技2018年便开始进入到隐私计算领域当中,目前,我们也获得了来自政府、行业机构、业务方等等的认可。比如,我们是首批通过信通院多方安全计算基础功能评测的厂商,也是首批通过银行卡检测中心评测、公安部病毒应急管理中心评测的一员,以及也是首个实现与同行业互联互通的厂商之一。

我们非常希望和包括金融业在内的各行各业的伙伴们一起探讨问题,并提出专业的解决方案,来突破一些业务难题,踏踏实实地走下去。

谢谢。