6月29日,在上海现代服务业联合会的指导下、上海市银行同业公会的支持下,朋湖网联合圆石金融研究院举办的陆家嘴产业金融论坛2022系列线上公益活动——数字经济下的“隐私计算应用产业发展论坛”于线上隆重召开。

本次论坛邀请到了上海市银行同业公会钱钧秘书长、上海交大计算法学与伦理研究中心执行主任刘志毅,富数科技、洞见科技、光之树科技、蓝象智联等来自隐私计算领域的先锋企业以及中国工商银行股份有限公司、中银金融科技有限公司等金融领域应用场景方专家代表,共同探讨数字经济时代下的隐私计算技术应用及产业发展方向,并从金融行业角度全方位解读隐私计算应用场景落地的实际案例,对隐私计算技术的发展模式及未来趋势进行了深刻的解析。

上海现代服务业联合会会长特别助理、汽车产业金融服务专委会秘书长,兼上海国际航运中心发展促进会金融与保险工作委员会常务副主任兼秘书长沈颐辰出席,并作了主办方致辞。

数字经济学家、上海交大计算法学与伦理研究中心执行主任刘志毅出席并带来了主题为《隐私计算赋能人工智能未来》的精彩演讲。

以下为演讲实录

各位好,我今天分享的题目是《隐私计算赋能人工智能未来》。

我们从两个角度来说,首先是从人工智能技术的发展角度来看,那么这一轮人工智能技术发展,实际上是12年开始,深度学习技术在诸多领域都取得成功后,成为了这一轮人工智能技术最重要的基础技术,同时也推动了当下智能化时代的到来。

我们能看到,从大型机时代到个人电脑时代、桌面互联网时代,然后到移动互联网时代,再到如今的万物互联与智能化时代,其实就是解决了三个方向的问题,即算力、算法、数据。

算力是信息化技术革命的基础,摩尔定律下硬件算力快速提升后,才造就了智能化的突破,它也是商业落地层面主要的推动力,使得训练大规模神经网络成为可能。算法的创新也就是我刚刚提到深度学习的突破,那实际上深度学习在上个世纪80年代就已经存在了,为什么到2015年后才能进行成熟的应用?其实也是因为算力问题,有了算力突破的支撑基础后才得到了成熟发展。

数据方面则是数据储存成本大幅下降,从而使得储存大量的训练数据经济上可行。在这三方面推动之下,我们可以看到大规模神经网络的计算成为可能,而人工智能技术也就进入了规模化应用的时代。这些应用包含了一些范畴:

实际上就可以分为三个方面:第一个是图像类、语音类、视频类技术,包括人体与人脸识别技术等;第二类,是自然语言处理;第三类,就是我们做深度学习的关联性技术,如知识图谱、AR与VR。

这是人工智能方面的发展概况,那另一方面从隐私计算技术发展来说,隐私计算技术(Privacy-preserving computation)是一套包含人工智能、密码学、数据科学等众多领域交叉融合的跨学科技术体系,而非一种单一的技术。

该技术在面对数据的所有者、搜集者、发布者和使用者以及意图窃取数据的攻击者时,能够实现数据处于加密状态或非透明状态下的计算,为隐私信息提供全生命周期保护的同时,实现数据“价值”和“知识”的挖掘和共享,真正做到“数据可用不可见”。

2017年谷歌提出联邦学习技术后,隐私计算已完全得到业界的认可,步入了发展快车道,与此同时,海内外开发者也开始探索区块链与隐私计算的融合应用,隐私计算进入技术完善阶段。根据Gartner预测,到2025年将有一半的大型企业机构在不受信任的环境和多方数据分析用例中使用隐私增强计算处理数据,该技术将在2~5年内走向成熟。

而隐私计算技术发展的内在动力,我们说最核心的是在于合规性和科技伦理问题。从现实情况来看,是数据泄露频发,隐私计算技术需求迅速增长;从政策角度来看,数字经济时代来临,数据要素市场化配置上升为国家政策,在《数据安全法》、《网络安全法》和《个人信息保护法》的三法联动推进下,中国数据市场迎来了安全合规发展阶段。

于是,我们就说隐私计算技术就成为了一个非常重要的基础设施。

那放眼国外,当下国内外隐私计算技术的发展也有所差异。国外是企业布局早,更加专注于技术的研究,商业化实践有限。具体来看,国外的隐私计算企业布局早于中国,并在不同技术层面取得了相应成果。如Intel SGX、TrustZone、AMD SEV等国外TEE技术方案经过多年的积累沉淀,目前相对成熟;微软、谷歌、Facebook(现改名为Meta)等大型科技企业分别在多方安全计算、联邦学习等领域持续探索多年。

但国外隐私计算企业虽然布局较早,但是整体的商用实践较为局限。在面向企业的服务中,医疗行业是较为活跃的领域之一。此外,谷歌、Facebook(现改名为Meta)等大型科技企业在探索面向C端的隐私计算应用,还有部分企业将隐私计算应用于数字货币相关场景。

回看国内,则是企业布局晚,技术发展和商业实践协同并行,整体发展迅速。国内在2016年开始出现垂直的隐私计算厂商,相对国外起步较晚。但近年来,中国隐私计算行业的投融资事件数持续增加,2020年和2021年分别有14起和17起融资事件。此外,综合科技企业、区块链企业、人工智能企业等多种类型的技术公司也在纷纷入局。

不同的隐私计算技术厂商也在金融、政务、运营商等领域中都积极展开隐私计算基础平台建设,并逐渐开始在应用层展开场景实践。

在产业需求的推动下,隐私计算跨平台互联互通建设、国产芯片厂商对可信硬件的研发、软硬一体机产品创新等均在如火如荼地开展。基于此,技术服务商还在探索基于数据运营商业模式下的更大市场机会。

从整体上来看,中国隐私计算在产、学、研的协同促进下取得了高效的发展。

以上是有关人工智能和隐私计算的发展概况。再回到人工智能领域来看,数据隐私安全问题逐渐受到重视,一方面很好的保护了隐私,另一方面,人工智能需要依赖于大量的样本数据,而原有技术方案限制了数据信息交换程度和频率,严重制约AI技术和相关生态的发展。

具体主要存在三方面的问题:一、企业间数据彼此隔离,A组织的数据不能直接复制给B组织使用,需要相关技术方案;二、绝大多数企业都存在数据量少,数据质量差的问题,不足以支撑人工智能技术的实现;三、数据本身是资产,竞争性商业公司所拥有的数据具备显性价值,不愿意直接分享。

竞争、安全及数据壁垒等因素造成组织间数据的难以流通,最终形成难以打破壁垒的“数据孤岛”。此外,即便不同行业之间有意愿交换数据,也可能遭遇政策问责和竞争保护,Al的大数据面临重重挑战。

那么,隐私计算对于人工智能而言,也成为了“最优解”。我们可以看到,隐私计算可以助力人工智能解决三大方面的难题:第一、消除数据孤岛、释放数据价值,可实现原始数据不出库,完成数据融合目标。我们说从传统互联网时代到如今产业互联网时代,最核心的难题就是数据变得孤岛化,我们能看到不管是金融、医疗还是制造业,数据呈现孤岛化是非常明显的问题,所以也导致了我们的项目很难实现规模化的网络效应。

第二、加强隐私保护、弥合信任鸿沟,可支持在数据本身不对第三方泄露的情况下完成操作。这是为了解决在具体的业务场景当中,甚至在公众舆论当中的一个信任问题,大家可以看到,凡是出现大规模的隐私泄漏、黑客攻击等事件,公众社会的信任、对科技公司的信任或者是对相关服务方金融机构的信任,就会下降。

第三、规避政策风险,助力合规经营,可助力公司在数据使用合规的前提下重新开展业务,规避政策风险。

接下来,我想介绍一下,隐私计算技术的实现思路,主要有三种:以密码学为核心、融合隐私保护技术的联合建模、依托可信硬件。

以密码学为核心的技术实现包含了多方安全计算、同态加密等多种密码学。目前行业的技术厂商通常将多方安全计算作为主要技术方案,而同态加密等密码学算法也同样被较多地应用于业务实践中,或是与联邦学习、可信执行环境等技术方案展开融合应用。 

融合隐私保护技术的联合建模是将联邦学习与各类隐私保护技术相融合的技术实现方式。基于数据在各参与方分布情况的差异,联邦学习可以分为横向联邦学习、纵向联邦学习、联邦迁移学习。

依托可信硬件,是以基于硬件的信任根,对隐私数据的计算环境进行隔离和度量。数据和算法被加密输入可行执行环境,仅对外输出最终的计算结果,原始数据和过程数据被就地销毁,从而实现数据的“可用不可见”。

这三种路径实际上并不是孤立的,而是可以相互融合、相互推动的。在我们看来,如果一个人工智能企业或一个处于数字经济领域中的企业,要想实现规模化,他可以选择走不同的路径去推动产业更好地挖掘数据价值。

那有哪些产业?比如说,金融行业,可以通过隐私计算进行建模来提升反欺诈的模型水平,在政务领域中可以借助隐私计算促进政务和企业的数据协作,实现政企数据融合应用,还比如说,医疗行业,隐私计算可以有效助力医学影像识别、疾病筛查、AI辅助诊疗、智能问诊咨询等,以及在广告领域中,联邦学习助力广告程序化交易联合建模,提升广告主投放效果和用户体验等。

最后,我总结一下隐私计算的未来发展趋势:

一、效率、性能提升和技术融合将成为隐私计算产品化的主要方向。因为现在隐私计算在应用过程当中,由于它实际上叠加了新的模型、算法和计算过程,所以在这个过程当中,实际上它的效能对整个平台来说是降低的。

牺牲一定的的效率获得更好的安全性,这是目前大部分隐私计算技术平台的现状。而计算效率和性能提升则是未来规模化推广的重要前提。此外,如何通过隐私计算多种技术路径的深度融合,使得通用型隐私计算平台成为未来主要产品形态是我们当下考量的重点。

二、隐私计算应用场景不断拓展,有望重塑数据使用模式。目前,隐私计算应用已经从典型的金融、医疗领域向其他行业拓展,数据协作的业务模式也会有所创新。

三、隐私计算将通过助力法规政策落地促进数据融合应用。实现数据保护或者实现这个隐私计算如何更好地应用,需要技术来解决,但是不能仅限于技术,通过法律法规的条例和技术的融合应用是前提,而通过技术与制度配套推进的方式实现数据保护将是隐私计算发展的有效路径。

隐私计算需动态适应法规政策的变化与完善,进一步落实合规要求。一方面隐私计算是更好地响应社会的需要,去让企业的内部数据更好地合规性应用,而不至于滥用或用到不合适的地方;另一方面,过度的强调绝对的隐私,这件事情我们也认为是不合适的。所以我们认为,通过跨学科的研究,或许我们也会出一些成果,比如说数字、法学相关的技术性讨论,然后也从法学角度讨论隐私数据相关的一些保护,更好地推动产业发展。