本文发自venturebeat,原题为“Meta’s RSC supercomputer brings revolutionary power — and privacy and bias concerns”,作者Ashleigh Hollowell,经朋湖网作者王姿蝶编译整理,供业内参考。

上个月,Meta(前身为 Facebook)宣布开发出一款名为 AI Research SuperCluster (RSC) 的超级计算机,并表示,该计算机预计在今年年末完成,届时,将成为世界上最快的人工智能超级计算机之一,为虚拟世界提供动力。

同时,RSC的先进计算能力将有助于解决该公司长期以来受到批评的问题,例如有害内容识别及算法偏差。

为解决这些问题,Meta曾在一篇博客文章中详细介绍了它计划如何培训RSC保护用户数据隐私。具体来说,该公司采用“无直接入站或出站方式将RSC与更大的互联网隔离,保证流量只来自于Meta的生产数据中心。”

“在将数据导入RSC前,将会经过隐私审查程序用以确认其已正确匿名化,或已采取替代隐私保护措施。数据在可用于训练AI 模型之前进行加密,并定期删除数据和解密密钥,以确保旧数据仍然无法访问。由于数据仅在内存中的一个端点解密,因此即使在不太可能发生设施物理破坏的情况下也能得到保护。”

01

具有综合优势的超级计算机

RSC超级计算机所具备的强大技术潜力和机会中包含针对仇恨(言论)内容。

据了解,在2020年,该公司曾报告称,“从Facebook删除的97%的仇恨言论在被标记前就已被自动化系统发现。”

由于RSC能够在AI模型数万亿个示例中挑选出数百种语言进行学习、理解,因此它更多效用于应用其强大计算能力来加速彻底解决仇恨言论和有害内容的事项。

RSC是在全球冠状病毒席卷中进行远程设计和建造的。尽管进程存在坎坷,但Meta表示RSC仍在短短一年半时间内将这一共享文档中的想法转变成为能够导航COVID-19 所需供应链危机、远程工作和新的安全协议的功能性集群。

“虽然高性能计算社区几十年来一直在处理规模问题,但我们还必须确保现阶段拥有必要安全和隐私控制措施,能够保护任何训练数据。”Meta表示,这与此前仅利用开源和公开可用数据集的AI研究基础设施不同,RSC能够通过模型训练中包含Meta生产系统的真实示例,来帮助确保我们的研究有效地转化为实践。

02

混合身份和解决偏见

本质上,RSC构建的“元宇宙”是为了寻求模糊物理和数字现实之间的界限,因此,它将把用户的物理身份与其数字身份交织合一。

但华盛顿大学的人工智能伦理学家Os Keyes认为物理和数字身份两者间的融合是令人担忧的。他表示,问题将存在于用户信息完全透明便不再需要隐私的哲学悖论之中。

并且,这种意识形态强调了Facebook的决策,在强调严格实名政策时将其与某种欺诈联系起来。却也因此伤害了一些“特殊”人群,例如性工作者、跨性别者、美洲原住民等姓名与身份意义不大的人群类型。

因此,Meta在凭借其有望成为复杂元节骨干超级计算机进行算法、数据集群学习时,可能会进一步延续大规模的人工智能偏见。

这一问题所能延伸范围颇广。

在科技行业、人工智能领域中,该由谁控制人工智能驱动的计算系统?如何准确从算法中学习,随后根据用户点击偏好、朋友类别和内容消费需求来定义人群?如果算法所推断的内容出现误导性画面,用户是否该享有发言权?

“如果Meta能够更明确地说明他们保留了哪些确切信息,并赋予其简便修复、纠正能力,那将是理想状态。”FutureAI 的首席执行官查尔斯西蒙说,普遍想法中,用户在Facebook中发布的图片或言论中的绝对隐私期望是不现实的。但若仅通过所点击话题、网站而断然其年龄、性别这是不准确的。因此,明确其推断的具体内容,以便用户纠正不符合事实的内容很重要。

Meta认为,RSC正在解决偏见问题。其负责任AI的支柱指出,现阶段,该团队已经开发并不断改进Fairness Flow工具和流程,用以帮助ML工程师检测某类AI模型形式的潜在统计偏差和Facebook常用标签。正如近期学术论文中所述,RSC的目标是将类似测量拓展于所有AI产品当中。

不过,解决偏见是一个长期、持久的挑战。

现阶段,Meta正在解决AI技术中因“训练数据不足、缺乏特征、错误指定的预测目标或输入特征中的测量错误”而长期存在的存在的缺陷。

从用户角度进行考虑,数据是否能够可以经由RSC匿名化?

Keyes认为,Meta的新型人工智能超级计算机与隐私相关的两个方面进行联结时,将会存在道德问题。首先,被Meta 称之为“功能保护”的隐私保护类型,其本质并非是为了保护用户数据。

“从隐私角度保护数据是表示很多内容将在功能上免受非Facebook用户的伤害。”Keyes表示,大型科技巨头的普遍问题在于定义“匿名数据”含义、定义用户数据及用户数据分析中的不透明化。在对数据进行去匿名化操作时,适当使用该用户已知数据因素来进行合理推断,那么该数据将根据该信息对某人进行去匿名化。

“确实,数据是否匿名取决于上下文语境。准确来说,可以从数据的上下关联性中确定它是否是真实匿名的。”Keyes认为,用户关注“数据影子”的悖论是符合实际的,因为这从本质上来说是自身的数据分身。当我们在数据中的个人代表可以“过自己的生活”时,这或许将变得危险,更容易使得数据出现在意想不到的地方,从而导致隐私受到侵犯。

除了Keyes外,人工智能和隐私专家也提出了一些与RSC计算、数据隐私安全以及对Meta隐私协议和保护措施相关的担忧。

“想象一下,你放入电脑中的所有东西相当于一张明信片。由于邮件是没有密封的,当有人递送邮件时,他们或许将在途中阅读邮件”西蒙表示,正因如此,用户需要开始考虑更加安全的方式来传输信息。

面对业内专家的疑虑,Meta回应道,RSC的公告是关于基础设施的,且并未改变其对于推进负责任人工智能基础设施的承诺。同时,他们还正在投资可解释的新研究,例如Captum等,用于解决人工智能所面对的不透明问题。

03

Meta 改善隐私和获得用户信任的坎坷之路

自 2006年Facebook第一次出现隐私“问题”以来,该公司因未能有效保护用户数据隐私且对其进行道德分析而受到广泛关注。

现阶段,Meta希望在隐私和偏见方面翻开新的一页。

在提供给VentureBeat的一份声明中,Meta解释道,当前,数据隐私由Meta的隐私团队监督,该团队是其建立全面隐私计划的核心,其中有不同组织和角色的数千人共同努力将隐私嵌入公共政策、隐私策略、法律等各个方面。

行业专家一致认为,Meta过去在失败的主要原因在于以反动方式处理用户隐私,而非从一开始就主动确保并采取具体措施。尽管其声称RSC的设计从一开始就考虑到了隐私和安全性,但由于隐私保护失败的时间很长,专家和用户都心存疑虑。

但Meta表示,自身始终致力于保护数据,并且采取了去标识化等方法来进行实施。西蒙解释说,虽然RSC超级计算机可能意味着Meta将有能力尝试解决偏见、保护隐私和识别有害内容以及增强的计算和人工智能功能,但该公司有能力大规模、快速实现这些愿景,但却并不代表其能够“更聪明地”实现这一目标。

“这是一个悬而未决的问题,Meta会被要求做得更好。并且,他们正在翻开新的一页,但新的一页并非其销售数据、点击量等商业模式。”西蒙说, 点击量通常来自于最具煽动性的文本。企业是否愿意为了用户和人类的利益而缩减点击量?我对这个想法持怀疑态度。”

Keyes也表达出类似观点,表示Meta当前政策缺乏明确细节,即当RSC用户数据不可避免地出现事故时该运用哪些流程来解决问题并实现某种程度上的公正。

“需要确保这些事情与Facebook的运作方式是d背道而驰的。从我的角度来看,Facebook无法充分做到这一点。”Keyes说,归根结底,我对Facebook建立RSC的根本担忧在于无论他们如何论证进行匿名化事物是安全的。因为,Facebook公司的目的和利润率是通过协调、调整和合并数据并尝试尽可能多地组装尽可能人性化的数据来实现的。

04

呼吁科技巨头采取行动

Meta的Facebook用户首次下降后其股价也随之下降,这是否表明有众多用户正在关注并尝试离开该平台进行其他形式的娱乐活动?业内专家认为这种可能性很大。

“作为用户来说,是可以选择退出的,但我认为这将是真正的监管形式。”西蒙表示,当人们在隐私方面越界后,就会选择退出。

那么,Meta该如何做得更好?

隐私专家沃尔特·哈里森 (Walter Harrison) 的公司Tapestri从最初创立起就具有隐私透明度。同时,这家公司整体就基于透明共享个人数据的最终方式、地点和原因,并为他们同意共享数据而付费。

尽管这或许与Meta的商业模式相反,但哈里森分享了一些关于该公司如何能够赢得公众信任的见解。

“我们对大公司的建议是尽可能获得明确的同意。显然,用户已经同意Facebook的条款和条件,并且,这条款非常长,普通人永远不会阅读它。但这也许也将再次提醒消费者,他们究竟在交换什么来使用服务。坦诚,将是朝着正确方向迈出的一步。”

同时,哈里森告诫人们要努力了解他们在没意识到的情况下分享出的个人信息、生物特征和偏好。特别是RSC将提供支持的元宇宙可在未来或许将成为一个空间,一种真实的,代表我们自身的方式,这或许会将物理和数字角色更容易结合在一起。

“如果我放弃了这么多自己来换取这项服务,我可以接受吗?这种交换值得吗?这就是我们都必须自己回答的问题。”哈里森表示。

用户可以预期新的超级计算机进行交换的交易实质?凭借从头开始实施的隐私保护,理想情况下,个人数据的完整性将保持不变,同时为技术创新提供动力。

Meta预计RSC将是“计算能力的功能变化”,这反过来将使公司能够“为我们现有的服务创建更准确的 AI 模型”并“实现全新的用户体验,尤其是在元宇宙世界中”。这家科技巨头声称,这些进步将帮助Meta构建“下一代人工智能基础设施”,并创造出基础技术,为元界提供动力,从而进一步推动整个行业的人工智能社区。