去年 ChatGPT 问世后给谷歌带来了少有的压迫感。多年来,谷歌一直对自身的定位是人工智能开发领域的领导者。然而,突然之间,来自美国人工智能初创公司 OpenAI 的一款产品在短时间内迅速吸引了数千万月活跃用户,不少人士也开始质疑谷歌是否已经失去了领先地位。

短短几周内,谷歌公司高层便宣布进入“红色警戒”状态,这意味着这家公司也必须加速推出人工智能功能。(据多家媒体报道,谷歌首席执行官桑达尔·皮查伊【Sundar Pichai】拉响了红色警报,但他后来在接受采访时表示,情况并非如此。)

一段时间以来,谷歌已经推出了几款人工智能产品,其中最值得关注的就是一款类似于 ChatGPT 的产品—— Google Bard 聊天机器人。然而,在几天前的谷歌年度 I/O 开发者大会上,谷歌宣布其即将推出一系列新的人工智能功能,几乎覆盖到公司的所有产品。

这些产品大部分都将在“未来几周”或“今年晚些时候”正式推出人工智能功能。在此之前,我们真正能获知的,只能是我们在大会上和会前新闻发布会上看到的演示内容。

在我看来,尽管这些功能在质量和实用性上会有所不同,但我们眼前关于短期内人工智能未来的事实开始变得越来越明显:仅靠技术还不足以完全重塑竞争格局。AI 领域现有参与者只需要在用户已经在使用的产品中新增这项功能,就能取得重要进展——而让用户切换平台似乎比一些人想象的要困难得多。

首先来谈谈平台切换的问题。今年 2 月,微软利用 ChatGPT 技术重新推出了带有生成式人工智能搜索结果的必应(Bing)搜索引擎。该公司希望此举可以再次吸引广大用户关注并使用必应,也为微软从更大的竞争对手手中夺取更大市场份额提供了机会。

三个月后的今天,即在谷歌将生成式人工智能功能添加至其搜索引擎之际,微软必应的发展似乎陷入了停滞。

据研究公司 YipitData 的一份报告,付费科技媒体 The Information 在 5 月 10 日报道称,过去三个月,必应在电脑端的市场份额仅增长了 0.25%。尽管微软向该媒体透露,必应在移动设备上的增长率更高,未来几个月电脑端的份额仍可能实现增长。

然而,该报道还提到,距首次推出已有 14 年的必应每日访问次数约为 4000 万,相比之下,ChatGPT 每天的访问次数超过了 6500 万。希望使用 OpenAI 聊天机器人的人们会直接进入 ChatGPT 界面,而微软只是通过整合 OpenAI 技术开辟新收入来源的数十家公司之一,对于微软来说,API 访问只是一种商品,并不是增长引擎。(我相信微软最终会通过其 Azure 云服务平台为 OpenAI 提供的基础设施服务等方式中,找到更多从人工智能中获利的方法。)

但我们需要认识到的是,除 ChatGPT 以外,用户在其他场景下的真正目的可能并不一定是探索或使用人工智能。相反,他们可能在期待这些产品通过人工智能提供更有用的功能和服务,且最好是在他们日常使用的产品和服务中。

前不久,我撰写了一篇文章,其中提到了基于文本框的界面设计技术存在的挑战。而从前不久的谷歌 I/O 开发者大会来看,这家公司已经开始在用实际产品设计来补充界面设计不足的问题,这也将多方面推动用户更有效地使用人工智能。

具体而言,直到现在,谷歌聊天机器人 Bard 一直都是一个独立存在,它就像一个测试谷歌大型语言模型 PaLM 极限的沙盒工具。不过,也许不久之后,你就可以将 Bard 输出的内容直接集成至 Gmail、Google Docs 和 Google Sheets 等一系列产品中,不需要再复制粘贴输出内容。ChatGPT 可能是世界上记录最多复制和粘贴次数的网站,而谷歌则有可能将整个过程整合为一个按钮功能。

然而,理想情况下,你根本无需访问某个专用网站就能使用生成式人工智能。比如,当前很多人都会让 ChatGPT 为他们编写电子邮件,然后将其复制粘贴到电子邮件客户端。而谷歌现在做的,就是允许你在 Gmail 邮件编辑文本框中让人工智能为你编写电子邮件。谷歌也承诺,预计今年晚些时候就能推出这项功能。

我预测,如果谷歌届时能推出这项功能,那通过 ChatGPT 网站产生的复制和粘贴操作也会减少。

你还可以将生成式人工智能文本框嵌入现有的生产力工具中,就像谷歌在今年 I/O 开发者大会上展示的“侧面板助手”(sidekick)功能一样。在大会上,谷歌高管阿帕娜·帕普(Aparna Pappu)展示了 Google Docs 中的侧面板助手功能。当她尝试与侄女一起写一篇关于失踪海贝的短篇故事时,侧面板助手提供了一些与上下文相关的建议。它想知道海贝经历了什么。

然后,侧面板助手提供了一些建议:也许它被一个有嫉妒心理的美人鱼偷走了;也许它是被一个时间旅行者带走的;也许它被一条章鱼吃掉了。

如果你是一个 10 岁的孩子,那通过这样的方式来写短篇故事一定会很有趣。而对于普通用户来说,它甚至可能不会被视作人工智能——相反,它可能更像是一个新的创意工具,可以让现有的热门产品变得更有用。

大会上还有很多类似的演示分享。其中让我印象比较深刻的是一个通过幻灯片生成演讲笔记的演示,这对于总有拖延症的工作者来说肯定是一项“及时雨”功能;另一个演示中,还有根据 Google Sheet 附件内容创建人们参加百乐餐(译者注:美国常见的一种聚餐方式,参与者每人自带一样食物)时自带菜肴清单的功能。

从某种程度上看,这些东西可能感觉平平无奇。但在短期内,这就是人工智能开始慢慢开始融入我们生活的方式。用不了多久,我们可能都不会再把它看作是人工智能了。(谷歌开发者大会上不断出现的一个自辨型主题是,该公司已经发布了很多使用机器学习的产品,但由于某种原因并未满足我们不断变化的人工智能的定义。比如,在谷歌照片中搜索“狗”就是如此。)

关于谷歌计划对搜索引擎展开的变革,即在搜索结果列表中,将若干生成式人工智能搜索结果排在普通蓝色链接之前,可能还需要另外再写一篇文章来介绍。但我想等我亲身体验后,再去更好地感受其颠覆性。

目前,无论是在搜索引擎还是其他产品方面,谷歌都已经将人工智能定位为了“帮助用户完成各项任务的一个助手”,而不是“无所不知的智慧星”。谷歌的人工智能可以为你撰写初稿,提供看待问题的不同思路,或者帮你快速了解和认识你感兴趣的全新内容。

在推动人工智能成为处理各项任务的有效工具方面,谷歌这一步似乎显得非常有考虑,它并没有提出任何过于宏大的口号,因为这就是人们在现实中使用人工智能的方式,

最终,我仍然相信人工智能的机会将远远大于任何一家公司。但是在这样一个时刻,所有这些大型语言模型正逐渐在功能上趋于一致,没有谁会仅凭技术就赢得这场竞赛。

人工智能正在从科学问题变成产品设计和市场营销问题,而在后面这些问题上,谷歌已经具有非常丰富的经验。

更好的元宇宙

在今年的谷歌开发者大会上,我看到的最令人印象深刻的产品或许是其 3D 视频会议产品 Project Starline 的最新原型,这是一个实验性的硬件项目,其探索的是一个非常有趣的问题:如果你在下一次 Zoom 视频通话中看到的对方是一个全息影像,会怎么样?

在 2021 年至 2022 年长达一年的关于“元宇宙”的讨论中,我们经常提到“远程呈现”(telepresence)这个概念。它是一种虚拟实在,能够使人实时地以远程的方式于某处出现,让人感觉就像在与某人面对面相处一样。除了 Zoom 之外,我们目前所能做的最好的努力就是戴上笨重的头显设备,进入像素化的会议室,与同事和亲人只有上半身的卡通形象进行交流。

Project Starline 还处于早期开发阶段,要实现大规模应用还需要大幅降低成本。但是,它只需要你坐在像电视机一样的设备前打开它就可以使用,无需戴上头戴设备、眼镜或耳机等设备。这个系统还可以在三维空间中以高分辨率呈现一个人与你进行交流。

该项目负责人安德鲁·纳科特尔(Andrew Nartker)在一个单独的空间为我演示了这个功能。当他伸手与我“击掌”时,他的手似乎穿过了屏幕。后来,他又递给我一个苹果,体验效果同样非常逼真。同时,纳科特尔的声音也和动作实现了实时同步,这增强了他就在我面前的错觉。

实际上,他是在只离我几步之遥的另一个单独空间里。我敢肯定,这背后肯定有一些技术增强功能,其可能在现实世界中并没有真正得到应用。例如,连接两端设备的稳定数据管道。

几天前,在与谷歌员工的交谈中,我明显了解到的是,Starline 项目目前主要的难处就是降低成本。(没人向我透露其具体成本,但如果你告诉我整套设备成本超过一百万美元,相对于其提供的体验质量,这个价格并不算高。)

值得庆幸的是,已经有迹象表明 Starline 正在降低成本。谷歌前不久表示,该公司已经在与合作伙伴(包括客户关系管理软件的行业巨头 Salesforce、移动电话运营商 T-Mobile 和共享办公租赁公司 WeWork)一起测试该设备。

鉴于当前面临的挑战,以及谷歌和众多公司都在推行的成本削减,如果 Starline 项目最终以失败告终,恐怕没有多少人会感到意外。但其中仍然存在一个更深层次的问题,即 Meta 公司的“元宇宙”还没有完全实现。如果能推出一种方便、舒适、符合人体工程学的视频聊天方式,我可以长时间让自己轻松地沉浸于其中。

我敢肯定,未来几年我肯定会参加一些虚拟现实会议,相比于在家使用 Starline,这可能是更加经济的方案。

然而,一旦这种情况发生改变,我的网络摄像头和耳机就会被放进抽屉里封存起来了。(36KR)