2023年,我们可以看到AI、元宇宙、云计算、大数据等技术蓬勃发展,推动着社会与产业走向新的变革。新的变革背后,是企业走向数字化、智能化发展的机遇,也是“存、算、网”三要素升级与全球化落地的挑战。
那么,面向机遇与挑战并存的未来,我们该如何面对?在数智化时代面前,具体的行业参与者该如何调整自身,自我创新,实现突破,从而走向新一轮的产业周期?
在于6月28日举办的2023亚马逊云科技中国峰会上,我们看到了亚马逊云科技给出了他们的“解决之道”。
01
智能化与全球化挑战下:无处不在的云服务
在当今的环境中,企业主要面临着两大需求:智能化、全球化。对于智能化,在峰会上,亚马逊云科技大中华区产品部总经理陈晓建表示,在今天,AI和机器学习的技术已经深入到很多创新场景当中,由于生成式AI的风潮,人们看到越来越多新的机会,比如说文本和图片的生成,推理、代码的生成等。
毫无疑问,生成式AI是现在目前最为关注的创新技术,AI技术的爆发也直接推动了对算力资源需求的增长。由此,算力资源的井喷也成为了企业面临的一大挑战,如何应对?
“针对算力需求井喷,亚马逊云科技致力于通过自研芯片创新、弹性的计算存储组合以及Serverless架构,帮助客户简化运维,以更高性价比满足多样算力需求。”他强调。
“亚马逊云科技为用户提供一个全面和深入的算力支持,包括Intel、AMD、 英伟达,和自研的CPU及加速芯片产品。”陈晓建说道。据介绍,自第一款自研芯片 Amazon Nitro 推出以来,亚马逊云科技便加速创“芯”,在整个计算实例变得越来越复杂、功能越来越强大的同时,不断专注于技术创新,提升产品效率,去年推出的第五代Nitro将每瓦性能提高了40%,其具有三大特点:一、实现了非常轻量级的虚拟化。在此前业界经常看到的虚拟化损耗通常在20-30%之间,Nitro通过硬件虚拟化,整个性能损耗不到1%;二、实现了网络和存储在硬件级别的隔离机制,导致我们在用户通信和拥有存储的数据通信的时候之间是完全隔离的,不会造成互相的干扰;三、在硬件层面实现了硬件的加密,任何进出Nitro的数据包都会进行硬件级别的加密,最大限度保证用户数据通信的安全。
此外,亚马逊云科技还推出了基于 ARM 架构的通用处理器芯片 Graviton,Graviton 目前已经到了 3E,相比之前的 Graviton 产品,Graviton3E 计算性能提高25%,浮点性能提高2倍,加密工作负载性能加快2倍;Graviton3E 特别关注向量计算的性能,跟前一代相比提升了35%。这个性能提升对于像 HPC 高性能计算这样的应用来说尤为重要。
为了满足更为丰富的算力需求,在加速创“芯”的基础上,亚马逊云科技还提供了高度弹性的计算资源。据悉,亚马逊云科技提供600多种不同的计算实例,从处理器、网络和存储等各种服务都能够与计算进行很好的结合,以搭“乐高”积木的方式搭建出一个丰富灵活的计算实例的资源,满足多种不同算力的要求。以存储为例,数据规模到达PB级别时存储方式变得非常重要,“热、温、冷、冻”不同类型的存储方式,成本和性能都有很大差别。Amazon S3对象存储提供8种存储层级,同时提供智能分层,自动选择最适合的存储层级。
“我们观察到,用户还希望能够降低云运维复杂性,于是,我们为用户提供的第三种‘武器’就是Serverless。”陈晓建表示,亚马逊云科技正在不断探索如何将云的弹性、敏捷性、按需付费的特性发挥到极致,在这个过程中,亚马逊云科技逐步推动着云服务全面迈向Serverless。
据了解,当下,亚马逊云科技已经实现了全栈数据服务的Serverless化,开启了云服务全面Serverless的时代,在此之下,用户无需预置或管理基础设施,就可以运行几乎任何类型的应用程序或后端服务代码,帮助用户最大限度减轻运维工作,并增加业务敏捷性,更好地应对业务的各种不确定性。
“除却算力的井喷需求,我们发现,全球布局已经成为很多企业的战略,我们也看到一些全球布局当中有一些通用的需求,他们需要有全球无处不在的云服务,他们也需要我们提供一个能够快速部署的、高效的能力,最后他们当然需要能够我们提供一个在全球符合各国、各地区合法合规的要求。”他指出,越来越多的中国企业在全球大展拳脚,打造全球化的企业对IT架构提出更高要求。
那么,如何满足?陈晓建强调,亚马逊云科技将提供高度安全可靠的云基础架构,让创新能够快速抵达每一个角落,为客户提供支持业务创新的算力,并能很好地支持客户的全球化布局战略。“我们希望客户无论何时何地,都可以使用相同的基础设施、服务、API和工具。”他说道。
除却打造无处不在的云服务,面向全球化的日新月异,企业也需要有一个快速部署可靠系统的能力。“我们CTO Werner Vogels曾说过一句话,叫‘Everything fails, all the time’。所有的功能模块都有可能出故障,我们不能完全避免故障的发生,但是我们通过努力,把风险降到最低。”陈晓建表示,亚马逊云科技主要有以下方式:
(1)区域隔离,多可用区设计:每个区域都会有多个可用区,任何单一可用区的故障不会影响到其他可用区的业务,最大限度降低服务的中断。
(2)控制面和数据面解耦:更多地依靠数据面来保持服务运行、降低对控制面的依赖,能够提高整体稳定性。
(3)蜂窝架构:把系统分割成多个微小的、单一的、相互之间隔离的蜂窝状单元,能够在问题出现时降低爆炸半径,通过爆炸半径能够把故障控制在一个单元以内。
(4)随机分片:是对蜂窝架构的进一步优化。它把客户的访问随机分配到不同的单元中,说单个单元的故障并不会对整个系统造成影响,还是可以通过其他的单元完成。
(5)服务责任模型:通过明确定义亚马逊云科技与客户责任区间的方式,保障客户在应用的任何阶段都能享有对所写代码和程序的控制权。
(6)运营就绪审查:通过对亚马逊云科技大量运营案例进行分析,对过往的问题进行复盘,从而用户在整个部署的时候能够避免重现他们之前所发生的问题。
(7)安全的持续部署:可以最大限度减少因错误部署而对生产造成的影响。
(8)COE纠错流程:了解问题所发生时候的系统状态,以防止类似的错误再次发生。
除此之外,安全合规性是当下时代语境中必不可少的全球化能力,据悉,亚马逊云科技几乎满足全球所有监管机构的合规性要求,其支持143项安全标准与合规认证。我们有超过300种安全合规服务,帮助各行各业的客户能够更方便的搭建满足全球各地安全和合规要求的架构。
我们看到,亚马逊云科技提供从中心到边缘的多种产品的解决方案,包括覆盖全球的基础架构,以及快速部署稳定系统的能力,还有全面支持全球各个国家和地区业务合规能力。成为用户创造坚实底层架构的基石是亚马逊云科技的发展方向,带着“让用户摆脱基础架构的束缚,以云技术加速企业创新”的目标,亚马逊云科技正在深入全球,据了解,截至今日,亚马逊云科技在全球拥有31个区域的99个可用区,已经覆盖了245个国家和地区,全方位助力企业实现全球化布局。
02
生成式AI机遇下:解锁AI生产力
在过去半年,“生成式 AI ”成为了一个重要的引爆点。峰会上,亚马逊云科技全球产品副总裁Matt Wood表示:“在过去6-8个月的时间里我们看到了生成式AI的转折点,或者引爆点,在技术进步与其所能实现价值间实现了融合。随着数据爆炸、高度可扩展的计算能力的可用性,以及机器学习技术的不断进步,生成式AI登上了我们的舞台。”
Matt Wood博士指出:亚马逊深信不疑的是,生成式 AI 在重塑各行各业。当前,我们处在其发展的最早阶段,是“非连续变化”的新时代。与早期的互联网性质相似,生成式 AI 同样也会逐渐释放超越传统界限的创新,将我们带入一个前所未有的时代。
面对这一时代机遇,身处行业中的我们该如何才能解锁生成式 AI 的核心价值?
这一疑问也是亚马逊云科技的愿景目标——利用大数据、AI、云计算等非常广阔、令人兴奋的技术,并将它们提供给每个人。当下,亚马逊云科技想用生成式AI做同样的事情,把这一非常广阔的、创造性的、重要的技术放到每一个构建者和每一个商业用户的手中。
Matt Wood博士表示,要想释放生成式AI的价值,首先要提供对一流基础模型的访问,以便可以构建最好的生成式AI应用程序。“我们的理念并不认为目前会有一个单一的模型包办一切,我们认为客户是希望能够用多种不同的模型,这种模型是可以从亚马逊这边来使用开源的模型,或者你自己做训练的模型,每一个模型都有自己的专长,有一些特别适用于做图像生成,另外一些做推理,有一些是在写作方面特别有意义。我们希望把所有的模型去做整合,把自己的应用融入这样的模型,实现我们的梦想。作为亚马逊云科技我们希望提供对所有最佳模型的访问,无论它们来自亚马逊或第三方或开源。”
为此,亚马逊云科技推出了Amazon Bedrock,据悉,这项新服务允许用户通过 API 访问来自 AI21 Labs、Anthropic、Stability AI 和亚马逊的基础模型。Amazon Bedrock 是客户使用基础模型构建和扩展生成式AI应用程序的最简单方法,为所有开发者降低使用门槛。在 Amazon Bedrock上,用户可以通过可扩展、可靠且安全的亚马逊云科技托管服务,访问从文本到图像的一系列强大的基础模型。
“第二点,我们希望能够提供一个安全和私密的环境,定制这些模型。”他说道,当你使用这些大型语言模型时,你必须非常清楚你的数据在使用时的去向,因为它可能会意外地泄露,并可能落入你的竞争对手手中。为此,亚马逊云科技借助Amazon Titan模型库从而实现安全和私密的模型调优,据了解,Amazon Titan是一系列不同的模型的库,可实现文本归纳总结、搜索结果嵌入、有害内容删减等,用户可以非常安全、隐私地对这些模型做优化和微调。
第三、亚马逊云科技将能够通过我们在定制芯片上的投入,提供非常低的成本和非常低的延迟访问以进行相关基础模型的训练和推理。“我们的自研芯片可以实现非常棒的低成本和低延迟,让大家在自己的组织里面更快更有效地使用大模型,我们的重点是希望把这样的模型脱离实验室的场景,并集成到核心应用里。”Matt Wood博士指出,亚马逊云科技有专用生成式AI的机器学习芯片,不管是Inferentia还是其他的,亚马逊云科技的Inf实例能够去实现低延迟,还有Trainium芯片能够帮助大家去更好地训练模型。网络优化型 Trn1n 实例专为大型网络密集型模型设计,其性能比 Trn1 高出 20%。
第四需要搜寻机会提升使用体验。“我们会系统性地搜寻一些机会,用生成式AI提升我们自己客户使用的体验,例如使用‘专业编程助手’快速轻松地编写源代码。”他说道。为此,亚马逊云科技推出了一个新的服务Amazon CodeWhisperer,“这是我们基于机器学习为开发人员提供的一个代码生成的服务,支持包括Java、JavaScript和Python等在内的15种不同的编程语言,个人用户可免费使用。在测试中,与未使用CodeWhisperer的参与者相比,使用CodeWhisperer的参与者完成任务的速度平均快57%,成功率高27%。”
“如果把所有这些放在一起——机器学习的创新、定制化的芯片以及利用Amazon Bedrock使用模型,你会发现‘从未有过如此简单、低成本的,借助机器学习进行代码构建的方式’。”他表示。
此外,在当下,数据作为新的生产要素在数字经济发展中扮演着重要角色,对于生成式AI而言,数据也是最重要的。Matt Wood博士强调,数据对于生成式AI而言更是所有一切的起点,数据也将推动着生成式AI的广泛应用。
为此,亚马逊云科技推出了云原生的数据战略:
战略一:全面的工具集,满足现在和未来所需。亚马逊云科技推出15种专门构建的云上托管数据库服务,为各类用户的应用场景提供完美契合的数据服务;亚马逊云科技的分析服务已全面实现Serverless化,包括交互式查询服务Amazon Athena、大数据处理服务Amazon Managed Streaming for Apache Kafka (Amazon MSK)、实时分析服务Amazon Kinesis、数据仓库服务Amazon Redshift、数据集成服务Amazon Glue、商业智能服务Amazon QuickSight以及运营分析服务Amazon OpenSearch Service。
战略二:轻松集成,连接所有数据。亚马逊云科技提出了Zero-ETL的愿景,致力于实现无缝的数据转换和调用,而用户不用编写任何的代码。我们最近推出了Aurora新的服务——Amazon Aurora可以与Amazon Redshift进行Zero-ETL集成,允许使用 Amazon Redshift 对来自Aurora的PB级事务数据进行近实时分析和机器学习 (ML)。事务数据在被写入Aurora后的几秒钟内,即可用在Amazon Redshift中,因此您不必构建和维护复杂的数据管道来执行提取、转换和加载 (ETL) 操作。
战略三:构建端到端的数据治理。通过数据治理,加速并保障数据流通。亚马逊云科技去年推出的一项全新的数据管理服务Amazon DataZone,可以让客户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理。借助Amazon DataZone,管理员和数据资产管理者可以使用精细的控制工具管理和治理数据访问权限,确保数据访问发生在正确的权限和正确的情境之下。
03
结语
从大众汽车、可口可乐、麦当劳、开利、西门子等成功的传统企业到Netflix、Airbnb、Uber等重塑了传统行业的独角兽,再到金融巨头纳斯达克、高盛、CapitalOne,我们看到,亚马逊云科技正为全球各行各业、各种类型的客户加快数字化转型和创新提供生产力。
这一切皆源于亚马逊云科技始终保持着对AI、大数据、云技术等技术的前沿探索,亚马逊云科技相信云服务是支持数字创新的关键生产力,亦一直专注于基础设施服务的持续创新,而持续创新这也是应对挑战、抓住机遇的唯一答案。