数字化转型的列车已驶向医疗与生命科学领域,以大数据、云计算、AI为代表的数字化技术所构成的新工具、新平台、新范式正在加速科研创新。“一般来说,科学家需要筛选10亿种化合物,和目标蛋白质去做模拟结合,如果我们今天只用一台单核的服务器,光是算力需求,大概要算475年才能完成。而今天,科学家如果在亚马逊云科技的平台上同时调用数万核的虚拟服务器,就可以实现在24小时之内完成对10亿种化合物的虚拟筛选。”在于4月27日举办的亚马逊云科技医疗与生命科学行业峰会上,亚马逊云科技大中华区战略业务发展部总经理顾凡说道。


亚马逊云科技大中华区战略业务发展部总经理顾凡

 

显而易见,数字化技术正在让浩瀚无涯的科研探索旅程步履加快,成为加速医疗与生命科学行业实现数字化转型和发展的重要途径。在此之中,作为全球最大的云厂商也是全球医疗及生命科学行业云计算引领者,亚马逊云科技正在为海内外医疗与生命科学领域的数字化创新插上强劲“动力引擎”,推动医疗与生命科学产业阔步前进。

 

朋湖网获悉,亚马逊云科技一直是医疗与生命科学行业数字化转型和创新的推动者和支持者,早在2013年,亚马逊云科技就组建了全球范围的医疗和生命科学专业团队,并联合数百家合作伙伴,服务于包括辉瑞、拜尔、罗氏、默沙东、飞利浦等头部企业在内的4200多家行业客户,积累了大量成功实践和经验。目前,全球前十大药企中,九家都在使用亚马逊云科技。在国内,亚马逊云科技也和数十家本地合作伙伴一起,共同服务于超过400家客户。

 

在昨日举办的亚马逊云科技医疗与生命科学行业峰会上,亚马逊云科技表示,未来其将围绕数据、算力和快速构建适合行业用户体验的创新解决方案三大需求发力,通过持续构建行业专属解决方案,进一步赋能生物制药、基因测序和医疗保健等细分领域的数字化创新,加速推进创新成果从实验室到真实世界的落地。

 

01 与时俱进,全面应对“3+2”挑战与需求

 

“之所以这么多的客户会选择亚马逊云科技,其实是跟亚马逊‘客户至尚’的理念是分不开的。亚马逊无论是做产品,还是做解决方案,永远都是从客户需求出发帮助客户解决行业里的应用问题。”会上,顾凡表示,在赋能数千家医疗和生命科学行业客户过程中,亚马逊云科技发现了整个产业普遍面临的三大挑战与两大需求。

 

三大挑战是过去和现在都存在的共通点。“其中,第一个挑战是海量数据的激增。”顾凡指出,随着测序技术的发展,基因测序的数据量正在极具增加,一台测序仪的下机数据往往超过100GB, 而在分析过程中,中间数据还会翻倍地增加。数据显示,预计到2025年,基因组测序领域全球每年将增加40EB(百亿亿字节)数据。

 

他强调,数据的爆炸式增长一定会带来两个挑战。第一是数据的存储,而且是更高性价比的存储。第二是数据快速自动化分析,否则数据本身并不会对于业务有任何帮助。

 

为此,亚马逊云科技提供了基因测序领域的数据全生命周期管理解决方案能够为基因分析不同阶段的生物信息学数据的存储、调用和分析提供更好的性价比和更高可用性。该解决方案包括数据上传、数据分析、数据共享和数据备份及存档全生命周期,具体来说将基因组学数据上传到Amazon Simple Storage Service (Amazon S3) 中并进行管理;使用云上分析服务对基因组学数据进行分析和处理,数据可以直接从 Amazon S3 中读取并在分析后将结果存回;使用 Amazon S3的访问控制功能控制数据的访问权限,并将数据共享给合作研究者;以及定期备份基因组学数据以确保数据安全,并将不再需要频繁访问的数据存档到 Amazon S3 Glacier 或 Amazon S3 Glacier Deep Archive 中以降低长期存储成本。

 

值得一提的是,Amazon S3对象存储提供高达八层的存储层级,提供的自动分层功能可以更高效地存储数据和实现成本节约。同时亚马逊云科技还将这项功能扩展至Amazon Elastic File System (Amazon EFS)云原生文件存储之中,进一步降低数据管理的难度。

 

此外,亚马逊云科技还在2022re:Invent期间最新推出了Amazon Omics服务,该服务是一项用于存储、分析和阐述基因组学、转录组学和其他组学数据的托管服务,并能够兼顾具体应用场景下的智能存储与调度需求。Amazon Omics的推出能够帮助行业用户更快速地进行基因分析研究,从而加速新药研发、疾病诊断和治疗等领域的进展。

 

顾凡举了一个例子,“未知君是中国首家专注于肠道微生态治疗的AI制药公司,在其研究的微生态领域,仅一个研究样本就会消耗100G200G的存储容量。随着基因测序和分析项目的增多,每个项目都会生成海量数据,对数据的存储、管理和处理极大增加了容量和计算量,不必要的延迟带来的时间消耗对未知君的研发业务造成了影响。同时,计算与存储成本也超出负荷。”他表示,通过亚马逊云科技提供的自动化数据生命周期管理服务,该公司将不同的数据分级存储、归档到成本极低的存储层中,有效降低存储成本,并实现了TB级基因数据的存储,同时还应对了团队不断增长的存储需求。

 

第二个挑战是持续而迅速的算力需求的挑战。根据《自然》杂志的数据显示,一款新药物研发的时间超过10年,研发成本超过20亿美金,而最终成功上市的新药成功率不到10%,当下,人工智能辅助药物研发是突破这一反摩尔定律的利器。

 

顾凡表示,亚马逊云科技提供基于高性能计算(HPC)的人工智能新药研发服务解决方案使研究人员能够在亚马逊云科技上组建数百万个vCPU的高性能计算平台,以开展数十亿蛋白质分子规模的药物发现研究。以十亿个分子的化合物分析为例,单核服务器需要475年,而在亚马逊云科技上只需要1天。

 

同时,亚马逊云科技还推出了“量子计算探索之药物发现方案”,该方案提供了一键部署的量子计算/经典计算混合架构,通过Amazon Braket量子计算平台调用量子计算资源进行实验,为量子计算在药物发现方面的应用探索新思路。

 

英矽智能是一家由生成式人工智能驱动的临床阶段生物医药公司,他们便利用亚马逊云科技构建了靶点识别、分子设计平台、和临床试验结果预测平台,使他们能够以数百万美元的成本,在不到18个月的时间内找到一种治疗纤维化的候选药物,完成了从靶点发现到化合物验证的临床前药物研发过程。

 

第三个挑战关乎解决方案。”顾凡指出,“非常多的客户告诉我们需要解决方案,而不仅仅是非常先进的亚马逊云科技的云服务。客户的核心诉求是不需要有专业的计算机背景就可以去使用开箱即用的解决方案来解决应用问题。比如医院里的医疗信息软件可能就有近100种,常用的就会有约20种,都需要亚马逊云科技和我们的合作伙伴提供解决方案。”

 

医疗保健行业企业希望能够快速构建轻松易用的创新应用,覆盖研究设计、临床实验、生产制造、上市推广、上市后监控与支持等各个环节,以向医疗人员提供更多更好用的新功能,并最终为患者提供加人性化的医疗方案。在了解这一诉求后,亚马逊云科技的行业专家团队与合作伙伴深入探索行业应用场景,结合丰富的云上应用开发实践,加速构建众多解决方案,满足医疗保健和医疗设备企业的数字化创新需求。

 

顾凡举了一个例子,“益体康(北京)科技有限公司是国内最专业的智慧远程心电平台及专业会诊服务提供商之一。益体康的远程心电诊疗平台能够充分赋能基层医疗,快速提供专家诊疗服务。为进一步提升诊断效果,益体康在亚马逊云科技上利用GPU实例大幅提升心电辅助诊断模型的训练效率。”他表示,使用亚马逊云科技,益体康成倍地提升了AI模型训练和推理效率,大幅缩短了产品上市时间——原本需要半年才能推出的AI 模型,目前仅需 个月左右,便可完成从训练到部署上线全过程——并且基于云的能力轻松支持十倍以上数据规模的模型训练场景。

 

 在助力客户与时俱进地应对当下行业普遍面临的技术挑战和需求,并提供符合和提升行业用户体验的应用和解决方案的同时,亚马逊云科技亦在着力满足客户的两大需求:安全合规与生成式AI的行业应用。

 

“在医疗行业合规非常重要,药品的制造也关乎生命安全。”顾凡强调,合规始终是所有一切的基石,亚马逊云科技的医疗与生命科学行业的团队从第一天开始就会非常关注合规。迄今为止,亚马逊云科技已通过了全球百项安全合规认证,符合全球50+医疗生命科学合规要求,符合包括美国健康保险流通新人责任法案HIPAA,,欧盟通用数据保护条例 GDPR,英、法、日、韩、加拿大等国家医疗数据安全合规,以及中国网络安全三级等保和中国人类遗传资源中方单位认证等多项行业安全合规要求。

 

“此外,我们既不应该去高估AIGC大模型的力量,但是更重要的是,不能低估AIGC大模型会重塑大量行业客户的体验。过去20多年的人工智能和机器学习一直都是亚马逊关注的焦点,亚马逊无论是对外的服务,还是对内部的运营,到处都可以看到人工智能和机器学习的身影。在生成式AI方面,我们的使命就是,要让各种技能水平的开发人员和各种组织都有机会使用生成式AI进行创新。”为此,亚马逊云科技推出了四项重要创新:Amazon Bedrock,通过API可访问亚马逊云科技和第三方的预训练LLM基础模型;两大Amazon Titan生成式大语言模型;Amazon EC2 Trn1n实例和Inf2实例正式可用,打造最具性价比的生成式AI云基础设施;Amazon CodeWhisperer,一款可以实时生成代码建议的AI编程助手。

 

据悉,在前不久,飞利浦医疗便宣布与亚马逊云科技合作,将飞利浦医学影像系统Philips HealthSuite Imaging部署在云端,并且使用Amazon Bedrock快速开发生成式人工智能应用程序,如医护人员的语音识别,同时生成专业诊断信息,降低模型开发成本,而不是从头构建LLM基础模型,还能够确保数据安全和隐私保护。

 

02 通力合作,加速云端构建行业数字化创新生态链

 

除却上述推出技术和解决方案之外,亚马逊云科技一直也在思考如何从多方面、全方位的去赋能行业客户,不断丰富行业数字化创新生态链。

 

为此,亚马逊云科技与APN合作伙伴网络成员联手为各种创新场景提供端到端解决方案,同时还在亚马逊云科技Marketplace上推出可以快速部署和使用的工具和服务。为了让客户更方便及更低成本地获取更多的第三方公开的高质量数据,亚马逊云科技还开放了96种生命科学公开数据集,涵盖生命科学、基因、重疾以及新冠研究等重要领域。

 

除此之外,在医疗资源密集的上海市徐汇区设立的上海亚马逊云科技生命健康数字化赋能中心已于202210月正式投入运营,顾凡表示,希望通过徐汇区这个平台和窗口,为区域内乃至全国生命健康行业的高质量发展贡献力量,同时,从赋能中通过卓越展示中心、协同服务云平台、行业俱乐部、全球合作计划四个方面为生命健康企业赋能。

 

面对医疗和生命健康行业的初创企业,亚马逊云科技还推出了“云创计划”,为他们提供起步云资源和技术服务,以加速扶持行业初创公司在云上开启数字化创新之旅,实现高速成长。据悉,目前亚马逊云科技累计支持的来自医疗和生命科学行业的初创企业数量已超过300家。

 

未来,带着“致力于赋能我们的客户加速从实验室到真实世界的数字化之旅”的美好愿景,亚马逊云科技将会助力医疗和生命科学行业的客户更快地去发现更具性价比及更加精准的医疗方案,我们有理由相信,由大数据、云计算、AI等数字化技术结合产生的科学智能新路径将会为更多的企业、行业打开。