从深蓝到AlphaGo再到今日的ChatGPT,在起起伏伏发展的几十年里,AI行业经历着“寒冬”与“阳春”的时节交替。

当下,伴随着ChatGPT的破圈热潮不断涌动,AI行业再一次迎来了春天,其带来的多米诺效应正在不断涌现。

而在ChatGPT风狂飙的背后,大模型也再一次浮出水面,其价值不断显现。不妨这么说,与其言ChatGPT再一次点燃了AI火苗,实则是大模型的发展再一次点燃了AI落地的希望,很多人认为,AI产业最为关注、最受期待的基础技术方向非大模型莫属,大模型是深度学习的未来,是使AI落地生根的丰沃土壤。

“练大模型”时不我待,同时,也不难看到,近两年,国内外产学研巨头纷纷扎堆“抢滩”AI大模型,开启了一场轰轰烈烈的“练大模型”运动。

在近日举行的2023全球人工智能开发者先锋大会上,SenseCore商汤大装置AI云正式上线。作为国内AI行业先行者,其大模型的发布、上线引发了各界的广泛关注。

面对AI的规模化落地难题,国内企业有什么自己的方法?大模型如何实现从“练”到“用”的丝滑转变?在今天,商汤AI大装置给了我们一些答案。

01

剑指规模化落地

1765年,英国人瓦特成功改良蒸汽机,揭开了第一次工业革命的序幕,社会生产力水平和工业文明开始进入一个全新阶段。

200多年过去了,人们试图让AI引领、推动第四次工业革命,呼声很大,但现实中,AI始终没未能在产业中掀起人们想看到的浪潮。

同样在200多年前,英国经济学家杰文斯曾这样说:“技术成本降低,将提升技术的普及度,从而扩大市场规模。”

蒸汽机的技术演变便是个鲜活的例子。在经过瓦特的改良后,蒸汽机并没有以迅雷之势全面向世界各地铺开,原因就在于投入产出比。尽管瓦特蒸汽机将每生产1马力需要消耗30磅煤这一数字降低至12.5磅,但还是很难比上水力,直至1850年,涡轮式蒸汽机的出现,将这一数字减少到5磅,才使得蒸汽机逐渐取代原先的动力模式,变为万能通用型动力,成为了工业革命中最强大的动力引擎。

如今,要想AI真正成为第四次工业革命中的“蒸汽机”,要跨越的便是这道成本“天堑”。“人工智能进入到行业的时候会发现它整个生产链条非常长,我们遇到很多长尾场景响应每个具体需求的时候,成本和代价都是非常高的。因此,要让人工智能成为一个未来我们整个国民经济发展的根本,我们需要突破一个新的红线,就是成本红线。”商汤科技联合创始人兼大装置首席科学家林达华此前公开表示。

简言之,从“技术概念”到产业落地,AI需要突破成本红线,而在很长一段时间内,由于应用场景的高度碎片化,AI产业都受困于“小作坊式”的AI开发窠臼之中,“千人千面”的企业应用场景需求让标准化生产、大规模量产成为难越的“天堑”。

而自2018年谷歌发布Bert、2020年OpenAI推出参数量高达1750亿的语言预训练模型GPT-3再到去年至今火爆全网的chatGPT,AI大模型让人们看到了希望,产学研各界看到了大模型带来的无限可能性:由不断重复开发、手工作坊式人工智能走向标准化、规模化、工程化的全新路径。

通过大模型进入AI工程化生产的智能时代成为共识,对于商汤科技而言,在迎来AI工程化到来的第一步是搭建通用人工智能基础设施——SenseCore 商汤 AI 大装置。

02

新范式:无标准、不行业

《千字文》有言:“日月盈昃,辰宿列张。寒来暑往,秋收冬藏。”

丰收的前提是提前播种,农耕如此,百业亦然,AI行业也不例外。面对这一场大模型风暴,商汤科技已然酝酿许久,自2019年,商汤便开始着力打造人工智能“大基础设施”:2020年启动建设了人工智能计算中心AIDC,并在2022年1月启用;2021年,商汤AI大装置亮相WAIC,第二年,商汤大装置AI云对外发布,并于前不久在2023全球人工智能开发者先锋大会正式上线。

以人工智能大模型开发、生产、应用为核心,打造一站式、自主研发AI云、AI平台、AI服务解决方案的AI大装置将为AI产业带来怎样的变化?

商汤科技董事长兼CEO徐立于去年底的公开演讲中清晰明确了这一改变。“今天的人工智能已经进入了量产时代,无标准不行业。”他指出,基于大装置的核心技术,大模型将彻底改变人工智能的开发范式——一切标准化,从而规模化、量产化。

在北宋著名建筑学家李诫的《营造法式》一书中曾提到:“凡构屋之制,皆以材为祖”,材即模块,举个例子,比如说一个木材可分为八分,只要讲需求到底是几分、是哪一个,别人就会根据这样的标准来制造。

在AI纷繁复杂的场景应用的背后都是人工智能的算法模型,每一类模型又能像建筑一般再进行细分进行结构化、模块化,从基础设施、数据标注、预训练大模型、行业模型到上层应用每个环节都能丝丝入扣,均形成流程标准化。当完成这一标准化后,模型也便从专用走向通用,规模化、量产化制造得以实现。

具体来看,这一AI量产化“新范式”的实现得益于商汤AI大装置对计算基础设施、深度学习平台、算法模型三大模块的有机整合。

在计算基础设施层,商汤自主投入的建设的新型人工智能计算中心(AIDC),总算力达4910PetaFLOPS。

在深度学习平台层,商汤提供全套AI数据管理、标注服务,AI Studio人工智能开发平台,涵盖可视化建模、模型管理、模型训练等全栈工具。

在算法模型层,提供OpenMMLab人工智能算法开源体系、OpenGVLab通用视觉开源平台、OpenDILab开源决策智能平台为核心的算法套件,同时拥抱社区,提供多样化的算法模型支持。在大模型算法研发上,商汤视觉大模型320亿参数,领先Google ViT-G、Meta SEER 10B等国外企业工作,视觉超大模型已覆盖商汤10+个核心业务,并持续拓展。在AIGC大模型、NLP大模型、Nerf三维大模型等领域大模型上也已经形成了一定的应用闭环。

通过对AI、超算与大数据的核心能力的融合,商汤的AI大装置的目标只有一个:通过为AI优化的高性能计算、高性能存储及缓存、高性能网络,支撑大模型在数千张卡、PB级存储上,完成万亿级参数大模型训练,从而完成标准化大模型生产流程。

“标准化不会限制行业发展,反而会给到行业更多应用可能,因为分工变得可能了,技术可以像搭积木一样轻松组合、高效复制、快速推广。”徐立指出,人只有完成了标准化,让更多的人利用好标准,共同参与到建设中,大幅降低生产成本,行业才能爆发,形成真正的产业。

商汤AI大装置是商汤创造性的人工智能开发新范式,是商汤对新锐产学动向的极致洞察,亦是商汤多年探索人工智能领域技术走向产业的又一次瓜熟蒂落。

03

赋百业:普惠大众、百业俱兴

当然,训练大模型只是第一步,用大模型才是AI落地真正的考验。数据显示,商汤科技AI大装置已经收获成效,支持商汤超过70%的业务。在其2021年财报中透露,SenseCore大装置支撑了商汤的AI技术在智慧商业、智慧城市、智慧生活和智能汽车四大板块的规模化落地,商用的AI模型数增加,带动了单客户的付费金额同比提高26%。

在智慧城市的应用场景中,SenseCore商汤AI大装置助力赋能城市治理,此前在上海市长宁区率先试点AI+一网统管应用,有效解决了暴露垃圾识别、共享单车乱堆放等城市痛点问题,极大提升城市管理效能。

在智能汽车领域,也有着商汤AI大装置的身影,依托于商汤SenseCore AI大装置打造的光机电软算一体化的深泉工业质检推训平台,福田康明斯发动机生产工厂实现了对发动机关键零部件的表面缺陷和装配缺陷的自动检测,大大提升了质检效率,更是提升了工人的能力,将工人从枯燥乏味的质检工作中解放出来从事工艺等更高水平的工作,为AI质检在汽车工业制造领域的敏捷创新和应用奠定了基础,也助力福田康明斯迈出了向智能制造转型升级的关键一步。

同样,在智能驾驶领域,商汤以Al大装置为基石,以SenseAuto Empower绝影赋能引擎为底座,在通过大模型生产高精度车端模型,大幅提升了few/one/zero shot在长尾类别中的精度,在重点关注的类别上,平均精度提升3%。

千行百业中诸如此类故事还在增加,业内对于商汤AI大装置的认可度也在节节攀升,一切正如徐立所言:“推动时代变革的核心,是技术带来的生产要素价格的变迁。今天商汤推行的标准化生产流程,如果能使AI模型生产以及AI的覆盖成本大幅下降,我们就能真正进入智能时代,人工智能才能真正做到普惠。只有人工智能的普惠,才能带我们穿越一个又一个经济周期。”

如他所说,我们欣喜地看见,商汤AI大装置在赋能千行百业上,交出了一份令人满意的答卷:以高效率、低成本、规模化的AI创新和落地普惠大众,走向产业。

大模型的价值正在不断涌现,我们正在等待着一个AI黄金时代的到来。新:、不行业新范式:无标