作者:郝俊慧 来源:IT时报
(资料图片仅供参考)
Bedrock(基岩),地理学中,它是地表层的坚硬岩层,很难被开采;《我的世界》里,它是最基础的方块,不可被破坏;而在2023年世界人工智能大会(WAIC2023)上,它是亚马逊云科技带来的镇馆之宝——基础大模型云服务。
今年4月发布的Amazon Bedrock,是亚马逊云科技在生成式AI领域的重要布局。之所以称为“云服务”而不仅仅是“大模型”,在于其不仅提供亚马逊云科技自己的模型Amazon Titan,还提供初创公司AI21 Labs、Anthropic,以及Stability AI的基础模型服务的访问,核心功能在于帮助开发者能够轻松定制模型,并构建属于自己的生成式AI应用程序。
不久前召开的WAIC2023上,亚马逊云科技生成式AI产品研究院院长Sherry Marcus向中国用户详解Amazon Bedrock。
“大模型家族”组团服务
“绝大多数的客户并不需要自己从零开始来训练模型。”对于大模型的应用场景,Sherry Marcus开宗明义,认为不能依赖一个万能的、单一的大型语言模型来应对各种任务,“正确的做法应该是,客户可以访问多个模型,然后根据自己的需求和数据来定制自己的模型。”
当用户进入Amazon Bedrock官网时,可能只需点击几次,便可以找到适合自己的模型服务。
首先是选择基础模型。Amazon Bedrock提供了一个“大模型家族”,为客户提供已经训练过的预训练模型。
其中Amazon Titan系列基础模型包括Titan Text和Titan Embeddings,Titan Text可以从简单的自然语言命令生成文本,适用于撰写博客、电子邮件、文档摘要、开放式问答和信息提取等各种应用;Titan Embeddings可以为搜索、异常检测和个性化等应用程序生成文本嵌入。
当然也可以选择其他公司预训练的大模型,AI21 Labs是多语言大语言模型,用于对话问答、工作流自动化,Stable Diffusion更是“文生图”的顶流,虚拟生成的人像画质堪比高清相机。
选择基础模型之后,便进入微调阶段,只要将提示词发送到模型,由Amazon Bedrock自动部署基础模型进行推理。
“客户可以根据自身需求,在大语言模型的基础之上,进行专业化或者专门化模型的构建,并且使用自己的数据,这样在享受大模型丰富度的同时,也可以体验小模型带来的快速迭代。”Sherry Marcus解释,通过微调,客户可以最大限度提高特定任务的准确性,只需使用20个示例标记便可以实现任务准确性,与基础模型相比,这些定制化模型风格各异,更适合银行、旅行和医疗等消费场景。
“芯片全家桶”解决算力难题
对于全球云服务商而言,ChatGPT是一个新的“Game?Changer”(规则制定者),提供以基础模型云服务为主的Maas(大模型即服务)将是云商下半场主要战术已毋庸置疑。
目前,除了亚马逊云科技,国内的华为云、腾讯云等云商均已提出要为客户提供“大模型超市”,而商汤、科大讯飞等拥有强大自主算力的AI公司,也很可能要来分一杯羹。
在这场由AIGC引发的创新浪潮中,算力将是关键的胜负手,不仅仅是紧缺的算力资源,还要有高度弹性化的算力供给能力。
WAIC 2023前一周,亚马逊云科技中国峰会落幕,彼时亚马逊云科技大中华区产品部总经理陈晓建拿出了一张亚马逊自研芯片“全家福”:作为亚马逊云科技第一款自研芯片,Amazon Nitro实现了高度轻量化的虚拟化,而基于ARM 架构的CPU芯片 Amazon Graviton,可以让F1一级方程式赛车的开发速度提速70%。
当然,用于机器学习训练和推理的芯片Amazon Trainium和Amazon Inferentia更受关注。据陈晓建介绍,基于Trainium的Trn1实例(云计算基础计算单元)和通用的GPU实例对比,在训练吞吐率上面,单节点可以提升倍,而多节点集群的吞吐率可以提升倍,从成本考虑,单节点成本可以降低倍,集群成本更是可降低倍。
针对需要集群训练的大模型,亚马逊可以用3万张Trainium芯片构建一个EC2 UltraCluster超大集群,使用户可以获得云上6 EFlops(每秒100亿亿次浮点计算)的训练超算能力。
ChatGPT带来的英伟达浪潮,使世人目光均聚焦于A100、H100等明星芯片,然而,在实际应用中,推理芯片才是“吞金兽”。原因很简单,训练往往只是阶段性服务,而推理是7×24在线不中断的服务,对客户来说,推理芯片的吞吐率、延迟率、成本都很重要。
陈晓建举例称,在为Stable Diffusion 服务时,Inferentia 2可节约50%成本,另一个提供AIGC视频剪辑的“当红炸子鸡”Runway,通过Inferentia 2获得了两倍吞吐率的提升。Sherry Marcus透露,通过Trainium和Inferentia,推理性价比提高了40%,数据吞吐量增加了四倍。
通过Amazon Bedrock提供基础大模型服务和以自研芯片确保算力能力,亚马逊云科技试图以低成本和加速的方式,解答更多人对于这场由AI创新带来的困惑。
“重塑”千行百业
“基础模型拥有巨大的潜力,但我们仍处在初级阶段。”亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian此前曾表示,基础模型多样化会推动新一波创新浪潮。
尽管这波浪潮只“潮起”了8个月,一头扎进来的云服务商、AI服务商和企业客户却已初见红利。亚马逊云科技在金融、医疗、外贸、制药等行业均有合作落地案例。
在医疗和生命科学领域,生成式AI将对制药、临床试验和医疗实践等整个价值链产生巨大影响,包括设计和合成新蛋白质序列、预测药物效果和副作用、识别患者风险因素、提供个性化护理方法,甚至合成患者和医疗数据进行模拟研究。
亚马逊云科技大中华区机器学习产品总监张洋介绍,飞利浦医疗与亚马逊云科技合作,将飞利浦医学影像系统 Philips HealthSuite Imaging 影像平台的服务部署在云端,并通过使用基于 Amazon Bedrock 的基础模型(Foundation Models)加速开发基于云计算的生成式人工智能应用,提供临床决策支持,实现更准确的诊断。在国内,也有医疗客户已经在利用Stable Diffusion助力生成大分子。
跨境广告和互联网广告中的DSP也已经有类似案例落地。张洋以眼镜销售举例,之前智能制作一个眼镜广告,只能上一个眼镜,或者请模特拍摄,需要花费大量的时间和精力,还可能涉及到版权,如今利用AIGC进行合成戴眼镜的模特,这个模型的推理速度是提升了270%,从原来每分钟张图像加速到4张图像,在有限流量和成本下获得更多的转化。
“AIGC将重塑大量客户体验和应用程序,”Sherry Marcus认为,人类当前面临的最大挑战,正是如何理解AIGC能够给各行业转型带来的影响,“我们可以将眼光放得更远一点,看它未来会带来怎样的颠覆式创新。”
关键词: