齐、楚、燕、赵、韩、魏、秦,到底谁是谁?
本届世界人工智能大会(WAIC 2023),30多个大模型同台竞技,围绕大模型的芯片算力、数据服务等企业也纷纷亮相,更多与AI相关领域如机器人、自动驾驶,也借助大模型展现出更加惊艳的能力。
7月初,一方面,美国政府又升级制裁,将限制中国企业使用美国厂商的云计算服务,堵住中国人工智能公司可能通过使用云服务绕过当前芯片出口管制规则的漏洞。另一方面,这场世界人工智能大会,也给全球展现出了中国AI产业、大模型技术发展的蓬勃动力。
很多观察者都将当前中国AI企业竞逐大模型的形势比喻为“战国时代”,那么,问题来了,谁是战国七雄呢?
由于大型语言模型的推动,人工智能在各个应用领域再次迎来高潮。然而,通用的大型模型并不能解决各个细分领域的问题,因此在人工智能竞赛的下一阶段,将会看到针对不同细分领域的竞争激烈对决。
行业大模型的参数可以更小,但领域范围内却更加专业。但只有具备通用大模型的能力,似乎也才有资格成为“七雄”。而本届WAIC上,国内通用大模型的巨头玩家们,也基本都到齐了——百度的文心一言、阿里巴巴的通意千问、华为云盘古大模型、讯飞星火、商汤日日新等AI大模型产品令人目不暇接;只有腾讯云专注于行业大模型。
文心一言:燕国
今年3月,作为国内AI领域的代表企业之一,百度发布大语言模型“文心一言”,成为我国首个类ChatGPT产品。在本届人工智能大会上,“文心一言”大模型自然要登台亮相。大模型时代,IT技术栈发生根本性改变,从芯片、操作系统和应用三层架构,转变为芯片、框架、模型、应用四层架构。百度在人工智能四层技术栈均有布局和领先的自研技术,尤其在位于四层架构核心的框架层和模型层。
百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在WAIC上也解读了文心大模型版核心技术,并表示,文心大模型效果、功能、性能全面提升,实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,模型效果提升50%,训练速度提升2倍,推理速度提升30倍。
燕国是周天子的遗脉,“燕东有朝鲜、辽东,北有林胡楼烦,西有上党九原,南有滹沱易水”,也就是产业环境比较好,与各行各业都有接触;而且 “燕有辽东之煮”,意思是燕国有渤海湾的盐业资源,而百度搜索的广告收入恰好就是“辽东之煮”。
文心一言,就是大模型战国时代的燕国。
讯飞星火:楚国
在本届WAIC上,讯飞星火不仅展示了大模型在PC与手机等不同终端中的应用实例,还以不同行业场景为切入点,让公众直观了解大模型如何赋能学习机助力教育提质增效,帮助医疗行业搭建个性化诊后康复管理平台等行业类创新应用。在工业、汽车、医疗等行业赛道,讯飞星火在大会现场都进行了案例展示。据了解,在8月15号,讯飞星火还将突破代码能力,实现多模态交互再升级。
在华为承办的昇腾人工智能产业高峰论坛上,科大讯飞高级副总裁、认知智能全国重点实验室主任胡国平公布了讯飞与华为的合作,宣布星火认知大模型与昇腾AI强强联合,让国产大模型架构在自主创新的软硬件基础之上,共筑我国通用智能新底座。
科大讯飞总部所在地合肥,在战国时代为楚国。楚国疆域最辽阔,在疆域、水源、人口、矿场及冶炼技术等多方面都具有优势,战国时期最重要的盐、铁、铜这三类大宗商品都能产出。楚国虽然面积最大,但缺乏熟地,很多疆域都开发不足。 讯飞星火拓展落地各行业速度也很快,但如何将生地变为熟地,也是大模型竞争中需要注意到的地方。
讯飞星火,就是就是大模型战国时代的楚国。
腾讯行业大模型:齐国
在大模型领域,腾讯所打造的“混元”自2月初被曝光研发团队后,鲜有消息。腾讯打法不同于其他家,相比通用大模型,腾讯更在意行业大模型。或许在腾讯看来,各家通用大模型水平最多也就在 水平附近,说自己超越ChatGPT往往会言过其实,“多腾讯一个不多,少腾讯一个不少”。那样还不如主打行业大模型概念,争取在行业大模型上成为第一。
而且,对行业大模型来说,其不需要像通用大模型一样耗费巨资训练通用数据,而更侧重行业本身的数据。企业在应用大模型时,既要关注敏感数据的保护与安全合规,也需要管理好大量的数据与标签,不断测试与迭代模型,这是通用大模型无法满足的需求。
齐国在战国诸多国家中虽然领土面积排第4位,但相比于楚、越、赵三国,齐国在人口密度上远胜于前三者。 齐国三面环海,在后方没有防御压力。齐国首都临淄人口密度更是“摩肩接踵”,堪称战国时代的“摩都”。而腾讯位居深圳,人才密度很高;QQ、微信、游戏也是自己的三道护城河, 在做行业大模型上,集团也能在后方给与全面的防御和资源对接。
腾讯行业大模型,是大模型战国时代的齐国。
阿里通义大模型:赵国
继通义千问之后,阿里云通义大模型家族在WAIC上也迎来新成员——阿里云宣布AI绘画创作大模型通义万相开启定向邀测,该模型可辅助人类进行图片创作,未来可应用于艺术设计、电商、游戏和文创等应用场景。阿里云智能集团CTO周靖人表示,这是阿里云大模型全面掌握多模态能力的关键一步,该能力将逐步向行业客户开放。
据了解,目前,阿里云大模型正逐步走向千行百业,已有超过30万企业申请测试通义千问,通义听悟累计用户数达到36万。“多模态是大模型演进的必然路径,我们希望用不同模态的能力服务千行百业,帮助企业全面拥抱智能化时代。”周靖人表示。
赵国疆域辽阔,而且勇于自我变革,如赵武灵王的胡服骑射变法。而阿里在组织结构上也常常为了适应新形势进行自我变革。 整个战国时代,唯一能够在军事上与秦国相提并论的国家只有赵国,堪称德比。而阿里也是中国互联网与腾讯并列的巨头德比(当然,“穿越”到战国时代之后,腾讯大模型还是更接近齐国而非秦国;阿里“穿越”之后也是更接近赵国,两者都不是秦国,但齐国和赵国也是实力相匹的)。
阿里通义是大模型战国时代的赵国。
商汤日日新:魏国
在WAIC上,商汤宣布了“商汤日日新SenseNova”大模型体系的多方位全面升级,以及在该体系下的一系列大模型产品更新和落地成果。此外,商汤也着重介绍并展示了其大模型技术自正式发布以来与产业各方的应用实践,包括商汤绝影最新打造的智能座舱产品和车路云协同交通体系等,以及在金融、医疗、电商、移动终端、产业园区等行业生产实践中的落地应用。
商汤科技董事长兼CEO徐立在产品发布环节中讲到:“大模型的突破掀起了人工智能的新一轮技术革命,随之而来的是产业需求呈现爆炸式增长,全新的应用场景和应用模式正迅速涌现。商汤希望通过‘大模型+大装置’持续推动AI基础设施能力的跃进提升,不仅打造通用能力更加强大的基础模型,也进一步高效融合不同垂直领域的专业知识,构建更懂行业、更具专长的专业大模型,从根本上降低大模型的下游应用成本和门槛,让大模型的产业价值在千行百业中绽放。”
战国时,魏国率先变法,吸引了吴起、乐毅、孙膑、商鞅、范雎、张仪、公孙衍、尉缭、姚贾等诸多领先人才,“四方贤士多归之”。 魏国自然资源或许比不上齐国、楚国,但丰富的人才资源成为魏国竞争力、威慑力的重要组成部分。商汤堪称科学家创业的典范,公司科技人才密度很高。对于AI公司来说,没有巨头在社交软件、搜索入口等方面更容易获利的“自然资源”,就得拼“人才资源”。
商汤日日新是大模型战国时代的魏国。
言犀大模型:韩国
京东即将推出的言犀大模型也亮相WAIC。京东探索研究院院长、京东科技智能服务和产品部总裁何晓冬表示,在大语言模型的研发上,京东更注重的是对话方向,也在积极推进多模态模型的研发。除了通用性的数据,京东还将零售、金融、健康、物流等广泛专业领域的产业数据也融合到基座模型进行训练。除了大语言模型,何晓冬称,京东也在语音、视觉等多模态模型上进行了研发。
战国时的韩国位于七雄的中间位置,“内修政教,外应诸侯”,申不害在韩国帮助韩昭侯推行变法,使韩国权力结构更加集中、强大;坐拥宜阳铁山,冶铁锻造手工业发达, “地方九百余里,带甲数十万,天下强弓劲弩皆出自于韩。” 在诸多大模型中,言犀大模型目前声量不大,在几家巨头中堪称疆域最小的大模型;但背靠京东,拥有强弓劲弩,也不可小觑。
言犀大模型,是战国时代的韩国。
为什么没有说谁是秦国?
谁会是秦国,目前绝对没有定论。战国七雄仅是一场比喻,在这场比喻里,一统天下的过程和结果都可能有变化。 这个比喻中没有出现秦国,是因为六国皆可能成为秦国。
除了上述之外,360智脑大模型、第四范式式说大模型等都在此次WAIC展会上亮相,还有星环无涯金融大模型、澜舟科技孟子GPT、蜜度蜜巢知识问答与内容生成大语言模型等在内的20余类垂直大模型,以及网易伏羲丹青约等AI绘画工具,也先后展出。尤为值得注意的是,包括中国移动、中国联通和中国电信在内的国内三大运营商,也在本届WAIC前后先后推出了自己的大模型产品。大模型也已经成为电信运营商的“兵家必争”之地。
在更加底层的芯片算力层面,以天数智芯、云天励飞、昆仑芯、平头哥半导体等为代表的10余家大模型应用芯片企业,也先后参展。
尽管很多人将现在比喻为大模型的战国时代,但大模型并没有出现当年团购时代“百团大战”的残酷(那才是真正的战国时代,是你死我活的拼杀),尽管各家都会讲述自己的技术优势,并公布各种测试中相对竞品的领先优势。
“百模大战”,与十多年前“百团大战”还是有很大不同,毕竟后者,那可是同质化内卷,是野蛮人互砍,是一段线下铁军重要性远超技术(当然技术也很重要)的蛮荒时代。
首先,在这个大模型战国时代,各家都呈现出进一步细化的特征,在通用之外寻找更多领域的落地。
比如腾讯提出不做非聊天式应用,而是面向企业的行业大模型。实际上,在腾讯云公布行业大模型解决方案之前,各垂直领域的行业大模型早已被多家企业先后推出。腾讯不做通用的、聊天式的大模型,也是扬长避短。不过,从腾讯的企业特点上去推测,或许很多人会觉得其做通用聊天更具优势?反而在行业大模型上,更多创业企业远比腾讯更处于细分行业一线,如推出自动驾驶、医疗、地产、安全、智能物联等行业大模型的诸多背后企业。
而美图集中于视觉创作、商业摄影、专业视频编辑、商业设计等领域,试图将美图需求从C端生活场景向B端生产力场景进阶,将AI 与影像生产力工具紧密结合。
360也认为GPT等通用大模型无法覆盖世界上太多的领域,这也正是行业大模型的机遇所在,“百模大战”最终比拼的将是各家应用场景落地能力。
其次,十多年前“百团大战”是新玩家在新赛道的野蛮竞争,双方都在起步,但起步就是贴身肉搏战,既分输赢,也决生死。 当时的竞争,一度上是非理性的。而目前的大模型战国时代发生的所谓“百模大战”,都比较温和,各大厂之间并没有你死我活的态度,而是更加理性,你玩你的我搞我的,大家唯一的对手其实就是ChatGPT。
当然,“百模大战”远不是“百团大战”,两者之间可比性本来就不多。大模型的竞争,目前看似乎既有匆忙的一面,也有气定神闲的一面,更考验企业长跑的能力。比如建设大规模分布式系统,进行分布式训练、推理的能力;比如以大模型为基础,部署商业化应用、运营商业生态的能力等等。
从PC时代到移动互联网时代,安卓ARM生态取代了Wintel生态,那么,大模型时代又将带来哪些变化,诞生哪些新霸主、新联盟?
其实,与其说大模型进入战国时代,莫不如说是更接近春秋时期的格局。
春秋时期,五大霸主之下,数百个小国各自占据着不同的生态位。打仗以贵族的战车战争为主,战车得在平坦的地面才能跑起来,两国打仗,要选开阔的地势会战。 对比战壕战中,大家在泥泞中挖壕堆土,浑身是泥;显然战车战更符合贵族保持仪表的习惯。
这种低烈度的贵族风格(当然,作战的平民会经历更加残酷的拼杀)战争,也流传下许多典故。比如宋襄公在“泓水之战”,为了维持仁义之礼,拒绝袭击正在渡河的楚军,而是等到楚军上岸摆好阵型之后,才面对面正式较量,最终败给楚国。
因此,不同于历史上,从春秋五霸加几百个小国,演变为战国七雄加少数几个小国,最终演化为统一的秦帝国; 中国的大模型战国七雄时代,很可能会是一种“倒流”式发展,从七雄到几十个小国,发展为五霸同时诞生数百个新的小国 (巨头的通用大模型数量略有减少但更多行业大模型崛起)。
而亿欧也将继续观察大模型行业的战事与进展。
关键词: