驱动中国2022年9月2日消息
近日,2022年世界人工智能大会在9月1日正式开幕,此次大会中元宇宙是一大展出亮点,作为最快落地场景的虚拟数字人也频繁在大会出镜互动。其中,本次大会将邀虚拟主持同现场主持一同互动,还将有多位虚拟数字人成为“暖场”嘉宾。
(资料图片)
近些年来,在元宇宙加持之下的虚拟数字人可谓相当火爆。数据显示,我国现有虚拟数字人相关企业38.8万余家,有近七成的虚拟人企业成立于1年之内。同时,根据IDC在6月发布了一份有关虚拟数字人报告显示,预测中国AI数字人市场规模在2026年将达102.4亿元。
因此,百亿的市场规模和各大企业的争相入局,虚拟数字人或将成为新的风口行业。但是,作为一个全新领域,大多数企业目前还是投入期间,想要实现落地和盈利还面临着技术、成本等一些列痛点问题。而且作为 unity中国总裁兼首席执行官张俊波也对此作出评价:虽然很多制作数字人的公司用的是元宇宙的概念,但是其本质上却是图形渲染公司。 那么,虚拟数字人究竟有何魔力,可以引发市场如此关注?
首先,虚拟数字人从字面含义来理解,就是具有数字化外形的虚拟人物,并且该人物同样拥有人的外观、行为、思想。通常需要三方面的AI技术作为支撑:一是用来收集声音素材的AI语音库,通过机器学习来缔造AI;二是由3D素材拼接出来的3D人物形象,包括各种角度的人物形象;三是动作捕捉后形成的AI动作和语音的交互功能。
其次,虚拟数字人的运作原理与AI人工智能是密不可分的,而虚拟数字人的系统一般分为人物形象、语音生成、动画生成、音视频合成显示、交互等5个模块构成。而交互模块,又可以分为互型数字人和非交互型数字人。其中,非交互数字人是系统依据目标文本生成对应的人物语音及动画,并合成音视频呈现给用户;交互型数字人根据驱动方式的不同可分为智能驱动型和真人驱动型。前者是通过智能系统自动读取并解析识别外界输入信息,根据解析结果决策数字人后续的输出文本,驱动人物模型生成相应的语音与动作来使数字人跟用户互动;后者是真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。
最后,虚拟数字人目前主要被广泛应用于企业服务、文娱领域和品牌代言。其中,企业服务场景一般是具有比价明显的服务和功能属性;而文娱和品牌场景一般具有较强的个性特征和身份标签。比如,江苏卫视2022跨年演唱会的虚拟人“邓丽君”,以及一年为制作公司Sidus Studio X创造了15亿韩元(约合人民币800万)的收益的“韩国第一网红”Rozy。
因此,虚拟数字人总的来说就是凭借数字化的技术支持,可以赋予人们巨大的想象空间,并且以此为起点,显示出超越真人的价值。 那么这种不受时间、空间与物理限制的虚拟数字人,距离行业爆发期究竟还有多久呢?
首先,对于虚拟数字人的行业爆发期,其实很难有一个标准的预测时间。虽然根据各项数据来看,这条赛道无论是目前还是以后,几乎都是兵家必争之地。但是想要真正实现虚拟数字人落地,还需要等到相关技术完全成熟才可以。比如,正如张俊波所言那样,目前很多制作公司借元宇宙之名,但行的却是图形渲染之实。同时,在探讨虚拟数字人自然离不开元宇宙的概念,而目前元宇宙虽然是22年最火的风口之一,但是其形式还一直处于初级阶段,并且元宇宙中三个不可或缺的基本要素,人物、场景、物,三者共同构建除了元宇宙的理论雏形。
而当下元宇宙最火热的方向虚拟数字人,在一定程度上来说,当前很多公司的技术流程多以真人为模特,并在光场设备的场景中做出相关表情并以此进行后期清理和设计。尤其是在二次元的应用上,“比如一个虚拟偶像类的数字人,其背后是动画师们在一帧一帧的精修渲染,或者是依赖于对中之人的动作捕捉”,但是无论是那一种的技术支撑都无法摆脱真人的限制。
其次,虚拟数字人除了技术要求之外,还有资金成本的制约。比如虚拟数字人除了自身的建模之外,对于算力资源的要求也是相当高的,这是因为高精度的3D模型多以视频形式来传播,而不是真正的实时交互,背后的制约因素就是需要强大的算力来支撑,而这一点别说个人设备根本无法实现,即使是企业端也需要耗费巨资来投入其中。所以,这样一来所造成的后果就是,虚拟数字人想要广泛运用到C端目前基本不太可能,而B端也需要考虑如何平衡成本和收益的问题。
因此,虚拟数字人虽然未来发展的潜力很大,但是目前还需要克服种种难关才可以实现行业的爆发期。
总之,虚拟数字人近几年来基本呈现稳定的增长态势,同时随着相关技术的成熟和制作成本的降低。未来虚拟数字人将会是千真万确、名副其实。