小冰CEO李笛：数字人的未来是混合模型-- 迪族网

小冰CEO李笛：数字人的未来是混合模型

来源：猎云精选　2023-07-06 05:43:21

大模型技术很酷，但李笛更关注付诸实用。

(相关资料图)

来源：猎云精选，文/盛佳莹

今年以来，大模型掀起热潮，沉寂许久的人工智能再一次令所有人兴奋起来。尤其是ChatGPT的出圈，为人工智能这把火添了新柴。

《人类简史》中提到，智人之所以能够成为这个星球唯一霸主，一个重要的原因是他们发展出了“虚拟”的语言。

数字人要想逼真，在语言能力上势必要下功夫，而ChatGPT的语义理解能力相比过往的人工智能有着显著的提升，不少人认为有大模型驱动，数字人将有变革性的发展。

而就在大模型浩浩荡荡而来，所有人都在加速狂奔时，小冰CEO李笛早在几个月前提出了自己的判断，在他看来，大模型只是揭示了一场变革的开始，但它远远不是变革本身。

掌舵小冰公司，相比于追求技术的酷，李笛更关注技术的实用性和稳健性。

不可否认，大模型固然是好。

“在数字人领域，大模型确实可以解决过去一些没有解决的问题。”李笛告诉猎云网，一方面，大模型涌现的能力之一是思维链，在一定程度上，比过去的知识图谱做得更好，“过去，大多通过脚本让人工智能一个步骤一个步骤地去完成一件事情，但到了大模型，它自己一定程度上有逻辑思维能力，会思考自己下一步应该做什么，这有机会让数字人去控制更多的线上线下的场合。”

另一方面，大模型在回答问题方面，比过去的检索模型、生成模型在质量上有巨大的提升，但尽管如此，大模型依然没有突破到意识层面。

对于数字人而言，其交互场景往往多样复杂，无法判断用户具体交互何种内容，这要求数字人需要拥有一定的通用泛化能力，而此前行业内使用的检索模型，往往无法覆盖长尾问题。

除此之外，李笛提到在与数字人交互时，用户对内容的需求偏向也不同，“有时候用户可能只是想和数字人聊天，寻求陪伴，这个时候更偏向于数字人输出有趣的内容，而有时候用户和数字人交互是纯知识交流，这个时候需要数字人提供有用的内容。”

李笛坦言，过去“有趣”和“有用”往往无法两全其美，只能偏重其中一方，但大模型的出现有机会让两者并重。

“大模型可以大量压缩信息，在预训练过程中，远大于其他检索模型所能压缩的知识，可以做很好的预测。”

或许因为大模型的“大力出奇迹”，让不少人对大模型产生了极大的期待，认为其将变革数字人行业。

但在李笛看来，这并不代表一个大模型可以驱动数字人的一切，他对大模型在数字人领域的应用视为是驱动数字人的其中一个技术来源。

事实上，李笛比国内平均早一年接触到ChatGPT，在国内数字人厂商狂热追逐大模型之时，李笛已经看到了大模型的问题所在。

李笛谈到：“大模型的本质仍是回答问题，但是人与人之间是互相激发，也并不一定要回答问题，要想让数字人像人，一定不能只是一个答疑者。”

此外，李笛还谈到，人在交互过程中是多模态交互。“虽然大模型也向多模态方向发展，但是这种多模态和数字人的多模态存在差别。大模型的多模态往往是同时处理多种模态，并把多种模态视为一个模态。而数字人的多模态是指，表情、声音、动作、语义彼此之间达成高度协调统一。”

大模型的交互速度也是数字人厂商不可忽视的维度。

在不同场景下，人对交互速度有着不同的标准，而数字人不论是直播还是对话，都偏向交流性场景，在数字人行业里有一句话，数字人的一大美德是“秒回”。