物联网智库 原创
导读
【资料图】
当前,人工智能技术的发展已经进入了新拐点,AI技术范式正从过去的“预训练模型-特定任务精调”向“基础模型-应用反馈学习”变迁,这种迁移也必然创造更多应用可能,各行各业也在纷纷探索AI新范式,包括通用大模型演进和利用大模型范式解决医疗、工业、办公等场景问题,新产品也已经快速融入各行各业,不断塑造新业态、新场景,带来巨大的商业价值。
作为国内顶尖的语音人工智能独角兽企业,云知声十年来构建了以语音、语言和知识图谱为核心,涵盖感知、认知与生成的全栈AI技术体系,并向多模态人工智能方向拓展。对于云知声而言,已经把ChatGPT技术升级作为公司AGI能力构建的新起点,并优先解决在智慧物联和智慧医疗领域的应用问题。
近期,云知声创始人、董事长兼CTO梁家恩博士与智次方·物联网智库创始人彭昭聊了聊大模型在不同场景中的应用。
从鉴别式AI到生成式AI的转变
大模型要更加注重数据安全
彭昭:如果转变为Maas的模式,如何判断各种模型的好坏呢?
梁家恩:其实最终都要从结果来评判的,ChatGPT比较好的一点就在于它其实在隐藏了中间的理解问题,用户不需要关心模型中间的“意图理解”环节,也不需要显式做句法分析、语义理解等动作,只要看看ChatGPT最终给用户的反馈质量如何就可以。就像图灵测试一样,只要人类无法判断是真人还是机器在回应,就是足够智能。如果单独处理“语义理解”任务,过去像BERT这种模型,要比GPT模型做得更好,因为它使用了双向注意力机制,但BERT架构没法直接形成直观的高质量回复,所以让非技术用户感知到。
彭昭:如果以数据为中心的话,掌握大量数据的企业会有很强的竞争优势吗?
梁家恩:不论是过去的传统算法,还是现在的机器学习算法,数据都已经变得非常重要,很多公司本质上也已经变成了数据公司。只要有很多的数据沉淀下来,模型就可以变得足够聪明,只不过此前使用传统的统计学习方法去挖掘这种能力,而现在是用深度学习和大模型的方法去挖掘,精度和能力也就越来越强。
彭昭:相比于其它行业来说,医疗领域对安全的要求更高甚至不容出错,云知声是如何在医疗行业大模型中满足近乎严苛的要求,从而让模型输出的结果更专业、更可信的?
梁家恩:云知声之所以把医疗作为一个主要方向,是因为医疗行业的知识密集程度非常高,如果在医疗领域的问题都能够处理好,相信很多其他行业也都能搞定,这对我们来说是一个技术的制高点,所以需要攻克它。另外,医疗行业的应用场景、应用空间包括社会价值也都很大。
在数据安全性方面,特别是有些涉及到用户的隐私数据,要求都是很高的,最难的就是真实的用户治疗案例,都必须经过数据的脱敏处理。另外,在我们和医院的合作过程中,也会把数据做相应的加密和tokenization,即把数据符号化,只有机器能够知道解码后的含义。在算法方面,现在的联邦学习也可以把各种特征融合后再去计算,使得不接触初始敏感信息的情况下,还可以继续优化模型。
彭昭:OpenAI的CEO也在积极的做一些生态投资的布局,云知声会不会担心OpenAI投资医疗赛道?
梁家恩:我觉得不论是教育还是医疗,这些行业其实都事关国计民生,所以这里面中国一定要有自己独立的解决方案,如果他愿意投资这方面的企业,在国内来看,我相信云知声是很好的标的。过去我们已经有很多行业已经遭受到所谓卡脖子的问题,在这个领域我们肯定不会让它成为一个新的卡脖子问题。
彭昭:云知声是以语音识别技术起家的,从2012年至今积累了大量相关经验,早期的这些技术积累对于云知声推出行业大模型有怎样的帮助?
梁家恩:当时起“云知声”这个名字的时候,我们就不仅仅停留在声音领域了,声音只是我们的一个切入点,我们更希望有一个云端大脑,有强大的认知能力,能够通过声音的交互去解决问题。
2012年时,我们开始布局“三驾马车”,到2016年AlphaGo开始兴起的时候,我们就已经开始布局底层的大规模计算能力,也就是Atlas超算平台。在此之上,我们还拓展了知识图谱和认知技术体系,从而形成一个全栈的技术体系。现在拓展到的大模型对我们来说只是一个算法框架的升级。类似过去用BERT主要是解决判别式问题的,那现在就把它切换成GPT的生成式框架,而BERT实际上是Transformer的编码器部分,GPT则是Transformer的解码器部分,算法改变对我们没有本质的挑战,我们也已经具备训练大模型的基础架构。除了算法和算力支撑,在行业问题认知和数据积累方面,也让我们充满信心。包括物联网和医疗领域,我们理解这些行业业务的核心问题,也有相关的数据积累,我们是非常有信心能把这个大模型做好的。
其实从ChatGPT的算法原理来说,早就已经有了, OpenAI最重要的是率先把产品做了出来,从而形成一个工程闭环。另外,大家对OpenAI的容忍度是远远高于Google的,如果OpenAI之前犯的那些错误Google同样犯的话,我估计后果是完全不一样的,所以不能说OpenAI在技术上是一骑绝尘的,像Google内部也有DeepMind在研究AGI,相关储备也已经非常充足。
在过去算法、算力和数据积累基础上,对我们来说就是把过去以BERT为核心的技术架构升级成以ChatGPT为核心的技术框架,这样的好处就在于可以用生成式AI把理解和生成打通,性能体验、灵活性、扩展性会强很多。
技术发展其实更符合对数曲线
关键词: