人工智能普及!继百度文心一言,国内另一巨头大语言模型开放内测-快看点


(资料图)

近日,阿里巴巴旗下的人工智能语言大模型通义千问(AliceMind-PLUG)正式开放内测申请,邀请广大开发者和研究者体验其强大的语言理解和生成能力。据悉,通义千问是目前中文社区最大规模的纯文本预训练语言模型,参数达到270亿,训练数据超过1TB,涵盖新闻、小说、诗歌、问答等多种文本类型和领域。

通义千问是阿里达摩院机器智能技术实验室倾力打造的具有领先性和系统化的深度语言模型体系。该体系在通用语言模型StructBERT基础上,拓展到多语言、生成式、多模态、结构化、知识驱动等方面。通义千问的核心模型PLUG集成了达摩院自研的语言理解模型StructBERT和语言生成模型PALM,通过构建输入文本双向理解能力,显著提升了输出文本的相关性和流畅性。

在语言理解任务上,PLUG以80.614的分数刷新了中文语言理解评测基准CLUE分类榜单历史纪录,在多项国际赛事上也取得了世界冠军。在语言生成任务上,PLUG支持零样本生成,可以在不需要任何下游任务标注数据的情况下,实现多种生成任务,如小说续写、专业文稿撰写、生活常识解答、诗词生成、菜谱生成、自由创作等。

阿里大语言模型的内测开启,无疑是对百度旗下的大语言模型“文心一言”的一次挑战。“文心一言”是百度自然语言处理部门推出的一款面向对话场景的预训练语言模型,参数达到100亿,训练数据为百度搜索引擎收集的中文对话数据。“文心一言”可以实现多轮对话、情感对话、知识对话等多种对话任务,并具有较强的个性化和情感化表达能力。

百度和阿里两家巨头在大语言模型领域的竞争,反映了当前人工智能领域的一个重要趋势:基于超大规模预训练模型的自然语言处理技术。这种技术通过利用海量的文本数据来训练一个通用的语言表示模型,然后根据不同的下游任务进行微调或零样本推理,从而提高了自然语言处理任务的效果和效率。这种技术也为各行各业提供了更多的应用场景和商业价值。

随着计算资源和数据规模的不断增加,以及预训练技术和优化方法的不断创新,我们有理由相信,大语言模型的发展还远未到达极限。未来,大语言模型将能够处理更复杂的语言理解和生成任务,甚至实现跨语言、跨模态、跨领域的通用智能。同时,大语言模型也将面临更多的挑战和问题,如如何保证模型的安全性、可解释性、公平性和伦理性等。这些都需要我们不断地探索和创新,以使大语言模型能够更好地服务于人类社会。

关键词:

推荐DIY文章
主机存在磨损或划痕风险 PICO4便携包宣布召回
穿越湖海!特斯拉Cybertruck电动皮卡可以当“船”用
vivoXFold+折叠旗舰开售 配备蔡司全焦段旗舰四摄
飞凡R7正式上市 全系标配换电架构
中兴Axon30S开售 拥有黑色蓝色两款配色
荣耀MagicBookV14 2022正式开售 搭载TOF传感器
it