面壁 Luca 开放公测,实测千亿参数基座模型效果

由李大海、知名学者刘知远组成的大模型明星团队面壁智能,近日发布了最新大模型成果 ,访问网站( /chat ),即可申请全民公测。


(相关资料图)

面壁智能联合创始人、CEO 李大海在发布会上表示 Luca 的多项语言模型能力已与 ChatGPT 相当,并重点展示了其强大的多模态能力和依托群体智能技术的 AI 原生应用场景。 相比于 5 月只是开启定向邀请内测,目前 Luca 版本已经开启全民公测申请。

李大海介绍,Luca 的名字取自地球生命始祖 LUCA(The Last Universal Common Ancestor),Luca 版本最早于 5 月 27 日在 2023 数博会上首次亮相并通过实时演示的方式展现过其多项出色功能。

实测 Luca ,复杂推理能力惊艳

面壁智能未在发布会上引用目前主流的基准测试结果,我们也从团队过往分享中了解到,他们更倾向于构造自己的数据集进行测试。

为了更直观的体现模型效果,CSDN 在第一时间于 luca-beta . mod 申请内测,测试了千亿参数基座模型的效果。我们选取了 Z-Bench (/zhenbench/z-bench)中部分问题,与 Luca 进行交互,都得到了不错的效果。

值得一提的是,在发布会的介绍中,李大海提及了 除 了优秀的大语言模型能力外, 还具备强大的多模态处理能 力,其图片理解能力已达中文 全网最强。

三个月迭代 85 次, 能力跃迁

版本最早于 5 月 27 日发布并开启内测,到如今的 版本,三个月里大语言模型能力整体提升 39 %。其中推理能力提升 119 %,推理、知识、生成等多项能力已媲美 ChatGPT。

除了优秀的大语言模型能力外,其中多模对话、细节描述和复杂推理三项整体得分为 分,而行业其他模型的平均得分是 分,远超现有支持中文且具备图片理解能力的大模型。

据悉,Luca 的语言交互基座模型是千亿级参数 CPM 大模型。CPM(Chinese Pretrained Model) 系列大模型享誉已久,是面壁智能从零自主研发的预训练大语言模型,其中包括国内首个中文大模型 CPM-1。最新的大模型训练直播项目 CPM-Live 的第二期百亿模型 CPM-Bee 是国内首个开源免费商用基座模型,目前已授权给数百家企业合法商用。

被业内寄予厚望的明星团队

面壁智能作为清华系的明星 AI 团队,一直受到行业关注。面壁智能的创始团队来自于清华大学计算机系自然语言处理与社会人文计算实验室,联合创始人&首席科学家刘知远为清华大学计算机系长聘副教授,智源青年科学家。技术团队中的曾国洋也是知名的小天才,是悟道·文源中文预训练模型团队的骨干成员。

今年上半年,面壁智能宣布了来自知乎和智谱 AI 的新一轮融资, 知乎 CTO 李大海自即日起出任面壁智能的董事和 CEO,负责面壁智能战略发展和日常运营管理。

回顾知乎与面壁智能的合作过程,也具有一定故事性。 李大海与刘知远早在 2016 年就认识,但 知 乎与面壁智能达成关键的投资合作意向,是在 今年 二月初的一个周五。 李大海 作为知乎 CTO 与刘知远就 合作 一事进行了交流后 , 随即召集知乎的技术团队对 CPM 进行了实测 , 在取得了不错的效果后 ,于 当周 周日 就 发起了 投资 面壁智能的投决会。

根据李大海介绍,这也是他作为知乎 CTO 发起的唯一一个投决项目。

李大海在近期 CSDN 的采访中认为「未来国内大模型的趋势可能发展为 3+N」,「3」即是三家基座大模型提供通用的底层服务,「N」则为各个专业领域、场景内的模型。

他表示以面壁智能扎实的技术实力很有希望成为这个「3」,在未来承担起建设中文基座大模型的重任。

关键词:

推荐DIY文章
主机存在磨损或划痕风险 PICO4便携包宣布召回
穿越湖海!特斯拉Cybertruck电动皮卡可以当“船”用
vivoXFold+折叠旗舰开售 配备蔡司全焦段旗舰四摄
飞凡R7正式上市 全系标配换电架构
中兴Axon30S开售 拥有黑色蓝色两款配色
荣耀MagicBookV14 2022正式开售 搭载TOF传感器
it