信息化产业已经从“手工时代”迈入“工业时代”。
【资料图】
编辑 | 刘杨楠
4月的科技界热闹非凡,AI领域可谓是“忽如一夜春风来,千家万家模型开”——阿里、华为、商汤等公司均发布自家大模型,钉钉、飞书、WPS等产品也宣布接入大模型。
就在昨天,又一个国产大模型问世。
4月18日,APUS在“ AiLMe· 最懂你”发布会现场发布了自研多模态人工智能大模型“AiLMe”。AiLMe参数已达千亿规模,具备对文本、图像、视频、音频的理解和生成能力。
针对具体应用场景,APUS从AiLMe内蒸馏出文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”、音频模型“异雀六”四个垂直领域精炼模型,并基于此创新研发出“智能问答大师、简笔成画、墨染、Daily Astro、Star Night、KJV Bible Now、PicPik”等系列AI产品。
发布会上,APUS创始人兼CEO李涛将这一波由大模型引领的人工智能浪潮定义为 “一次全新的工业革命”, 其最具代表性的变革,就是 把传统以软件、互联网为代表的信息化产业从“手工时代”真正带入了“工业时代”。
2014年,国家出台双循战略,APUS应运而生,聚焦工具类出海业务。创业初期,APUS主打一款基于安卓系统的桌面应用,上线三个月,就拿下了30多个国家Google应用商城的个性化榜单第一名。
作为一家成立8年的全球化移动互联网公司,APUS早已实现营收正增长,月收入超过亿元,“足迹”遍及欧美、东亚、 东南亚、南亚、中东等 200 多个国家和地区,产品支持超过25种国际语言,累计覆盖全球20多亿用户。
如今,大模型席卷互联网产业,对APUS来说,这是一个巨大的舞台。
人工智能大模型利用深度学习模型生成文本、图像、音频或视频等内容,让处于“手工”时代的信息化产业一跃迈入“工业”时代。
在APUS创始人兼CEO李涛看来: “人工智能是AI时代的操作系统,将重塑信息产业、农业、制造业、服务业等所有产业,起到大规模提质提效的作用。”
当下,全球AI产业百舸争流,但能够实现超千亿参数的大模型研发并非易事。
大模型,尤其是多模态大模型的塑造是结合算力、算法、数据、场景的综合性系统工程,这决定了大模型的锻造绝非一朝一夕之功,注定是长坡厚雪的长期事业。
李涛在接受媒体专访时表示,人工智能发展将遵循“四步走”,即 现有信息系统提效,现有产品服务改造与重构,新场景、新物种,以及全产业升级。
APUS是最早开始关注并投入人工智能的入局者之一,“我们在2018年就进行了AI技术布局,并在2018年推出了多款基于AI技术的应用如CutCut、PickU 、Vieka等,用户可以体验智能抠图,变老变年轻等功能”,李涛介绍。
李涛在发布会上阐述了APUS转型人工智能的契机,在ChatGPT“出圈”前两个月,基于多年的全球化经验,APUS提前感知到了人工智能挥动的“蝶翼”。“今年一月我们就已经在内部所有系统接入人工智能,用来提升工作效率;随后便进行产品的改造升级;大模型AiLMe也是我们阶段性的重要成果”。
此外,APUS在全球有超24亿的用户积累,丰富的产品矩阵也让APUS在多元场景中积累了海量用户数据,这些都成为APUS入局人工智能的最强底气。
3月,首次具备对图像理解能力的GPT-4发布,让“多模态大模型”在行业普及并进入大众视野。多模态的“多”有哪些能力?大模型的“大”又从何而来?AiLMe的架构与能力又有哪些特别优势?发布会现场还发布了国内首份多模态大模型技术白皮书《AiLMe技术白皮书》。
所谓“多”就是指其在大语言模型的基础上,又融合了对图像、视频、声音的理解和生成。而参数规模决定着大模型整体的理解和生成能力,大模型的“大”即是大规模参数,参数越大,存储的知识越多,模型能力越强。
在技术架构的设计上,APUS按照文本、图像、视频、音频的“理解”和“生成”过程形成了两套打法——“理解”部分采用目前业内主流的Transformer架构,并吸收了目前人工智能领域前沿成果,设计了一套 “插件式”架构 ,可以自主学习和使用“工具”,这些“工具”以插件的方式接入到AiLMe的平台中,可以极大提升AiLMe的能力;“生成”部分则沿用了目前业内主流的扩散模型 (Diffusion Model) ,并继承了开源社区的生态。
AiLMe在模型训练时,分为 预训练 (Pre-trained) 阶段和微调 (Fine-tuning) 阶段 。
为解决算力问题,APUS在国内郑州和新加坡分别建设了两大智算中心,还融合自建GPU服务器算力和第三方的算力协同作用。
在数据方面,目前大模型的训练数据一般来自于互联网公开的语料库、网页以及行业公开数据,但在APUS绘制的训练数据图中可以看到,其自有数据也占了很大比重—— 在为全球用户提供产品和服务时,APUS积淀的高质量专有数据成为其研发全球性大模型的优势之一。
业内研究表明,如今大模型研究已经告别了单纯增加大模型参数规模的阶段,决定大模型效果的因素按照重要性排序为: 训练数据质量>训练数据规模>参数规模。 ”AiLMe采用高质量的海量训练数据来训练模型,实现了较好的效果。
今天的AiLMe已具备了自主学习能力。ChatGPT支持插件被认为是AI自我进化的雏形,但过程中尚需要用户手动选择插件;而AiLMe紧跟AI技术发展前沿,采用了 插件式架构 ,后续能够通过迭代开发补充各种插件来扩充自身能力,并且可以自主学习调用插件,无需用户干预,就能够使大模型实现目标驱动,进行自我进化。
通过自主学习和人类反馈不断解锁新能力,AiLMe将更高效地解决个性化、开放式的海量任务。目前,AiLMe已在多个to C场景落地,在场景多样性、任务复杂度上显示出能力与潜力。
据悉, AiLMe将会向客户开放API接口和服务。 届时,客户可根据实际应用需求,调用AiLMe的各项AI技术能力。
聊天对话、创作文章、作诗谱曲、慰藉心绪……在AiLMe之上,智能应用焕发出全新生机。
从AiLMe大模型蒸馏出的异雀 (八、三、四、六) 系列精细模型,分别对应着文、图、视、音四个垂直领域,基于四款精炼模型,APUS创新研发了多款人工智能产品:
· KJV Bible Now是一款面向海外市场的《圣经》产品,让用户拥有自己的专属牧师助手,帮助其解答用户困惑,释放情感。
PicPik,是一款AI图片、视频、娱乐创作工具,能够帮助用户高质量、高效率、低门槛的创作。
· Daily Astro是一款面向海外市场的款塔罗牌产品,让星座、占卜爱好者实现牌面占卜、运势解析。
· Star Night是一款助眠类产品,除了能为用户提供白噪音音频等帮助用户快速入睡,还能依据用户喜好勾勒出理想的数字睡眠伴侣,让它来朗读睡眠故事。
· 智能问答能够在对话之间帮助用户快速完成撰写报告、论文、程序、简历及解答生活疑问等。
· 简笔成画则让用户变身“神笔马良”,只要在手机屏幕上画出草图,寥寥几笔,它就会自动补全图案,形成精美绘画。
· 墨染作为AI绘画工具素材创作社区,功能丰富,除了有慕夏、毕加索等30多款创作风格可选,还具备文案优化等功能。
AiLMe的能力释放让AI产品更加智慧、场景更加多元,既丰富了APUS的产品矩阵,也为开发者打造了创新平台。
目前,国内AI行业的发展可谓百花齐放,越来越多的企业和机构开始投入大量资金和人力来研究和开发AI技术,推动了AI产业的快速发展和创新。期待APUS的AiLMe大模型越来越强大,为用户提供更加全面、精准的服务体验,同时随着技术的不断发展有更广泛的应用场景与更出色的表现。
关键词: