自计算机出现,一个可模拟人类思维的工具——人工智能开始诞生,并在以后的岁月中让无数上至科学家,下至计算界的爱好者为之不断努力。
几十年后的今天,人工智能已在教育、安全、金融、交通、家居、医疗健康等领域实现技术落地。ChatGPT的横空出世,更把人工智能推到一个新风口。
(资料图片仅供参考)
人工智能演进背后,其实是深度学习技术的厚积薄发。深度学习则基于大量训练数据实现,这就导致AI项目开发时间长,成本高。在实际的AI产业落地和科研探索过程中,预训练模型以其迁移学习,成为破解这一问题的重要途径。
先导杯大奖赛,正在加速预训练模型的丰富与落地。
预训练模型赛果落地
第四届“先导杯”区域创新赛第一赛区成果出炉,区域赛聚焦人工智能和高端计算两大领域,面向全国开发者发起光源预训练模型积分赛,鼓励开发者了解国产先进计算平台,通过选手参与和贡献预训练模型开源项目,为国内预训练模型社区添砖加瓦。
预训练模型是一个通过在大量数据上进行训练并被保存下来的模型参数。通俗点讲,即人类为解决类似问题创造出来一个模型,当我们遇到新的任务,便无需从零开始训练所有参数,只需在当前模型的基础上微调便可解决问题,减少模型训练所需的时间与成本。
可以说,预训练模型是更偏入门级的深度学习,难度降低,极大提升选手参赛的积极性,同时更有助于选手学习掌握国产算力。
据悉,在已经落幕的西部及东北联合赛区创新赛中,来自各重点高校的选手踊跃参赛,并基于赛题开发了数十个预训练模型,模型覆盖图像识别、图像检测、图形分割、图像超分、NLP大模型、Vision Transformer、MLP-Mixer等方向。值得一提的是,本次大赛中,某服务器厂商的大模型就被成功进行了移植。
赋能国产预训练生态建设
事实上,2020年伴随ChatGPT-3的出现,超大规模预训练模型以绝对的数据和算力优势取代了一些小的算法模型,更为人类开辟了一条通向通用人工智能的可能路径。在此背景下,建设国内的预训练模型和生态亟不可待。
本次光源预训练模型积分赛,参赛选手基于指定的开源社区完成预训练模型作品开发。开发的预训练模型及数据集,可通过开源社区开放给用户;用户可以此自行创建、协作、部署和优化自己所需的人工智能模型,降低开发成本。
这也让我们看到大赛更深层的意义,一方面通过留存的预训练模型,解决用户使用国产算力的入门问题,另一方面,丰富开源社区预训练模型类型,助力国产卡顿预训练生态建设。
随着预训练模型的不断增加与丰富,国产预训练生态日渐繁荣,上述开源社区或将像Huggingface一样,成为推动工业、医疗等垂直应用领域人工智能技术规模化应用的核心动力。
据悉,“先导杯”全国挑战赛也联合企业发布人工智能赛题。其中,网易伏羲提供AIGC方向的命题及玉言训练大模型技术支持;瑞莱智慧聚焦AI运用,发布智慧视频深度伪造检测赛题。该赛题成热门赛道,吸引来自清华大学、北京大学、浙江大学、曼彻斯特大学、中国科学院软件所、鹏程实验室等知名院校和机构的选手参赛。广大计算机爱好者可关注“先导杯计算应用大奖赛”并报名参赛!
关键词: