AI作画开始大众化

图/OpenAI

2022 年 4 月，人工智能研究公司 OpenAI 发布了新版本的文本生成图像程序——DALL-E 2，随后一张由 DALL-E 2 生成的「宇航员在太空骑马」图片开始蹿红社交网络。

相比前代，DALL-E 2 生成图像有了更高的分辨率和更低的延迟，同样基于用户描述文本进行生成。不过和之前 OpenAI 推出的产品一样，DALL-E 2 开始并不对外开放，仅限部分研究人员注册使用该程序，一直到 9 月才宣布向公众开放使用，每月仅限 15 个免费图像。

这也为下半年 Stable Diffusion 的爆火和流行提供了机会。 如果说上半年最火的「AI 画师」当属 DALL-E 2 和 Midjourney，8 月 22 日 Stable Diffusion 发布之后基本就成了「AI 画师」的代名词。

在目前的三大 AI 图像模型中，Stable Diffusion 诞生得最晚，但由于发展良好的开源社区，它的用户关注度和使用范围都超越了 Midjourney 和 DALL-E。任何人都可以免费使用，任何公司也可以基于开源项目定制自己的 AI 生成图像程序。

「一个不在乎人工智能争论的老艺术家」，图/DrMacabre68

「我们已经看到 3 岁到 90 岁的人第一次开始创作。」StabilityAI CEO Emad Mostaque 在一次采访中说，该公司资助了 Stable Diffusion 的开发。在海外知名论坛 Reddit 的「StableDiffusion」板块下，每天都有用户分享通过 Stable Diffusion 生成新的图像作品。

到现在「AI 画师」已经可以走入千家万户。 用户可以在本地部署，普通消费级显卡就能满足硬件要求，也可以直接输入一串网址，直接输入描述文本开始创作，这是 2021 年 DALL-E 初代发布的时候不敢想的。

不仅如此，「AI 画师」出现和流行也在 2022 年挑战人类的美术和图片产业。

9 月，全球最大图库盖蒂图片社（Getty Images）宣布禁止上传和销售使用 DALL-E、Midjourney 和 Stable Diffusion 等 AI 艺术工具生成的插图。盖蒂认为 AI 产生的图片并非是一种人类创造性的艺术品。

《太空歌剧院》，图/Jason Allen

同月，游戏公司 CEO 兼游戏设计师 Jason Allen 通过 Midjourney 生成的《太空歌剧院》，在美国科罗拉多州博览会举办的艺术展中一举夺得数字艺术组大奖。

但这次获奖也引起了广泛的争论，有人认为这对其他自己创作的人不公平，「这就跟为什么我们不让机器人参加奥运会的原因完全一样。」参加评审的艺术家杜兰（Cal Duran）甚至表示，他在评分的时候根本没意识到这幅画由 AI 生成。

相比之下，百度更加务实，一开始就确定了自己「辅助」定位。8 月，百度基于自身的文心大模型也推出了AI 绘画平台「文心一格」，更明确定位为面向有设计需求和创意的人群，基于文心大模型智能生成多样化AI创意图片，辅助创作者的创意设计。

在技术之外，AI 生成图像还在探索如何解决版权等一系列问题。

用嘴做视频？还要再等等

作为 AI 大厂，Meta 和谷歌实际上没有缺席任何一个重要的 AI 技术，在 AI 视频生成上更是独领风骚。

Meta 在 9 月率先推出了 Make-A-Video，言简意赅地表达了它的作用：做视频。更具体地说，Make-A-Video 可以通过文本、图片或者视频来生成一个全新的视频内容，尤其是文本直接生成视频，直接让视频创作的门槛大大降低，比如输入「机器人在时代广场跳舞」：

图/Meta

仅仅一周后，Google 也发布了自己的 AI 视频扩散模型 Imagen Video。与 Make-A-Video 相比，Imagen Video 最直接的感受就是清晰度更高——画面分辨率可以达到 1280×768，帧率也能到 24 fps 了。

不过，两者实际上都还存在画面不正常抖动、主体畸形、动作不够流畅等问题，而且与之前推出文本生成图像程序一样，谷歌和 Meta 都没有选择对外开放，这也是为什么相比 AI 画画的流行，AI 生成视频领域更多还是处在看热闹的阶段——就像 2021 年的 AI 生成图像。

字节也看好 AI 视频模型的未来，在抖音内就支持了「图文成片」功能，输入一段文字，软件智能匹配图片素材、添加字幕、旁白和音乐，自动生成视频。从一些创作者的反馈来看， 目前「图文成片」的实现还很初级，智能匹配和生成视频两个环节都很难真正在视频生产环节中使用。

当下 AI 生成视频在技术上显然还不够成熟，但最近几年 AI 进化速度在肉眼可见地加快，很难想象今年 AI 视频模型又会发生什么样的质变。

不管 AI 视频模型是否能在今年再度质变，就如百度移动生态负责人何俊杰在 9 月的 2022 百度万象大会上所说， 「未来十年，AIGC 将颠覆现有内容生产模式，可以实现以十分之一的成本，以百倍千倍的生产速度，创造出有独特价值和独立视角的内容。」

何俊杰，图/百度

可以预期，AIGC 将是 UGC 用户生成内容出现之后，又一个内容生产的大变革，最直接的应用就是大大降低视频制作的成本和门槛，这也意味着为视频内容在供给侧的大爆发提供了技术基础。

那场万象大会上，百度就推出了基于文心 AI 大模型的「创作者 AI 助理团」，由 AI 文案、AI 画师和 AI 视频制作人组成。理想状态下，借助「创作者 AI 助理团」，一个人就可以是一支视频团队。

但显然，现实是 AI 视频生成还需要一些时间。

ChatGPT，属于AI的「初代iPhone」

12 月初，OpenAI 发布了 ChatGPT——一个对话式 AI，发布后很快就在小范围内流行起来，随后持续发酵并风靡全网。从敲代码、写稿、写诗、推荐到教你学英语、写小说，甚至是一场类似人类之间的对谈，ChatGPT 都表现出了惊人的语言对话能力。

ChatGPT 甚至一度拉响了谷歌搜索的红色警报。

用 ChatGPT 修 bug，图/@amasad

与 OpenAI 之前发布的产品不同，ChatGPT 选择面向公众大范围公测，短短 5 天，其用户注册量就突破了百万级， 这在互联网增长集体放缓的 2022 年多少有些不可思议。即便到了岁末年初，很多用户依然在使用 ChatGPT 做报告、写年终总结等事务，可见其表现带来的用户粘性。

ChatGPT 之所以脱颖而出，普遍认为很大程度上是因为它采用了很自然的措辞进行对话，有网友评价其使用体验「就像平常聊天」。而 ChatGPT 背后的核心之一是使用 GPT-3 的新版本 GPT-3.5 来进行对话，该版本拥有 1750 亿个模型参数。

事实上，从 GPT-3 引发全球范围 AI 大模型的军备竞赛开始，这件事一定程度上就是巨头之间的比拼。谷歌在 2021 年推出了万亿级参数的 AI 大模型——Switch Transformer，微软和英伟达烧坏了 4480 块 GPU 后，才开发出 5300 亿参数的自然语言生成模型 MT-NLG（威震天-图灵）。

「钱」，图/英伟达

根据媒体报道，GPT-3 训练的仅是硬件和电力成本就高达 1200 万美元（约 7500 万人民币），GPT-3.5 应该只高不少。目前 ChatGPT 仍然是免费使用，但显然 OpenAI 不可能一直免费开放下去。

另一个对话式 AI 的问题在于——自以为是。大量的用户对话已经证明，ChatGPT 的回答并不可靠，但它又经常以令人信服的方式「胡说八道」。 OpenAI 也承认，尽管 ChatGPT 生成的回答从语气上已经非常逼近真人，但有时仍会给出完全错误的答案。

这不是在否认 ChatGPT 带来的惊艳。Box CEO 亚伦·莱维认为，「当一种新技术已经到了改变你对计算机的看法时，你会有一种特定的感觉。谷歌做到了，火狐做到了，AWS（亚马逊）做到了，iPhone 做到了，OpenAI 正在通过 ChatGPT 做到这一点。」

写在最后

过去十年，可以说互联网和智能手机彻底改变了内容的分发和消费环节，但在内容生产领域本质上没有过多的变化。而在过去一年，AIGC 已经带来了太多的变化，Stable Diffusion、Imagen Video 和 ChatGPT 分别对应了最主要的内容形式——图像、视频和文本。

当然，AIGC 还在面对很多挑战，包括版权、生成质量不稳定、创作主体争论等，甚至 AI 生成视频还没有经过大众使用验证。但现如今 AIGC 开始「飞入寻常百姓家」，已经具备了成为一项大众化技术的基础，未来很可能极大地提高内容的生产效率和丰富度。

从《太空歌剧院》获得艺术大奖到今天，AI 的争论依然没有停止，但就如 Jason Allen 为自己的事件所做的总结：AI 作画程序已经诞生，人们能做的只有承认并接受这件事。

题图来自 StabilityAI

关键词：人工智能直接输入亿美元左右

推荐DIY文章

主机存在磨损或划痕风险 PICO4便携包宣布召回

穿越湖海！特斯拉Cybertruck电动皮卡可以当“船”用

vivoXFold+折叠旗舰开售配备蔡司全焦段旗舰四摄

飞凡R7正式上市全系标配换电架构

中兴Axon30S开售拥有黑色蓝色两款配色

荣耀MagicBookV14 2022正式开售搭载TOF传感器

华硕无双上新新增指纹识别模块和键盘背光

曝爱彼迎联合创始人加入特斯拉董事会自愿放弃现金薪酬

联想YOGAPro14si9版将开启预售搭载i9-12900H处理器

RTX4090发布：性能提升高达2倍功耗保持450W

一加NordWatch智能手表官宣采用矩形表盘

小米米家智能枕开启众筹内置智能压电传感器可捕捉心跳

要在新材料行业的花园里开数智之花，需要怎2023-05-25
iQOO 11S手机曝光，搭载骁龙8Gen2增强版本2023-05-25
usmile笑容加发布新品，口腔清洁进入可视化2023-05-25
内行看门道！618活动拉开帷幕，小米13系列2023-05-25
阿水的GPT客户端，上线啦！2023-05-25
当前讯息：瑞文哪个皮肤手感好点_瑞文哪个2023-05-25
今日关注：快讯：美能能源涨停报于17.61元2023-05-25
晶科能源N型技术高价值市场分析研讨会：未2023-05-25
遇见造物主偷袭大师怎么解锁2023-05-25
遇见造物主好戏开场怎么解锁|今日热搜2023-05-25
遇见造物主死亡丰碑怎么解锁-速看料2023-05-25
遇见造物主知识就是力量怎么解锁2023-05-25
七项重点工程助力江苏电网平稳度夏2023-05-25
天天最资讯丨“中高考服务季”进行中2023-05-25
环球今热点：哈德森开启新赛季备战！下月初2023-05-25
热门看点：哲库事件后，华安张江光大REIT下2023-05-25
13年快男十强（快男十强）_当前最新2023-05-25
【世界时快讯】不爱做家务的来，洗地吸尘原2023-05-25
天天时讯：打造超Pro级硬件规格！小米Civi32023-05-25
新消息丨AI前沿速报0525：Windows11将搭载AI助手2023-05-25
vivo旗舰直降1100元当前关注2023-05-25
一加员工：OV64B一般是千元机的主摄！OPPO2023-05-25
环球动态:大容量还不限速上海移动云盘助2023-05-25
再开行业先河，欠薪两月的爱驰汽车倡导员工2023-05-25
出轨成性，死拖张嘉倪，换着法子骂网友，买2023-05-25
今日快看!西藏日喀则：金融活水“贷”动文2023-05-25
雪居之地哪些首领具有扫射和狂热的资质2023-05-25
塞尔达传说王国之泪为海布拉带来和平挑战视2023-05-25
塞尔达传说王国之泪科尔天的下落挑战视频攻2023-05-25
塞尔达传说王国之泪白鸟所指引的洞窟任务在2023-05-25

最新快讯!2022，谷歌、抖音和百度涌向AIGC

AI作画开始大众化

用嘴做视频？还要再等等

ChatGPT，属于AI的「初代iPhone」

写在最后

新闻排行

精彩推荐

综合信息