2022 年年末,OpenAI 推出 ChatGPT,人们对于 AI 的认知受到巨大冲击,从此大量资源和资金涌入这个行业。想起前两个月和做 AI 识别的创业者聊天,他说“AIGC 这一波热潮,除了激发新一波的创业,更调动起了甲方老板们的积极性,好像自己不拥抱 AIGC,就要下牌桌了一般”。
举一个比较典型的例子,前段时间,某全球知名化妆品集团“全网”寻找一家体量不大的公司,问到了我们这里来,而打听一圈下来我们发现,这家服务商好像忙到没时间回消息。
被“追逐”的主角是 ,2020 年成立。成立时间虽短,却已经获得不少优质投资机构背书。CrunchBase 显示, 最近一次融资在 2022 年 5 月,获得高瓴创投领投的 800 万美元,纪源资本和金沙江创投也有参与。
(相关资料图)
而 被打听最多的服务就是利用 AI 帮助时尚品牌生成高质量产品图片。之所以有这么多品牌想积极尝试 AI 成图,与商拍成本不低且流程繁琐直接相关。
一个品牌如果要制作效果不错且有模特出镜的产品图,需要根据风格和主题提前招募挑选模特、预约拍摄地点和设备,拍摄后需要后期处理、挑选、审核图片,流程上需要几天到几周不等。一年中这样的拍摄可能得有好几次。
而根据品牌对成片的要求,费用波动也很大。一家提供 AI 商拍工具的企业 业务负责人吴海波告诉笔者,行业内部有这样一个大概认知,一个品牌每年在素材准备中的花费大约会在年 GMV 的 2%-5%。如果按照这个区间,一个电商卖家一年的 GMV 如果是 200 万美元,那么每年在素材上的花费大约会是 4-10 万美元,也就是 30-70 万人民币,其实也是一笔不小的支出。
按道理,一个 AI 生图的服务,如果成片能够同等代替原来素材,且订阅费用低于原来的素材拍摄花费,应该是能在市场上跑通的。事实又是怎样的呢? 被品牌追捧,是个例还是普遍现象?
于是我们打算从 AI 商拍产品切入,以窥行业一角。
静态产品图生成功能已经开卷
笔者测试了 6 款提供 AI 商拍工具的产品,其中 2 款效果不佳,这里不多着笔墨。
多数产品会提供 3 类功能,静态产品图生成、真人模特换脸、基于产品/假模生成模特图。其中静态产品图生成功能难度最低,每一款产品在细分功能上都已经做得比较成熟。而假模生成模特图功能有的暂未开放,有的需要直接联系销售或加入候补名单。
生成静态产品图功能的使用路径基本相同,“上传图片——抠产品——选择背景参考模板生成新背景/输入 prompt 生成新背景”。
笔者在 4 款产品中上传了相同的“手托酒瓶”图片。
:
只支持自动抠图(自动识别产品边框后抠图),因此笔者被迫保留了手的部分,但对于电商卖家来说,这是个挺大的 bug。在生成新背景环节, 提供了 3 个功能,选择背景模板、输入 prompt 生成背景、上传参考背景图后 根据参考图生成类似背景。对比下来, 的可选模板不算多,但根据参考图变形的功能十分好用。
输入prompt 生成的产品图
(prompt 大意:身着比基尼的女生躺在沙滩上,身旁的桌上放着产品。//可以看到背后的比基尼女生已经变成了毕加索风格)
参考背景图(左)和上传参考背景图生成的产品图(右)
在生成图片后, 支持用户调节图片参数,使成图效果更自然和有质感。
WeShop:
WeShop 会将用户上传的原图分为多个色块,用户可以勾选想要保留的区域,或者上传一张蒙版图。虽然色块被切割得很细,但笔者在只勾选酒瓶部分后,生成的图片里还是会看到原图手部的影子。了解后得知,是 WeShop 为了让生成图中商品与背景融合得更好,在 AI 生成时会以原背景作为生成基础,在笔者测试 WeShop 的真人图和人台图时也会发现相同的情况,这里建议 WeShop 上线一个抠图后清除背景的功能,更加方便用户使用~
在生成新背景步骤,WeShop 也提供 3 个功能,背景模板、输入 prompt 生成背景、高级自定义。前 2 个功能与 类似。高级自定义功能则是让用户输入正反向咒语,也就是背景图中希望出现的元素和不希望出现的元素,通过正反向咒语让 WeShop 更快生成符合用户期待的图片。
输入 prompt 生成的图片
输入正反向咒语生成的图片(反向prompt:sea,希望成图中有沙滩但没有海)
:
在笔者看来,抠图这一步做得最好的是 ,因为 在智能抠图外支持精细抠图,通过原图上描点的方式选定保留或去除的部分,在 4 个工具的试用过程中,只有用 生成的图片完全看不到原图手部的影子。
这里有两个点值得说一下,首先对于商用来说,卖家在拍产品图的时候,大概会降低“手”这类影响元素,所以是否能手动抠图可能并不是特别一个严重的问题。
另外,其实很多修图 App 的抠图功能,已经能做到和 同等水平、甚至更好。
在背景生成环节,用户可以通过选择模板并添加线稿图(即选择添加希望出现的元素)来控制背景生成,此外也可以调节图片参数,让成图效果更好。
强行修改 prompt 内容后生成的图片没有出现爆米花
每选择一个模板或线稿图元素(类似于一朵花),prompt 输入框中就会自动加入标签。笔者虽然可以强硬修改标签内容,例如我将“优雅餐具在侧”改写成“爆米花在侧”,但系统似乎并不会执行改变后的指令,所以 的场景融绘框大概率只起到展示用户选择的内容的作用,并不支持输入 prompt 生成背景。
:
的静态产品图生成功能基本融合了上述 3 款产品的功能,支持选择背景模板、输入 prompt 生成背景,可以像 一样 2 张图变形后合成新图、调整图片参数,也可以像 一样添加线稿元素。
产品与背景合成后成图(左)和选择背景模板并添加线稿后成图(右)
不难看出,在静态产品图生成这一功能上,由于操作步骤大差不差,服务商们已经开始在细节上做文章,这就要看谁更能洞察到电商从业者们的细节需求了。
而事实上,厂商要做出生成静态产品图这样的功能,门槛似乎也不在技术层面。
从产生 idea到第一版产品落地只需 1 个月
为了弄清 AI To 电商的应用现状,我们联系到了 WeShop 的负责人吴海波,吴海波告诉笔者,“要推出底层模型需要足够的人力和资金,所以你看到这些厂商会是 OpenAI、Midjourney。而多数厂商并没有能力搭建模型,包括我们。WeShop 的团队不到 20 人,所以我们采用了拥抱开源的方式”。
WeShop 现阶段采用了开源的 Stable Diffusion(以下简称 SD)作为底层模型。从底层模型到 WeShop 版本只需要两步走。
吴海波介绍,“2022 年 10 月的时候 Stability AI 推出了 SD 版本,之后其实也陆续推出了几个新的版本,但大家都认为不及 版本好用。是因为 GitHub 社区中有大量的人才已经基于 SD 、针对不同场景优化出了更好用的模型。SD 的生态是非常丰富的,你基本可以在社区上找到任何能想到的针对某一特定功能优化过的新模型,比如优化人像、比如提升动漫效果”。
WeShop 团队已经明确了要做 AI 商拍图的目标,因此可以很轻易地确定需要优化的功能,并在社区中找到在这一分支上优于 SD 的最好的模型(check point)。“而只要是基于 SD 的模型,经过测试和调参,就可以很好地 mix。这是我们的第一步,产品类似于一个缝合怪,但耗时非常短”。
而即便是站在人才们的肩膀上做缝合,也还只是一个普适的产品,无法完全满足电商需求。例如,利用 AI 生成图片过程中,成图和原图如果出现服装纹理、材质的变化,在学术上是被允许的,但在电商领域,就变成了货不对版的严重错误。要让产品符合电商从业者的需求,还需要做进一步优化。
吴海波介绍,“SD 的底层模型是基于 20 亿图片训练出来的,我们在第二阶段则是用了 20 亿的百分之几的数据量级去对模型做了微调”。
笔者对技术一窍不通,听到几十倍的数据投喂量级差距,首先会觉得太少了。对此吴海波解释,“投喂的数据自然是越多越好,但挑选数据、打标和审核需要很长时间,要先保证数据质量”。
WeShop 被投喂的数据基本来自蘑菇街近年在电商领域积累到的图片,例如运营社区时从卖家处获得的图片、从签约的 KOL 处获得的图片、在国内外收集到的全品类产品图等等。这些前期准备也使 WeShop 的落地时间控制在了 1 个多月,大概比真正从 0-1 的厂商用时会短一些。
不过再怎么看,这项生意的技术壁垒都不算高。更早起步,通过不断投喂优质数据、以及用户交互之后带来的技术迭代和功能优化,可能是这场竞赛中比较重要的一环。
吴海波从做产品的角度,则认为“在 AIGC 应用层面的创业,技术甚至不是最重要的,最重要的是对产业需求的理解。互联网行业就有非常多的例子,比如说算法推荐不是字节发明的,但是字节系的产品把这项技术与内容产业结合到了极致。WeShop 是切商拍场景的工具,对这个需求的洞察源于过去 12 年蘑菇街在电商领域的积累。我们了解商家需要什么样的商拍图、甚至我们可以教那些中小商家怎么用 WeShop 把商品图做得比原来更好,这些对产业的理解倒推我们在非常多的细节上去满足客户的需求。所以这波 AI 创业,真正的竞争壁垒在于去满足用户甚至自己都没意识到的需求,把每一个细节做到极致”。
不论是从上面的初步测试结果、还是产品的研发周期,都会发现,大家的确是都在跑步入场,平台功能现阶段可能并不完善,市面上的同类产品也是如此。在模特换脸图和假模生图功能上,这种功能不成熟更加明显。
模特图生成功能:缺乏绝对强者
由于 和 的模特换脸功能无法体验,笔者只测试了 和 WeShop。
笔者上传了冷脸女孩展示黑色 T-恤的图片。
在选定变化区域后, 直接让用户通过输入 prompt 自由发挥,但出图效果很不错。
WeShop 则进一步降低了用户的使用门槛,用户可以从模板中选择人种和场景快速成图。
而对从业者最友好的则是笔者测试期间 WeShop 新推出的“复刻任务”功能,用户可以直接将已经完成的任务用在新任务上。有了这个功能,商家可以制作同个模特不同姿势角度的组图。不过吴海波告诉笔者,尽管这一直是卖家们呼声很高的功能,但因为人脸固定存在隐私及版权风险,因此直到现在才推出。“我们团队近期刚刚通过技术方案解决这个问题,即限制用户只能使用 WeShop 生成的人脸固定模特面容,无法使用外部肖像。这样能规避肖像隐私问题和肖像版权问题。”
复制任务操作界面
复制任务生成的图片
从静态产品图到模特换脸再到基于产品生成模特图,难度逐层加高。目前 和 的 AI 时尚模特功能无法直接体验,因此笔者只测试了 WeShop。
准确地来说,WeShop 需要用户上传产品的人台图(真人比例的假人模特穿上产品的图片)。笔者尝试上传了一套女装和一套男装的人台图,生成的图片效果不太稳定,有时会出现服装与产品不符(男装)或 AI 模特的身体部位不真实的情况,需要多试几次,才会有效果不错的成图出现。
WeShop 生成的效果不好(肩带变形)(上)与效果好(下)
由于没有更多测试对象,因此在模特图生成功能对比上可能存在偏颇,但仅从现有的产品出图效果可以看出,这一功能还有很多地方亟待加强。不过,即便是当前不够成熟的产品,也已经有用户能够有效用起来了。
AI 商拍图工具涌现,首先最大化利用的是中小出海卖家
“现在市场利好的一面是,所有人都对 AI 充满热情,所以乐于尝试的从业者不少,包括一些体量很大的国内和出海品牌都会来咨询”,吴海波透露。
一位了解不少服装出海品牌的从业者 Bruce 也说,“一些企业其实缺少一个既懂业务、又了解 AI 的高管,这导致它们虽然急着结合 AI,但不知道具体怎么做,所以市面上出现一个什么产品就会去先了解一下,获得一些思路”。
而大企业要真正融合 AI 产品并不是容易的事,已经将市面上这些 AI 商拍图产品用于业务中的主要用户其实并非大厂。
吴海波告诉笔者,“结合 WeShop 现在的产品力,我们发现,将 WeShop 利用得最好的人群有 2 类,一类是做跨境的中小卖家,另一类是国内位于经销链路起点的档口卖家,后者所占的比例最近明显上升”。
进一步具象这些人群时,吴海波解释道“体量小的跨境卖家,机动性反而高。且对于年 GMV 几百万元的卖家,他的 SKU 不会很多,每个月花费 298 元购买基础套餐就足够了,并不需要付出很大的成本。
国内市场的电商链路更成熟,相关服务成本更低,所以目标市场在国内的这部分卖家他们在选购 AI 商拍图产品时其实更看重生图效果,价格反而不是首要考虑因素了。为了满足用户需求,我们常常得一天迭代好几个新版本”。
这里附上各产品的会员价格(从上至下:、 海外、 国内、)(WeShop 国内及海外版本收费不同)
大量的同类产品一起竞争,虽然在功能有些许细微差异下,但叠加并不高的服务价格和当下中国的 SaaS 环境,厂商们依然需要继续往前探索。而放大视角去看,我们发现上述产品背后的厂商在做的事情并不完全相同。
根据官网介绍, 希望利用 AI 改变内容创作的方式,未来大概率也不会只聚焦于电商。 本身有象寄翻译、AI 文案撰写等矩阵产品,似乎是打算基于 AI 为电商从业者提供更多类型的工具。 目前已经推出了AI 绘画、AI 商品图以及智能设计产品,目标用户看上去和 交集更大。
关于 WeShop,吴海波则告诉笔者,“AI 不断进步,我认为未来会有很多公司将 AI 视为自己的员工,发展出新的工作模式。那个时候 AI 和人类员工各自的业务流如何构建和协同就会变成一个亟待解决的问题。WeShop 是我们探索新型工作流的起点”。
在笔者成稿期间,又陆续发现了不少提供类似功能的产品,但距离这一细分领域出现寡头恐怕还要很久很久。更优的底层模型出现、产品功能和定价模式优化以及企业本身指定的发展方向都可能改变竞争格局,入局者可以做的还有很多。读者们还有什么 AI 商拍图产品,以及其他优质的 AI 在细分领域的应用案例推荐,欢迎在评论区推荐给我们,我们都会一一测试。
关键词: