微信公众号后台最近更新了一项新功能。
文章编辑在选择插入图片时,除了原本从图片库选择和本地上传之外,多了一个新的选项——“AI配图”。
点击这个选项,创作者会进入一个AI图像生成页面,只需要输入一段文字描述你想要的配图,然后等上十几秒,系统就会生成四张照片。根据这四张照片,你可以进一步选择图片风格和比例,然后对图片进一步生成修订,直到满意之后,将其插入到文章当中。
这项功能的加入,意味着以后微信公众号的配图都可以通过AI生成解决,创作者也不必再因为图片版权的风险而担忧了。
微信公众号后台截图
微信公众号不是第一个更新这项功能的平台。2023年初,百家号在文心一言刚发布不久就上线了类似的功能。微信公众号更新的意义在于,作为行业最早、影响力最大,但更新最缓慢的平台,它的改变代表一个阶段的结束,以及一个新阶段的开始。
无独有偶,几乎在这件事情发生的同一时间,字节跳动出售图虫的信息被披露。
图虫,一个供摄影师交流的社区平台,或者也可以更简单粗暴地将其理解成一个在线图库,在2016年被字节跳动全资收购。
彼时今日头条刚刚上线不过四年,图文内容平台正飞速扩张。字节跳动这家公司也不过刚刚成立两年,图虫是这家年轻公司的第一笔对外投资,其目的也是不言而喻的,通过收购图库为今日头条上的图文内容提供版权素材,从而规避风险。
转眼时间过去了将近十年,字节跳动将这第一笔对外投资出售,卖在了这个图文渐渐势微,且AI快速发展的今天,结合微信公众号的变化,这很难不让人发出一个疑问——图库,是不是已经完成了它的历史使命?
那么事实是这样吗?AI时代,图库失去价值了吗?
图库的对抗与妥协
不知道是不是命中注定,生成式AI被大众熟知的第一件事,就是给传统图库的一个下马威。
2022年8月29日,在美国科罗拉多州普韦布洛,一场博览会正在举行。
自1872年开始,在8月下旬举办一场博览会就成为了科罗拉多州的一项传统,哪怕这场博览会已经连续21年亏损。
但2022年这场博览会注定不太一样,因为这一年一幅名叫《Théâtre D'opéra Spatial(太空歌剧院)》的画作在博览会上获奖。
《太空歌剧院》的特别之处在于,它是创作者Jason Michael Allen(杰森·迈克尔·艾伦)先使用Midjourney生成后,再用PS润色的作品。在科罗拉多博览会上获奖,让它成为历史上第一批使用AI创作并获奖的作品之一。
图片《Théâtre D'opéra Spatial》创作者:Jason Michael Allen 图源:维基百科
虽然《太空歌剧院》获奖事后在X等互联网平台上颇受争议,但在产业的视角里,它的影响丝毫不逊色于AlphaGo在2016年战胜李世石。
就像第一辆汽车之于马车的意义一样,很多时候一个事物的新生往往也意味着另一个事物即将走向死亡。AI与传统图库的故事也是如此。
事实也是这样,在《太空歌剧院》获奖后不久,越来越多创作者就开始使用Midjourney、Stable Diffusion等AI工具创作图像,并将其上传到Shutterstock等付费图库平台上赚取收益。
图库最开始的态度是拒绝,而且反应也很迅速。距离《太空歌剧院》获奖不到一个月,美国头部图库之一的Getty Images就发布了禁止上传、销售使用AI生成图片的公告,相关图片不仅无法获取收益,而且之前上传的AI生成图片也将全部做删除处理。
紧跟着Getty Images之后,Newgrounds、PurplePort、FurAffinity等图片网站也都做出类似的决定。
图:Getty Images联合旗下平台iStock 发布的禁止AI图片公告 图源:官网截图
关于封禁的原因,Getty Images的CEO Craig Peters的说法是,基于内容合法性考虑,由于许多AI生成图像使用的生成素材并没有获得版权许可,因此贸然出售可能会给客户及公司带来法律风险。
但令人感到诧异的是,仅仅在宣布禁令后不到两周,Getty Images就和英伟达合作推出了自己的AI生成工具 Generative AI by Getty Images。
按照Getty Images CEO的说法,Generative AI by Getty Images的特别之处在于,它是经过“许可”的,只根据Getty Images的创意内容进行训练,因为完全符合商业安全标准,因此不会有第三方知识产权纠纷,而且我们还会向这些内容的创作者支付「报酬」。
而在Getty Images之后不久,美国另一家之前同样拒绝AI图片头部图库Shutterstock也和OpenAI合作推出了自己的图片生成工具。
与Getty Images选择为图片创作者支付报酬类似,Shutterstock成立了一个“贡献者基金”,宣称如果有创作者的图片被用作AI训练,将会获得这个基金的补偿。
总而言之,在AI图片的快速蔓延下,传统图库在经过短暂的抵抗之后,就毫不犹豫地选择了拥抱。
而他们拥抱AI的方式,是将自己与图片内容创作者绑在一起,高喊保护知识产权和摄影师劳动成果的口号,追求交易数据的透明度。
但这样就可以在AI时代继续保持图库的价值吗?答案可能并不一定。
选择AI,还是选择人?
从商业的角度来讲,图库最核心的价值,是保护创作者知识产权的前提下,提高图片内容流转的效率。
中国最早的在线图库是2000年由时任中国青年报图片编辑、摄影记者柴继军创办的Photocome,它也是视觉中国的前身。
当时,报刊杂志是照片最常用的场景。作为图片编辑,柴继军每天大概要收到300多组稿件,但能够被选中的图片非常有限。落选的照片,要么转给其他媒体同行使用,要么就只能被丢掉,造成大量的浪费。[1]
与此同时,2000年前后网易、搜狐、新浪等门户网站纷纷创立,互联网的发展让图片需求爆发式增长,为图库网站送来第一阵东风。也正是在这样的背景下,柴继军创办了Photocome。
但谁也没想到,新闻媒体这个在20年前亲手将图库送上快车道的行业,也会是20多年后第一个抛弃图库的行业。
2023年底,国内科技媒体36氪开始尝试用AI生成的图片替代从图库购买的摄影师作品。不久之后,钛媒体、虎嗅等内容平台也开始逐步跟进。如今在这三个平台,AI生成图片已经基本取代了摄影师作品。
平台选择AI生成图片的原因很简单,一是低成本,二是低风险。
首先是低风险。按照目前国内的法律,AI并不享有版权,AI生成的图片版权归创作者个人所有,所以使用AI生成图片再也不用担心会突然收到不知从何处寄来、并要求赔偿几十万的律师函。
其次是成本上。如果与图库网站进行合作,通常一张照片的价格在几百元到几千元不等。即便年框协议,动辄也要几十万元。
而使用AI生成图片,Midjourney不限生成数量的会员一个月只需要60美元(约434.5元人民币)。而如果选择用第三方大模型的API自己搭建应用,国内如通义千问、文心一言最贵的大模型,输入和输出价格也不过120元/1 M tokens。
而这1 M tokens按照输出图片的分辨率和模型的输出效率不同,大约可以输出1万到3万张图片不等。对比下来,使用AI生成图片几乎等于不要钱。
从这个角度来看,使用AI生成的图片,几乎完美替代了图库的商业价值。也难怪的各大图片网站尽皆争相开发自己的图片生成工具。
但这是否意味着摄影师作品就注定会被淘汰掉呢?答案显然不是。
今年7月13日,特朗普在宾夕法尼亚举行总统竞选演讲时遭到枪击,美联社摄影师是Evan Vucci拿着相机,冒着被枪击的危险,第一时间冲到特朗普的身前拍下了历史性的一刻——满脸鲜血的特朗普被众人拥护在星条旗下,高举的手臂紧握拳头,给人带来强烈的视觉冲击。
很难说这张图片为特朗普后来赢得美国总统大选做出了多大的贡献。
特朗普的人生照片 摄影:Evan Vucci
而作为对比,虽然AI图片如今正在被越来越广泛的使用,但它却完全不具备这种从照片中传达的、激动人心的力量。
事实上,当前由AI批量制作的图片还显得十分冰冷和刻板,而缺少一种人类创作者所特有的生命力。这么说可能有些抽象,但大家其实只需要看两张图的对比就会很明显地感受到。
AI配图与摄影师配图对比
可以说,如果将图片比作一份美食,那么AI生成的图片就像是一份全麦面包,粗糙、干巴,除了能够提供能量和饱腹感之外,与食物没有任何关系。相反,由摄影师拍摄的图片却像是八大菜系,能够刺激人们丰富的味蕾。
即当图片由AI实现批量生产之后,图片的意义就变成了满足基本的图片使用场景的需求,而人们对于美、对于个性和人性的追求则被自然的忽视掉了。
而这一点,恰恰是摄影师能够对抗AI的一个重要的破局点。
可怕的不是AI,而是失去想象
从逻辑上讲,AI似乎很难替代摄影师作品,自然也很难替代图库,但现实情况却往往令人担忧。
一方面,内容消费者似乎并不在意图片有没有灵魂,有没有故事。
因为随着AI图片在各个内容平台上的应用越来越多,我们并没有看到有内容消费者对此提出异议,或者说,提出异议的人并没有多到能够让内容平台的管理者改变策略。
在这样的基础上,内容平台也自然而然的忽略了内容消费者对于内容品质的需求。毕竟相比于创造一个足够优质的作品来换取一个消费者可能并不在意的加分项相比,使用AI图库带来车根本缩减和风险降低是立竿见影的利润。
就这样,消费者的默认和内容平台的忽视在某种程度上达成共识,并一起推动AI图片内容的快速扩张。虽然可能很多人都知道其中存在的不足,但无人在意。
而这才是图片内容创作者所面临的真正挑战。
回过头来,我们其实也需要思考这样一个问题。就是当AI让人类想要获取任何一张图片都变得轻而易举的时候,图片的意义是什么?
更早遇到这个问题的是以写字为生的创作者。当人们获取一篇文章只需要在大语言模型的对话框中提出一个需求时,写作还有意义吗?
作为文字工作者,我们也曾仔细思考过这个问题,文章的意义是是什么?它是文字的排列组合吗?
答案显然不是,我们认为文字真正的意义在于,创作者透过文字所传达的思想和情感。
2003年,刘慈欣曾发表一篇名为《诗云》的小说,小说中的高等级的外星文明为了能写出超越的李白的诗歌,穷尽了太阳系的大部分能量,花费十年的时间列出了汉字所有可能的组合。
但外星人最终也没有写出“ 超越李白的诗歌”,因为外星人发现,虽然在穷尽的所有可能中,一定有超越李白的诗歌存在,但它却没有办法将其找出来。
这是文字的意义,也是诗歌的意义,即“技术永远无法替代艺术”,图片其实也是如此。
而如果有一天,AI生产替代掉所有的原创内容,那可能不是AI的胜利,而是人类的悲哀。
参考资料:
[1]:南方都市报《视觉中国掌门发家史:图编、掮客、A股上市,身家因黑洞缩水上亿》记者:刘苗
本文来自微信公众号“有界UnKnown”,作者:山茶