每年内容授权费5000万美元!过去半年时间OpenAI不断与媒体公司达成协议,向他们支付每年至多5000万美元的费用,获得媒体内容授权,用于AI大模型的训练与产品服务,同时与媒体共同探索AI时代的商业模式与资讯形态。
最高金额授权协议
AI行业领头羊OpenAI与美国媒体行业巨头新闻集团近日宣布达成合作协议,OpenAI正式获得新闻集团旗下诸多媒体的内容以及历史文档的授权,用于AI训练以及GPT产品的信息输出。无论从合作级别还是金额来说,这一交易都是AI行业发展的里程碑事件。
双方没有公布这份授权协议的细节。但据《华尔街日报》报道,这份五年期授权协议价值超过2.5亿美元,相当于OpenAI每年将向新闻集团支付高达5000万美元的内容授权费用。其中一部分是现金支付,另一部分则用OpenAI的服务来折抵。
新闻集团有足够的理由对这份授权协议感到满意,他们从OpenAI得到的授权费用远远高于其他媒体公司。据报道,OpenAI与Axel Springer(Politico和Business Insider母公司)达成的授权协议是三年2500万-3000万美元,与英国《金融时报》达成的授权费用是每年500-1000万美元,而给美联社的授权费用则是每年几百万美元。
当然,新闻集团在媒体行业的地位与影响力配得上这份最丰厚的合同。新闻集团是媒体大亨默多克(Rupert Murdoch)打造的全球媒体巨头,也是目前全球市值最高的新闻媒体公司(156亿美元)。新闻集团旗下包括了《华尔街日报》、道琼斯通讯社、财经网站Market Watch、《巴伦周刊》、《纽约邮报》、哈珀柯林斯出版社(Harper Collins)、英国《泰晤士报》、《太阳报》等诸多媒体业务。
需要强调的是,根据双方签署的协议,新闻集团的资讯内容在发布之后,不会立即出现在ChatGPT中,会等待一段时间才通过OpenAI分发,这是为了保证《华尔街日报》等媒体的订阅收入。而且,这也不是一份独家授权协议,意味着新闻集团还可以从谷歌等其他AI公司继续获得授权收入。
除了上述诸多主流媒体,过去半年时间,OpenAI还和Vox Media、美联社、《大西洋(3.840, -0.07, -1.79%)周刊》、法国《世界报》以及Dotdash Meredith出版集团等诸多全球知名媒体达成了授权协议。虽然金额远不及新闻集团,但这些媒体的负责人也对OpenAI的付费授权协议感到满意。
媒体AI合作双赢
对媒体来说,AI平台为内容付费是对媒体内容价值的认可。Vox Media CEO班克夫(Jim Bankoff)表示,OpenAI的授权协议符合他们的预期,生成式AI不仅可以带来新闻内容的用户体验创新,还可以保护新闻内容与版权价值,提高新闻行业工作者与创作者的生产力。
OpenAI联合创始人兼CEO奥特曼(Sam Altman)也对媒体合作前景给予了乐观展望。他表示,OpenAI与知名媒体达成诸多内容合作协议,有助于推动媒体和科技行业共同努力,创造AI尊重、增强和维护新闻行业标准的未来。
作为目前最炙手可热的AI公司,OpenAI完全有财力支付给媒体的授权费用。去年12月,OpenAI的营收已经超过了20亿美元,而且随着诸多商业化模式的逐步落地,预计其2025年营收可能会超过40亿美元。
随着产品的逐渐成熟,OpenAI目前正在积极探索各种商业合作模式,就在前不久,他们与四大会计事务所之一的普华永道达成授权,后者将成为OpenAI的最大企业客户和授权经销商。此外,OpenAI也是目前估值最高的创业公司之一,其估值已经超过了800亿美元,未来上市之后会拥有更多的融资手段。
对于AI平台来说,支付这些看似高昂的授权费用一方面可以有效化解AI未来可能面临的法律风险,另一方面可以获得更多优质训练数据,提供更为精准优质的信息。而优质数据将成为决定未来AI大模型的关键因素。
DatologyAI公司创始人莫科斯(Ari Morcos)表示,优质数据匮乏是制约AI研究的直接问题。他的公司正在帮助AI公司打造工具以更好的筛选数据。据AI研究公司Epoch预计,OpenAI的GPT-4使用了12万亿个Token进行训练,而GPT-5可能需要60万亿-100万亿Token的数据。(注:Token是AI模型处理的最小数据单元)
此外,媒体行业也是OpenAI的重要目标客户。OpenAI与媒体签署的合作协议,即包括了他们授权使用媒体内容,也包括了媒体使用OpenAI产品与服务的部分。
举例来说,Vox Media就计划使用ChatGPT来呈现自己的数据知识库Forte体验。媒体收获的不仅仅是得到了内容付费,还有生成式AI时代带来的全新资讯呈现方式,与OpenAI合作也是在这一全新时代占据先机。
在与OpenAI达成合作之后,《大西洋周刊》CEO汤姆森(Nicholas Thompson)表示,AI大模型搜索将成为未来民众主要的信息获取方式,与OpenAI合作可以让《大西洋周刊》的优质内容呈现给数以百万计的用户。此外,美联社也在继续与OpenAI谈判,希望将自己的资讯通过GPT工具呈现给更多受众。
化解山寨斯嘉丽负面
此外,对OpenAI来说,与新闻集团高调达成内容授权协议,展示自己尊重知识产权的立场与负责形象,时机也选择得非常恰当,因为这是对冲“山寨斯嘉丽声音”负面丑闻的有效手段。
此前OpenAI在发布GPT-4o的过程中,使用了一个女声语音助手Sky,其声音让人不禁想到了知名电影《Her》(国内翻译为:云端情人)中斯嘉丽·约翰逊(Scarlett Johansson)的声音Samantha。初听起来两个声音非常相似,带有斯嘉丽标志性的略带沙哑却又性感迷人的声线,但仔细听又似乎有点差别。
这一举动彻底激怒了斯嘉丽。因为OpenAI此前曾经联系她,希望获得她的声音授权,用于GPT的语音助手,但被斯嘉丽拒绝了。就在GPT-4o发布前两周,奥特曼还在联系斯嘉丽的经纪人争取授权。但最终,OpenAI却在没有得到授权的情况下,就直接推出了一个山寨版的“斯嘉丽声音”。
斯嘉丽在网上发帖,公开谴责OpenAI,并计划提起诉讼向OpenAI索赔。此事再次引发了外界对于AI公司数据侵权的担忧情绪。随后OpenAI宣布撤下Sky语音,奥特曼也发表声明对此道歉。当然,OpenAI的法律团队还需要与斯嘉丽达成和解。
AI训练内容的来源是否合法一直是OpenAI所回避的灰色地带问题。今年年初,OpenAI的CTO米拉·穆拉迪(Mira Murati)在接受媒体采访时,在被问到文生视频工具Sora的训练数据来源是否包括YouTube和Instagram的内容时,穆拉迪非常明显地表现出了尴尬,支支吾吾地表示“我不确定,我不知道。”
她的这种奇怪反应引发了网络热议。作为OpenAI的CTO,穆拉迪不太可能不清楚训练数据的来源,但她也无法直接回答,因为承认使用训练数据就可能会带来侵权诉讼,毕竟谷歌和Meta并没有和OpenAI达成任何内容授权协议。
还需和解纽约时报
尽管与诸多主流媒体一一达成内容授权协议,OpenAI还需要搞定一家最为重要的主流媒体,需要就一起焦点诉讼案件达成和解。与《华尔街日报》齐名的《纽约时报》目前尚未接受OpenAI的和解条件。纽约时报公司目前市值在85亿美元左右。
去年年底,《纽约时报》母公司对OpenAI以及合作伙伴微软提起起诉,指控他们未经授权使用《纽约时报》的版权内容训练ChatGPT以及CoPilot,并将《纽约时报》内容在自己的产品中呈现给用户。
纽约时报公司提出,两家公司的AI工具不仅未经授权使用了《纽约时报》的数据进行训练,还分流了《纽约时报》网站的流量,导致了公司广告、订阅和授权营收的损失。因此纽约时报公司向这两家AI公司提出数十亿美元的索赔,并要求他们停止使用自己的内容数据。
纽约时报公司的诉讼得到了媒体行业的认可与支持。媒体行业机构News/Media Alliance的负责人考弗里(Danielle Coffey)发表声明支持纽约时报公司,认为此举展示了保护新闻内容的价值与重要性。但他也指出,高质量的新闻与新技术手段面对的是相同的受众群,如果可以合作则可以互相成就。
与纽约时报公司一道起诉OpenAI的,还有Alden Global投资集团旗下的八家地区性知名报纸,包括《芝加哥论坛报》、《纽约每日新闻》(NY Daily News)、《丹佛邮报》、《圣何塞水星报》(San Jose Mercury News)等等。OpenAI在这些地区的具体信息时,同样明显引用了这些地区性权威媒体的内容。
纽约时报公司在起诉书中列出了ChatGPT在很多问题上的回答范例,都与《纽约时报》的内容几乎完全一样。显然,OpenAI抓取了《纽约时报》的数据,并以此为基础整理出信息提供给用户。
对于纽约时报公司的这一指控,OpenAI并没有否认,也无法否认。但OpenAI认为,这些都是互联网上的公开数据,按照当前的法律规定,只要在公平使用(Fair Use)的原则下就可以无需授权使用。
OpenAI表示,对纽约时报公司选择提起诉讼感到惊讶和失望。OpenAI还强调,他们尊重内容创作者和所有者的版权,并致力于与他们达成一致,确保媒体可以从AI科技中受益,打造新的内容模式。
OpenAI并不是不想付费,就在《纽约时报》诉讼之前,他们一直在商谈授权合作协议,也愿意提供每年数千万美元计的费用。但是OpenAI后来加入了新的免责条款,让纽约时报公司无法接受,最终导致谈判破裂,促使纽约时报公司选择起诉索赔。
不过,纽约时报公司对OpenAI的侵权诉讼同样面临着困难。哈佛法学院知识产权教授瑞贝卡(2.330, 0.02, 0.87%)·图什内(Rebecca Tushnet)看来,这和当年图书出版商起诉谷歌侵犯版权的案件非常相似,而出版商输掉了那起侵权官司,现有案例的判决并不利于纽约时报公司。
从某种意义上来说,正是纽约时报公司去年年底的诉讼与索赔,才促使OpenAI加快与媒体公司的合作授权谈判,在过去半年与诸多主流媒体迅速达成付费合作协议。能否与《纽约时报》达成和解将成为OpenAI与媒体行业和解的最终标志。
媒体转型AI时代
在过去二十多年时间,网络资讯的获取方式先后经历了搜索网络时代和社交媒体时代,如今正在大步迈进生成式AI的时代。每一次科技大潮的到来,都给媒体行业原本的流量和商业模式带来了重大冲击。
越来越多的用户习惯通过搜索和社交媒体获取资讯,而不再愿意登陆媒体网站,更不愿意付费阅读。媒体行业只能看着科技公司通过网络广告赚得盆满钵满,自己却不得不面临网站流量、广告与订阅营收下滑的困境,被迫进行裁员甚至是关闭。
对于目前这波生成式AI的大潮,媒体行业同样充满着怀疑与警惕。《大西洋周刊》去年年底预计,原本他们网站40%的流量都来自于谷歌搜索之后的点击,但是生成式AI或将彻底改变用户获取资讯的方式,也可能给媒体网站的流量带来毁灭性打击。
未来用户可能只会简单询问生成式AI产品来获取资讯,或者让AI为自己整理归纳一篇概要,而不再愿意到媒体网站付费阅读全文。《大西洋周刊》甚至悲观的预计,如果谷歌把AI签入搜索,那么可能高达有75%的搜索都会终结在生成式AI,不会再引流到网站。
就在上月的谷歌I/O大会上,谷歌正式在美国市场推出了AI Overviews功能,将生成式AI整合到搜索引擎中,直接提供个性化的搜索回答。谷歌预计,今年年底这一功能的用户量将达到10亿人。虽然谷歌也会在AI回答中列出搜索信息来源,但是各家媒体公司也可能会面临损失20%-40%流量的最坏结果。
新闻集团CEO汤普森(Robert Thomson)在与OpenAI签署协议之后表示,“(五年2.5亿美元授权协议)认可了顶级新闻应有顶级价格。数字化时代的一大特征是分销者占据主导地位,而内容创作者经常利益受损。很多媒体公司都被无情的科技大潮所卷席。我们现在有责任抓住这一最大的机遇。”
或许对媒体行业来说,接受OpenAI等AI巨头抛来的橄榄枝,与科技公司在AI新时代合作,共同探索新的资讯形态、商业模式和分成比例,才是最好的选择。