年终岁尾,正值圣诞节热闹气氛的OpenAI写下了2024年的发展清单。
OpenAI联合创始人兼首席执行官Sam Altman在社交平台公布,AGI(稍晚一些)、GPT-5、更好的语音模型、更高的费率限制;
更好的GPTs;更好的推理能力;对唤醒/行为程度的控制;视频模型;个性化;更好的浏览;开源,将是OpenAI在2024年要实现的目标。
Sam所罗列的产品计划,多数都是烧钱大户。根据彭博的消息,OpenAI正以1000亿美元或更多的估值寻求新一轮融资,同时与G42洽谈数十亿美元的芯片合作计划。
所以,OpenAI公布的2024年产品计划并非空口吹嘘,是要实实在在的大干一场。
下面,「AIGC开放社区」根据OpenAI以往的产品发布和技术趋势,为大家解读其2024年的主要产品计划。
GPT-5
关于GPT-5最早的消息,要追溯到今年的7月31日。当时一位名叫Josh Gerben的商标律师,代理了OpenAI申请GPT-5的商标信息。
根据美国专利商标局展示的信息,OpenAI是在7月18日提交的申请,GPT-5提供的功能包括自然语言处理、文本生成、理解、语音转录、翻译、预测和分析等,实际发布功能可能会有变动。
此外,OpenAI在申请商标之前做了一件很重要的事情,就是与官方达成了AI安全协议,自愿承诺管理AI带来的各种风险,并在未来产品发布、使用等过程中遵守安全、保障、信任三大原则。
也就是说,这为OpenAI开发GPT-5铺平了安全道路解开了枷锁。
11月9日,OpenAI宣布成立了一个“数据合作联盟”,主要用于文本、图像、视频、音频等,尤其是那些超长的跨语言的非公开私密数据,能深刻表达人类意图、情感的内容。
Sam曾表示,除了更强的技术架构、参数之外,海量优质、隐私数据将是开发GPT-5的一个重要基础。
因为,这有助于大模型深度了解全球各个行业的运作模式、不同种族的语言/文化、人类的工作思维/意图等。
11月14日,金融时报爆出消息,OpenAI为了开发GPT-5等产品,向微软寻求新一轮融资。这也再次证明了开发GPT-5,将是一个非常烧钱的项目。所以,从上面的消息不难看出,OpenAI说要做GPT-5并不是随口说说,画个饼做个无法实现的展望,而是扎扎实实的一步步地推进整个计划。
更好的GPT
要说2023年OpenAI发布的哪一个产品最让人印象深刻,我选自定义GPTs。
自定义GPTs是OpenAI在今年11月7日,首届全球开发者大会上公布的产品。
用户在构建自定义GPTs时无需任何代码,全程支持可视化点击操作,只需要给ChatGPT对话指令或额外的知识数据,然后选择是否需要网络搜索、数据分析和图片生成等多模态功能即可。自定义GPTs让那些不懂编程的人也能参与到生成式AI当中,同时可以将自己海量的优质数据与他人分享。
短短不到两个月的时间,用户通过自定义GPTs构建的特定领域ChatGPT助手已超过数十万个,其欢迎程度可见一斑。
2024年,OpenAI若开放“GPT商店”,想必又要迎来一波应用热潮。
开源
其实OpenAI一直在做开源项目,例如,Github上超过53,000颗星的语音识别模型Whisper;
Github超过10000颗星的,文生3D模型Shap-e;用于提升文生图模型的一致性解码器Consistency Decoder等。
Whisper开源地址:https://github.com/openai/whisper
Shap-e开源地址:https://github.com/openai/shap-e
Consistency Decoder开源地址:https://github.com/openai/consistencydecoder
但这些都无法满足我们的需求,最想要的是ChatGPT啊!
前不久,Meta、甲骨文、英特尔、Meta、AMD、IBM、索尼、戴尔等57家科技、学术研究等知名机构组成了一个“开源AI大联盟”。
这个联盟的研发费用超过800亿美元,学术机构的学生资源超40万人,总成员超过100万人。
颇有三国演义里的“十八路诸侯”的意思,要与闭源阵营的ChatGPT、Midjourney、Gen-2等产品一较高下。所以,OpenAI迫于开源界的巨大压力,2024年所指的开源,很可能就是ChatGPT使用的GPT系列大语言模型。