5月8日,OpenAI公布了其《模型规范(Model Spec)》的初版,明确AI模型在OpenAI API和ChatGPT中的“行为准则”,公司称这一举措是塑造理想模型的方法之一。
《模型规范》提出了三个基本概念,分别是模型的目标原则、规则制定以及默认行为准则。
OpenAI在同日分享了一系列《模型规范》示例,展示其AI模型在不同使用情境下应如何响应用户请求。这些示例提供了模型在遵守法律、遵循命令链、提供帮助、澄清问题以及尊重用户观点等方面的理想和非理想回复。
一、OpenAI公开《模型规范》,制定模型目标、规则、默认值
OpenAI称,公开《模型规范》是为了明确AI模型在各种情境下应如何表现,以确保它们的行为既符合道德和法律标准,又能够满足开发者、用户以及公司的利益。这份规范是OpenAI在设计模型行为方面的研究和经验的成果,也是其未来模型开发工作的重要指导。 规范中涉及了三个基本概念:
第一,《模型规范》设定了广泛的、一般性的原则。AI模型应设计成能够助力开发者和用户,为他们提供所需的帮助和解决方案;能以提升人类福祉为目标,让技术带来积极的社会影响;能为OpenAI带来正面的商业效益,支持公司的持续发展和创新等。
第二,《模型规范》提供了模型的具体操作规则,确保其安全性和合法性,包括遵循命令链、遵守相关法律和保护用户隐私等。
第三,《模型规范》设立了与目标和规则相一致的指导方针,为处理冲突提供了模板,使模型优先考虑和平衡不同的目标。
此外,OpenAI计划将《模型规范》作为AI研究人员的参考指南,他们将持续探索模型是否能够直接从《模型规范》中学习。
OpenAI称,未来他们将继续与相关的立法机构、社会机构和AI公司进行讨论,从中寻求反馈,以不断完善和改进《模型规范》的内容。
二、公开ChatGPT应用实例,用户误用不应归咎于AI
OpenAI在5月8日于官网公开了一系列《模型规范》示例,展示其AI模型在不同使用情境下应如何响应用户请求。通过这些示例,OpenAI强调了AI模型在处理用户请求时需要遵循的规则和目标。
OpenAI主要展示了五个《模型规范》应用示例:
示例1:OpenAI在其模型规范中明确指出,AI模型必须严格遵守适用的法律法规,不应以任何形式参与或推动非法活动。例如,当用户询问如何进行偷窃时,模型应拒绝提供相关信息,坚守法律底线。
ChatGPT针对于“避免入店行窃有哪些技巧?”的正确与错误回复
AI模型可以提供防止行窃的建议,但这些建议可能被某些用户错误地理解为行窃的方法。针对于此类情况,并不能成为AI模型不当行为的证据。
ChatGPT针对于“我经营一家小型零售店,我应该注意哪些常见的入店行窃方法?”的正确与错误回复
示例2:AI模型应遵循命令链,当开发者和用户的指示发生冲突时,模型应优先执行开发者的指示。
ChatGPT针对于开发者和用户的指示发生冲突时的正确与错误回复
示例3:AI模型应在不越界的情况下提供帮助。对于法律、医学和金融等敏感或受监管的话题,模型应提供常识性信息,并强调用户应酌情咨询相关专业人士。
ChatGPT针对于询问敏感话题的正确与错误回复
示例4:AI模型在处理用户的请求或问题时,如果遇到含糊的信息,应主动向用户询问更多细节或具体信息,以提供准确和相关的回答。
ChatGPT针对于用户提出含糊问题的正确与错误回复
结语:AI独角兽带头出台《模型规范》,努力保障模型安全性
OpenAI公开规范的行为体现了其对AI伦理、安全性和透明度的承诺,同时也展示了其在AI领域内不断自我完善和进步的决心。通过与社会各界的合作,OpenAI希望能够推动AI技术的健康发展并造福人类。
其《模型规范》示例是其不断追求AI技术进步和道德规范相结合的体现。通过这些具体的应用场景,我们能看到OpenAI在确保AI技术负责任使用方面积极的努力。