定制企业生成人工智能有望带来安全性和性能优势,但成功开发模型需要克服数据、基础设施和技能挑战。
ChatGPT 等面向消费者的预构建生成人工智能模型引起了广泛关注,但定制模型最终可能在实践中对组织更有价值。
大多数公司的生成式人工智能计划都处于早期阶段。根据TechTarget 企业战略小组 (ESG) 的最新研究,目前只有 4% 的组织在成熟的企业范围生产中拥有生成式 AI 。大多数 (54%) 仍处于早期部署、试点或规划阶段。
随着企业越来越多地探索生成式人工智能,许多人都认识到将模型与其特定数据和用例保持一致的价值。同一项 ESG 调查显示了对定制的偏好,56% 的受访者计划训练自己的定制生成人工智能模型,而不是仅仅依赖 ChatGPT 等一刀切的工具。
但成功开发定制企业生成式人工智能在数据管理、安全性和系统集成等领域面临着重大挑战。为了解决生成式人工智能的风险和局限性,同时利用定制模型的优势,企业需要采取有针对性的方法来部署这种新兴技术。
定制企业生成人工智能模型的好处
开发定制企业模型有几个令人信服的理由:
- 更强的隐私和安全性。
- 通过对专有内部数据进行微调来提高性能。
- 由于能够根据公司工作流程的特点定制人工智能工具,因此集成更容易。
特别是,生成式人工智能的隐私和安全风险是企业关注的主要问题,一位金融、银行和保险行业的 IT/云经理在回应 ESG 的调查时将现有的生成式人工智能工具描述为“安全风险太大”。
“许多可用的人工智能技术都是免费的,或者是由现有供应商启用的——组织没有机会根据数据隐私、安全性、合规性、机密性和知识产权考虑因素主动审查该技术的风险,”说。另一位受访者是电信行业的业务副总裁。
当涉及到用于训练模型的内部数据时,经过微调的专有模型可以为具有安全意识的组织提供更好的监督。通过内部模型,组织可以保持对敏感数据的控制,而不是与第三方共享访问权限。
适合公司特定任务和数据的模型也可能产生更多相关输出和更少的幻觉。这可以缓解一些组织对使用第三方模型获得准确、公平和代表性输出的担忧。
“人们对人工智能报告的准确性和完整性感到担忧,”医疗保健和健康服务行业的一位顾问在回应 ESG 的调查时表示。“我们如何确认和验证数据来源?此外,算法也存在包含偏差的问题。”
在目标数据集(这里是有关组织及其行业的信息)上训练模型的过程称为微调,可以为相关任务产生更准确的结果。为解决特定业务问题和工作流程而定制的人工智能工具可以提高效率并减少集成问题。总之,这意味着定制模型可能需要较少的广泛监督,同时产生更符合业务需求的输出。
定制企业生成人工智能模型的挑战
然而,采用生成式人工智能并非没有挑战。ESG 调查的受访者指出了生成式人工智能实施的广泛障碍(定制或其他方式),主要是缺乏员工专业知识和技能(39%)、道德和法律考虑(例如偏见和公平)(32%)以及对数据质量的担忧(31%)。
创建有效的定制生成人工智能是一项特别复杂的任务,需要克服三个主要障碍:高质量数据不足、将模型集成到遗留系统中的困难以及人工智能和机器学习 (ML) 人才的缺乏。
如果没有足够高质量、广泛且集成良好的数据,训练准确的专有模型可能会很困难或不可能。将杂乱的企业数据转换为可用的培训语料库是一个需要付出大量努力的过程,涉及构建管道来摄取和准备专有数据,以便精心标记并输入到模型中。
这种清理和标记企业数据的过程本身就是资源密集型的,但构建和维护能够适应随时间变化的模型管道还需要大量的 ML 专业知识,而这些专业知识在当前的 IT 员工中仍然稀缺。四分之一的受访者认为技术复杂性是其组织中生成式人工智能实施的障碍,而合格的机器学习和数据科学专业人员的供应有限,加剧了这些技术挑战。
任何追求专有生成人工智能的组织都需要内部机器学习专家来完善数据管理实践并为自定义模型构建培训管道。部署后还需要ML 操作(MLOps )技能来执行监控模型性能、解决数据缺陷和错误以及处理集成问题等任务。但由于企业对相对较小的机器学习人才库的激烈竞争,雇用这些团队成员本身可能会构成障碍。
有效的定制生成人工智能之路
企业生成式人工智能仍处于早期阶段。为了避免代价高昂的错误,组织需要培养耐心、现实主义以及长期愿景。
构建定制的生成式人工智能模型是一项复杂且成本高昂的提议,并不是每个企业的正确选择。在评估内部模型开发计划是否值得时,企业应权衡生成式人工智能的潜在收益与所需资源。
“我们在采用人工智能方面仍处于相当早期的阶段,”一位交通行业的业务经理在回应 ESG 的调查时表示。“虽然许多人在谈论人工智能并意识到人工智能的潜力,但人们......不愿意采用[或]投入精力来训练人工智能。”
受访者预计他们的组织需要在广泛的领域进行投资以支持生成式人工智能计划,包括培训和员工技能(47%);信息管理(44%);数据隐私、合规性和风险(37%)。
但对于需要和资源投资机器学习基础设施和人才的企业来说,构建定制的生成式人工智能可以提供竞争优势。受访者期望在其组织中使用生成式人工智能带来广泛的好处,包括改进或自动化流程和工作流程(53%)、支持数据分析和商业智能(52%)以及提高员工生产力(51%)。
广泛的规划对于生成式人工智能计划的成功至关重要。第一步,花时间仔细识别定制的生成式人工智能工具可以带来特别高回报的孤立领域。接下来,构建原型并进行广泛的试点,然后再扩展到广泛部署。
在 ESG 的调查中,顶级企业生成式人工智能用例包括数据洞察、聊天机器人、员工生产力和任务以及内容创建。例如,计算机服务行业的一位企业高管报告说,他们的组织使用生成式人工智能来创建从社交媒体营销到技术电子书再到演示幻灯片的内容。
总体而言,关键是从小事做起,重点突出,目标明确的模型,在证明价值后可以逐步扩大范围。不要期望构建一个庞大的内部 ChatGPT;针对特定任务对内部数据集的模型进行微调速度更快,资源占用更少,并且更有可能展示短期回报。