像培养孩子一样培养人工智能
作者:编辑部
2023-06-19
摘要:以成长型思维开发有效且安全的人工智能。

多年来,甚至在ChatGPT将人工智能(AI)牢牢地置于公众想象力的最前沿之前,人工智能已经在从医学到航空航天的各行各业慢慢占据了一席之地。然而,这项技术并没有完全发挥其潜力。

研究发现,在使用人工智能的公司中,只有11%的公司获得了经济利益。即使是科技巨头也在苦苦挣扎。IBM耗资20亿美元的诊断人工智能系统Watson Health在实验室实验中比医生更准确地诊断癌症,但在现场失败了。对于传奇的美国跨国公司来说,这成为一场商业和声誉灾难。

这次失败很难归咎于缺乏技术专长,因为IBM指派了一支工程师队伍来研究沃森健康。我们对在各种商业环境中开发人工智能的挑战的广泛研究指出了一个令人惊讶的原因:Watson Health的开发并推向市场的方式适用于传统IT,但不适用于AI。这是由于传统软件和人工智能之间的根本区别:前者处理数据,而人工智能不断从数据中学习,并随着时间的推移变得更好,如果培育得当,甚至超越了它的预期能力。

类似于最佳育儿方式的做法可以加速人工智能的发展。我们规定了一种基于培养和学习的人工智能开发方法,在工业和其他客户的 200 多个人工智能项目中取得成功的关键因素。

尽早部署并从错误中吸取教训

孩子们不是通过观看教育视频来学习骑自行车,而是通过爬上自行车并踩下踏板来学习骑自行车,从每次痛苦的跌倒中吸取宝贵的教训——不久之后,奇迹就会发生。

同样的逻辑也适用于人工智能。IBM等许多公司认为他们应该在部署之前收集大量数据以完善算法。这是错误的。让人工智能在现实世界中工作,而不是将其隔离在受控环境中,有助于生成更多数据,这些数据反过来又反馈到开发过程中。

尽管早期部署本质上风险更大,但它也会启动一个连续的反馈循环,通过该循环,算法会通过新数据进行丰富。此外,重要的是,数据既来自标准情况,也来自困难或非典型情况,这些情况共同支持全面的人工智能开发。

相比之下,IBM在实验室中广泛开发和测试了Watson Health,并将诊断工具推向市场,而没有从真实世界的数据中持续学习。事实证明,这种传统的构建-测试-部署过程不足以训练AI。

建立安全机制

保护消费者和维护声誉的安全机制对于人工智能的发展至关重要。AI LiveSim等模拟器环境允许在现实世界中部署之前对全尺寸AI系统进行安全,全面的测试。

与此同时,特斯拉在后台运行新版本的自动驾驶软件,而人类驾驶汽车。软件做出的决策(例如转动方向盘)将与驾驶员的决策进行比较。分析任何重大偏差或不寻常的决定,并在需要时对AI进行重新训练。

为创意应用开发的人工智能可以说需要更强大的护栏。类似于儿童与坏公司混在一起并学习不良习惯,人工智能可能会接触到充满偏见和歧视性内容的训练数据。

为了抢占先机,OpenAI采用了一种称为对抗性训练的方法来训练其AI模型,使其不会被攻击者的流氓输入所愚弄。这种方法涉及将聊天机器人暴露给对抗性内容,这些内容可能会克服机器人的标准约束,使其能够识别流氓内容并避免将来上当。

捕获用户行为

在理想的AI开发周期中,开发人员会记录所有用户的反应和行为,以进一步开发算法,而不会质疑建议或预测的准确性或价值。例如,Netflix AI内容推荐器只是记录用户是否观看推荐的内容和观看持续时间。

凯米拉是一家专门为造纸和纸浆生产等水密集型行业提供可持续化学解决方案的公司,该公司开发了一种基于机器学习的系统,可在生产问题发生之前检测它们,并提出建议以预防故障。 人工智能系统从响应中学习,以提出更好的建议。

Watson Health 的开发人员如果同意这一原则,本可以取得更好的结果。除了对算法进行编程以要求医生评估AI生成的建议之外,他们本可以训练系统简单地记录医生的处方。 将Watson Health 集成到患者信息系统中,还可以将其沉浸在反馈循环中,以便根据实际病例和患者结果进行持续培训。

用户反馈为具有特定重点的垂直应用程序提供了出色的培训数据。数据,尤其是标记数据,已成为人工智能公司的重要资产。开发人员不应该雇用人工来标记数据,而应该考虑尽可能自动化该过程的方法。

事实上,开发人员应该部署许多自动数据收集器,并设计明确的反馈循环以进行大规模学习。在上述驾驶辅助开发示例中,许多车辆可以涵盖更广泛的情况,而不仅仅是少数情况。一辆汽车在特斯拉前切入会触发事件发生前几秒钟的视频上传。该系统将镜头输入特斯拉的深度神经网络,该网络学习各种信号,例如逐渐向车道分隔线移动,从而预测切入并采取适当的行动,例如减速。

相比之下,传统汽车公司往往陷入固定思维模式,开发和部署驾驶辅助软件,几乎没有自动反馈收集或数据更新。

大规模持续学习设计

就像孩子们不会永远呆在幼儿园一样,人工智能的训练方法应该不断升级。但很多时候,人工智能开发人员专注于人工智能算法和单个用例的最新发展,而不是设计系统以涵盖大量用例和数据流。

以凯米拉(Kemira)为例,该公司专门为造纸和纸浆生产等水密集型行业提供可持续化学解决方案。它开发了一种基于机器学习的解决方案,能够揭示造纸过程中变量之间的因果关系,并识别可能导致生产中断或质量问题的工艺条件和现象。随着系统对潜在不稳定的根本原因的深入了解,它还为造纸机操作员生成可操作的风险缓解建议。为了确保可伸缩性,该系统是基于云的,并使用 MLOps 进行模型重新训练治理,并能够扩展到更多用例。

大规模学习设计的一个关键要素是系统架构,它可以自动收集反馈,为大量AI模型提供频繁更新并生成模拟训练数据。芬兰能源公司Suur-Savon Sähkö开发了一种人工智能预测方法,该方法从历史和实时消耗数据中学习,将能源生产效率和供热温度预测的准确性提高了50%以上。

更进一步,公司可以开发一个模拟环境,生成合成数据并允许更快的开发周期。例如,特斯拉从其车队中捕获数据,为模拟复杂交通环境的模拟器提供数据,从而产生新的合成训练数据。

AILiveSim 开发了一个参数化、与领域无关的仿真环境,支持汽车、自主船舶和自主采矿中的机器应用。模拟器使公司能够构建原型并验证概念;创建合成数据集来训练人工智能系统;调试和优化算法以及测试和验证产品。它通过捕获数据和测试很少发生的真实案例来加速机器学习系统的开发。

总而言之,转向成长型思维并采用上述持续学习方法的组织更有可能创造出适合快速发展的世界的人工智能解决方案。通过不断提供数据和反馈的算法,组织可以确保其产品和服务保持灵活、安全和相关性。


热门文章