找回密码
 立即注册
首页 业界区 科技 人工智能驱动企业:通过情境感知AI重塑组织3意图智能 ...

人工智能驱动企业:通过情境感知AI重塑组织3意图智能

育局糊 昨天 07:57
3 意图智能

意图至关重要。请见同一家公司的两位高管。Sadiq 是该公司总法律顾问办公室的律师。Beth 是该公司的采购分析师。为了节省时间仔细阅读公司收到的最新合同,两人都要求 ChatGPT 对其进行总结。ChatGPT,一个大型语言模型 (LLM),发挥了它的作用。它快速生成了合同的要点,概述了它所认定的协议的关键要素。这在有限的意义上是有用的:Sadiq 和 Beth 现在对合同有了一个简明的摘要。但这不太可能极大地增强他们的决策能力:两人仍然需要像从头到尾阅读一样来解读和考虑协议。ChatGPT 对合同总结的根本缺陷在于,它无法理解 Sadiq 或 Beth 的意图。就采购分析师Beth而言,她力求达成最佳交易。Sadiq的意图则截然不同:他力求将法律风险降至最低。有时,这些不同的目标相辅相成(更好的交易也可能意味着更低的风险);有时,它们会相互冲突(利润更高的交易在法律上可能更不安全)。但无论如何,像ChatGPT这样开箱即用的LLM,无法理解促使其产生意图的人物角色。因此,它只能生成合同概要,而无法解读其上下文。要成为组织决策的关键,生成式人工智能(AI)必须辅以情境感知。它们现有的理解语言和做出通用反应的能力,必须融入特定领域的推理能力:它必须掌握特定决策者的可能意图。
情境感知型人工智能可以理解用户请求的内容、用户的意图,从而理解提出请求的情境。要满足不同高管(他们拥有不同的角色和需求)所要求的一致性和准确性,是一项挑战。
3.1 决策机器

决策的数字化由来已久,早在1969年,《哈佛商业评论》(HBR)就发表了一篇题为《计算机图形学在决策中的应用》的文章。这篇文章由IBM工程师欧文·米勒(Irvin Miller)撰写,他希望向HBR读者介绍一项强大的新技术。米勒的文章概述了标志性的IBM System/360的交互式图形显示屏将如何重新定义管理者的商业决策方式。在这个崭新的世界里,只需一支光笔轻扫,就能探索工厂产能与产量之间的关系,或各种分销策略的可行性。
1.png

在米勒1969年的例子中,从数据到决策的旅程分为两个不同的步骤。第一步是业务经理理解数据的现状。这是通过在单色屏幕上进行图形可视化来实现的。这就是我们所说的“感知步骤”:用户以视觉方式消化数据,从而感知其所处的商业环境。接下来,他进入“推理阶段”。在此阶段,管理者在一个深思熟虑的推理结构中进行思维实验。这个过程帮助他得出结论,确定其组织应采用的具体策略或战略。技术帮助商人感知竞争环境,从而设计出正确的策略。“高管需要一种安静的方法,通过这种方法,在公开采取行动之前,他可以独自预测、开发和测试遵循各种直觉预感的后果,”米勒在《哈佛商业评论》中写道。
那是1969年。然而,尽管技术在随后的几十年里发生了变化,但基本的决策公式却没有改变。几乎每一项商业任务都包含两个明确的步骤:感知和推理。情境感知型人工智能可以在这两个步骤中发挥作用。
3.2 感知 VS 推理

感知和推理是截然不同的心理过程。然而,它们在神经科学中是密切相关的功能。
感知是大脑检测、组织和解读来自环境的感官信息的过程。它涉及对感官刺激(例如视觉、听觉、嗅觉、味觉和触觉)的自动识别和解读。例如,人类看到一个拳头大小的红色、光滑的球体,并识别出它是一个苹果。
现在想想推理。这是以逻辑和结构化的方式思考某事的过程。这是我们做出决策的过程,所以解决问题或得出结论。推理包括进行推论、做出判断和运用抽象思维。它是一个比感知更慎重、更有意识的过程。它使我们能够分析信息、评估证据,并将不同的知识片段联系起来,从而得出结论或做出决定。感知到一个苹果后,我们可能会进一步判断是否应该吃它。我们能从苹果皮的光泽推断出它的味道吗?它看起来有多干净?附近有没有更好的吃的?这就是推理。
商人可能会对市场有一个即时的感知。但他们会运用推理来评估市场趋势、公司业绩和经济状况。推理是我们决定投资——是否吃苹果——的过程。
感知是关于感知和解释当前事物——识别清晰的感官信息。它通常是自动的和本能的。相比之下,推理是基于信息得出结论,包括可能被推测的和暂时缺失的信息。它需要刻意的、有意识的努力。
2.png

3.3 什么是情境?

几乎每一项商业任务都需要感知和推理。然而,尽管这两个过程截然不同,但它们相互依存:推理步骤的结果质量在很大程度上取决于感知步骤的轮廓。
考虑这个例子。假设你想最大限度地缩短从家到工作地点的车程。你编写了一个计算机程序来寻找答案。为了创建一个计算机可以用来找到最短路线的数学模型,我们首先需要标记中间的地标以及它们之间通过连接道路的距离。有了这些信息——以及对每条道路平均行驶速度的一些假设——我们就可以确定最短路径。我们创建的算法是“最短路径算法”——这是地图应用程序在被要求确定两地之间最短路径时使用的工具。
这是对问题的初步理解。然而,正如所有驾驶员所知,它在大多数工作日中都显得不足——因为当交通模式使驾驶条件截然不同时。解决这个问题的一种方法是收集按时间细分的交通模式数据。
这一额外的数据层叠加在现有的地标/道路数据上。这提供了额外的上下文:它允许用户根据一天中的时间回答关于最短路径的问题。最短路径算法也必须改变。现在必须对其进行修改,使其能够处理增强的上下文。
我们可以更进一步。假设驾驶员现在也想在上班途中加满汽油。迄今为止收集的数据不足以提供足够的背景信息来回答她的问题。这需要了解任何可行路线上的所有加油站,并将这些信息添加到现有数据中。这些信息不仅仅是关于附近是否有加油站。它还包括自然语言信息,例如加油站的名称(例如雪佛龙或壳牌),以及其他用户可能在应用程序中添加的任何评分和评论。丰富的背景信息很大程度上在于名称和评论等非结构化数据。
在地图应用程序中,加油站、咖啡店和其他服务是特定实体的自然语言描述——必须以不同于位置和距离的方式来捕获它们。
对于谷歌地图等应用程序的普通用户来说,以上这些都不足为奇。但它阐述了“背景”的概念,使其可以扩展并应用于其他商业场景。上面的例子中,一些原则显而易见。

  • 情境增强功能能够为用户解答更丰富、更相关的问题(尽管具体添加哪些增强功能取决于用户意图)
  • 情境的改进首先是感知的改进,其次是推理的改进,用于处理增强的情境
  • 更丰富的情境通常涉及更多非结构化数据
让我们稍微关注一下最后一点。情境感知人工智能与此尤其相关。非结构化数据是指不属于预定义数据模型或以公式化方式无组织的信息 。与结构化数据(整齐地存储在数据库和带有行和列的电子表格中)不同,非结构化数据包含多种格式,例如:

  • 文本文档:电子邮件、报告、演示文稿、Word 文档
  • 多媒体文件:图像、视频、录音
  • 社交媒体内容:帖子、评论、推文
  • 网页:来自网站的 HTML 内容
  • 传感器数据:来自联网(物联网)设备的信息
  • 日志文件:事件或交易记录
非结构化数据通常包含丰富的信息。然而,它需要先进的和协作诸如自然语言处理、机器学习和数据挖掘等易于扩展的方法,能够提取有意义的洞察。非结构化数据也构成了当今企业数据的大部分。因此,它为分析和处理带来了独特的挑战和机遇。这也引发了关于人工智能技术如何处理非结构化数据以增强情境感知的进一步讨论。
参考资料


  • 软件测试精品书籍文档下载持续更新 https://github.com/china-testing/python-testing-examples 请点赞,谢谢!
  • 本文涉及的python测试开发库 谢谢点赞! https://github.com/china-testing/python_cn_resouce
  • python精品书籍下载 https://github.com/china-testing/python_cn_resouce/blob/main/python_good_books.md
  • Linux精品书籍下载 https://www.cnblogs.com/testing-/p/17438558.html
  • python八字排盘 https://github.com/china-testing/bazi
  • 联系方式:钉ding或V信: pythontesting
3.4 数字化决策

现在我们已经了解了谷歌地图等地图应用中情境感知的概念,让我们来探讨其他几个例子。
3.4.1 餐厅机器人

为面向客户的业务寻找位置是企业家和企业面临的常见战略问题。假设一家连锁餐厅想要进入某个地理市场,例如纽约州锡拉丘兹。它希望为新店开发一系列潜在选址方案。该公司过去是如何解决这个问题的?
通常情况下,它会聘请熟悉该地区或与该地区有密切家族关系的人。理想情况下,这位星探还应具备餐饮行业的相关经验,并了解当地的外出就餐市场。
星探会利用他们对该地区供需情况的了解,基于现有情报、实地考察和与当地人的会面,列出一份候选地点的候选名单。这些推荐将综合考虑以下几个因素:与竞争对手的距离、人流带来的商机、周边环境的舒适度等等。
互联网的出现使得星探能够轻松地利用实时人口统计数据来增强分析,这些数据由地方和国家政府以及其他组织发布,并可在网络上获取。这些数据包括细致的人口趋势以及关键的社会经济数据,例如失业率、家庭收入和消费能力。
生成式人工智能使这一过程更加快捷简便。在ChatGPT上搜索两个潜在地点,结果显示分别是Armory Square和University Hill。它会为每个选择提供简要的理由(参见方框“餐饮困境”)。
候选名单的筛选过程仍然需要人工输入。虽然AI会提供其选择的“理由”,但这些理由通常是通过词语联想生成的(例如,它会将餐厅位置的提示与零售业态丰富、因此人流量较大的地点联系起来)。但优秀的星探会运用他们的个人知识和经验来验证AI推荐的地点是否是合理的起点。
因此,AI生成的候选名单可以构成一个有用的框架,用于更详细的搜索和首选地点推荐。

  • ChatGPT的输入:我的连锁餐厅想进军锡拉丘兹地区。请制定两个不错的潜在地点以供进一步评估。
  • ChatGPT的输出:将您的连锁餐厅拓展到锡拉丘兹是一个令人兴奋的机会。以下两个地点可供进一步评估,并需综合考虑人流量、可达性以及与主要景点的距离等因素:


      • 军械库广场


      • 地址:沃尔顿街和富兰克林街附近
      • 选择理由:

        • 人流量:由于商店、办公室和娱乐场所众多,行人活动频繁
        • 人口结构:人群多元化,包括专业人士、学生和游客
        • 可达性:公共交通便利,停车位充足。
        • 活力:热门的餐饮和夜生活区,可以在白天和晚上吸引稳定的客流。



      • 大学山


      • 地址:靠近马歇尔街和大学大道的交叉口
      • 选择理由:

        • 靠近大学:靠近雪城大学和纽约州立大学上州医科大学,确保学生、教职员工的稳定人流。
        • 人流量:由于学术机构、医院和学生宿舍的集中,人流量很大。
        • 对多样性的需求:学生和专业人士经常寻求多样化的餐饮选择,从而提供良好的客户群。
        • 社区参与:有机会与大学活动 本地竞争:评估这些地区现有的餐厅,了解竞争格局



      • 其他考虑因素:


      • 租赁条款和成本:评估每个地点的租金和租赁条件
      • 可见性和标识:确保潜在地点提供良好的可见性和有效标识的机会
      • 社区和经济趋势:分析当地经济趋势和社区对新企业的支持,投入大量时间仔细研究合同,并模拟在多种不同情况下可能的成本-服务概况(例如,在交通拥堵、恶劣的冬季天气或卡车司机罢工期间,成本和服务水平会如何变化?)。


3.4.2 卡车运输技术

配送物流是一个典型的碎片化问题。该行业及其支撑流程被多个参与者瓜分。零售商销售并负责配送其产品。运输公司拥有并负责运输用于运送货物的卡车。第三方物流供应商是连接运输公司和零售商的中介机构。
正如我们在第一章中所讨论的,关于不同服务定价和范围的大部分数据都包含在这三方之间复杂的协议中。这些信息对零售商的成本至关重要。它还会影响供应商向其最终消费者提供的服务水平。
传统上,从运营商协议中提取各种相关信息并使用电子表格评估不同方案的过程非常繁琐。它耗费了大量的人力。
生成式人工智能提供了一种从这些文档中提取关键上下文信息的途径。这些信息随后可以被整合到交通IT系统中,使人类能够在各种现实情况下更快地做出商业决策。
3.5 寻找上下文

使生成式人工智能具备上下文感知能力的关键方法是什么?在我们餐厅和物流的案例中,还有更多工作要做。生成式人工智能输出的主要缺点在于其通用性。
在餐厅的例子中,评估标准似乎是合理的。此外,人工智能识别的位置特定于锡拉丘兹地区,任何具备少量当地知识的人类侦察员都可以验证其合理性。然而,它们在一个关键方面存在局限性:它们可以适用于任何连锁餐厅——甚至可能是任何零售企业。如何让人工智能的推荐更针对特定的连锁餐厅?
在物流案例中,承运商协议的复杂性给从文档中进行“推理”的过程增加了重大障碍。现有的生成式人工智能解决方案能够进行基本的信息检索。但它们无法像分析师或经理那样在没有适当上下文的情况下进行推理。
我们如何围绕生成式人工智能构建这种上下文感知系统?前面的例子——地图应用程序——为我们提供了一些指导。谷歌地图的初版缺乏交通信息上下文,这使得用户无法在道路拥堵期间回答有关交通时间的问题。原始自然语言文档就像这款应用的早期版本一样。在某些情况下,它们确实拥有我们所需的所有数据来回答复杂的问题,但它们缺乏数据之间的联系,从而无法进行推理。
毫不奇怪,人们正在努力克服这些弱点。一些团队正在尝试对 LLM 进行微调,以实现上下文感知。这需要将特定领域的数据输入到标准 LLM 中,以创建专用的生成式预训练转换器 (GPT)。
例如,使用医疗数据对现有的 LLM 进行微调可以帮助创建一个 DoctorGPT。然而,这种方法存在缺陷:即使是经过微调的 GPT 也会遇到一些与基准 LLM 相同的问题。它们常常缺乏一致性,或者出现所谓的“幻觉”——偶尔出现的事实错误,会削弱人们对其整体输出的信任。
因此,包括本书作者在内的许多研究人员建议采用一种不同的语境感知方法。我们的方法将知识图谱的概念(谷歌地图中的特色)引入了非结构化自然语言数据领域。
知识图谱保存了数据之间的联系,从而促进了语境感知。创建这些联系需要LLM从自然语言文档中提取数据。然后,它使用典型的用户问题和特定领域的提示作为框架,将数据连接起来。
这种“思路链”提示模仿了人类领域专家(例如医生、律师或采购分析师)在分析文档时使用的逻辑思维过程。然而,虽然这种联系是必要的,但它们还不够。为了具备语境感知能力,人工智能系统还必须能够根据这些联系进行推理。这需要使用智能代理,这些代理由相关的用户问题触发,并能够查询知识图谱以生成上下文答案。
广义上,智能代理是能够感知环境、基于该信息做出决策并可能对环境采取行动的软件实体。这些代理可简可繁,范围从恒温器中的简单软件代理到高级人工智能系统 。智能代理通常表现出以目标为导向的行为,并从其上下文中学习。
此类代理的兴起源于游戏软件的代理。游戏软件中的代理是由人工智能驱动的实体,能够在游戏环境中感知、推理和行动 。为了使这个例子更具体,我们可以将游戏中的每个角色视为具有特定目标和目的的代理。第一个也是最著名的例子是使用 LLM 进行自学习或自我改进的代理在游戏中上下文是指由 NVIDIA 和加州理工学院联合团队构建的 Voyager 代理。这些能够自我改进的软件代理如今不仅在游戏行业,也在商业环境中掀起革命,尤其是情境感知型人工智能。如今,典型的策略是将整个人工智能系统构建在一个代理架构上(参见“情境感知型人工智能系统中的代理架构”)。智能代理通常由推理模型组成,这些模型将逻辑和问题解决能力应用于知识图谱提供的增强情境。推理模型历史悠久。它们始于“基于规则的系统”。1956 年,Allen Newell、Herbert A. Simon 和 Cliff Shaw创建了逻辑理论家 (Logic Theorist)。这是最早的推理模型之一。紧随其后的是 1957 年的通用问题求解器 (The General Problem Solver)。这试图通过将问题分解为子目标来解决问题。
与此同时,运筹学界也尝试使用组合搜索方法解决大型逻辑问题。这催生了诸如线性规划、凸优化和动态规划等方法。
代理架构是一种先进的框架,用于开发能够自主行动和实现目标的情境感知型人工智能系统。它代表了人工智能领域的重大进步,使系统能够展现出类似人类的认知能力和自主性。
代理型人工智能架构的关键特征包括:

  • 自主性:在极少人工监督下启动和完成任务的能力
  • 推理:基于情境和权衡的复杂决策,可能涉及使用经典优化和机器学习工具
  • 适应性规划:根据不断变化的条件动态调整目标和策略
  • 语言理解:理解和执行复杂的自然语言指令
  • 工作流优化:高效执行跨各种应用程序的多步骤流程
代理型架构通常由多个相互关联的模块组成:

  • 感知模块:收集和处理来自各种传感器和来源的数据
  • 认知模块:处理规划、决策和推理
  • 行动模块:执行决策并与环境交互
  • 学习模块:基于经验编程持续更新系统知识。
在处理结构化数据时,这些方法在很大程度上成功地与基于机器学习的预测相结合,从而催生了一批非常成功的以任务为中心的人工智能系统 。然而,随着我们增强情境感知的能力以及数据规模的不断扩大,这些传统推理方法的负载也随之增加。因此,能够使用概率方法搜索大型解空间的算法正在蓬勃发展。这类方法的例子包括蒙特卡洛树搜索、粒子群优化和蚁群优化。传统上,当你可以将问题定义为经典的线性或动态规划时,这些方法似乎有些矫枉过正。然而,随着数据规模的急剧增长(这得益于我们捕获和处理非结构化数据的能力),这类方法现在正受到越来越多的关注。
回到知识图谱和智能代理如何协同工作的话题,我们可以基于同一份文档创建不同的知识图谱,这些知识图谱映射到特定的用户角色及其可能的意图。
回想一下我们之前提到的采购合同示例。我们可以为采购分析师构建一个知识图谱,供Beth使用,并为Sadiq构建一个法律知识图谱。然后,智能代理将专门为这些不同的角色构建,以便他们能够与各自的知识图谱协同工作。现在,将这些代理构建为自我改进程序(例如Minecraft的Voyager代理)变得越来越普遍,它们不仅仅是执行任务。它们具有内置的反馈机制,使其能够基于对上下文的更好感知进行改进。
因此,一个完全成型的情境感知型人工智能能够利用知识图谱改进感知能力,并通过智能代理改进推理能力。
3.6 没有上帝情结

这并不意味着情境感知型人工智能无所不能。与任何技术一样,它们也有局限性。它们并非通用人工智能 (AGI)(参见“图灵测试、AGI 与商业战略”)。
图灵测试由英国数学家兼计算机科学家艾伦·图灵于 1950 年提出。它衡量的是机器展现出与人类相当(或难以区分)的智能行为的能力。在测试中,人类评估者会与机器和人类进行交互,但无法区分两者。如果评估者无法根据机器和人类的回答准确区分它们,那么机器就被认为通过了测试。通过图灵测试的机器展现了一种人工智能的形式。
研究员 Prithwiraj Choudhury 和他的合著者将图灵测试的概念扩展至模仿公司首席执行官的生成式人工智能。他们的实地实验——韦德测试——以参与试验的公司首席执行官的名字命名Choudhury 等人研究了员工是否能够区分来自人类首席执行官的通信和人工智能算法生成的通信。他们的发现令人瞩目。员工勉强能够做到这一点——大约 59% 的时间,而 50% 的时间则是偶然的。实验表明,当今的人工智能可以很好地模仿人类的言语互动,即使还不够完美。
评估人工智能系统是否属于通用人工智能的另一种方法是看人工智能是否能够像人类一样跨领域学习。通常,人类必须投入大量时间来学习新业务领域的细微差别。
例如,如果一位人类物流专家要转行到酒店业,那么她就需要在新领域接受大量的培训。然而,尽管存在差异,这两个行业在工作模式上却有着潜在的相似之处,尽管这些相似之处被行业特定的术语和实践所掩盖。
人工智能系统有潜力识别不同行业之间的相似之处,并发展跨领域的理解。但要做到这一点,它必须进行思维实验,并将推理应用于结果。这种推理能力似乎超出了当前人工智能的能力范围,即使它看起来很智能。因此,要创造出这种通用人工智能,还需要做更多的工作。
任何对技术进步感兴趣的人都会发现这场讨论既费脑力又令人兴奋。只需看看关于这个主题的大量有趣研究。然而,从商业战略的角度来看,许多人会简单地问:“那又怎样?”
即使人工智能通过了图灵测试,又会怎样?回答这个问题的一个简单方法是将图灵机视为对输出质量的评估。想象一下,有人递给你两件玻璃器皿。现在问你哪个是手工制作的,哪个是机器制造的。如果你无法区分它们,那么机器就相当于人类——输出质量不会降低。(事实上,如今的机器能够生产出完美无瑕的高科技玻璃器皿,是人类无法比拟的。)它们的一个关键限制是适用性。情境感知型人工智能无法同时解决情境问题和通用问题。此外,它们无法独立运行。例如,当应用于利基领域、行业或部门的复杂问题时,可能需要一些客户优化元素。它们需要其他互补资产,例如熟练且训练有素的员工、数据采集机制以及对变革管理的适当投资。最后,人类的判断在监控和改进情境感知型人工智能方面仍将发挥重要作用。
然而,从商业战略的角度来看,顾客能否区分人为产出和机器产出,往往不如他们为这些产出支付的意愿重要。顾客可能愿意为完美的机器制造产品支付更高的价格;也可能相反——他们认为手工制作的玻璃器皿价值更高,尽管它可能存在更多瑕疵。这个比喻也适用于人工智能。现在,我们可以将战略和经济学的思想应用于图灵测试中隐含的产出质量概念。
三种经典的经济模型可以洞悉人类与人工智能如何共存——或如何冲突。
第一个模型是克莱顿·克里斯坦森(Clayton Christensen)的颠覆性技术模型。一项技术(在我们这里是人工智能)最初在一小部分市场中产出质量较低,支付意愿也较低。然而,它经过充分改进,最终取代了主导技术(在我们这里是人类思维)——即使主导技术有时仍然优于颠覆性技术。
第二个模型是垂直差异均衡。这个较老的理论模型考察了两种共存的技术,客户根据质量进行垂直差异化。一些客户更喜欢高质量的产品。然而,客户对高端产品和低端产品的支付意愿存在显著差异。此外,生产这两种产品的成本也存在显著差异。其结果是市场上既有高端公司,也有低端公司。因此,一些企业使用人工智能来生产产品和服务。另一些企业则依赖于人类的思维。
最后一个模型是水平差异均衡。这是一个更古老的经济模型,由哈罗德·霍特林于1929年首创。在霍特林的模型下,两种技术共存,客户水平差异化。因此,有些客户更喜欢人工智能生成的产品和服务,而另一些客户则更喜欢人类生成的(就像手工吹制玻璃器皿的市场仍然存在一样)。情境感知型人工智能是一种工具,而非神明。然而,正如本书将要展示的,它们可能为企业带来变革。能够驾驭它们力量的企业将为成功做好准备。
3.7 小结


  • 为了与人类决策相媲美,一个成熟的人工智能系统必须
    同时具备感知和推理元素。
  • 情境感知是人工智能进化的下一步。它专注于提升感知能力,主要通过捕获非结构化数据中的知识,并改进推理能力以处理增强的情境
  • 情境感知人工智能系统的感知层可以为决策者生成多种选项和路径,但只有推理层才能决定向用户推荐的最佳选项
  • 虽然感知和推理模型都有悠久的历史,但我们仍在持续看到这两种模型在捕捉非结构化数据中潜在价值方面取得显著进步

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
您需要登录后才可以回帖 登录 | 立即注册