2024 年，3 项技术将为生成式人工智能提供帮助 译文

2024 年，3 项技术将为生成式人工智能提供帮助译文

随着 ChatGPT 惊艳的首年即将落幕，生成式人工智能（genAI）与大型语言模型（LLM）无疑已成为引人瞩目的技术焦点。然而，在企业的黄金时期，它们是否已具备投入使用的能力呢？ChatGPT 所遭遇的挑战众所周知，其在回答问题时的准确性尚待提高。尽管 ChatGPT 基于如 GPT-4 般复杂的人类知识计算机模型，但它却鲜少坦诚自己的不足，此现象被誉为人工智能幻觉。此外，在逻辑推理方面，ChatGPT 也常常显得力不从心。当然，这源于 ChatGPT 并不具备推理能力——它仅如同一款高级文本自动补全工具。

用户或许难以接受这一事实。然而，GPT-4 这一智能系统令人印象深刻：它能够参与模拟律师资格考试，并以排名前 10% 的成绩脱颖而出。利用这样一个强大的工具来探寻企业知识库，无疑充满着诱惑。然而，我们既需避免它过于自信，也需防止它过于愚蠢。为了解决这些问题，三种有力的新方法应运而生，它们为提升可靠性提供了可能。虽然这些方法的关注点或许各有侧重，但它们皆围绕一个基本理念：将 LLM 视为一个 "封闭的盒子"。换言之，关键不在于精益求精地完善 LLM 本身（尽管人工智能工程师仍在不断优化其模型），而在于构建一个事实核查层以支撑 LLM。这一层旨在过滤掉错误答案，并为系统注入 "常识"。让我们逐一探寻它们是如何实现这一目标的。

矢量搜索技术的能力

矢量搜索技术的广泛应用，已成为众多数据库的鲜明特色，其中包括部分专为矢量而生的数据库。矢量数据库的诞生，旨在为文本、图像等非结构化数据打造高效索引，将其在高维空间中进行精确搜索、深度检索和高效接近。比如，在搜索“苹果”一词时，或许能找到关于水果的资讯，而在“矢量空间”的周边，却可能涌现出科技企业或音乐公司的相关信息。

矢量，已然成为人工智能领域的实用黏合剂。我们得以利用它们，将数据库与LLM等组件中的数据点紧密关联，而不仅仅是将它们视为训练机器学习模型的数据库关键字。在这个探索与发现的旅程中，矢量搜索能力拓宽了我们的视野，让数据间的联系更加丰富多彩，为人工智能的发展注入无限生机。

检索增强生成

检索增强生成（Retrieval-augmented generation，简称 RAG）作为一种精湛方法，在与大型语言模型（LLM）的交互中融入上下文，日益受到业界瞩目。本质上，RAG 通过对数据库系统进行深度检索，使得本地语言机制的回应紧贴上下文，从而让回应更加贴切。上下文数据可以包括诸如时间戳、地理位置、参考资料和产品 ID 等元数据，理论上甚至可以实现任意复杂的数据库查询结果。

这一系列背景信息有助于整个系统输出更为精确且相关的回应。RAG 之精髓在于从数据库中获取特定主题的最精确、最新信息，进而优化模型回应。相较于 GPT-4 神秘的内部运作，若 RAG 成为业务 LLM 的基石，业务用户将可更为透明地了解系统是如何推导出所提供的答案。倘若底层数据库具备矢量功能，LLM 的回应（包括嵌入式矢量）便可应用于数据库中相关数据的检索，从而提升回应的准确性。

知识图谱的力量

然而，即便在最先进的矢量和 RAG 增强搜索功能的助力下，ChatGPT 在关键任务领域的可靠性仍待提升。矢量作为一种数据编目方式，并非最丰富的数据模型，而知识图谱却以其独特魅力，成为 RAG 首选数据库。

知识图谱，一个由相互关联的信息编织而成的语义丰富网络，将多元维度融汇于单一数据结构，如同网络为人类所做的那样，展现出强大的整合能力。得益于知识图谱透明、编辑过的内容，其质量得以保障，成为信息时代的坚实基石。

我们还可借助向量将 LLM 与知识图谱紧密相连。当向量解析为知识图谱中的一个节点时，图谱的拓扑结构便能发挥作用，进行事实核查、近似搜索和一般模式匹配，确保传递给用户的信息准确无误。

知识图谱的应用远不止此。华盛顿大学的人工智能研究员 Yejin Choi 教授正积极探索一新概念，备受比尔·盖茨赞誉。崔教授及其团队构建了一个由机器编写的知识库，通过提问与一致通过的答案筛选，助 LLM 优选知识。

Choi 教授的研究采用了一种名为“批判者”的人工智能，它擅长探测 LLM 的逻辑推理，构建一个仅包含优质推理和事实的知识图谱。假如你问 ChatGPT（3.5），在太阳下晒干五件衬衫需要多长时间，这是一个明显的推理不足例子。常识告诉我们，无论衣物数量，晾干时间都应为一小时，但人工智能却试图用复杂数学解决，甚至展示其错误的工作原理以证明方法正确！

尽管人工智能工程师们不断努力改进（ChatGPT 4 也不例外），Choi 教授的方法仍为通用解决方案提供了可能。尤其值得一提的是，该知识图谱进一步助力 LLM 训练，尽管体积较小，但准确率却大幅提升。

重构语境

我们见证了知识图谱凭借 RAG 赋予的更为丰富的上下文与结构，进而强化了 GPT 系统的卓越性能。此外，证据表明，企业通过结合基于向量和图的语义搜索（知识图谱的近义词）的应用，能够持续获得高精度成果。

借助向量、RAG 和知识图谱的支持，大型语言模型的架构得以焕发活力，为企业带来丰厚价值，而无需专业知识去构建、训练和微调 LLM。这是一套综合策略，使我们得以借助计算机（LLM）更为基础的“理解”，深化对概念丰富、上下文的把握。显然，企业因此受益匪浅。图表的魅力在于解答了核心问题：数据中的关键要素是什么？哪些是非同寻常的？更重要的是，根据数据模式，图表能够预测未来走向。

这一事实能力与 LLMs 的生成元素相辅相成，令人信服地展现广泛适用性。展望迈向 2024 年的征程，我预言这种将 LLM 转变为关键业务工具的强力策略必将得到广泛认可。

作者 | Jim Webber

来源 | 3 technologies coming to generative AI’s aid in 2024 | InfoWorld