AI知识库的真相，你知道吗？

愤怒的蜗牛

04-29 132阅读 0评论

很多人对AI知识库的想象是这样的，他们以为只需将所有资料一股脑地拖进AI客户端，比如 Cherry Studio 内。

AI知识库的真相，你知道吗？图片

AI知识库的真相，你知道吗？

这样，AI就会认真阅读所有内容，并自动生成完美结论。

然而，实际体验后，许多人发现AI知识库的效果远没有想象中理想，经常遇到各种奇怪的问题。

本文将从知识库的原理出发，探讨AI知识库的技术局限。同时，我会介绍一些进阶方案，例如引入重排序模型、数据库（mcp server），以及使用超大上下文模型等方法。

目前，大模型知识库最常见的技术是RAG（检索增强生成）。

当用户将资料加入知识库时，程序会先将其拆分为多个文本块。

AI知识库的真相，你知道吗？图片

随后，使用嵌入模型将这些文本块向量化。

向量化指将拆分后的文本转化为一组超长的数字序列。

AI知识库的真相，你知道吗？图片

以我自己的知识库为例，这里用到的嵌入模型输出的是1024维：

AI知识库的真相，你知道吗？图片

也就是说，每个文本块都被转换成一个由1024个数值组成的向量：

AI知识库的真相，你知道吗？图片

之后，程序会将向量及其对应文本存储到向量数据库中。

AI知识库的真相，你知道吗？图片

接下来，当用户发起提问时，问题本身也会被向量化，转化为一个1024维向量。

AI知识库的真相，你知道吗？图片

然后，系统会将用户问题的向量与数据库中的所有向量进行相似度计算，这一过程完全基于向量的数学运算。

AI知识库的真相，你知道吗？图片

最终，知识库会选出与问题最相似的几个原文片段，将它们与用户的问题一同发送给大模型，由大模型进行归纳总结。

AI知识库的真相，你知道吗？图片

从这个流程可以看到，在RAG架构中，大模型主要负责归纳总结，答复质量在很大程度上取决于文本块的检索精度。事实上，RAG系统普遍存在切片粗暴、检索不精准、缺乏整体视角等典型问题。

OpenUI：从构思到UI仅需数秒

AI杀手级应用有苗头了，自主使用操作系统Agent智能体，开源！

相关阅读

ACL 2025 | 基于Token预算感知的大模型高效推理技术

OpenAI久违发了篇「正经」论文：线性布局实现高效张量计算

被疯传的“恶趣味”：看Copilot这款“熊孩子”把微软工程师逼疯！Agent 刚上线就翻车？网友：微软工程师成了“人肉保姆” 译文

1步碾压250步！何恺明新作祭出MeanFlow，一行公式让 FID 狂降近 70%

奥特曼：Codex 让我感到 AGI！最新谈话罕见透露下一代“完美模型”，大胆预测 Agent 明年突破边界！

OpenAI深夜宣布ChatGPT支持MCP、会议记录，万物互联时代来了！

使用Claude 4提升程序员生产力的五种高级方式译文

AI+数字经济的核心三要素

您需要登录账户后才能发表评论

发表评论取消回复

评论列表（暂无评论，132人围观）

还没有评论，来说两句吧...

目录[+]

微信二维码

微信二维码

支付宝二维码