RAGless Knowledge Base MCP进入 Archive Manager

Archive Manager

无向量、无切割、无幻觉的知识库

彻底告别传统 RAG 的碎片化切割与向量漂移问题。Archive Manager 以层级树索引保留文档完整结构,让 LLM 像专家一样阅读和检索长文档,返回精准可溯源的段落原文,而非拼凑的碎片摘录。

无向量数据库依赖
层级树完整索引
零碎片化切割
检索路径完全透明
MCP 协议即插即用
中英文混排支持
核心差异

为什么不用向量 RAG

传统 RAG 用碎片化换来的是可扩展性,代价是精度的系统性损失。Archive Manager 用结构化换来真正的精准。

传统向量 RAG
  • 文档切割为固定长度碎片,上下文断裂
  • 向量相似度匹配,语义漂移导致幻觉
  • 切片跨越段落,检索结果缺乏完整性
  • 需要维护向量数据库,运维成本高
  • 对长文档(百页以上)效果急剧下降
  • 检索结果无法追溯原始段落结构
Archive Manager RAGless
  • 层级树索引,完整保留文档结构与章节关系
  • LLM 多步推理检索,无向量漂移,零幻觉
  • 返回完整段落原文,精确到章节编号
  • 无向量数据库依赖,轻量部署
  • 专为长文档(研报、法规、手册)优化
  • 完整引用路径可追溯,结果可验证
层级树索引工作原理
① 结构解析
  • 文档 → 标题层级识别
  • 构建章节父子关系树
  • 每节点生成内容摘要
  • 关键词与实体标注
② 推理检索
  • 查询 → 目录树扫描
  • 定位相关章节范围
  • 深入节点精读内容
  • 跨章节结果整合
③ 精准返回
  • 完整段落原文
  • 精确章节路径引用
  • 置信度与相关性说明
  • 检索推理路径可查

核心功能

全面覆盖知识库从构建到检索到集成的完整链路

层级树索引引擎

上传文档后自动解析标题层级,构建完整的目录树结构。每个节点对应文档的真实章节,保留父子关系与同级关系,LLM 在这棵树上进行多步推理,而非在碎片中做相似度匹配。

  • 自动识别 H1-H6 及隐式标题层级
  • 支持无目录文档的智能结构推断
  • 树节点包含摘要与关键词,加速定位

推理式多步检索

检索过程模拟人类专家阅读行为:先浏览目录确定范围,再深入相关章节精读,最后跨章节整合答案。每一步推理均有路径记录,结果完全可解释。

  • Top-down 目录扫描 → 章节精读两阶段
  • 跨文档多源整合,自动识别信息矛盾
  • 检索路径完整透明,每步决策可查

Neo4j 知识图谱

可选模块:自动从文档中抽取实体(人物、机构、概念、事件)及其关系,构建跨文档知识图谱。D3.js 力导向图实时可视化,支持图上点击探索关联知识。

  • 实体与关系自动抽取
  • 跨文档实体消歧与合并
  • D3 力导向图交互式可视化

多格式文档支持

全面支持企业常用文档格式,自动处理复杂排版(表格、图注、脚注、附录),确保内容提取完整度达到 99% 以上。

  • PDF(扫描版 OCR + 原生版)
  • Word DOCX / Markdown / TXT
  • 自动处理表格、脚注、嵌套列表

MCP Server 标准接口

提供符合 MCP 协议规范的 Server 端点,任何支持 MCP 的 AI Agent(包括 Claude、Lyna Agent 等)均可通过 API Key 认证直接挂载知识库,无需额外集成开发。

  • 标准 MCP 工具定义,即插即用
  • API Key 细粒度权限控制
  • 支持同时挂载多个知识库实例

多场景预设配置

内置针对不同文档类型深度优化的检索策略配置,无需手动调参即可在各场景获得最优检索效果。

  • 通用 / 法律 / 金融 / 政策 / 技术文档
  • 自定义场景配置支持
  • 场景配置可导出复用

四步上手

从文档上传到 Agent 可用,最快 5 分钟

01

上传文档

拖拽上传 PDF、DOCX、Markdown,支持批量上传整个文件夹。

02

自动建树

系统解析文档结构,构建层级目录树,生成节点摘要与关键词索引。

03

自然语言检索

直接用问题提问,系统在知识树上推理定位,返回精准段落原文。

04

Agent 调用

通过 MCP 接口挂载至 AI Agent,实现知识驱动的自动化工作流。

技术优势

从架构设计到工程实现,每一个细节都为精准检索服务

无向量数据库

彻底摆脱向量数据库的运维负担。知识索引以结构化树形数据存储,无需 Pinecone、Weaviate、Chroma 等额外基础设施,部署简单、成本低。

增量文档更新

新增或修改文档时,系统仅对变更节点重新建树,而非全量重建。大型知识库(千份文档)的更新时间从分钟级降至秒级。

段落级精度定位

检索结果精确到段落级别,附带完整引用路径(文档名 → 章节 → 子节点编号)。引用准确率接近 100%,满足法律、金融等高合规要求场景。

检索质量可量化

每次检索返回置信度评分与相关性说明。系统记录检索历史与用户反馈,持续优化同类文档的检索策略。

多语言文档

原生支持中英文混排文档,自动识别文档主语言,跨语言查询时智能翻译检索词再执行,中英文知识库统一管理。

异步建树,实时可用

文档上传后立即可检索已建树部分,无需等待全量索引完成。大型文档(500页 PDF)的建树通常在 30 秒内完成。

MCP 协议集成

让任意 AI Agent 拥有知识库能力

Archive Manager 提供标准 MCP Server 接口,任何兼容 MCP 协议的 AI Agent 均可通过配置直接挂载知识库,无需开发任何集成代码。

API Key 认证,细粒度权限控制
一个 Agent 可同时挂载多个知识库
查询延迟通常在 2 秒以内
完整的调用日志与用量统计
mcp_config.json
{
  "mcpServers": {
    "archive-manager": {
      "url": "https://archive.runemind.com.cn/mcp",
      "apiKey": "am_sk_xxxxxxxxxxxxxxxx",
      "knowledgeBases": [
        "legal-docs",
        "product-manual",
        "research-reports"
      ]
    }
  }
}
配置完成,Agent 即可直接查询知识库

适用场景

任何需要从长文档中精准检索信息的场景

企业知识库

产品手册内部制度技术文档

将产品手册、内部规范、技术文档、会议纪要统一入库。新员工入职提问、老员工查制度,全部通过自然语言完成,无需人工维护 FAQ 列表。

法律合规研究

合同分析法规检索判决研究

上传合同、法规、判决书,AI 精确定位相关条款,理解上下文语义,不因切割产生断章取义。适合律师事务所、合规部门的法律文书研究。

金融研报分析

研报检索年报分析招股书对比

海量研报、年报、招股书的跨文档检索与对比分析。按公司、行业、时间维度组织知识树,快速定位特定财务数据或分析观点。

技术文档助手

API 文档架构设计运维手册

将 API 文档、架构设计文档、运维手册整合入库,开发和运维人员用自然语言提问即可获得精准答案,告别在文档堆里 Ctrl+F 的时代。

开始构建你的知识库

上传文档,5 分钟内获得精准可溯源的知识检索能力。无需向量数据库,无需复杂配置,开箱即用。