菜单

cuilinsu
cuilinsu
发布于 2026-05-25 / 0 阅读
0

企业级知识框架Cortexa:RAG、Agent推理、Wiki实现一个基于大语言模型LLM的知识管理框架

介绍

1.1、Cortexa

Cortexa 是一个面向企业生产环境的 RAG 知识平台,围绕三大核心能力构建:

  • RAG 快速问答:适合日常知识查询,毫秒级返回带引用的答案

  • ReAct Agent 智能推理:自主编排知识检索、MCP 工具与网络搜索,完成复杂多步任务

  • Wiki 模式:让 Agent 从原始文档中自治生成相互链接的 Markdown 知识库与可视化知识图谱

搭建完全可私有化部署的模块化架构,Cortexa 帮团队把分散文档沉淀为可查询、可推理、可持续演进的专属知识资产。

Cortexa 三大核心能力 — RAG 答、Agent 做、Wiki 沉淀,三者形成知识飞轮
Cortexa 三大核心能力 — RAG 答、Agent 做、Wiki 沉淀,三者形成知识飞轮

1.2、整体能力一览

Cortexa 的能力栈分三层,共 24 个独立可交付的产品模块。

三层能力栈 — 基础能力是地基,核心能力是主干,高级能力是 Cortexa 的差异化护城河
三层能力栈 — 基础能力是地基,核心能力是主干,高级能力是 Cortexa 的差异化护城河

2、架构设计

2.1、三层架构视角

Cortexa 在外部视角上分为三层:客户端层 / 业务层 / 存储层

Cortexa 三层架构 — 客户端层接入多端,业务层 Java+Python 双栈协作,存储层多组件分工
Cortexa 三层架构 — 客户端层接入多端,业务层 Java+Python 双栈协作,存储层多组件分工

Cortexa 三层架构 — 客户端层接入多端,业务层 Java+Python 双栈协作,存储层多组件分工

2.2、业务层内部分层

主服务采用经典四层结构,层与层之间不允许跨层调用

四层不跨层 — Handler 改动不牵动 Service,客户切换数据库时只动 Repository
四层不跨层 — Handler 改动不牵动 Service,客户切换数据库时只动 Repository

啰嗦换演进 — 分层的「啰嗦感」换来的是可演进性,这是企业产品五年后还能维护的本钱。

2.3、五大架构思想

思想

核心做法

工程回报

模块化可插拔

接口 + 多实现 + 注册表

不被供应商绑定

严格分层

Handler/Service/Repository 不跨层

改一层不动其他

同步异步分离

慢路径走 Redis 队列

用户体感秒级

Java + Python 双栈

业务侧 Java,AI 侧 Python

各栈独立演进

安全纵深防御

加密+脱敏+沙箱+SSRF+参数化

经得起合规审计

2.4、模块化可插拔 — 核心模式

接口+多实现+注册表 — 切换向量库改一行配置即可,业务代码零修改
接口+多实现+注册表 — 切换向量库改一行配置即可,业务代码零修改

2.5、同步异步双路径

同步异步双路径 — 耗时 > 1 秒的全部走异步队列,用户体感始终秒级
同步异步双路径 — 耗时 > 1 秒的全部走异步队列,用户体感始终秒级

队列叠加三个工程考量:可重试(失败回到队列)、可去重(同资源短时间多次触发只处理一次)、死信兜底(超过重试次数进死信表)。这套机制保证文档处理和向量化任务即便偶有失败也不会丢,生产环境跑得住。

3、功能模块设计

挑出最具工程价值的六个核心模块,讲清楚每个模块「解决什么 / 关键设计 / 工程亮点」。

3.1、六模块全景

模块

解决什么

关键设计

工程亮点

RAG 问答流水线

检索-生成的 10+ 步如何工程化

EventManager 串 11 个 Plugin

每步可单测/可降级/可定制

Wiki 自动网络

知识不沉淀

LLM 驱动的 Map-Reduce

持久化任务队列 + 死链自动修复

智能搜索与问答

多种交互模式统一接入

混合检索 + 精排 + 多轮上下文

RRF 融合算法 + MMR 多样性

Agent ReAct 引擎

不止答还要做

Think-Act-Observe 循环 + 30+ 工具

Token 预算 + 跨轮 KB 脱敏

模型管理

30+ Provider + API Key 安全

加密+脱敏+日志过滤三层

加密版本号预留升级路径

沙箱执行

用户脚本不可信

Docker 沙箱 + Local 降级

AST 校验前置 + 输入输出限制

3.2、RAG 问答流水线 — Plugin 责任链

Cortexa 的 RAG 流水线不是「检索-生成」两步,真实链路有十余个阶段。我们将其抽象为责任链(Chain of Responsibility)结构,由 EventManager 调度。

11 个 Plugin 串成的责任链 — Plugin 5 是抗胡编关键:召回为空直接返回固定话术,不调 LLM
11 个 Plugin 串成的责任链 — Plugin 5 是抗胡编关键:召回为空直接返回固定话术,不调 LLM

抗胡编不依赖 prompt 工程,而是工程层判断:Plugin 5 之后若搜索结果完全为空,直接返回预设话术,不进入 LLM 生成阶段。说白了,RAG 翻车 90% 翻在「该说不知道的时候非要说」,这事儿在系统层就该解决,不该交给 prompt。

4.3、Wiki 自动知识网络 — Map-Reduce

Wiki 模式是 Cortexa 差异化的核心,采用 LLM 驱动的 Map-Reduce 范式实现知识沉淀。

Wiki 摄取 Map-Reduce — 持久化任务队列 + 死信兜底,4 万文档级 KB 永不丢任务
Wiki 摄取 Map-Reduce — 持久化任务队列 + 死信兜底,4 万文档级 KB 永不丢任务

4.4、智能搜索与问答会话

Cortexa 对外提供三种交互模式,共享同一套检索能力。

交互模式

适用场景

关键能力

输出形态

普通搜索

已知关键词,快速查找原文

关键词倒排 + 高亮片段

原文片段列表

智能搜索

模糊语义,跨文档关联

向量+关键词+图谱并行 + RRF 融合

相关段落 + 元信息

问答会话

自然语言提问,要结论

RAG Plugin 链全流程 + 多轮上下文 + 引用追溯

流式答案 + 来源链接

三种模式共享检索引擎,差异在「后处理深度」。这一抽象让客户能按场景选型:对延迟敏感选普通搜索,对答案要求高选问答会话。

4.5、Agent ReAct 执行闭环

如果 RAG 是「Cortexa 帮我答」,Agent 是「Cortexa 帮我做」。

Agent ReAct 闭环 — 跨轮 KB 脱敏避免「AI 用过时信息」,HITL 拦截敏感工具调用
Agent ReAct 闭环 — 跨轮 KB 脱敏避免「AI 用过时信息」,HITL 拦截敏感工具调用

跨轮 KB 工具结果脱敏是一个非常微妙的生产化设计:多轮对话中,前序回合的 KB 检索结果可能与当前 KB 状态不一致。我们将历史 KB 结果替换为提示文本「知识库可能已变更,请重新检索」,强制 LLM 重新检索而非沿用旧结果。这事儿避免了 90% 的「为什么 AI 还在用过时信息」类投诉。

4.6、安全纵深防御(模型管理 + 沙箱)

模型管理与沙箱执行共同构成 Cortexa 的安全底座,采用 6 层纵深防御。

6 层安全纵深 — 每一项都是踩过坑或差点踩坑后加的,合规审计的最低门槛
6 层安全纵深 — 每一项都是踩过坑或差点踩坑后加的,合规审计的最低门槛

总结

维度

Cortexa

一句话定义

让团队把分散文档沉淀为可查询、可推理、可持续演进的专属知识资产

三大核心能力

RAG 快速问答 / ReAct Agent 智能推理 / Wiki 自动知识网络

三层架构

客户端 / 业务(Java+Python 双栈)/ 存储

业务层四子层

Handler / Service / Repository / Infra(不跨层)

部署组合

Docker Compose --profile 灵活叠加

抗胡编机制

召回为空直接返回固定话术,不调 LLM

参考文档:https://mp.weixin.qq.com/s/UF54KfM8dKF1KW3_69W8xw?mpshare=1&scene=1&srcid=0522COWsiXWgpE0lIcfYIzfO&sharer_shareinfo=b769f785b260459be4db8ea6326073c8&sharer_shareinfo_first=3e1590f843ed5f9c4a11cc3fa7bbef04&version=5.0.8.99856&platform=mac#rd