企业级知识框架Cortexa：RAG、Agent推理、Wiki实现一个基于大语言模型LLM的知识管理框架

介绍

1.1、Cortexa

Cortexa 是一个面向企业生产环境的 RAG 知识平台,围绕三大核心能力构建:

RAG 快速问答:适合日常知识查询,毫秒级返回带引用的答案
ReAct Agent 智能推理:自主编排知识检索、MCP 工具与网络搜索,完成复杂多步任务
Wiki 模式:让 Agent 从原始文档中自治生成相互链接的 Markdown 知识库与可视化知识图谱

搭建完全可私有化部署的模块化架构,Cortexa 帮团队把分散文档沉淀为可查询、可推理、可持续演进的专属知识资产。

Cortexa 三大核心能力 — RAG 答、Agent 做、Wiki 沉淀,三者形成知识飞轮

1.2、整体能力一览

Cortexa 的能力栈分三层,共 24 个独立可交付的产品模块。

三层能力栈 — 基础能力是地基,核心能力是主干,高级能力是 Cortexa 的差异化护城河

2、架构设计

2.1、三层架构视角

Cortexa 在外部视角上分为三层:客户端层 / 业务层 / 存储层。

Cortexa 三层架构 — 客户端层接入多端,业务层 Java+Python 双栈协作,存储层多组件分工

Cortexa 三层架构 — 客户端层接入多端,业务层 Java+Python 双栈协作,存储层多组件分工

2.2、业务层内部分层

主服务采用经典四层结构,层与层之间不允许跨层调用。

四层不跨层 — Handler 改动不牵动 Service,客户切换数据库时只动 Repository

啰嗦换演进 — 分层的「啰嗦感」换来的是可演进性,这是企业产品五年后还能维护的本钱。

2.3、五大架构思想

思想	核心做法	工程回报
模块化可插拔	接口 + 多实现 + 注册表	不被供应商绑定
严格分层	Handler/Service/Repository 不跨层	改一层不动其他
同步异步分离	慢路径走 Redis 队列	用户体感秒级
Java + Python 双栈	业务侧 Java,AI 侧 Python	各栈独立演进
安全纵深防御	加密+脱敏+沙箱+SSRF+参数化	经得起合规审计

2.4、模块化可插拔 — 核心模式

2.5、同步异步双路径

队列叠加三个工程考量:可重试(失败回到队列)、可去重(同资源短时间多次触发只处理一次)、死信兜底(超过重试次数进死信表)。这套机制保证文档处理和向量化任务即便偶有失败也不会丢,生产环境跑得住。

3、功能模块设计

挑出最具工程价值的六个核心模块,讲清楚每个模块「解决什么 / 关键设计 / 工程亮点」。

3.1、六模块全景

模块	解决什么	关键设计	工程亮点
RAG 问答流水线	检索-生成的 10+ 步如何工程化	EventManager 串 11 个 Plugin	每步可单测/可降级/可定制
Wiki 自动网络	知识不沉淀	LLM 驱动的 Map-Reduce	持久化任务队列 + 死链自动修复
智能搜索与问答	多种交互模式统一接入	混合检索 + 精排 + 多轮上下文	RRF 融合算法 + MMR 多样性
Agent ReAct 引擎	不止答还要做	Think-Act-Observe 循环 + 30+ 工具	Token 预算 + 跨轮 KB 脱敏
模型管理	30+ Provider + API Key 安全	加密+脱敏+日志过滤三层	加密版本号预留升级路径
沙箱执行	用户脚本不可信	Docker 沙箱 + Local 降级	AST 校验前置 + 输入输出限制

3.2、RAG 问答流水线 — Plugin 责任链

Cortexa 的 RAG 流水线不是「检索-生成」两步,真实链路有十余个阶段。我们将其抽象为责任链(Chain of Responsibility)结构,由 EventManager 调度。

11 个 Plugin 串成的责任链 — Plugin 5 是抗胡编关键:召回为空直接返回固定话术,不调 LLM

抗胡编不依赖 prompt 工程,而是工程层判断:Plugin 5 之后若搜索结果完全为空,直接返回预设话术,不进入 LLM 生成阶段。说白了,RAG 翻车 90% 翻在「该说不知道的时候非要说」,这事儿在系统层就该解决,不该交给 prompt。

4.3、Wiki 自动知识网络 — Map-Reduce

Wiki 模式是 Cortexa 差异化的核心,采用 LLM 驱动的 Map-Reduce 范式实现知识沉淀。

Wiki 摄取 Map-Reduce — 持久化任务队列 + 死信兜底,4 万文档级 KB 永不丢任务

4.4、智能搜索与问答会话

Cortexa 对外提供三种交互模式,共享同一套检索能力。

交互模式	适用场景	关键能力	输出形态
普通搜索	已知关键词,快速查找原文	关键词倒排 + 高亮片段	原文片段列表
智能搜索	模糊语义,跨文档关联	向量+关键词+图谱并行 + RRF 融合	相关段落 + 元信息
问答会话	自然语言提问,要结论	RAG Plugin 链全流程 + 多轮上下文 + 引用追溯	流式答案 + 来源链接

三种模式共享检索引擎,差异在「后处理深度」。这一抽象让客户能按场景选型:对延迟敏感选普通搜索,对答案要求高选问答会话。

4.5、Agent ReAct 执行闭环

如果 RAG 是「Cortexa 帮我答」,Agent 是「Cortexa 帮我做」。

Agent ReAct 闭环 — 跨轮 KB 脱敏避免「AI 用过时信息」,HITL 拦截敏感工具调用

跨轮 KB 工具结果脱敏是一个非常微妙的生产化设计:多轮对话中,前序回合的 KB 检索结果可能与当前 KB 状态不一致。我们将历史 KB 结果替换为提示文本「知识库可能已变更,请重新检索」,强制 LLM 重新检索而非沿用旧结果。这事儿避免了 90% 的「为什么 AI 还在用过时信息」类投诉。

4.6、安全纵深防御(模型管理 + 沙箱)

模型管理与沙箱执行共同构成 Cortexa 的安全底座,采用 6 层纵深防御。

总结

维度	Cortexa
一句话定义	让团队把分散文档沉淀为可查询、可推理、可持续演进的专属知识资产
三大核心能力	RAG 快速问答 / ReAct Agent 智能推理 / Wiki 自动知识网络
三层架构	客户端 / 业务(Java+Python 双栈)/ 存储
业务层四子层	Handler / Service / Repository / Infra(不跨层)
部署组合	Docker Compose `--profile` 灵活叠加
抗胡编机制	召回为空直接返回固定话术,不调 LLM

参考文档：https://mp.weixin.qq.com/s/UF54KfM8dKF1KW3_69W8xw?mpshare=1&scene=1&srcid=0522COWsiXWgpE0lIcfYIzfO&sharer_shareinfo=b769f785b260459be4db8ea6326073c8&sharer_shareinfo_first=3e1590f843ed5f9c4a11cc3fa7bbef04&version=5.0.8.99856&platform=mac#rd

菜单

分享

企业级知识框架Cortexa：RAG、Agent推理、Wiki实现一个基于大语言模型LLM的知识管理框架

介绍

1.1、Cortexa

1.2、整体能力一览

2、架构设计

2.1、三层架构视角

2.2、业务层内部分层

2.3、五大架构思想

2.4、模块化可插拔 — 核心模式

2.5、同步异步双路径

3、功能模块设计

3.1、六模块全景

3.2、RAG 问答流水线 — Plugin 责任链

4.3、Wiki 自动知识网络 — Map-Reduce

4.4、智能搜索与问答会话

4.5、Agent ReAct 执行闭环

4.6、安全纵深防御(模型管理 + 沙箱)

总结

mem0 支持的图形数据库

9 种主流的 RAG（AI 检索增强）技术

langfuse可观测平台

Hello Halo

SFT、RL、OPD 不是三种训练技巧，而是三种”策略分布塑形”方式

Codex自我蒸馏玩法火了！OpenAI员工亲授：复制粘贴就能让AI消灭重复劳动

长篇白话系列：大模型之MoE（Mixture of Experts）

ICLR 2026记忆三剑客：MemGAS/RF-Mem/AMemGym，Agent终于不再失忆了

Agent Skills 综述

Anthropic 再发长文：首次详细揭秘Agent的评估全过程