Agentic RAG整体架构

Multi-mode Agentic RAG架构图

用户层

  • • Web/移动端界面
  • • API接口
  • • 数字人交互
  • • 语音/文字输入

Agent协调层

  • • Intent Manager
  • • Context Manager
  • • Session Manager
  • • Response Orchestrator

CKB Agent

  • • 知识图谱构建
  • • 实体关系抽取
  • • 知识推理
  • • 动态知识更新

RRA Agent

  • • 检索策略优化
  • • 多轮检索增强
  • • 相关性重排序
  • • 答案融合生成

SubAgent池

  • • Table RAG Agent
  • • Code Agent
  • • Math Agent
  • • Domain Experts

基础设施层

  • • 向量数据库
  • • LLM推理引擎
  • • 缓存系统
  • • 监控与日志

核心技术栈

技术领域 当前方案 升级计划 时间表 状态
LLM引擎 GPT-3.5/Claude GPT-4/Claude 3 + 私有化Qwen 2025年8-9月 核心
向量检索 Elasticsearch Milvus + Elasticsearch混合 2025年9月 新增
Agent框架 自研框架 LangChain + 自研增强 2025年10月 实验
知识图谱 Neo4j + 自研CKB 2025年9-10月 新增
Table处理 基础解析 Markitdown + Table RAG 2025年8月 核心
语音技术 Azure TTS 流式TTS + AWW集成 2025年8-9月 核心
数字人 3D Avatar + 口型同步 2025年9-11月 新增
监控体系 基础日志 Prometheus + Grafana 2025年8月 核心

技术演进路线

2025年8月 - 当前阶段
基础RAG优化期
• 修复OnPrem断网运行问题
• Table RAG精度优化到80%+
• 建立RAG测试基准和评估体系
• FAQ匹配算法优化
2025年9-10月
Agent架构升级期
• CKB Agent原型开发与验证
• RRA Agent多轮检索实现
• Knowledge Aware RAG集成
• Agent协作机制建立
2025年11月
Multi-mode融合期
• 文本/表格/代码多模态处理
• SubAgent专家系统集成
• 动态Agent调度优化
• 端到端精度达到85%+
2025年12月-2026年1月
生态扩展期
• MCP标准制定与开放
• 第三方Agent接入
• 插件市场建设
• 行业解决方案定制

性能目标与指标

85%
RAG解决率
目标:90%(12月)
<2s
平均响应时间
目标:<1.5s
95%
精确度
保持95%+
1000+
并发支持
目标:5000+

Agent协作流程

用户查询

意图理解

主控Agent

任务分解

专家Agent

并行处理

结果融合

生成回答

技术债务管理

待解决技术债务

高优先级

代码架构重构

当前代码耦合度高,需要模块化重构以支持Agent架构

计划:9月开始分阶段重构,10月完成

中优先级

测试覆盖率提升

当前单元测试覆盖率仅40%,需要提升到80%+

计划:每月提升15%,12月达标

中优先级

文档完善

技术文档和API文档不完整,影响开发效率

计划:建立文档规范,每周更新

MCP生态系统规划

Model Context Protocol (MCP) 生态系统

开放标准,连接AI能力与业务场景

🏢

企业系统

ERP、CRM集成

🔧

开发工具

IDE插件、DevOps

📊

数据平台

BI工具、数据仓库

🤖

AI服务

第三方模型、Agent

📱

应用生态

移动APP、小程序

🌐

行业方案

垂直领域定制