# LLM大模型网关 > **能力定位:** 通用能力层核心能力 > **复用率:** 71% (5个模块依赖) > **优先级:** P0(最高)⭐ > **状态:** ❌ 待实现 --- ## 📋 能力概述 LLM大模型网关是平台AI能力的核心中枢,负责: - 统一管理所有LLM调用 - 根据用户版本动态切换模型 - 成本控制与限流 - Token计数与计费 --- ## 🎯 核心价值 ### 1. 商业模式技术基础 ⭐ ``` 专业版 → DeepSeek-V3(便宜,¥1/百万tokens) 高级版 → DeepSeek + Qwen3 旗舰版 → DeepSeek + Qwen3 + Qwen-Long + Claude ``` ### 2. 成本控制 - 统一监控所有LLM API调用 - 超出配额自动限流 - 按版本计费 ### 3. 统一接口 - 屏蔽不同LLM API的差异 - 统一的调用接口 --- ## 📊 依赖模块 **5个模块依赖(71%复用率):** 1. **AIA** - AI智能问答 2. **ASL** - AI智能文献(双模型判断) 3. **PKB** - 个人知识库(RAG问答) 4. **DC** - 数据清洗(NER提取) 5. **RVW** - 稿件审查(AI评估) --- ## 💡 核心功能 ### 1. 模型选择 ```typescript selectModel(userId: string, preferredModel?: string): string // 根据用户版本和配额选择合适的模型 ``` ### 2. 统一调用 ```typescript chat(params: { userId: string; modelType?: ModelType; messages: Message[]; stream?: boolean; }): Promise ``` ### 3. 配额管理 ```typescript checkQuota(userId: string): Promise // 检查用户剩余配额 ``` ### 4. Token计数 ```typescript countTokens(text: string): number // 使用tiktoken计算Token数 ``` --- ## 📂 文档结构 ``` 01-LLM大模型网关/ ├── [AI对接] LLM网关快速上下文.md # ✅ 已完成 ├── 03-CloseAI集成指南.md # ✅ 已完成 ⭐ ├── 00-需求分析/ │ └── README.md ├── 01-设计文档/ │ ├── 01-详细设计.md # ⏳ Week 5创建 │ ├── 02-数据库设计.md # ⏳ Week 5创建 │ ├── 03-API设计.md # ⏳ Week 5创建 │ └── README.md └── README.md # ✅ 当前文档 ``` ### 快速入门文档 ⭐ | 文档 | 说明 | 状态 | |------|------|------| | **[AI对接] LLM网关快速上下文.md** | 快速了解LLM网关设计 | ✅ 已完成 | | **03-CloseAI集成指南.md** | CloseAI(GPT-5+Claude-4.5)集成文档 ⭐ | ✅ 已完成 | --- ## ⚠️ 开发计划调整 ### 原计划:Week 2完成LLM网关 **调整:** LLM网关完整实现推迟到Week 5 ✅ **理由:** 1. 现有LLM调用已经work(DeepSeek、Qwen) 2. CloseAI集成配置已完成,可直接使用 3. ASL开发不阻塞,先用简单调用 4. Week 5有多个模块实践后,再抽取统一网关更合理 ### 当前可用(Week 3 ASL开发)✅ - ✅ DeepSeek API(直连) - ✅ GPT-5-Pro API(CloseAI代理) - ✅ Claude-4.5 API(CloseAI代理) - ✅ Qwen API(DashScope) - ✅ 4个模型的基础调用代码示例 ### Week 5完善(LLM网关统一) - 统一调用接口 - 版本分级(专业版/高级版/旗舰版) - 配额管理和限流 - Token计数和计费 - 使用记录和监控 --- ## 🔗 相关文档 - [通用能力层总览](../README.md) - [系统架构分层设计](../../00-系统总体设计/01-系统架构分层设计.md) --- **最后更新:** 2025-11-06 **维护人:** 技术架构师