# 安全开发规范 > **版本:** v1.1 > **创建日期:** 2026-03-02 > **最后更新:** 2026-03-03(v1.1:采纳架构师审查意见,补充 OSS 签名 URL、导出审计、接口限流、依赖安全) > **强制等级:** P0 必须遵守 > **适用范围:** 前端(React/TypeScript)+ 后端(Node.js/TypeScript)+ 部署(Docker/SAE) > **背景:** 本规范基于 2026 年 3 月安全评估中发现的实际漏洞总结而成,所有条目均对应真实代码问题 --- ## 目录 1. [API 访问控制规范(防 IDOR)](#1-api-访问控制规范防-idor) 2. [数据库查询安全规范(防 SQL 注入)](#2-数据库查询安全规范防-sql-注入) 3. [LLM 调用安全规范(PII 脱敏)](#3-llm-调用安全规范pii-脱敏) 4. [认证与授权规范](#4-认证与授权规范) 5. [敏感信息管理规范(防泄露)](#5-敏感信息管理规范防泄露) 6. [前端安全规范](#6-前端安全规范) 7. [日志与错误处理安全规范](#7-日志与错误处理安全规范) 8. [部署与网络安全规范](#8-部署与网络安全规范) 9. [Code Review 安全检查清单](#9-code-review-安全检查清单) --- ## 1. API 访问控制规范(防 IDOR) > IDOR(Insecure Direct Object Reference,不安全的直接对象引用)是本系统曾出现的最大面积漏洞,影响 ~29 个接口。以下规范**强制执行**。 ### 1.1 核心原则 **任何通过 ID 访问资源的 API,必须在查询条件中包含归属校验。** - 个人资源(会话、文档、任务):必须加 `userId` - 租户资源(项目、团队数据):必须加 `tenantId` - 禁止仅凭资源 ID 查询/修改/删除 ### 1.2 正确写法 ```typescript // ✅ 正确:查询条件包含 userId const session = await prisma.ssaSession.findFirst({ where: { id: sessionId, userId }, }); if (!session) { return reply.status(404).send({ error: '资源不存在' }); } ``` ```typescript // ✅ 正确:通过关联关系校验归属 const result = await prisma.aslExtractionResult.findFirst({ where: { id: resultId, task: { userId }, }, }); ``` ```typescript // ✅ 正确:租户资源按 tenantId 过滤 const project = await prisma.iitProject.findFirst({ where: { id: projectId, tenantId, deletedAt: null }, }); ``` ### 1.3 错误写法(禁止) ```typescript // ❌ 禁止:仅凭 id 查询,任何登录用户都可访问 const session = await prisma.ssaSession.findUnique({ where: { id }, }); // ❌ 禁止:update 时不校验归属 await prisma.ssaSession.update({ where: { id }, data: { ... }, }); // ❌ 禁止:通过子资源 ID 查询不校验父资源归属 const messages = await prisma.ssaMessage.findMany({ where: { sessionId: id }, }); ``` ### 1.4 Controller → Service 传参规范 Controller 层**必须**从 request 获取 userId/tenantId 并传入 Service: ```typescript // Controller 层 const userId = getUserId(request); const result = await myService.getResource(resourceId, userId); // Service 层 async getResource(resourceId: string, userId: string) { const resource = await prisma.myTable.findFirst({ where: { id: resourceId, userId }, }); if (!resource) throw new NotFoundError('资源不存在'); return resource; } ``` ### 1.5 特殊场景处理 | 场景 | 处理方式 | |------|---------| | SUPER_ADMIN 查看任意资源 | Service 方法判断角色,SUPER_ADMIN 可跳过 userId 校验 | | Worker / 后台任务 | 保留无 userId 参数的内部方法,方法名加 `Internal` 后缀(如 `getSessionInternal`) | | 多人协作资源(IIT 项目) | 使用 `tenantId` 而非 `userId`,同租户成员共享访问 | | 资源不存在 vs 无权限 | 统一返回 **404**(不返回 403,避免暴露资源存在性) | ### 1.6 已有的正确实现(参考模板) 新模块开发时,参考以下已正确实现归属校验的模块: - **PKB**:`documentService.getDocumentById(userId, id)` — `where: { id, userId }` - **RVW**:`reviewService.getTaskDetail(userId, taskId)` — `where: { id: taskId, userId }` - **AIA**:`conversationService.getConversationById(userId, id)` — `where: { id, userId }` ### 1.7 OSS 签名 URL 安全要求 文件下载是 IDOR 的重灾区。所有通过 OSS 签名 URL 提供文件下载的接口,必须遵守: **归属校验(与 1.1 一致)**:生成签名 URL 前,必须先校验文件/会话/任务归属当前用户。 ```typescript // ✅ 正确:先校验归属,再生成签名 URL const document = await prisma.document.findFirst({ where: { id: documentId, userId }, }); if (!document) return reply.status(404).send({ error: '文件不存在' }); const signedUrl = await storage.getSignedUrl(document.ossKey, 300); return reply.send({ url: signedUrl }); ``` ```typescript // ❌ 禁止:不校验归属直接生成签名 URL const document = await prisma.document.findUnique({ where: { id: documentId } }); const signedUrl = await storage.getSignedUrl(document.ossKey); ``` **签名 URL 有效期**: | 场景 | 最大有效期 | 说明 | |------|-----------|------| | 文档预览/下载 | 300 秒(5 分钟) | 用户点击后立即下载,无需长时效 | | 大文件下载(>100MB) | 900 秒(15 分钟) | 为慢速网络留余量 | | 内部服务间传递 | 3600 秒(1 小时) | Worker 处理数据时使用,非用户直接访问 | ```typescript // ✅ 正确:显式设置短有效期 const signedUrl = await storage.getSignedUrl(ossKey, 300); // ❌ 不推荐:使用默认有效期(当前默认 3600 秒,对用户下载偏长) const signedUrl = await storage.getSignedUrl(ossKey); ``` **Bucket 权限**:代码中严禁调用 `putBucketAcl` 或将 Bucket 设置为 `public-read`(静态资源 Bucket 除外)。 --- ## 2. 数据库查询安全规范(防 SQL 注入) ### 2.1 核心原则 **禁止将用户输入直接拼接到 SQL 字符串中。必须使用参数化查询。** ### 2.2 Prisma ORM 查询(推荐) ```typescript // ✅ 正确:使用 Prisma 标准 API(自动参数化) const records = await prisma.qcRecord.findMany({ where: { projectId, status }, skip: offset, take: pageSize, }); ``` ### 2.3 原始 SQL 查询 当必须使用原始 SQL 时(如复杂聚合、向量搜索),使用 Prisma 的参数化原始查询: ```typescript // ✅ 正确:$queryRaw 使用模板字面量(自动参数化) const results = await prisma.$queryRaw` SELECT * FROM iit_qc_records WHERE project_id = ${projectId} AND status = ${status} LIMIT ${pageSize} OFFSET ${offset} `; ``` ```typescript // ✅ 正确:Prisma.sql 拼接动态条件 import { Prisma } from '@prisma/client'; const conditions: Prisma.Sql[] = [Prisma.sql`project_id = ${projectId}`]; if (status) { conditions.push(Prisma.sql`status = ${status}`); } const whereClause = Prisma.join(conditions, ' AND '); const results = await prisma.$queryRaw` SELECT * FROM iit_qc_records WHERE ${whereClause} `; ``` ### 2.4 禁止写法 ```typescript // ❌ 致命:$queryRawUnsafe + 字符串拼接 const results = await prisma.$queryRawUnsafe(` SELECT * FROM records WHERE project_id = '${projectId}' AND status = '${status}' LIMIT ${pageSize} OFFSET ${offset} `); // ❌ 危险:单引号转义不能防止所有注入 const safeKbId = kbId.replace(/'/g, "''"); const sql = `SELECT * FROM documents WHERE kb_id = '${safeKbId}'`; ``` ### 2.5 向量搜索场景 ```typescript // ✅ 正确:pgvector 查询使用参数化 const results = await prisma.$queryRaw` SELECT id, content, 1 - (embedding <=> ${vectorParam}::vector) AS similarity FROM document_chunks WHERE kb_id = ${kbId} ORDER BY embedding <=> ${vectorParam}::vector LIMIT ${topK} `; ``` --- ## 3. LLM 调用安全规范(PII 脱敏) ### 3.1 核心原则 **所有发送给外部 LLM 的用户数据必须经过 PII 脱敏处理。** ### 3.2 架构方案 系统通过 `LLMFactory.getAdapter()` 统一创建 LLM 适配器。全局脱敏通过 `MaskedLLMAdapter` 代理实现,**默认开启**,无需各模块单独处理。 ``` 业务模块 → LLMFactory.getAdapter() → MaskedLLMAdapter(自动脱敏)→ 真实 Adapter → 外部 LLM ``` ### 3.3 脱敏覆盖范围 | PII 类型 | 脱敏规则 | 示例 | |----------|---------|------| | 手机号 | 保留前 3 后 4 | `13800138000` → `138****8000` | | 身份证号 | 保留前 6 后 4 | `330102199001011234` → `330102********1234` | | 患者姓名 | 保留姓氏 | `患者张三丰` → `患者张**` | | 邮箱地址 | 保留首字符和域名 | `zhangsan@example.com` → `z***@example.com` | ### 3.4 开发时注意事项 - **不要在业务代码中重复实现脱敏**:全局脱敏由 `MaskedLLMAdapter` 自动完成 - **System Prompt 不会被脱敏**:只有 `user` 和 `assistant` 角色的消息会被脱敏 - **如需关闭脱敏**(如调试):设置环境变量 `PII_MASKING_ENABLED=false` - **如需扩展脱敏规则**:修改 `backend/src/common/services/piiMaskingService.ts` ### 3.5 使用通用脱敏服务 当业务代码需要在非 LLM 场景下脱敏(如日志、API 响应): ```typescript import { PiiMaskingService } from '@/common/services/piiMaskingService'; // 脱敏单段文本 const masked = PiiMaskingService.maskText(rawText); // 脱敏 LLM 消息数组 const maskedMessages = PiiMaskingService.maskMessages(messages); ``` --- ## 4. 认证与授权规范 ### 4.1 路由注册规范 **所有 API 路由必须挂载 `authenticate` 中间件,除非有明确的豁免理由。** ```typescript // ✅ 正确:路由级别挂载认证 app.register(async (protectedApp) => { protectedApp.addHook('preHandler', authenticate); protectedApp.register(myRoutes, { prefix: '/api/v2/my-module' }); }); ``` ```typescript // ❌ 禁止:未挂载认证的业务路由 app.register(myRoutes, { prefix: '/api/v1/my-module' }); ``` ### 4.2 角色与模块权限 ```typescript // 需要特定角色 app.get('/admin/users', { preHandler: [authenticate, requireRoles(['SUPER_ADMIN', 'ORG_ADMIN'])], }, handler); // 需要模块订阅 app.get('/ssa/sessions', { preHandler: [authenticate, requireModule('SSA')], }, handler); ``` ### 4.3 测试/调试端点 ```typescript // ✅ 正确:生产环境禁用测试端点 if (process.env.NODE_ENV !== 'production') { app.register(testRoutes, { prefix: '/test' }); } ``` ```typescript // ❌ 禁止:测试端点无条件注册且无认证 app.register(testRoutes, { prefix: '/test' }); ``` --- ## 5. 敏感信息管理规范(防泄露) ### 5.1 环境变量与密钥 | 规则 | 说明 | |------|------| | 密钥只通过环境变量注入 | 数据库密码、API Key、JWT Secret 等**严禁硬编码** | | `.env` 文件不提交 Git | 确认在 `.gitignore` 中 | | `.env.example` 使用占位符 | 示例值写 `your-api-key-here`,**不写真实密钥** | | 文档中不记录密钥 | 部署文档写"见阿里云控制台",不写实际密码 | | 脚本/测试代码不硬编码密钥 | 从 `process.env` 或配置文件读取 | ### 5.2 正确写法 ```typescript // ✅ 正确:从环境变量读取 const apiKey = process.env.DEEPSEEK_API_KEY; if (!apiKey) throw new Error('DEEPSEEK_API_KEY is required'); ``` ```typescript // ❌ 禁止:硬编码密钥 const apiKey = 'sk-7f8cc37a79fa4799860b38fc7ba2e150'; ``` ### 5.3 `.env.example` 规范 ```env # ✅ 正确 DATABASE_URL=postgresql://postgres:your-password@localhost:5432/ai_clinical_research JWT_SECRET=replace-with-a-strong-64-char-secret DEEPSEEK_API_KEY=your-api-key-here # ❌ 错误 DATABASE_URL=postgresql://postgres:Xibahe@fengzhibo117@rds-xxx.rds.aliyuncs.com:5432/ai_clinical_research DEEPSEEK_API_KEY=sk-7f8cc37a79fa4799860b38fc7ba2e150 ``` ### 5.4 密钥泄露应急流程 如果发现密钥已泄露(提交到 Git、发到聊天群等): 1. **立即轮换**:更换泄露的密钥/密码 2. **清理 Git 历史**:使用 BFG Repo-Cleaner 或 `git filter-branch` 3. **排查影响**:检查日志确认是否有异常访问 4. **通知团队**:更新相关服务的配置 --- ## 6. 前端安全规范 ### 6.1 Token 存储 当前使用 `localStorage` 存储 JWT Token。后续优化方向: - 考虑迁移到 `httpOnly` Cookie(防 XSS 读取) - Access Token 设置较短过期时间(当前 2h,合理) - Refresh Token 仅在续期时使用 ### 6.2 XSS 防护 ```typescript // ✅ 正确:React JSX 自动转义
{userInput}
// ❌ 禁止:dangerouslySetInnerHTML 使用未经净化的内容
// ✅ 如必须渲染 HTML,先使用 DOMPurify 净化 import DOMPurify from 'dompurify';
``` ### 6.3 API 请求 ```typescript // ✅ 正确:使用统一的 apiClient(自动带 Token、处理 401) import apiClient from '@/common/api/axios'; const { data } = await apiClient.get('/api/v2/xxx'); // ❌ 禁止:直接用 fetch/axios 不带认证 const res = await fetch('/api/v2/xxx'); ``` --- ## 7. 日志与错误处理安全规范 ### 7.1 日志脱敏 ```typescript // ✅ 正确:日志中脱敏敏感信息 logger.info('验证码已发送', { phone: phone.replace(/(\d{3})\d{4}(\d{4})/, '$1****$2') }); // ❌ 禁止:明文记录验证码、密码、Token logger.info('验证码已生成', { phone, code }); console.log(`验证码: ${code}`); ``` ### 7.2 错误响应脱敏 ```typescript // ✅ 正确:生产环境返回通用错误信息 return reply.status(500).send({ error: '服务内部错误', ...(process.env.NODE_ENV !== 'production' && { stack: error.stack }), }); // ❌ 禁止:生产环境返回完整错误栈 return reply.status(500).send({ error: error.message, stack: error.stack, }); ``` ### 7.3 管理与高危操作审计日志 以下两类操作**必须**记录审计日志: **管理员增删改操作**: ```typescript await prisma.adminOperationLog.create({ data: { userId: currentUser.id, action: 'DELETE_USER', targetId: targetUserId, details: JSON.stringify({ reason }), ip: request.ip, userAgent: request.headers['user-agent'], }, }); ``` **数据导出/批量下载操作**: 凡涉及"报表导出"、"Excel 数据下载"、"批量文献导出"、"文档下载"的接口,必须调用 `activityService.log()` 记录导出日志。这是发生数据泄露时的唯一溯源手段。 ```typescript // ✅ 正确:导出接口记录审计日志 app.get('/sessions/:id/export', async (request, reply) => { const userId = getUserId(request); const session = await sessionService.getSession(id, userId); // 执行导出... const exportData = await sessionService.exportData(session); // 记录导出日志 await activityService.log({ userId, action: 'EXPORT', module: 'DC_TOOL_C', targetId: session.id, details: JSON.stringify({ exportType: 'excel', rowCount: exportData.rowCount, }), ip: request.ip, }); return reply.send(exportData.buffer); }); ``` **必须记录导出日志的接口清单**(新增接口时参照补充): | 接口 | 模块 | |------|------| | `/dc/tool-b/tasks/:taskId/export` | DC 数据提取 | | `/dc/tool-c/sessions/:id/export` | DC 数据清洗 | | `/asl/extraction/tasks/:taskId/export` | ASL 提取结果导出 | | `/asl/fulltext-screening/tasks/:taskId/export` | ASL 全文筛选导出 | | `/asl/research/tasks/:taskId/export-word` | ASL 深度研究导出 | | `/aia/protocol-agent/export/docx` | 研究方案导出 | | `/ssa/sessions/:id/download-code` | SSA 代码下载 | | `/ssa/sessions/:id/download-sap` | SSA SAP 下载 | | `/admin/system-kb/:id/documents/:docId/download` | 系统知识库下载 | --- ## 8. 部署与网络安全规范 ### 8.1 Docker 安全 ```dockerfile # ✅ 正确:使用非 root 用户运行 RUN addgroup --system appgroup && adduser --system appuser --ingroup appgroup USER appuser # ✅ 正确:多阶段构建,减少攻击面 FROM node:20-slim AS builder # ... 构建 ... FROM node:20-slim AS runner COPY --from=builder /app/dist ./dist ``` ### 8.2 Nginx 安全头 ```nginx # 必须配置的安全响应头 add_header X-Frame-Options "SAMEORIGIN" always; add_header X-Content-Type-Options "nosniff" always; add_header X-XSS-Protection "1; mode=block" always; add_header Referrer-Policy "strict-origin-when-cross-origin" always; # HTTPS 部署后启用 # add_header Strict-Transport-Security "max-age=31536000; includeSubDomains" always; # add_header Content-Security-Policy "default-src 'self'; script-src 'self' 'unsafe-inline'" always; ``` ### 8.3 CORS 配置 ```typescript // ✅ 正确:生产环境使用白名单 app.register(cors, { origin: process.env.NODE_ENV === 'production' ? ['https://iit.xunzhengyixue.com'] : true, credentials: true, }); // ❌ 禁止:生产环境允许所有来源 app.register(cors, { origin: true }); ``` ### 8.4 数据库连接 ```env # ✅ 正确:启用 SSL DATABASE_URL=postgresql://user:pass@host:5432/db?sslmode=require # ❌ 不推荐:无 SSL DATABASE_URL=postgresql://user:pass@host:5432/db ``` ### 8.5 接口限流与防刷规范 所有暴露到公网的接口必须配置速率限制,防止暴力破解和数据爬取。使用 `@fastify/rate-limit` 中间件。 **全局默认限流**(在 `backend/src/index.ts` 中注册): ```typescript import rateLimit from '@fastify/rate-limit'; await app.register(rateLimit, { max: 100, timeWindow: '1 minute', }); ``` **敏感接口独立限流**(更严格): ```typescript // 登录接口:单 IP 每分钟最多 5 次 app.post('/api/v1/auth/login', { config: { rateLimit: { max: 5, timeWindow: '1 minute' }, }, }, loginHandler); // 验证码接口:单手机号每分钟 1 次(业务层已有),单 IP 每分钟 5 次 app.post('/api/v1/auth/send-code', { config: { rateLimit: { max: 5, timeWindow: '1 minute' }, }, }, sendCodeHandler); ``` **登录失败锁定**(在 `auth.service.ts` 中实现): - 同一账号连续登录失败 5 次 → 锁定 15 分钟 - 锁定期间返回 `429 Too Many Requests` - 锁定计数存入 cache(如 `PostgresCacheAdapter`),成功登录后重置 ### 8.6 依赖安全审查 每次发版前必须检查 npm 依赖的已知漏洞。 **本地检查**: ```bash # 检查后端依赖漏洞 cd backend && npm audit # 检查前端依赖漏洞 cd frontend-v2 && npm audit ``` **CI/CD 集成**(搭建流水线时必须配置): ```yaml # GitHub Actions 示例 - name: Security audit run: npm audit --audit-level=high # high/critical 级别漏洞必须修复后才能上线 ``` **package.json 中添加审查脚本**: ```json { "scripts": { "audit": "npm audit --audit-level=high", "audit:fix": "npm audit fix" } } ``` --- ## 9. Code Review 安全检查清单 每次 Code Review 时,以下安全项**必须检查**: ### 9.1 访问控制 - [ ] 新增/修改的 API 是否挂载了 `authenticate` 中间件? - [ ] 通过 ID 查询的接口是否在 `where` 条件中包含 `userId` 或 `tenantId`? - [ ] `findUnique`/`findFirst` 查询是否只按 `id`?(如果是,很可能有 IDOR 风险) - [ ] `update`/`delete` 操作是否校验了资源归属? ### 9.2 输入安全 - [ ] 是否使用了 `$queryRawUnsafe`?(需特别审查) - [ ] 原始 SQL 中是否有字符串拼接用户输入? - [ ] 用户上传文件是否做了类型和大小校验? ### 9.3 敏感信息 - [ ] 代码中是否有硬编码的密钥、密码、API Key? - [ ] 日志中是否打印了敏感信息(验证码、Token、密码)? - [ ] 错误响应是否泄露了内部实现(stack trace、SQL 语句)? ### 9.4 LLM 安全 - [ ] 新增的 LLM 调用是否通过 `LLMFactory.getAdapter()` 统一入口? - [ ] 是否有绕过全局脱敏直接调用外部 API 的代码? ### 9.5 前端安全 - [ ] 是否使用了 `dangerouslySetInnerHTML`?如是,内容是否经过 DOMPurify 净化? - [ ] API 调用是否使用统一的 `apiClient`? - [ ] 是否有敏感信息写入 `localStorage`/`console.log`? ### 9.6 文件下载与数据导出 - [ ] 生成的文件下载链接是否为短时效(<= 300 秒)的预签名 URL? - [ ] 导出/下载接口是否记录了审计日志(`activityService.log` 或 `adminOperationLog`)? ### 9.7 限流与防刷 - [ ] 暴露到公网的查询、登录接口是否配置了 Rate Limit? --- ## 常见问题 FAQ ### Q: 为什么查不到资源要返回 404 而不是 403? 返回 403 会暴露"资源存在但你没权限"这一信息,攻击者可以通过此响应确认某个 ID 对应的资源确实存在。统一返回 404,攻击者无法区分"资源不存在"和"无权访问"。 ### Q: SUPER_ADMIN 需要跨用户查看数据怎么办? 在 Service 方法中通过角色判断跳过归属校验: ```typescript async getSession(sessionId: string, userId: string, role: string) { const where: any = { id: sessionId }; if (role !== 'SUPER_ADMIN') { where.userId = userId; } return prisma.ssaSession.findFirst({ where }); } ``` ### Q: 后台 Worker 没有用户上下文怎么校验归属? Worker 内部调用使用 `xxxInternal` 方法,该方法不校验 userId。但必须确保 Worker 处理的数据 ID 本身来自已校验过归属的上游流程(如任务队列中的 taskId 是由已认证的用户创建的)。 ### Q: 哪些数据应该做 PII 脱敏? 所有可直接或间接识别到自然人的信息:手机号、身份证号、姓名、邮箱、住院号、病历号、地址等。当前系统自动脱敏前四类,如业务中出现其他 PII 类型,需在 `PiiMaskingService` 中扩展规则。 --- **最后更新:** 2026-03-03(v1.1) **维护人:** 技术架构师