# **PRD:智能数据清洗工作台 (The Data Cleaning Portal)** | 文档版本 | V1.0 (基于原型 V2) | | :---- | :---- | | **产品形?* | Web 端综合仪表盘 (Dashboard) | | **核心价?* | 作为数据清洗模块的统一入口,提供工具启动、异步任务监控、数据资产管理及跨工具流转能力?| | **目标用户** | 临床医生、科研助?| ## **一?产品架构?(Product Architecture)** 工作台处于系统的二级导航位置,向下连接三个具体工具,横向连接任务与数据? 全局导航 \-\> **工作?(本PRD)** \-\> (工具 A, 工具 B, 工具 C) ## **二?核心功能需?(Functional Requirements)** ### **1\. 全局导航集成 (Global Navigation)** * **P0:** 必须无缝嵌入现有系统顶部导航栏? * **位置?* 位于 知识??智能数据分析 之间? * **状态:** 点击后高亮显示“智能数据清洗”? ### **2\. 工具启动?(The Launcher)** * **P0:** **三卡片入口:** 醒目展示三个核心工具的入口卡片? * **工具 A (超级合并?:** 强调“多源数据合并、ID对齐”? * **工具 B (病历结构化机器人):** 强调“AI 提取、非结构化转结构化”? * **工具 C (科研数据编辑?:** 强调“在线清洗、缺失值处理”? * **交互?* 点击卡片,以**全屏模态框**?*新页?*形式打开对应工具? ### **3\. 任务流转中心 (Task Flow Hub) —?核心交互** * **P0:** **最近任务列表:** 展示用户最近发起的 10 条任务? * **字段定义?* 任务名称 | 所属工?A/B/C) | 状?处理?完成/失败) | 进度?| 操作? * **P0:** **状态实时更新:** * **处理中:** 显示动态进度条(如 45%)? * **失败?* 显示红色警告,支持查看错误日志? * **P0:** **智能流转操作 (Smart Action)?* * 基于任务类型,动态推荐下一步操作: * **工具 A 完成后:** 显示按钮 \[下载\] ?\[?AI 提取\] (跳转工具 B)? * **工具 B 完成后:** 显示按钮 \[下载\] ?\[去清洗\] (跳转工具 C)? * **工具 C 完成后:** 显示按钮 \[下载\]? ### **4\. 数据资产?(Data Asset Library) —?V2 核心升级** * **P0:** **Tab 分栏视图?* * **\[全部\]** * **\[处理结果\] (Outputs):** 存放工具 A/B/C 生成的最终文件。图标使用绿?蓝色区分? * **\[原始上传\] (Inputs):** 存放用户直接上传的底表。图标使用灰色区分? * **P0:** **资产卡片信息?* * 文件名、标签(如“已清洗”、“已脱敏”)、行数、修改时间? * **P0:** **快捷操作 (Hover Actions):** * 鼠标悬停在卡片上时,显示操作按钮? * \[下载\]: 下载到本地? * \[去处理\]: 如果是原始文件,点击跳转到工具选择页(或默认工?A)? * \[分析\]: 如果是处理结果,点击跳转到“智能数据分析”模块(未来规划)? * **P0:** **原始文件上传入口?* * 底部固定按钮 \[+ 上传原始文件到库\],允许用户将本地 Excel 存入云端备用? ## **三?界面原型参?(UI Reference)** 请严格参?智能数据清洗工作台\_原型演示\_V2.html? * **布局?* 顶部?Launcher,下方分为左右两栏(?2/3 为任务,?1/3 为资产)? * **视觉风格?* * 工具 A:蓝色系 (Blue) * 工具 B:紫色系 (Purple) * 工具 C:翠绿色?(Emerald) * 状态色:处理中(?、成??、失??、警??? ## **四?数据交互逻辑 (Data Logic)** 1. **任务轮询 (Polling):** * 工作台加载时,调?GET /api/tasks/recent? * 若列表中有状态为 processing 的任务,每隔 5 秒轮询一次状态更新,直到完成? 2. **跨工具流?(Handoff):** * 当用户点?\[?AI 提取\] 时: * 前端获取该任务的 resultFileId? * 跳转路由?/tools/b?sourceFileId={resultFileId}? * 工具 B 初始化时,自动加载该文件,无需用户重新上传? 3. **资产管理:** * 工具 A/B/C 产生的最终结果,需自动注册?DataAsset 表中,并标记 type='output'? * 用户手动上传的文件,注册?type='input'? ## **五?埋点与统计需?* * **UV/PV:** 工作台访问量? * **CTR:** 三个工具卡片的点击率(判断哪个工具最常用)? * **流转?** 用户点击“去 AI 提取”等流转按钮的比例(判断工作流是否顺畅)