# 工具C - Bug修复与优化总结 **修复日期**: 2025-12-08 **修复?*: AI Assistant **修复范围**: 7个严重问?+ 5个体验优? --- ## 📋 修复清单 ### ?问题1:表头特殊字符导致功能异? #### 1-1. Pivot转换只有1?🔴 **已修?* **问题描述**: - 表头包含括号、等号等特殊字符(如`体重(kg)`、`1.高血压病(无=0,有=1)`? - 导致Pivot转换时列名处理失败,只生?列而不是按透视列展开 **根本原因**: - Python的`pivot_table`列名展平逻辑无法处理特殊字符 **解决方案**: ```python # 文件: extraction_service/operations/pivot.py (73-95? # 增强列名展平逻辑,清理特殊字? if len(value_columns) == 1: value_col_clean = str(value_columns[0]).replace('(', '').replace(')', '').strip() df_pivot.columns = [f'{value_col_clean}___{str(col).replace(" ", "_")}' for col in df_pivot.columns] ``` #### 1-2. 计算列功能报?🔴 **已修?* **问题描述**: - 点击"执行计算"报错?公式包含不允许的字符" - 无法使用包含中文括号、等号、冒号的列名 **根本原因**: - `compute.py`的正则验证过于严格,只允许英文括? **解决方案**: ```python # 文件: extraction_service/operations/compute.py (63-67? # 1. 放宽字符验证,支持中文括号、等号、冒? allowed_chars = r'[a-zA-Z0-9_\u4e00-\u9fa5\s\+\-\*/\(\)\[\]\{\}\.,:\*\*=()【】、。:;!?]' # 2. 使用列名映射,将特殊字符列名替换为安全变量名 for i, col in enumerate(result.columns): safe_var = f'col_{i}' formula_safe = re.sub(rf'\b{re.escape(col)}\b', safe_var, formula_safe) env[safe_var] = result[col] ``` --- ### ?问题2:数值映射只提取1个唯一?🔴 **已修?* #### 2-1. 婚姻状况只显?个值(实际?种)🔴 **已修?* **问题描述**: - 选择"婚姻状况"列时,只提取?个唯一? - 实际数据?种:已婚、未婚、其他?空白) **根本原因**: - 前端从`data`数组提取唯一值,但`data`只有?0? - 完整数据?668行,婚姻状况的分布不? **解决方案**: ```typescript // 文件: frontend-v2/src/modules/dc/pages/tool-c/components/RecodeDialog.tsx (45-72? // 调用后端API从完整数据中提取唯一? const response = await fetch( `/api/v1/dc/tool-c/sessions/${sessionId}/unique-values?column=${encodeURIComponent(selectedColumn)}` ); ``` ```typescript // 新增API: backend/src/modules/dc/tool-c/controllers/SessionController.ts (366-428? // GET /api/v1/dc/tool-c/sessions/:id/unique-values?column=xxx async getUniqueValues(...) { const data = await sessionService.getFullData(id); const cleanedValues = values.map((val) => typeof val === 'string' ? val.trim() : val ); return Array.from(new Set(cleanedValues)).filter(v => v !== null).sort(); } ``` #### 2-2. 研究中心:只显示1个值(实际?种)🔴 **已修?* 同上,使用相同解决方案? --- ### ?体验优化?项) #### ?优化1:表格线框颜色加??**已完?* **需?*: 线框太淡,看不清? **修改**: ```css /* 文件: frontend-v2/src/modules/dc/pages/tool-c/components/ag-grid-custom.css (24-26? */ --ag-border-color: #d1d5db; /* ?e5e7eb -> #d1d5db */ --ag-row-border-color: #e5e7eb; /* ?f1f5f9 -> #e5e7eb */ border-bottom: 2px solid #d1d5db; /* 表头底部边框加深 */ ``` #### ?优化2:表头宽度减?0% + Tooltip ?**已完?* **需?*: 列宽太大,同一屏无法显示太多列 **修改**: ```typescript // 文件: frontend-v2/src/modules/dc/pages/tool-c/components/DataGrid.tsx (32-53? { headerName: col.name, headerTooltip: col.name, // ?鼠标悬停显示完整列名 width: 90, // ??50 -> 90(减?0%? minWidth: 60, // ??00 -> 60 } ``` #### ?优化3:新列显示在原列旁边 ?**已完?* **需?*: 生成新列时,希望紧邻原列,方便对? **修改**: - `binning.py` (139-148?: 分组列插入到原列旁边 - `recode.py` (56-63?: 编码列插入到原列旁边 - `compute.py` (149-161?: 计算列插入到第一个引用列旁边 - `conditional.py` (131-139?: 条件列插入到参考列旁边 ```python # 示例: binning.py original_col_index = result.columns.get_loc(column) cols = list(result.columns) cols.remove(new_column_name) cols.insert(original_col_index + 1, new_column_name) result = result[cols] ``` #### ?优化4:保持原始行顺序 ?**已完?* **需?*: 数据处理后,行顺序要保持与原Excel一? **修改**: ```python # 文件: extraction_service/operations/pivot.py (90-97? # Pivot后按原始顺序排序 original_order = result[index_column].drop_duplicates().tolist() order_map = {val: idx for idx, val in enumerate(original_order)} df_pivot['_sort_order'] = df_pivot[index_column].map(order_map) df_pivot = df_pivot.sort_values('_sort_order').drop(columns=['_sort_order']) ``` #### ?优化5:提示只显示?0??**已完?* **需?*: 用户担心数据处理时数据丢? **修改**: ```typescript // 文件: frontend-v2/src/modules/dc/pages/tool-c/index.tsx (256-264?