主题
WellChina 数据扩充策略
产品经理交付物 | AIS-94 | 2026-03-17
一、现状概述
状态更新 (2026-03-17): P0 和 P1 的城市/医院/手术扩展已完成。当前数据如下:
| 实体 | 当前数量 | 目标规模 | 状态 |
|---|---|---|---|
| 城市 | 13 | 25+ | P0+P1 完成 |
| 医院 | 101 | 150+ | P0+P1 完成 |
| 手术 | 50 | 30+ | 已超额完成 |
| 手术分类 | 12 | 12+ | 已完成 |
| 保险 | 5 | 10+ | P0 完成 |
| 科室 | 10 | 15+ | P0 完成 |
二、城市覆盖目标
2.1 城市分批规划
第一批(P0 — 立即执行):一线城市补全
已有 6 个城市,无需新增城市,但需要大幅补充医院数据。
| 城市 | Tier | 现有医院数 | 目标医院数 |
|---|---|---|---|
| 北京 | tier_1 | 3 | 15-20 |
| 上海 | tier_1 | 3 | 15-20 |
| 广州 | tier_1 | 1 | 8-12 |
| 深圳 | new_tier_1 | 1 | 6-10 |
| 成都 | new_tier_1 | 1 | 6-8 |
| 海南(博鳌) | tier_2 | 1 | 3-5 |
第二批(P1 — 2 周内):新一线城市扩展
| 城市 | Tier | 目标医院数 | 入选理由 |
|---|---|---|---|
| 杭州 | new_tier_1 | 6-8 | 浙大附属医院群、外籍人口多、数字化医疗领先 |
| 南京 | new_tier_1 | 5-8 | 鼓楼医院等顶级三甲、长三角枢纽 |
| 武汉 | new_tier_1 | 5-8 | 同济/协和双雄、中部医疗中心 |
| 重庆 | new_tier_1 | 4-6 | 西南医疗重镇、直辖市 |
| 西安 | new_tier_1 | 4-6 | 西北医疗中心、西京医院等 |
| 天津 | new_tier_1 | 4-6 | 环渤海、天津医科大附属体系 |
| 长沙 | new_tier_1 | 4-6 | 湘雅医院系统、中南医疗中心 |
第三批(P2 — 1 个月内):重要二线城市
| 城市 | Tier | 目标医院数 | 入选理由 |
|---|---|---|---|
| 青岛 | tier_2 | 3-5 | 外企聚集、国际化程度高 |
| 大连 | tier_2 | 3-4 | 日韩侨民多、东北医疗中心 |
| 苏州 | tier_2 | 3-5 | 外企密集、新加坡工业园区 |
| 厦门 | tier_2 | 3-4 | 台胞聚集、东南沿海旅游城市 |
| 沈阳 | tier_2 | 3-5 | 东北医疗中心、中国医科大附属 |
| 济南 | tier_2 | 3-4 | 山东医疗中心、齐鲁医院 |
| 昆明 | tier_2 | 3-4 | 东南亚跨境医疗需求 |
| 郑州 | tier_2 | 3-4 | 中原腹地、郑大一附院(全国床位最多) |
| 合肥 | tier_2 | 2-3 | 科大附属、中部新兴城市 |
| 福州 | tier_2 | 2-3 | 福建省会、侨乡 |
| 宁波 | tier_2 | 2-3 | 长三角经济强市 |
| 无锡 | tier_2 | 2-3 | 长三角、外企多 |
2.2 城市数据字段完整度标准
| 字段 | 优先级 | 说明 |
|---|---|---|
| nameEn / nameCn | 必填 | 中英文城市名 |
| slug | 必填 | URL slug |
| tier | 必填 | tier_1 / new_tier_1 / tier_2 |
| descriptionEn | 必填 | 200-500字城市医疗概况 |
| expatPopulation | 建议 | 外籍常住人口估算 |
| internationalAccessibility | 必填 | high/medium/low |
| transportationInfo | 建议 | JSON: 国际直飞航线数、高铁通达性 |
| coordinatesLat / coordinatesLng | 建议 | 地图功能预备 |
三、医院覆盖目标
3.1 总体目标
- 第一批(P0):现有 6 城市补充至 60-75 家医院
- 第二批(P1):新增 7 城市,新增 30-50 家医院
- 第三批(P2):新增 12 城市,新增 30-40 家医院
- 总计:120-165 家医院
3.2 医院筛选标准
按优先级排序:
- 复旦排名 Top 100 综合/专科(~50 家)— 全部入库
- 各城市 Top 3 公立三甲(按综合实力)— 确保每城市有覆盖
- JCI 认证医院(全国约 100+ 家)— 国际患者首选
- 知名中外合资/国际医院(和睦家、嘉会、百汇等连锁)— 英语服务有保障
- 有国际部的公立三甲(协和国际部、华山国际部等)— 服务外籍有经验
3.3 医院类型分布建议
每个一线城市目标分布:
| 类型 | 数量 | 说明 |
|---|---|---|
| public_tertiary_a | 5-8 | 复旦排名靠前的三甲 |
| public_tertiary_b | 3-5 | 区域重点三甲 |
| sino_foreign_jv | 2-3 | 和睦家/嘉会等 |
| private_premium | 2-3 | 高端私立(百汇等) |
| private_mid | 1-2 | 中端私立/专科 |
3.4 医院数据字段优先级
| 字段 | 优先级 | P0 必填 | 说明 |
|---|---|---|---|
| nameEn / nameCn | 必填 | ✅ | 中英文院名 |
| slug | 必填 | ✅ | URL slug |
| cityId | 必填 | ✅ | 所属城市 |
| type | 必填 | ✅ | 医院类型枚举 |
| englishServiceLevel | 必填 | ✅ | full/partial/none |
| hasInternationalDept | 必填 | ✅ | 是否有国际部 |
| jciAccredited | 必填 | ✅ | JCI 认证状态 |
| descriptionEn | 必填 | ✅ | 100-300 字英文介绍 |
| addressEn | 建议 | 英文地址 | |
| addressCn | 建议 | 中文地址 | |
| website | 建议 | 官网 | |
| internationalPhone | 可选 | 国际部电话 | |
| fudanRankings | 建议 | 复旦排名 JSON | |
| paymentMethods | 可选 | 支付方式 | |
| appointmentMethods | 可选 | 预约方式 | |
| coordinatesLat/Lng | 可选 | 地图坐标 | |
| imageUrl | 可选 | 后续批量补充 |
3.5 第一批重点医院名单(示例)
北京新增(12-17家):
- 北京大学第一医院
- 北京大学人民医院
- 北京大学第三医院(生殖医学领先)
- 中国人民解放军总医院(301医院)
- 中日友好医院(有国际部)
- 首都医科大学附属北京天坛医院(神经外科)
- 首都医科大学附属北京同仁医院(眼科)
- 首都医科大学附属北京朝阳医院
- 中国医学科学院肿瘤医院
- 阜外心血管病医院
- 北京和睦家医院(已有 United Family)
- 北京明德医院
- 北京嘉禾妇儿医院
上海新增(12-17家):
- 复旦大学附属华山医院(国际部)
- 复旦大学附属中山医院
- 上海交通大学医学院附属瑞金医院
- 上海交通大学医学院附属仁济医院
- 复旦大学附属肿瘤医院
- 复旦大学附属眼耳鼻喉科医院
- 上海市第一人民医院
- 上海市第六人民医院(骨科)
- 上海长海医院
- 上海德达医院(心脏专科)
- 百汇医疗上海
- 上海禾新医院
- 上海永远幸妇科医院
四、手术/价格覆盖目标
4.1 新增手术品类
现有 9 个分类下需补充的手术:
Dental(牙科)— 现有 1 项
- 新增:牙冠/牙桥(Dental Crown/Bridge)
- 新增:正畸(Orthodontics/Invisalign)
- 新增:全口种植(Full Mouth Implants)
Eye Care(眼科)— 现有 1 项
- 新增:ICL 晶体植入(ICL Implantation)
- 新增:白内障手术(Cataract Surgery)
- 新增:飞秒激光辅助(Femtosecond LASIK)
Health Checkup(体检)— 现有 1 项
- 新增:PET-CT 全身筛查
- 新增:心脏专项体检(Cardiac Screening)
Fertility(生殖)— 现有 1 项
- 新增:人工授精(IUI)
- 新增:冻卵(Egg Freezing)
- 新增:第三代试管婴儿(PGT/PGD)
Cancer Care(肿瘤)— 现有 1 项
- 新增:质子重离子治疗(Proton Therapy)
- 新增:靶向药物治疗(Targeted Therapy)
- 新增:免疫治疗(Immunotherapy — PD-1/PD-L1)
Orthopedics(骨科)— 现有 1 项
- 新增:膝关节置换(Total Knee Replacement)
- 新增:脊柱融合术(Spinal Fusion)
- 新增:关节镜手术(Arthroscopy)
Cardiac Care(心脏)— 现有 1 项(CABG)
- 新增:心脏支架/PCI(Coronary Stenting)
- 新增:心脏瓣膜置换(Heart Valve Replacement)
- 新增:射频消融术(Radiofrequency Ablation)
TCM(中医)— 现有 1 项
- 新增:针灸疗程(Acupuncture Course)
- 新增:中医康复(TCM Rehabilitation)
Cosmetic(医美)— 现有 0 项
- 新增:双眼皮手术(Double Eyelid Surgery)
- 新增:鼻综合整形(Rhinoplasty)
- 新增:面部提升(Facelift)
- 新增:吸脂(Liposuction)
新增手术分类建议
| 分类 | Icon | 代表手术 |
|---|---|---|
| Neurosurgery(神经外科) | Brain | 脑肿瘤切除、DBS 深脑刺激 |
| Organ Transplant(器官移植) | Activity | 肝移植、肾移植 |
| Bariatric Surgery(减重手术) | Scale | 胃袖状切除、胃旁路 |
4.2 价格数据策略
颗粒度:采用价格区间(min/max),不追求精确值。
| 数据层级 | 说明 | 优先级 |
|---|---|---|
| Procedure 级别 | 全国参考价格区间 | 必填 |
| HospitalProcedure 级别 | 医院特定价格区间 | 建议(Top 30 医院必填) |
| priceUsComparison | 美国同类手术价格 | 必填 |
| savingsPct | 节省百分比 | 必填(自动计算即可) |
中美价格对比数据来源建议:
| 来源 | 用途 | 可靠度 |
|---|---|---|
| 各省医保局公示价格 | 中国公立医院定价参考 | 高 |
| 好大夫在线 / 丁香园 | 患者实际花费参考 | 中 |
| Medicare Fee Schedule (CMS.gov) | 美国价格基准 | 高 |
| FAIR Health Consumer | 美国自费价格参考 | 高 |
| Medical Tourism Association 报告 | 国际医疗旅游价格对比 | 中 |
| 各医院国际部官网公示 | 外籍患者实际定价 | 高 |
五、数据录入方式建议
5.1 方案对比
| 方式 | 适用场景 | 优点 | 缺点 |
|---|---|---|---|
| Seed 文件扩展 | 第一批大规模录入 | 版本可控、可 review、幂等 | 数据量大时文件冗长 |
| Admin 后台 | 日常增补和修改 | 非技术人员可用 | 批量操作效率低 |
| CSV 批量导入 | 大批量结构化数据 | 效率最高 | 需要开发导入功能 |
5.2 推荐方案:分阶段混合
Phase 1(P0,本周):扩展 Seed 文件
- 将第一批 60-75 家医院数据写入
prisma/seed.ts - 优点:工程师可以 code review 数据质量,与代码一起版本管理
- 拆分 seed 文件:
seed-cities.ts、seed-hospitals.ts、seed-procedures.ts等模块化
Phase 2(P1,下周):开发 CSV 批量导入
- 开发
POST /api/admin/import端点 - 支持 CSV 上传:城市、医院、手术三类模板
- 添加数据校验:slug 唯一性、外键存在性、枚举值合法性
- 导入前预览 + 确认机制
Phase 3(持续):Admin 后台日常维护
- 现有 Admin 已支持医院/手术/保险 CRUD
- 需补充:城市 CRUD、科室 CRUD、分类 CRUD、HospitalProcedure 管理
- 需补充:数据导出功能(CSV/JSON)
5.3 数据验证和质量控制
| 环节 | 措施 |
|---|---|
| 录入前 | CSV 模板强制字段标注、枚举值下拉选择 |
| 录入时 | Zod schema 校验、slug 自动生成、重复检测 |
| 录入后 | 数据完整度报告(缺失字段统计)、定期复核 |
| 持续 | 标记 verifiedAt 时间戳,过期数据提醒(> 6 个月未验证) |
5.4 工程分工建议
| 任务 | 负责人 | 说明 |
|---|---|---|
| Seed 文件扩展(城市+医院数据) | 工程师 A | 数据整理 + seed 代码编写 |
| 新增手术数据 | 工程师 A | 与医院数据同步 |
| CSV 导入功能开发 | 工程师 B | API + 前端上传界面 |
| Admin 后台补全(城市/科室 CRUD) | 工程师 B | 扩展现有 admin 模块 |
| 数据校验 + 完整度报告 | 工程师 A | Script 或 admin dashboard |
六、阶段规划总览
第一阶段(P0)— 本周
目标:现有城市医院数据从 10 → 60-75 家
| 任务 | 预期产出 |
|---|---|
| 北京新增 12-17 家医院 | 含全部复旦 Top 100 北京医院 |
| 上海新增 12-17 家医院 | 含全部复旦 Top 100 上海医院 |
| 广州新增 7-11 家医院 | 中山/南方/广医系列 |
| 深圳新增 5-9 家医院 | 港大深圳补充、北大深圳 |
| 成都新增 5-7 家医院 | 华西系列补充 |
| 海南新增 2-4 家医院 | 博鳌周边补充 |
| 新增 15+ 手术品类 | 覆盖所有 9 个分类 |
| 补充 HospitalProcedure 关联 | Top 30 医院 × 核心手术 |
第二阶段(P1)— 2 周内
目标:新增 7 个新一线城市,总医院数 → 100-125 家
| 任务 | 预期产出 |
|---|---|
| 新增杭州/南京/武汉/重庆/西安/天津/长沙 | 7 城市完整数据 |
| 每城市 4-8 家医院 | 30-50 家新医院 |
| CSV 批量导入功能上线 | 提升后续录入效率 |
| 新增 3 个手术分类 | 神经外科/器官移植/减重 |
第三阶段(P2)— 1 个月内
目标:新增 12 个二线城市,总医院数 → 150+
| 任务 | 预期产出 |
|---|---|
| 新增 12 个二线城市 | 完整城市数据 |
| 每城市 2-5 家医院 | 30-40 家新医院 |
| 保险覆盖扩充 | 新增 5+ 保险公司 |
| 数据完整度报告 | 缺失字段补全 |
| Admin 后台补全 | 城市/科室/关联管理 |
七、架构影响评估
现有系统影响
| 模块 | 影响程度 | 说明 |
|---|---|---|
| Prisma Schema | 无需改动 | 现有模型已足够支撑扩展 |
| Seed 文件 | 重大改动 | 需要模块化拆分,数据量增大 10 倍 |
| Admin 后台 | 中等改动 | 需补充城市/科室 CRUD 和批量导入 |
| 前端列表页 | 小改动 | 数据量增大后需要分页和筛选优化 |
| 搜索功能 | 需关注 | 150+ 医院需要搜索功能支撑发现 |
| 数据库性能 | 无影响 | 数百条记录级别,无性能压力 |
无需新增组件
现有数据模型设计合理,所有枚举值、关系模型均已覆盖扩展需求。主要工作量在数据整理和录入,而非系统开发。
八、风险与注意事项
- 数据准确性:医院信息(尤其是价格、JCI 状态)需要定期验证,建议利用
verifiedAt字段跟踪 - 英文描述质量:面向外籍用户,医院英文描述需要专业且准确
- 价格波动:中国医疗服务价格受政策影响大(如集采),需注明"仅供参考"
- 合规:价格数据不构成医疗报价,需要免责声明
- 数据来源:优先使用官方公开数据,避免版权风险