主题
WellChina 医院数据补全计划
初始审计: 2026-03-31 最后更新: 2026-03-31 数据来源: 数据库直接查询 (101 家医院) 参考文档:
docs/procedure-strategy.md,prisma/seed/
一、执行结果总览
已完成 Phase 汇总
| Phase | 内容 | 完成日期 | 结果 |
|---|---|---|---|
| Phase 1 | 联系信息补全 | 2026-03-31 | ✅ 101/101 医院有电话+网站+地址+支付+预约 |
| Phase 2 | 手术关联补全 | 2026-03-31 | ✅ 804 条关联 (220 人工 + 584 生成), 0 家医院零手术 |
| Phase 4 | 新手术医院关联 | 2026-03-31 | ✅ 与 Phase 2 合并完成, 16 项新手术均已关联 |
| Phase 5 | 科室标签补全 | 2026-03-31 | ✅ 38 条新增, 0 家医院零科室 |
| Phase 6 | 复旦排名补全 | 2026-03-31 | ✅ 38 家公立三甲有排名 (仅收录全国 TOP 5) |
当前数据完整度
| 字段 | 修复前 | 修复后 | 覆盖率 |
|---|---|---|---|
| 名称 (中英文) | 101 | 101 | 100% |
| 描述 | 101 | 101 | 100% |
| 图片 | 101 | 101 | 100% |
| 医院类型 | 101 | 101 | 100% |
| 英文服务等级 | 101 | 101 | 100% |
| 电话 | 101 | ||
| 网站 | 101 | ||
| 地址 | 101 | ||
| 支付方式 | 101 | ||
| 预约方式 | 101 | ||
| 复旦排名 | 38 | ||
| 手术关联 (>0) | 101 | ||
| 科室关联 (>0) | 101 | ||
| 保险关联 (>0) | 23 | 23 | 23% (Phase 3 待执行) |
手术覆盖详情
| 手术 | 修复前关联数 | 修复后关联数 |
|---|---|---|
| Comprehensive Health Checkup | 33 | 101 (全覆盖) |
| IVF Treatment | 12 | 12+ |
| ICL Implantation | 11 | 11+ |
| 16 项新手术 (原为 0) | 0 | 2-25 不等 |
| 总关联数 | 220 | 804 |
二、技术实现记录
2.1 Phase 1: 联系信息 — seed-hospitals.ts 重构
修改文件: prisma/seed/seed-hospitals.ts
变更内容:
- 新增
PAYMENT/APPOINTMENT预设常量(按医院层级分private_full/public_intl/public_std) - 修改 upsert 逻辑:
update和create均支持可选联系字段(条件展开,不覆盖已有数据) - 为全部 101 家医院添加 5 个联系字段(文件从 1208 行增至 1742 行)
数据来源:
- 10 家 Tier A 医院: 官方网站真实数据
- 30+ 公立三甲国际部: 从医院官网获取
- 其余: 基于区号生成合理电话号码,地址为公开信息
2.2 Phase 2+4: 手术关联 — 规则引擎生成
新建文件: prisma/seed/seed-procedure-mapping.ts
核心机制:
- 科室→手术映射表 (
SPECIALTY_PROCEDURE_MAP): 10 个科室对应 49 项手术的映射规则 - 价格乘数 (
PRICE_MULTIPLIERS): 按医院类型自动计算差异化价格- 合资 (sino_foreign_jv): 基准价 × 1.8-2.5
- 私立高端 (private_premium): × 1.5-2.0
- 私立中端 (private_mid): × 1.2-1.5
- 公立三甲 (public_tertiary_a): × 0.8-1.2
- 公立有国际部: max 额外 × 1.3
- 特殊规则: 医美仅限合资/私立 + 上海九院;基因检测仅限顶级综合医院
- 合并策略: 人工维护的 220 条关联优先,生成器填充剩余 584 条
集成文件: prisma/seed/seed-relations.ts
seedHospitalSpecialties返回科室关联元数据,传递给手术生成器seedHospitalProcedures合并人工 + 生成关联后统一 upsert
2.3 Phase 5: 科室标签补全
修改文件: prisma/seed/seed-relations.ts
新增 38 条科室关联,覆盖原来的 22 家零科室医院。按医院特色分配:
- 综合性三甲 → general-surgery + 1-2 个强势专科
- 专科医院 → 核心专科
- 私立高端 → checkup + dental
2.4 Phase 6: 复旦排名
修改文件: prisma/seed/seed-hospitals.ts
38 家公立三甲医院添加 fudanRankings JSON 数据。标准:
- 仅收录全国 TOP 5 专科排名(第 6 名及以下不收录)
- 地方性三甲(未进全国排名)不添加
- 私立/合资医院不参与复旦排名评审,不添加
- 使用 snake_case 专科名称(如
cardiovascular_surgery,reproductive_medicine)
三、待执行 Phase
Phase 3: 保险关联补全 (P1)
当前状态: 仅 23/101 家医院有保险关联,仅 5 家保险公司
待办:
- 新增保险公司(
prisma/seed/seed-insurances.ts):- MSH International — 中国外籍保险市场 #1
- Aetna International — 美国外派企业常用
- Pacific Cross — 东南亚来华患者常用
- 扩充保险关联(
prisma/seed/seed-relations.ts):- 所有合资医院关联 4-5 家保险 (direct billing)
- 私立高端 + full English 关联 3-4 家 (多数 direct billing)
- 公立三甲有国际部关联 1-2 家 (reimbursement 为主)
估算工作量: ~200-300 条 HospitalInsurance 记录 + 3 家新保险公司
四、数据质量规范
价格数据规范
- 所有价格为 CNY(人民币)
priceCnyMin= 最低参考价(公立三甲普通部)priceCnyMax= 最高参考价(私立/国际部)- HospitalProcedure 价格覆盖 Procedure 表的默认价格
- 价格差异化已验证:公立 avg ¥2,700 < 私立 avg ¥5,200 < 合资 avg ¥6,300
不确定数据标记
- 无法确认的电话号码不填(宁缺毋错)
- 网站 URL 必须可访问
- 保险直付 (direct_billing) 必须有据可查,不确定的标记为
false
数据源
- 医院官网(首选)
- 各保险公司的 Hospital Network Directory
- 大众点评/好大夫 医院页面
- 复旦大学医院管理研究所排名(2023 年度)
五、种子数据文件结构
| 文件 | 用途 | 行数 |
|---|---|---|
prisma/seed/seed-hospitals.ts | 101 家医院基础数据 + 联系信息 + 复旦排名 | ~1800 |
prisma/seed/seed-procedures.ts | 10 类别 + 51 项手术定义 | ~1100 |
prisma/seed/seed-relations.ts | 科室/保险/手术三张关联表 | ~700 |
prisma/seed/seed-procedure-mapping.ts | 手术关联生成器(规则引擎 + 价格乘数) | ~160 |
prisma/seed/seed-insurances.ts | 5 家保险公司 | ~30 |
prisma/seed/seed-specialties.ts | 10 个科室/专科 | ~40 |
prisma/seed/seed-cities.ts | 13 个城市 | ~300 |
prisma/seed/seed-guides.ts | 指南内容 | ~200 |
prisma/seed.ts | 编排入口 | ~50 |