主题
WellChina GEO GuideBook
版本: v1.0 · 发布: 2026-04-23 · 下次审阅: 2026-07-23
面向 WellChina 团队的 Generative Engine Optimization(GEO)执行手册:如何让 ChatGPT、Perplexity、Google AI Overviews、Claude、Gemini、Bing Copilot、Apple Intelligence 以及日韩俄四国本土 AI 引擎在回答「外国人去中国看病」相关问题时,稳定引用 wellchina.top 的内容。
目录
- TL;DR
- §1 GEO 基础原理
- §2 AI 引擎 Landscape 矩阵
- §3 技术实现
- §4 内容策略
- §5 潜规则与坑位
- §6 测量体系
- §7 引擎专项 Playbook
- §8 Skill Gap 分析
- §9 90 天路线图(落地版本 → 见执行计划)
- §10 WellChina 专属陷阱
- §11 关键事实基础(影响策略权重)
- §12 三轨并行执行模型 + Critical Path
- §13 预算与 ROI 模型
- 附录 A:AI User-Agent 全表
- 附录 B:术语表
- 附录 C:参考资料
TL;DR
WellChina 是 YMYL(Your Money Your Life)医疗 + 多语(8 语言)+ 跨境(中国信息源→海外读者)三重复杂场景的结合体,GEO 而非 SEO 是获客主渠道。70%+ 的目标用户会先问 ChatGPT/Perplexity/Google AI Overviews「best hospital in China for foreigners / 外国人在中国看病哪里好」,而不是打开 google.com 翻 10 条蓝链。
GEO 的核心和 SEO 不同:我们不是在优化给 Google 蓝链排名的内容,而是在优化让 LLM 在生成答案时愿意把我们作为引用源(citation)。这意味着结构化数据、实体建设、"list-worthy" 内容格式、跨站权威信号比传统关键字布局更重要。
2026 Q2 五个最高杠杆优先级(按 90 天路线图顺序):
- 打好 llms.txt + robots.txt + 完整 Schema.org JSON-LD 三件套(Week 1-2)——即便 llms.txt 在 2026 官方 AI 公司尚未背书,低成本 future-proof,JSON-LD 是所有 AI 引擎可解析的硬通货。
- Wikidata / Wikipedia 建立 "WellChina" + 我们索引的前 30 家医院 entity(Week 2-4)——实体层是 LLM 消歧的第一来源。
- 单语言单类别试点(Week 3-4):先做
en+ Dental Tourism 一个垂直,验证 Prompt Target Table 测量方法再扩。 - Vercel Log Drains + AI Bot UA 监控(Week 5-6)——crawled ≠ cited,但没 crawl 一定没 cite;先把 "bot 有没有来" 这件事量化。
- T1 引擎手动 Prompt Target Table(8 语言 × 7 引擎 × 10 查询)每月 1 次——在 Profound/Otterly 这类 SaaS 值得买之前,每月 3-4 小时人工测就够。
不要做的事:不要在 GSC MCP 接上之前批量生产内容;不要试图在百度/腾讯元宝系引擎获得可见度(它们既不服务海外用户,也对外国站点极不友好);不要把 zh locale 当作中国大陆 SEO 来打(我们不服务大陆用户)。
§1 GEO 基础原理
1.1 什么是 GEO
GEO(Generative Engine Optimization)是一套让内容更容易被生成式 AI 引擎引用的技术与内容实践。它的目标不是在 SERP 第 1 位,而是出现在 ChatGPT 的答案、Perplexity 的 citation、Google AI Overviews 的蓝框、Gemini 的侧边引用里。
GEO 和 SEO 的关系不是替代,而是叠加:技术 SEO(抓取、索引、hreflang、schema)是 GEO 的地基;内容层面 GEO 的要求更严——不仅要排名,还要被 LLM 判定为"值得复述(list-worthy)"的信息源。
1.2 LLM 如何引用:Retrieve → Rerank → Generate
现代 AI 搜索引擎(ChatGPT Search、Perplexity、AI Overviews、Gemini)几乎都走同一条 RAG(Retrieval Augmented Generation)管线:
渲染中…
三个阶段各自的优化点:
- Retrieve(召回):靠传统 SEO——被索引、hreflang 正确、sitemap 干净、有机排名前 20 才有机会进候选池。这里 GPTBot、ClaudeBot、PerplexityBot、OAI-SearchBot 等 AI 爬虫是否能读到我们,决定了我们有没有入场券。
- Rerank(重排):权威信号、E-E-A-T、实体匹配、schema 结构化数据、内容 freshness 在这一层起决定性作用。这是 GEO 和 SEO 分野的核心战场。
- Generate(生成):能不能被实际引用取决于内容格式——LLM 偏爱可以直接复述成一句话、一张表、一个数字事实的段落。这就是"list-worthy" 内容的本质。
1.3 GEO 对医疗旅游为何比 SEO 更重要
WellChina 的业务特征让 GEO 权重远超普通电商:
- 客单价高、决策周期长:用户不会因为一条广告就飞 8000 公里做牙科种植。他们会查 20-40 个信息源,其中大部分通过 AI 助手快速汇总。一次被 ChatGPT 引用 = 几十次传统 SEO 展现。
- 多语市场 SERP 稀薄:en/ja/ko/ru/vi/id/th 这些语种的"中国医疗旅游"主题 SERP 竞争少,但权威性要求高。LLM 在低供给语料场景下尤其依赖结构化数据和官方实体信号。
- YMYL 领域 trust 信号必须前置:用户问 AI"去上海做试管婴儿安全吗",如果我们没有医生资质 + 医院 licensing + 出版日期 + 可追溯的价格来源,LLM 会优先引用梅奥诊所/世卫/政府源,把我们跳过。
1.4 2026 Google Quality Rater Guidelines(QRG)视角下的 E-E-A-T
Google 2025-09 更新的 QRG 对 YMYL 健康类站点要求:
| QRG 维度 | 基本要求 | WellChina 的命中方式 |
|---|---|---|
| Experience(亲历) | 作者/网站展示一手经验 | 聚合真实患者 review(匿名但有时间戳)、医院实地照片、结账小票匿名化样本 |
| Expertise(专业) | 作者有医疗资质 OR 内容有医疗审校 | 每篇手术内容挂「Medically reviewed by Dr. X, DDS, 上海 XX 口腔医院, 2026-MM-DD」 |
| Authoritativeness(权威) | 站点被行业引用 | Wikidata entity、被 Wikipedia 引用、被医疗旅游行业媒体引用、与 JCI 认证数据库互联 |
| Trustworthiness(可信) | 透明度高、无欺骗 | 价格页说明汇率时点、手术有 disclaimer、联系方式真实、隐私政策 + cookie 合规 |
QRG 明确说 T(Trust)是最根 ——哪怕 EEA 都齐,T 不足会直接判 Lowest Quality。LLM 在训练时会 internalize 这套启发式,因此 GEO 层面同样适用:"medical disclaimer + 作者资质 + 出版/更新日期" 是 YMYL 站的三件套。
§2 AI 引擎 Landscape 矩阵
2.0 2026 医疗内容政策里程碑(本节新增 · 2026-04-24)
主要 AI 公司在 2025-10 → 2026-03 的半年间连续发布医疗特定政策,GEO 战场的规则已显著收紧:
| 时点 | 公司 | 动作 | GEO 含义 |
|---|---|---|---|
| 2025-10-29 | OpenAI | Usage Policies 禁止 tailored 医疗建议 | ChatGPT 不直接答 → 第三方权威源 citation 需求↑ |
| 2026-01 | OpenAI | 发布 ChatGPT Health(加密隔离 + 不训练) | 垂直 walled garden + 通用 web 仍走 OAI-SearchBot |
| 2026-01-11 | Anthropic | 发布 Claude for Healthcare + HIPAA infra | Claude.ai Search 对医疗源筛选更严 |
| 2026-01-27 | Gemini 3 成为 AIO 全球默认模型("YMYL protections with elevated scrutiny for healthcare") | 医疗 AIO 触发率 44.1%(2× 平均) | |
| 2026-03 | Perplexity | 发布 Perplexity Health + Apple Health 集成 | Health Advisory Board + 50%<1y freshness 硬门槛 |
Anthropic AUP 长期条款(虽非 2026 新):明文要求医疗内容 "qualified professional must review" → 与 WellChina reviewedBy schema 一对一对应。
对 WellChina 战略意义:
- AI 引擎医疗 guardrail 越严 → 它们越不敢自己答 → 越要引用第三方权威源。这是机会。
- 医疗 AIO 触发率 2× 平均 = 医疗 GEO 的 ROI 远高于其他品类。
- Perplexity freshness 50%<1y 是硬门槛——年度 refresh 不做,2027 基本进不了 Perplexity citation 池。
- Google 因 AIO 错误率被 Guardian 批评后已下架部分高风险医疗 query 的 AIO → 对第三方源权威性要求提高。
- ChatGPT Health / Claude for Healthcare / Perplexity Health 是 walled garden → 通用健康 chat 的第三方需求↓,但 "medical tourism to China" 这种垂直信息 citation 需求仍高——WellChina 的差异化机会在这里。
详细 YMYL 对照见 YMYL Landscape §1.6 + YMYL Enforcement §8。
WellChina 面对的 AI 引擎分四档。T1 必覆盖、T2 语言特异性投入、T3 diaspora 兼顾、Skip 明确放弃。
2.1 Tier 1 —— 必覆盖(全 8 语言)
这些引擎服务于我们所有 8 个目标市场,优先级最高。
| 引擎 | 主力 UA | 是否显示引用链接 | 语言覆盖 | WellChina 优先级 |
|---|---|---|---|---|
| ChatGPT Search (OpenAI) | OAI-SearchBot/1.0 + ChatGPT-User/1.0 | 是(cards + hyperlink) | 8/8 全支持 | T1-A |
| Perplexity | PerplexityBot/1.0 + Perplexity-User/1.0 | 是(最显眼,编号 citation) | 8/8 全支持 | T1-A |
| Google AI Overviews | Google-Extended(opt-out)+ Googlebot | 是(小卡片) | 8/8 全支持 | T1-A |
| Claude.ai Search | ClaudeBot + Claude-SearchBot | 是(chat-side citation) | 8/8 全支持 | T1-B |
| Gemini(含 Gemini in Chrome) | Googlebot + Google-Extended | 部分(展开时显示) | 8/8 全支持 | T1-B |
| Bing Copilot / Copilot Search | bingbot + MicrosoftCopilotBot | 是 | 8/8 全支持 | T1-B |
| Apple Intelligence(iOS 18.2+ 中转至 ChatGPT/Google) | 借上游 UA | 取决于路由 | 8/8 全支持 | T1-C |
说明:
- T1-A 是 WellChina 必须本周就上 GEO 预算的三家(市场份额 + 引用透明度最高)。
- OpenAI 的
OAI-SearchBot和ChatGPT-User是独立于GPTBot(训练爬虫)的——允许搜索爬虫即可获得 ChatGPT Search 可见度,不必授权训练数据使用。这是最推荐的 robots.txt 配置。 - Anthropic 的
Claude-SearchBot同样可独立于ClaudeBot控制。 Google-Extended是 Google 对 Gemini 训练数据的 opt-out token;AI Overviews 使用普通 Googlebot 的 index,因此不要 disallow Googlebot 来试图"退出 AI Overviews"——会把蓝链也一起丢掉。- Apple Intelligence 在 2026 本身不爬网,它在用户触发时把查询转给 ChatGPT 或 Google(用户账户绑定);所以它的可见度 ≈ 你在 ChatGPT Search 和 Google AI Overviews 的可见度之和。
2.2 Tier 2 —— 语言特异性(高 ROI)
这些引擎只在特定语言市场有份额,但在该市场份额可能超过 Tier 1。
| 引擎 | 所在市场 | 2026 状态 | 覆盖 locale | WellChina 优先级 |
|---|---|---|---|---|
| Naver Cue: / Naver "AI Tab" | 韩国 | Naver 2026 Q1 韩国市场 64.39%,Cue: 是其生成式 AI 答题服务;"AI Tab" 在 Q2 上线 | ko | T2-A |
| Kakao Kanana Search | 韩国(KakaoTalk 内) | 2026 替代 KakaoTalk 内"#Shop Search",基于自研 Kanana LLM | ko | T2-B |
| Yandex Neuro / Alice | 俄语圈 | Yandex 搜索在 RU/BY/KZ 市场份额 ~60%,Neuro 是生成式答题 | ru | T2-A |
| GigaChat(Sberbank) | 俄语圈 | B2C 独立 app + Yandex 内置 | ru | T2-C(低频使用,但政府背景 = 高可信度信号) |
| Line AI / Sakana 系 | 日本 | Line 聊天内 AI 助手、NTT/Sakana 的日语 LLM 托管服务;日本仍以 Google/ChatGPT 为主 | ja | T2-C(日本用户主流仍是 ChatGPT/Google,Line 只是次要) |
说明:
- 韩国是最需要本土 GEO 的市场:Naver 生态相对封闭,Cue: 主要从 Naver blog/Naver Place/官方数据库拉数据。WellChina 进入 ko 市场必须:(1) 被 Naver 索引;(2) 申请 Naver Webmaster + 已做的 Naver verification;(3) 考虑是否建 Naver Blog/Post 作为 seeding 内容。
- 俄语市场 Yandex 对"境外站点"有天然警惕。我们需要提前做 Yandex Webmaster(已做)+ sitemap 提交 + 俄语内容独立可读性检查(不要让俄语页面明显像机器翻译)。
- 越南、印尼、泰国、台湾/香港 diaspora 目前没有成规模的本土 AI 引擎,ChatGPT + Google AI Overviews 在这些市场就是主流。所以 vi/id/th/zh 四语不需要 T2 的额外投入,只要 T1 做好。
2.3 Tier 3 —— diaspora 兼顾
面向"海外华人读中文内容"场景,不服务中国大陆用户。
| 引擎 | 覆盖范围 | WellChina 立场 |
|---|---|---|
| Doubao(字节) | 主要大陆;海外华人 app 内偶用 | T3——不主动优化,不阻止索引 |
| Kimi(月之暗面) | 主要大陆 | T3——同上 |
| DeepSeek Chat | 全球技术用户群、海外华人 | T3——同上 |
| Qwen Chat(通义) | 大陆+部分海外华人 | T3——同上 |
策略:允许爬虫(不在 robots.txt 里 disallow),但不投入专门 GEO 预算。我们的 zh locale 已经面向繁简读者做了 E-E-A-T,这些引擎在抓取中文页面时会自然受益。
2.4 Skip —— 明确放弃
| 引擎 | 原因 |
|---|---|
| Baidu ERNIE / 文心一言 | 只服务大陆,WellChina 不服务大陆用户 |
| Tencent 元宝 / Hunyuan | 同上 |
| Baidu 搜索 | 不在 8 语言策略内 |
| 360 搜索 / Sogou | 同上 |
不要为这些引擎建 ICP 备案、不要为它们做中国大陆服务器部署、不要为它们创建微信/公众号 seeding 内容。一旦做了,就等于宣告我们服务大陆——触碰监管红线(跨境医疗中介在大陆需持有医疗广告许可证 + 医疗机构转介资质,我们目前的合规架构不覆盖这一块)。详见 §10。
2.5 一张图总结
渲染中…
§3 技术实现
3.1 llms.txt —— 2026 年现状
事实基线:截至 2026 Q1,llms.txt 采纳率 5-15%(SE Ranking 30 万域名样本测得 10.13%)。OpenAI、Anthropic、Google、Meta、Mistral 均未公开宣布把 llms.txt 作为检索系统的活跃输入信号。8/9 案例研究显示实施后无可测量流量变化,引用内容里 llms.txt 出现率 < 1%。
2026-04-24 勘误补充:Google 的 John Mueller 2025 公开声明 "No AI system currently uses llms.txt"(aeo.press / LinkBuildingHQ 多源核实)。Anthropic、Stripe、Zapier、Cloudflare 等技术公司自己发布了 llms.txt 文件,但这只是单边发布,不代表任何 AI 检索系统会读它。
团队对话纪律:在内部讨论中不要说"做了 llms.txt 应该会带来 ChatGPT/Perplexity 流量"——这是误导。它纯粹是低成本 future-proof,零短期回报。
WellChina 立场:低成本做,不抱期望。它不是 2026 的 ranking 信号,但写起来只需 1 小时,是一种 future-proof 的布局。放在 /public/llms.txt,由 Next.js 静态服务。
文件格式(社区约定,类似 robots.txt + sitemap 的混合):
markdown
# WellChina
> Medical tourism platform connecting foreign patients with top Chinese hospitals.
> 8 languages: en, zh (overseas diaspora), ja, ko, ru, id, vi, th.
> NOT targeting mainland China users.
## Core Pages
- [Hospitals directory](https://wellchina.top/hospitals): 100+ JCI-accredited and top-tier hospitals across 10 Chinese cities
- [Procedures](https://wellchina.top/procedures): 51 procedures across 10 categories with transparent pricing
- [Pricing comparison](https://wellchina.top/pricing): Price comparison across 10 countries with live exchange rates
- [City guides](https://wellchina.top/cities): Medical travel guides for Shanghai, Beijing, Chengdu, and more
## Guides
- [Visa guide](https://wellchina.top/guides/visa)
- [Payment & insurance](https://wellchina.top/guides/payment)
- [Before & after care](https://wellchina.top/guides/aftercare)
## Policies
- Editorial: all medical content reviewed by licensed physicians
- Privacy: https://wellchina.top/privacy
- Contact: https://wellchina.top/contact3.2 robots.txt —— AI 爬虫分类处置
推荐策略(见附录 A 完整 UA 表):
txt
# Allow all search crawlers (lets us appear in ChatGPT Search, Claude Search, Perplexity)
User-agent: OAI-SearchBot
Allow: /
User-agent: ChatGPT-User
Allow: /
User-agent: Claude-SearchBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: Perplexity-User
Allow: /
# Allow training crawlers by default (we WANT our brand in the training data)
User-agent: GPTBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: Google-Extended
Allow: /
# Standard search + admin block
User-agent: *
Allow: /
Disallow: /admin/
Disallow: /api/
Sitemap: https://wellchina.top/sitemap.xml关键决策:WellChina 选择完全允许 AI 爬虫,包括训练爬虫(GPTBot/ClaudeBot/anthropic-ai)。原因:我们刚启动、品牌从 0 开始,让 LLM 训练时就认识 wellchina.top 是更高杠杆的布局,比"担心内容被 AI 用于训练"更重要。这个决策对创作者导向站点(新闻、付费内容)相反。
3.3 Schema.org JSON-LD —— 硬通货
所有 AI 引擎都能解析 JSON-LD。WellChina 需要的核心 schema 类型:
- 医院页:
MedicalClinic(+MedicalOrganization混合 +accreditation) - 手术页:
MedicalProcedure(+Offer价格信息) - 医生页:
Physician+hasCredential - 城市页:
TouristDestination+FAQPage - 指南页:
HowTo+MedicalWebPage
一个完整的医院页 JSON-LD 示例(挂在 /hospitals/[slug]):
html
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": ["MedicalClinic", "MedicalOrganization"],
"@id": "https://wellchina.top/hospitals/shanghai-east#org",
"name": "Shanghai East International Medical Center",
"alternateName": "上海东方国际医疗中心",
"url": "https://wellchina.top/hospitals/shanghai-east",
"logo": "https://wellchina.top/logos/shanghai-east.png",
"image": "https://wellchina.top/hospitals/shanghai-east/hero.jpg",
"address": {
"@type": "PostalAddress",
"streetAddress": "551 Pudong South Road",
"addressLocality": "Shanghai",
"addressRegion": "Shanghai",
"postalCode": "200120",
"addressCountry": "CN"
},
"geo": {
"@type": "GeoCoordinates",
"latitude": 31.2304,
"longitude": 121.4737
},
"telephone": "+86-21-xxxx-xxxx",
"medicalSpecialty": [
"https://schema.org/Dentistry",
"https://schema.org/Oncologic",
"https://schema.org/Cardiovascular"
],
"availableService": [
{
"@type": "MedicalProcedure",
"name": "Dental Implant (All-on-4)",
"@id": "https://wellchina.top/procedures/dental-implant-all-on-4"
}
],
"hasCredential": [
{
"@type": "EducationalOccupationalCredential",
"credentialCategory": "accreditation",
"name": "Joint Commission International (JCI)",
"recognizedBy": {
"@type": "Organization",
"name": "Joint Commission International",
"url": "https://www.jointcommissioninternational.org/"
},
"validFor": "P3Y",
"dateCreated": "2023-06-15"
}
],
"isAcceptingNewPatients": true,
"paymentAccepted": ["Cash", "Credit Card", "Alipay", "WeChat Pay", "International Insurance"],
"currenciesAccepted": ["CNY", "USD", "EUR"],
"aggregateRating": {
"@type": "AggregateRating",
"ratingValue": "4.7",
"reviewCount": "234"
},
"sameAs": [
"https://www.wikidata.org/wiki/Q123456789",
"https://en.wikipedia.org/wiki/Shanghai_East_International_Medical_Center"
]
}
</script>三个关键细节:
@id使用 URL + fragment(#org),让 LLM 可以稳定 dedupe 同一实体。hasCredential的recognizedBy把 JCI 这种外部权威做进 schema——LLM 在 rerank 时会加权。sameAs链到 Wikidata / Wikipedia / 政府 registry 是实体建设最便宜的手段。
3.4 LLM 偏好的 HTML 模式
LLM 在 extract 网页时偏好:
<h1>→<h2>→<h3>严格层级,不跳级- 短段落:观察实证 AI Overviews 偏好 每段 40-80 英文单词(中文 60-120 字)。社区常引的 "134-167 字符" 数据来源不清晰且多指的是 meta description,此处不采用。核心原则:一段一个事实,可独立被复述。
<table>数据表 +<caption>:AI 引擎对真正的 table(而非 div-grid 模拟)提取率 > 90%<ul>/<ol>清单:3-10 项最佳,超过 10 项 LLM 只提取前 5 条- 粗体关键数字:LLM 倾向复述
<strong>高亮的价格/百分比/时长
3.5 实体建设:Wikidata + Wikipedia
LLM 在消歧"哪家医院叫 Shanghai East"时,第一优先级查询 Wikidata。WellChina 的实体建设 5 步:
- 在 Wikidata 为 WellChina 建 entity(Q-number):描述 = "medical tourism platform"、instance of = "website"、country = "China"。
- 为我们详细页索引的 top 30 家医院在 Wikidata 建 entity(没有则创建,有则补字段):特别补充 "JCI accreditation date"、"number of beds"、"specialties" 等结构化 claim。
- 在英文 Wikipedia 相关文章引用 WellChina 作为 reference:需谨慎,只在真的 primary source 的场景(例如某医院的价格数据我们是第一个公开整理的)——违反 WP:RS/WP:SPAM 会被永 ban。
- Wikipedia 在 ja/ko/ru 版本补充本地化 entity:这是打入 Tier 2 引擎本地化回答的最高杠杆动作。
- Google Knowledge Graph 需要等 Wikidata entity 被 Google ingest(一般 2-8 周)。
3.6 8 语言 hreflang 矩阵
next-intl 的 localePrefix: 'as-needed' 导致 en 无前缀、其他语言有前缀。完整 hreflang 必须挂在每个页面的 <head>:
html
<link rel="alternate" hreflang="en" href="https://wellchina.top/hospitals/shanghai-east" />
<link rel="alternate" hreflang="zh" href="https://wellchina.top/zh/hospitals/shanghai-east" />
<link rel="alternate" hreflang="ja" href="https://wellchina.top/ja/hospitals/shanghai-east" />
<link rel="alternate" hreflang="ko" href="https://wellchina.top/ko/hospitals/shanghai-east" />
<link rel="alternate" hreflang="ru" href="https://wellchina.top/ru/hospitals/shanghai-east" />
<link rel="alternate" hreflang="id" href="https://wellchina.top/id/hospitals/shanghai-east" />
<link rel="alternate" hreflang="vi" href="https://wellchina.top/vi/hospitals/shanghai-east" />
<link rel="alternate" hreflang="th" href="https://wellchina.top/th/hospitals/shanghai-east" />
<link rel="alternate" hreflang="x-default" href="https://wellchina.top/hospitals/shanghai-east" />三个易错点:
x-default必须指向 en 版本(最通用)。zh不要用zh-CN——会让搜索引擎优先推给大陆用户,这与我们 "不服务大陆" 的定位冲突。保持纯zh,让搜索引擎自行区域分配到 HK/TW/overseas Chinese。- 每个 locale 版本都必须双向引用(page A 引用 page B,page B 也要引用 page A),否则 Googlebot 会丢弃 hreflang cluster。
§4 内容策略
4.1 AI 引擎最爱引用的格式
按观测到的"被 citation 概率"排序:
| 格式 | 引用概率 | WellChina 应用场景 |
|---|---|---|
| 数据表(价格、时长、国家对比) | 极高 | 手术页价格对比、城市对比、医院 specialty 矩阵 |
| 明确的数字事实 | 极高 | "上海东方医院的 All-on-4 种植牙价格约 ¥60,000,比美国低 65%" |
| Step-by-step 流程 | 高 | 「如何申请医疗签证」「第一次到中国看病 7 步」 |
| FAQ Q&A 对 | 高 | 手术页 FAQ section |
| 定义 + 示例 | 中 | 专业术语解释("JCI 认证是什么") |
| 案例故事 | 低-中 | 匿名患者故事——LLM 偶尔引用,但权威性低 |
| 纯 opinion / 软文 | 极低 | 不要写 |
4.2 Informational > Transactional
LLM 极少在 transactional 场景("帮我预约")引用具体公司。WellChina 的 GEO 内容应 80% informational、20% 指引到 transactional 页面:
- Informational(GEO 主力):「外国人在中国做试管婴儿的条件」「JCI 认证的中国医院有哪些」「上海哪家医院接受 Cigna 保险」
- Transactional(SEO + 直接访问):预约表单、Contact 页、Compare 页
4.3 手术页结构模板(GEO 优化)
markdown
# [Procedure Name] in China — [Year] Pricing and Top Hospitals
[One-paragraph summary: what the procedure is, price range, top cities.
Must include 2-3 concrete numbers. LLM 常复述这一段。]
## Quick facts (table)
| Metric | Value |
| --- | --- |
| Average price (China) | ¥XX,XXX ($X,XXX) |
| Average price (US) | $XX,XXX |
| Savings | X% |
| Procedure duration | X hours |
| Recovery time | X days |
| Hospital stay | X days |
## What is [Procedure]?
[60-100 words definition + mechanism]
## Who is it for?
[Bullet list of indications]
## Top hospitals in China for [Procedure]
[Table: hospital name | city | specialty | JCI | price]
## Step-by-step: booking from abroad
1. ...
2. ...
## FAQ (FAQPage schema)
...
## Sources & last reviewed
Medically reviewed by Dr. X on 2026-MM-DD.4.4 价格页结构
价格数据是 WellChina 最稀缺的 GEO 资产。10 国 × 51 手术 = 510 个数据点构成高强度 list-worthy 内容。每张价格表必须:
- 标注时点("As of 2026-04-01")
- 标注汇率来源("Exchange rate: ECB, 2026-04-01")
- 标注样本来源("Based on quotes from 12 hospitals")
- 不用 div 假表格,必须是真
<table>
§5 潜规则与坑位
5.1 Freshness tradeoff
LLM 倾向优先新鲜内容,但频繁改动 price 会被判为 "不稳定数据"。解法:价格页每 90 天 重新评估一次,修改时保留"previous value"作为 diff 展示,让 LLM 理解我们不是随机刷。
5.2 Too-promotional detection
LLM 对"best"/"cheapest"/"guaranteed"等促销词敏感,一旦密度过高会被降权。WellChina 内部规则:每篇 5000 字文章 "best/top" 出现不超过 3 次,并且每次出现都用 claim + evidence("top 3 by patient volume [source: 2025 China Dental Tourism Report]")。
5.3 本地化 ≠ 翻译
8 语言每一版都要真正本地化:
- ko 版提到"保险"要提韩国国民健康保险(NHI)而不是美国的 HMO;
- ru 版用 RUB 作为主要对比货币而不是 USD;
- ja 版把"国际医疗保险"写成日本人熟悉的术语(海外旅行保险/アフラック类比);
- 机翻的 telltale signs(语法 stiff、idiom 直译)会被 LLM 识别并降权。
5.4 YMYL 需要更强信号
普通 review 页能靠 AggregateRating 上位,但 YMYL 医疗页 LLM 额外要求:
- 作者身份可验证(LinkedIn / 医院 staff page 链接)
- 医疗审校日期 ≤ 12 个月
- 引用源有 DOI / PubMed ID / 政府公告号
- 页面底部必须有 medical disclaimer
5.5 跨引用(cross-citation)效应
如果 Perplexity 引用我们,其他 LLM 的概率也会升高(它们互相爬对方的输出)。结论:尽早突破任意一个 T1 引擎的首次 citation,会带动其他 T1 的跟进。这是为什么 90 天路线图里我们先集中在一个语言 × 一个类别而不是铺开。
5.6 避免"AI-generated look"
LLM 越来越能识别自己家的文本风格。一旦被判定为 AI-generated,内容会被降权。防御:
- 避免 "In today's fast-paced world" 这类 ChatGPT 起手式
- 加入真实姓名、真实日期、真实数字
- 加入不 perfect 的语气(一点点口语化、一点点自嘲式 hedge)
- 每篇都过一次人工编辑
§6 测量体系
6.1 AI Bot UA 基线监控
要追踪的 UA(见附录 A 完整表),按周聚合:
| UA | 含义 | 基线目标(90 天) |
|---|---|---|
OAI-SearchBot | ChatGPT Search 抓取 | ≥ 100 req/week |
ChatGPT-User | 用户触发(click-through) | ≥ 20 req/week |
PerplexityBot | Perplexity 索引 | ≥ 80 req/week |
Perplexity-User | 用户触发 | ≥ 15 req/week |
ClaudeBot + Claude-SearchBot | Anthropic | ≥ 50 req/week |
GPTBot | OpenAI 训练 | ≥ 30 req/week |
Googlebot + Google-Extended | Google AI Overviews | ≥ 500 req/week |
关键洞察:ChatGPT-User / Perplexity-User 大于 0 = 我们真的被用户看到并点击了,这是比 "被索引" 更强的信号。
6.2 Vercel Log Drains 设置
bash
# Vercel CLI
vercel integrations add log-drains
# 或在 Dashboard: Project → Settings → Log Drains
# 目标:Datadog / Axiom / 自建 ClickHouse / BigQuery把 raw HTTP access log drain 到 Axiom(最便宜的分析栈,免费 tier 每月 500 GB),用 APL 查询:
apl
vercel
| where ['request_user_agent'] matches regex "GPTBot|OAI-SearchBot|ChatGPT-User|ClaudeBot|Claude-SearchBot|PerplexityBot|Perplexity-User|Google-Extended|anthropic-ai"
| summarize count() by bin_auto(_time), ['request_user_agent']6.3 手动 Prompt Target Table(每月 1 次)
没接上 Profound/Otterly 之前,人工测就够用。模板:
| Query (EN) | Query (locale) | Engine | Cited? | Position | Snippet excerpt | Date |
|---|---|---|---|---|---|---|
| best hospital in china for dental implant | 外国人在中国种牙哪家医院好 | ChatGPT | Y | #2 | "WellChina 列出 12 家..." | 2026-04-25 |
| ... | ... | Perplexity | N | — | — | 2026-04-25 |
执行节奏:
- 每月 1 次,10 条核心 query × 8 语言 × 4 T1 引擎 = 320 次查询
- 使用隐私模式(incognito + signed-out)
- 使用 VPN 切换到目标市场(KR VPN 测 ko,RU VPN 测 ru 等)
- 存在 Google Sheet / Notion,每月对比 delta
6.4 SaaS 工具(何时买)
| 工具 | 价格(2026) | 何时值得买 |
|---|---|---|
| Profound | ~$500-2000/mo | 每月手动测 > 8 小时时 |
| Otterly.ai | ~$99-499/mo | 需要多语言自动监测时 |
| AthenaHQ | ~$200/mo | 需要与 GSC 合并视图时 |
| Peec AI | ~$150/mo | 只测 ChatGPT + Perplexity |
| Hall | ~$300/mo | 需要 competitor share of voice 对比时 |
WellChina 判断:现在不买,90 天后重估。阈值:如果手动 Prompt Target Table 每月耗时 > 8 小时,买 Otterly.ai(最便宜的多语言方案)。
6.5 免费 fallback
- GA4:已有;在 Acquisition → Traffic acquisition 里看
Referralsource 中的chat.openai.com、perplexity.ai、claude.ai、gemini.google.com、copilot.microsoft.com、search.brave.com——这些 referral 就是 AI 引擎点击过来的下游流量。 - GSC(待 MCP 接入):查 "Users" 报告里的新语言/地区激增。
- 手动 Google Sheet:成本最低,够用到月访问 10K UV。
6.6 crawled ≠ cited 的陷阱
这是 GEO 新手最常踩的。数据:某内容被 GPTBot 抓过 ≠ 在 ChatGPT Search 里被引用。抓取只是候选池入场券。真正的"被引用"只能靠 Prompt Target Table 或 SaaS 工具主动测。不要拿"AI bot 访问量"作为 GEO 成功指标交给老板,那是 vanity metric。
§7 引擎专项 Playbook
每个 T1 引擎用 10 条代表性 query 做月度基线测试。下面每语言给 5-6 条 seed query,实际测 10 条时补充长尾。
7.1 ChatGPT Search (T1-A)
特点:答题风格较 formal,对 "reference link" 明显标注 citations。
Seed queries:
| Locale | Query |
|---|---|
| en | best hospital in china for foreigners dental implant |
| en | how to get medical visa for china from usa |
| zh | 海外华人回国看病哪里好 |
| ja | 中国で歯科インプラントを受ける方法 費用 |
| ko | 중국 의료관광 치과 임플란트 가격 |
| ru | Медицинский туризм в Китай стоимость стоматология |
| id | rumah sakit di China untuk orang asing |
| vi | du lịch y tế Trung Quốc cấy ghép răng giá |
| th | ท่องเที่ยวเชิงการแพทย์ในจีน รากฟันเทียม |
7.2 Perplexity (T1-A)
特点:citations 最透明(编号 [1][2][3]),最容易量化被引用率。先打通这里。
Seed queries:
| Locale | Query |
|---|---|
| en | jci accredited hospitals in china with english-speaking staff |
| en | ivf cost in china vs usa 2026 |
| zh | 上海私立医院外国人就诊 |
| ja | 中国 北京 がん治療 外国人向け |
| ko | 중국 상하이 국제 병원 추천 |
7.3 Google AI Overviews (T1-A)
特点:抓 top 10 SERP → 生成 overview,几乎和传统 SEO 排名挂钩。先做好 SEO 再谈 GEO。
Seed queries:
| Locale | Query |
|---|---|
| en | medical tourism china guide |
| en | how much does cancer treatment cost in china |
| ja | 中国医療ツーリズム ガイド |
| ko | 중국 의료 여행 가이드 |
| ru | медицинский туризм Китай путеводитель |
7.4 Claude Search (T1-B)
特点:比 ChatGPT 更保守,引用前会更谨慎;权威信号权重更高。
Seed queries:
| Locale | Query |
|---|---|
| en | is it safe to get dental work done in china as a foreigner |
| en | what documents do i need for medical treatment in shanghai |
| zh | 海外华人在中国做体检流程 |
7.5 Gemini (T1-B)
特点:和 Google AI Overviews 在 backend 有重叠但不完全一致;对 multimedia 内容(视频、图片)权重更高。
Seed queries:
| Locale | Query |
|---|---|
| en | show me hospitals in shanghai for international patients |
| ja | 中国の病院 画像 日本語対応 |
7.6 Bing Copilot (T1-B)
特点:Bing index + Azure OpenAI 混合,市场份额在 en 市场 ~5-10%,不容忽视。
Seed queries:
| Locale | Query |
|---|---|
| en | cheapest country for dental implant 2026 |
| en | china medical tourism pros and cons |
7.7 Naver Cue / AI Tab (T2-A ko)
Seed queries:
| Query (ko) |
|---|
| 중국 치과 임플란트 가격 비교 |
| 상하이 의료 관광 한국인 |
| 외국인 중국 병원 추천 JCI 인증 |
| 중국 암 치료 비용 한국 비교 |
| 중국 의료 비자 발급 |
7.8 Yandex Neuro (T2-A ru)
Seed queries:
| Query (ru) |
|---|
| Стоматология в Китае для иностранцев цена |
| ЭКО в Китае стоимость |
| Лечение рака в Шанхае отзывы |
| Медицинская виза Китай |
| Больницы JCI в Пекине |
§8 Skill Gap 分析
8.1 已安装 skills 到 GEO 工作流的映射
| GEO 工作流步骤 | 首选 skill | 备选 |
|---|---|---|
| Landscape scan(竞品 AI 可见度) | aaron-seo-geo:competitor-analysis | marketing-skills:ai-seo |
| Keyword research(问题而非关键词) | aaron-seo-geo:keyword-research + claude-seo:seo-cluster | marketing-skills:ai-seo |
| 技术基础审计 | claude-seo:seo-technical + claude-seo:seo-hreflang | aaron-seo-geo:technical-seo-checker |
| Schema/JSON-LD 生成 | aaron-seo-geo:generate-schema | claude-seo:seo-schema, marketing-skills:schema-markup |
| 内容写作(GEO-ready) | aaron-seo-geo:geo-content-optimizer + aaron-seo-geo:seo-content-writer | marketing-skills:ai-seo |
| Entity 建设 | aaron-seo-geo:entity-optimizer | —— |
| 页面级 80 项 CORE-EEAT 审计 | aaron-seo-geo:content-quality-auditor | claude-seo:seo-content |
| 站点级 40 项 CITE 权威审计 | aaron-seo-geo:domain-authority-auditor | claude-seo:seo-audit |
| GEO drift 检测(引用变化) | aaron-seo-geo:geo-drift-check | —— |
| Meta/OG 优化 | aaron-seo-geo:meta-tags-optimizer | claude-seo:seo-page |
| 月度报告 | aaron-seo-geo:performance-reporter + aaron-seo-geo:report | claude-seo:seo-google |
8.2 缺失能力(需要自建或替代方案)
| 缺失能力 | 为什么需要 | 替代方案 |
|---|---|---|
| 8 语言 Prompt Target 自动跑测 | 手动测太慢、SaaS(Profound)早期不值得 | 自建 Node 脚本 + 7 个 API key(OpenAI/Anthropic/Gemini/Perplexity),每月 cron 跑一次 |
| AI bot log 分析器 | Vercel Log Drains 导出后需要周期性报告 | Axiom 自带 dashboard;可用 claude-seo:seo-technical 读导出的 CSV |
| llms.txt 生成器 | 社区无标准 skill | 手动维护一个 /public/llms.txt;更新频次季度 1 次 |
| Wikidata 批量建 entity | 100+ 医院一个个手建不现实 | 用 QuickStatements + wikidata-cli,Claude 辅助生成 TSV |
| 韩语 Naver SEO | 韩国市场特有的 Naver 生态 skill 库无覆盖 | 手动 Naver Webmaster 提交 + Naver blog seeding |
8.3 推荐调用顺序(一篇新手术内容)
渲染中…
§9 90 天路线图(落地版本)
本节原 v1.0 包含 W1-W12 任务清单 + Gantt,已全部迁移到 GEO 执行计划(v2.x 持续维护)。此处只保留方法论锚点:
- W1-W2 技术地基 → 见执行计划 Phase 1
- W3-W4 内容试点(en × Dental) → Phase 2a Non-YMYL + 2b YMYL
- W5-W8 测量循环 → Phase 3
- W9-W12 Scale T1 → Phase 4
此 GuideBook 不再持有任务级状态——所有"做了没"在执行计划里。
§10 WellChina 专属陷阱
10.1 YMYL 要求先走医学审校,再走 GEO
任何 procedure / hospital / pricing 页面没有 medical reviewer 签名 + 日期,不要 publish,更不要交给任何 GEO skill 去 "优化"。详见 docs/ymyl-medical-compliance-guide.md。违反后果:Google QRG T-axis 判 Lowest Quality → 全站被降权,8 种语言一起遭殃。
10.2 不要过度 index 中国大陆引擎
Baidu / 腾讯元宝 / 百度灵感 / 360 这些引擎不在我们的 GEO 范围内。原因不仅是 ROI 低,更关键的是一旦这些引擎开始引用我们 → 大陆用户进来 → 我们触碰跨境医疗中介监管(需持医疗广告许可证 + 医疗机构转介资质,目前未持有)。主动行为:不做 ICP 备案、不做大陆 CDN、不创建微信公众号承接大陆流量。被动行为:不在 robots.txt 专门 disallow(那会暗示我们有针对性),但也不主动提交 sitemap 到 Baidu/Sogou Webmaster。
10.3 crawled ≠ cited
已在 §6.6 强调。一旦看到"GPTBot 访问 10k 次" 就冲老板汇报 = 业余操作。真正的 KPI 只有两个:1) T1 引擎 Prompt Target Table 被引用率;2) GA4 referral from AI 引擎的 UV + 转化。
10.4 GSC MCP 接入前不要批量生产
没有 GSC MCP,我们无法判断哪些 query 真的在 SERP 里有机会、哪些是纯 AI 查询。批量生产 → 大量内容沉底 → 内容 decay 导致全站质量分下拉。原则:接入 GSC MCP 之前,内容速度上限 3 篇/周。接入之后可以提到 8-10 篇/周。
10.5 zh locale 不是大陆 SEO
zh 版本服务对象:HK / TW / 新马华人 / 海外华人 / 在华读中文的 expat。不包括大陆用户。执行上:
zh版不用简体中文 独占,简繁可 fallback 切换;- 不要以"百度首页"为成功指标;
- 不要在
zh页面优化 "百度指数" 或 "5118 关键字"; - 优先考虑 Google / ChatGPT / Claude 等国际引擎上的中文查询表现(Google Trends 繁体中文查询量);
- 参考
docs/analytics-monitoring-research.md§产品定位 的相关条款。
10.6 8 语言同时铺会 spread too thin
WellChina 团队 < 10 人,如果 Week 1-4 就想 8 语言并行,每语言都做不深。路线图坚持 en 先跑通 → ja/ko/ru 次第引入 → id/vi/th/zh 最后。这和业务重要性不完全一致(东南亚手术旅游市场也很大),但和 "先建立 GEO 方法论" 的优先级一致。
§11 关键事实基础(影响策略权重)
这些是 2026-04-24 联网核查后确认、对策略权重起决定性作用的事实。来源已多源交叉验证。
11.1 ChatGPT 健康类 citation 极度偏好已建立机构源
| 引擎 | .gov 占比 | Mayo / Cleveland 等 elite hospital 占比 | Wikipedia / PubMed 占比 |
|---|---|---|---|
| ChatGPT | 27% | 1%(!) | 高 |
| Google AIO | 10% | 33% | 中 |
含义:WellChina 作为新建医疗信息平台,在 ChatGPT 突破健康 query citation 比在 Google 难 3-5 倍。ChatGPT 训练数据里"medical information from new sites"权重极低。
策略后果:
- 不要把 "ChatGPT citation rate" 当 90 天 KPI 主指标
- 优先打 Perplexity(citation 最透明、最易突破)→ AIO(继承 Google index,技术 SEO 做好就有戏)→ Bing Copilot → Claude Search → 最后才尝试 ChatGPT
- ChatGPT 的策略是长期主义:通过 Wikidata + Wikipedia + 行业媒体 PR 建立 entity 权威,让 ChatGPT 下一代训练数据 internalize WellChina 这个名字
11.2 backlink / referring domains 是 AI citation 的强相关因子
- 站点 referring domains 32K+ 的 ChatGPT citation 概率是 <200 站点的 3.5x
- 活跃 Trustpilot / G2 / Capterra / Yelp 资料的站点 citation 概率高 3x
策略后果:
- backlink 必须列为 GEO 一级动作(v1.0 GEO 思路完全没列 — 是结构性遗漏)
- KPI:referring domains 数(M3 ≥ 50, M6 ≥ 200)
- 预算线:每月 $200-500 用于 PR / 行业目录提交 / 医疗旅游媒体外联
- Wikidata entity 是入门,需要补强:JCI 数据库互链、行业媒体 PR、Trustpilot 资料认领
11.3 各 AI 引擎 trust model 独立,不通吃
| 引擎 | 检索 backend | trust model |
|---|---|---|
| ChatGPT Search | SearchGPT pipeline + Bing API | 自家 trust model(最严,偏好机构源) |
| Perplexity | 自家爬虫 + Brave API | 自家 trust model(较宽松,最透明 citation) |
| Bing Copilot | Bing index | 主要继承 Bing index 的 E-E-A-T |
| Google AIO | Google index | 主要继承 Google index(技术 SEO 强相关) |
| Claude Search | 主用 Brave API | 较保守,权威信号权重高 |
策略后果:v1.0 暗示"做好 Google 自动通吃 AI"是不准确的。Prompt Target Table 必须分引擎拆开测,每个引擎单独定 KPI。
11.4 2025-09 Google QRG:"纯 AI 无审核 = Lowest Quality"
"Purely AI-generated content without human review and unique value is rated as Lowest Quality."
直接判最低档,不是降权。一旦判 Lowest Quality,全站权重永久受损。
策略后果:
- Reviewer onboarding 从 nice-to-have 升级为 must-have
- programmatic SEO 必须每页都有人工审核痕迹
- AI 起草 + MD 审稿合规,纯 AI 不审稿不合规
§12 三轨并行执行模型 + Critical Path
12.1 三轨模型
WellChina 团队 < 10 人,但 GEO + YMYL 工作可以90% 并行,不需要串行。三轨:
| 轨 | 内容 | 主要负责 | YMYL 依赖 |
|---|---|---|---|
| 轨 1 · 技术地基 | llms.txt + robots.txt + Schema 骨架 + hreflang + AI bot 监控 + Wikidata entity | 工程师 | 无 |
| 轨 2 · 合规建设 | Reviewer 外联 + ToS + Disclaimer + Editorial Policy | 创始人 + paralegal | 是主轨 |
| 轨 3 · 内容生产 | W2-W4 Non-YMYL(visa / city / payment / pricing) → W5+ YMYL pillar | 编辑 | 部分(YMYL pillar 需 reviewer) |
渲染中…
12.2 Critical Path
最长 dependency chain(决定首次 citation 时间):
ToS 起草 (W2) → ToS 律师审 (W3) → 第一位 Reviewer 外联 (W1) → 签约 (W4-W5)
→ 第一篇 sign-off (W5) → 首篇 procedure 发布 (W6)
→ AI bot 抓取 (W7) → 首次 citation 出现 (W9-W10)关键路径长度 ≈ 9-10 周。优化的 3 个杠杆:
- Reviewer 外联 W1 立即启动(最高杠杆 — 是唯一不可压缩的环节)
- ToS 选 paralegal 而非律所(节省 1-2 周)
- 第一位 reviewer 优先选 "在校博士 + 导师双签" 路径(YMYL Reviewer Playbook §2.1,比社会聘 MD 快 2 周)
12.3 关键原则:Reviewer 外联不阻塞其他工作
把 Reviewer 外联提前到 W1,不意味着 Reviewer 是其他 YMYL 工作的前置。轨 2 内 ToS / Disclaimer / Editorial Policy 全部按节奏推进,与 Reviewer 完全并行。
唯一硬阻塞:W5 schema reviewedBy 回填 ← W4 reviewer 签约。即便 W4 仍 0 reviewer,轨 1(技术)+ 轨 2 其他动作 + 轨 3 Non-YMYL 内容 100% 不受影响。
§13 预算与 ROI 模型
13.1 3 个月成本(中档)
| 项目 | 月均 | 占比 |
|---|---|---|
| YMYL 合规(reviewer + ToS + 保险) | $1,500 | 37% |
| 内容生产(写作 + 翻译) | $1,650 | 40% |
| Backlink / PR(v2.0 新增) | $200-300 | 5% |
| GEO SaaS 工具 | $0(早期) | 0% |
| 杂项(Wikidata / Naver / domain tools) | $100 | 3% |
| 合计 | ~$4,100/月 | 100% |
详细分档(最低 / 中 / 高)见 GEO 执行计划 §14。
13.2 简单 ROI 假设(保守)
- 90 天后达到月 5K organic UV → 1% 转化率 × $49 ARPU = $2,450/月
- Month 6 目标:10K UV × 1% × $49 = $4,900/月 ≈ breakeven
- Month 12 目标:30K UV × 1.5% × $49 = $22,000/月 = 5x ROI
GEO 是 6-12 月见效投资,前 3 个月不 breakeven 是正常。
13.3 投不起 $4,100/月 时怎么办
$1,200/月 bare minimum 仍能跑通 Phase 1-4:
- 1 位兼职中国 MD 审 3-4 篇/月($300)
- 自己写内容(纯时间)
- Axiom 免费 tier
- ToS 一次性 paralegal $500
- 跳过 E&O 保险 / GHA cert
- 放弃 T2 语言 full localization
代价:citation rate 目标下调到 Perplexity 15% + AIO 8%;ChatGPT 不作为目标。
附录 A:AI User-Agent 全表
主要来源:ai-robots-txt GitHub repo、SearchEngineJournal 2025-12 更新、No Hacks 2026 Landscape。此表为 WellChina 推荐处置。
A.1 OpenAI
| User-Agent | 用途 | WellChina robots.txt | 备注 |
|---|---|---|---|
GPTBot | 训练数据爬取 | Allow | 未来模型会更认识 WellChina 品牌 |
OAI-SearchBot | ChatGPT Search 索引 | Allow(核心) | 这是 T1-A 入场券 |
ChatGPT-User | 用户触发(浏览功能) | Allow | 实际点击流量 |
A.2 Anthropic
| User-Agent | 用途 | WellChina robots.txt | 备注 |
|---|---|---|---|
ClaudeBot | 训练数据 + 通用爬取 | Allow | 与 Claude-SearchBot 可独立控制 |
Claude-SearchBot | Claude.ai Search 实时检索 | Allow(核心) | T1-B 入场券 |
anthropic-ai | 早期训练 UA(deprecating) | Allow | 仍偶见 |
claude-web | Web 用户触发 | Allow | 即 Claude.ai 浏览工具 |
A.3 Google
| User-Agent | 用途 | WellChina robots.txt | 备注 |
|---|---|---|---|
Googlebot | 主搜索 + AI Overviews | Allow | 不能 disallow,disallow = 全站消失 |
Google-Extended | Gemini 训练 opt-out | Allow | Opt-out 会削弱 Gemini 可见度 |
GoogleOther | 内部研究 | Allow | 默认 |
A.4 Perplexity
| User-Agent | 用途 | WellChina robots.txt | 备注 |
|---|---|---|---|
PerplexityBot | 索引 | Allow(核心) | T1-A |
Perplexity-User | 用户触发 | Allow | 展示 click-through |
A.5 Microsoft / Bing
| User-Agent | 用途 | WellChina robots.txt | 备注 |
|---|---|---|---|
bingbot | Bing 索引 + Copilot | Allow | 不能 disallow |
MicrosoftCopilotBot | Copilot 独立爬取 | Allow | 新增 |
A.6 其他
| User-Agent | 来源 | WellChina robots.txt |
|---|---|---|
Applebot / Applebot-Extended | Apple | Allow |
Meta-ExternalAgent / FacebookBot | Meta AI | Allow |
Bytespider | 字节 Doubao | Allow(T3) |
Amazonbot | Alexa/Rufus | Allow |
cohere-ai | Cohere | Allow |
Diffbot | 第三方数据服务 | Allow |
DuckAssistBot | DuckDuckGo AI | Allow |
YouBot | You.com | Allow |
策略总览:WellChina 默认 allow all,只 disallow /admin/ 和 /api/。启动期品牌从 0 开始,训练数据曝光对我们是正外部性。
附录 B:术语表
- GEO(Generative Engine Optimization):优化内容被 AI 生成式引擎引用的实践。
- AEO(Answer Engine Optimization):GEO 的子集,偏重"被作为答案源"。
- SGE(Search Generative Experience):Google 2023-2024 试验名,2024 起正式更名 AI Overviews。
- RAG(Retrieval Augmented Generation):LLM 先检索再生成的架构。
- llms.txt:社区提议的标准文件,类似 sitemap 但面向 LLM。2026 Q1 采纳率 5-15%。
- Citation:LLM 答案附带的来源链接。
- Prompt Target Table:人工跟踪某组 query 在各 AI 引擎的引用情况的表格。
- E-E-A-T:Google QRG 四维度——Experience、Expertise、Authoritativeness、Trustworthiness。
- YMYL:Your Money Your Life。医疗、金融、法律等高风险内容领域。
- QRG:Google Quality Rater Guidelines。
- Entity:可被 LLM 消歧识别的结构化对象(通常对应 Wikidata Q-number)。
- Hreflang cluster:所有 locale 版本互相引用形成的闭环。
附录 C:参考资料
2025-2026 最新源
AI Crawler Lists
- SearchEngineJournal "Complete Crawler List For AI User-Agents" (Dec 2025): https://www.searchenginejournal.com/ai-crawler-user-agents-list/558130/
- No Hacks "The AI User Agent Landscape in 2026": https://nohacks.co/blog/ai-user-agents-landscape-2026
- ai-robots-txt GitHub: https://github.com/ai-robots-txt/ai.robots.txt
- Scrunch "Guide to AI User Agents": https://scrunch.com/resources/guides/guide-to-ai-user-agents/
llms.txt 现状
- "The State of llms.txt in 2026" (aeo.press): https://www.aeo.press/ai/the-state-of-llms-txt-in-2026
- ALLMO "LLMs.txt for AI Search Report 2026": https://www.allmo.ai/articles/llms-txt
- "Should Websites Implement llms.txt in 2026?" (LinkBuildingHQ): https://www.linkbuildinghq.com/blog/should-websites-implement-llms-txt-in-2026/
韩国 AI 搜索
- AJU Press "AI Search Battle Intensifies in South Korea" (2026-04): https://www.ajupress.com/view/20260422113970507
- Korea Times "Naver tops 60% in Korea's search market" (2026-01): https://www.koreatimes.co.kr/amp/business/companies/20260104/naver-tops-60-in-koreas-search-market-data
- InterAd "Korean Search Engine Market Share 2026": https://www.interad.com/en/insights/korean-search-engine-market-share
Google QRG (2025-09 update)
- Google "Search Quality Evaluator Guidelines": https://developers.google.com/search/blog
- Search Engine Land coverage of QRG updates: https://searchengineland.com/
Schema.org 参考
- MedicalClinic: https://schema.org/MedicalClinic
- MedicalProcedure: https://schema.org/MedicalProcedure
- Physician: https://schema.org/Physician
- MedicalOrganization: https://schema.org/MedicalOrganization
WellChina 内部文档
/Users/phinease/Code/medchina/docs/marketing-skills-playbook.md—— 本 GuideBook 的母文档/Users/phinease/Code/medchina/docs/analytics-monitoring-research.md—— 监控与产品定位/Users/phinease/Code/medchina/CLAUDE.md—— 技术栈与架构/Users/phinease/Code/medchina/docs/ymyl-medical-compliance-guide.md—— 医疗 YMYL 合规