Estimating marginal treatment effect in cluster randomized trials with multi-level missing outcomes¶

作者: Chia-Rui Chang, Rui Wang
来源: Biometrics
主题: 因果推断
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向要解决的根本问题是：在整群随机试验（CRT）中，当结局数据存在多层级缺失（个体缺失、子群缺失、群缺失）时，如何一致且高效地估计边际处理效应（marginal treatment effect）。当前成熟度：方法学上，单层级缺失（个体层）的处理已有较成熟的IPW-GEE和双重稳健估计量，但多层级缺失（尤其是群层缺失）的理论与方法尚不完整，本文是填补这一缺口的工作。

发展脉络（history）¶

奠基工作： - Little et al. (2012)（[2]）：美国国家研究委员会报告，系统总结了临床试验中缺失数据的预防与处理方法，确立了MAR/MNAR框架作为标准。本文引用它作为多层级缺失机制假设的参照基准。 - Giraudeau & Ravaud (2009)（[7]）：指出CRT中意向性治疗（ITT）分析的困难，以及选择偏倚的预防。这是CRT方法学的早期系统性讨论。

主要进展（单层级缺失处理）： - Prague et al. (2015)（[14]）：提出AUG-IPW估计量，在CRT中处理个体层MAR缺失，并证明双重稳健性（outcome模型或missingness模型之一正确即一致）。这是本文最直接的前身。 - Chen et al. (2020)（[3]）：将二阶GEE（GEE2）与IPW结合，处理CRT中信息性缺失下的ICC估计，并引入“二阶”双重稳健估计方程。本文引用它作为IPW方法处理个体缺失的代表。 - Balzer et al. (2021)（[13]）：提出两阶段TMLE，在CRT中同时调整基线协变量不平衡和缺失结局，几乎消除因差异结局测量导致的偏倚。这是TMLE在CRT中的前沿应用。

当前frontier（多层级缺失）： - Mitani et al. (2022)（[18]）：在纵向聚类数据中处理信息性聚类大小（ICS）和信息性脱落，提出逆概率删失权重+CWGEE。虽然聚焦于牙科数据，但其“多层级缺失”思想（个体-牙齿、群-患者）与本文有交集。 - Mohan & Pearl (2018)（[6]）和 Moreno-Betancur et al. (2018)（[10]）：用因果图（DAG）框架分析缺失数据机制，提出“可恢复性”（recoverability）概念，超越传统MAR/MNAR二分法。本文引用它们作为多层级缺失机制建模的替代框架。

本文的位置：本文是第一个系统处理CRT中多层级（个体、子群、群）缺失结局的工作。它把Prague et al. (2015)的双重稳健思想扩展到多层级，提出乘性稳健（multiply robust）估计量——在每一层级分别设定倾向性得分模型，估计量在任一层级模型正确设定时即保持相合。

子线索聚类¶

IPW/GEE方法簇（Prague 2015, Chen 2020, Mitani 2022）：核心是用逆概率权重修正缺失偏倚，结合GEE处理聚类相关性。局限：通常只处理单层级缺失，或假设缺失机制在层级间独立。
TMLE/DML方法簇（Balzer 2021, Tchetgen & Shpitser 2012[5]）：用目标最小损失估计或双重机器学习，同时处理缺失和协变量调整。优势是效率更高，但计算复杂，且对多层级缺失的理论扩展尚不充分。
因果图/可恢复性框架簇（Mohan & Pearl 2018, Moreno-Betancur 2018, Lee et al. 2023[11]）：用DAG刻画缺失机制，判断目标参数是否可恢复。优势是透明且能处理MNAR，但需要完整图结构假设，且目前主要针对单层级缺失。

这个方向在追问的核心问题¶

多层级缺失下，边际处理效应是否可识别？ 需要什么假设（如层级间缺失机制的条件独立性）？
如何构造多层级缺失下的相合估计量？ 权重如何跨层级乘积？方差如何正确估计？
乘性稳健性（multiply robustness）是否成立？ 即：只要每个层级至少有一个模型正确，整体估计量是否一致？
有限样本下，多层级权重估计的收敛速率是否影响整体估计？ 特别是当某些层级样本量很小（如群数少）时。

⚠️ 作者的 framing¶

作者把缺口 frame 成：现有IPW-GEE方法只处理个体层缺失，忽略群层缺失；当群层缺失与结局相关时，这些方法产生偏倚。因此，“显然的下一步”是构造一个能同时处理个体、子群、群三层缺失的乘性稳健估计量。

被淡化或回避的竞争路线： - 多重插补（MI）：作者在intro中只提了一句“MI也可用于多层级缺失”，但未深入讨论。实际上，多层级MI（如Diaz-Ordaz et al. 2016[16]）是直接竞争者。作者可能回避是因为MI需要正确设定联合分布，而IPW方法对缺失机制假设更灵活。 - TMLE：Balzer et al. (2021)的两阶段TMLE也能处理缺失，但作者未将其作为主要比较对象。可能因为TMLE需要交叉拟合，在群数少时表现不稳定。

什么明显该被引/该存在、却没出现在intro里？ - Kahan et al. (2022)（[8]）：关于CRT中estimand选择的讨论（participant-average vs. cluster-average treatment effect）。本文的边际处理效应是participant-average，但未讨论当cluster size信息性时，这个estimand是否合适。这是一个值得研究者去查的张力点。 - Hossain et al. (2016)（[15, 17]）：系统比较了CRT中缺失二值/连续结局下各种方法的偏倚。本文未引用，可能因为聚焦于多层级缺失，而Hossain的工作只处理单层级。

张力¶

未见明显对立引用。所有被引工作基本一致认为：IPW/GEE是处理CRT缺失的主流方法，多层级扩展是自然方向。唯一的潜在张力是：Prague et al. (2015)的双重稳健性要求“outcome模型或missingness模型之一正确”，而本文的乘性稳健性要求“每个层级至少有一个模型正确”——后者更强（需要更多模型），但更灵活（允许不同层级用不同模型）。这个trade-off未被作者明确讨论。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

符号： - \(i = 1, \dots, m\)：群（cluster）索引。\(m\)是群总数。 - \(j = 1, \dots, n_i\)：第\(i\)个群中的子群（subcluster）索引。\(n_i\)是群\(i\)中的子群数。 - \(k = 1, \dots, n_{ij}\)：第\(i\)个群第\(j\)个子群中的个体索引。\(n_{ij}\)是子群\(ij\)中的个体数。 - \(Y_{ijk}\)：个体\(ijk\)的结局变量（可观测或缺失）。 - \(A_i\)：群\(i\)的处理分配（0/1，二值）。CRT中处理在群层随机化。 - \(X_{ijk}\)：个体\(ijk\)的基线协变量向量（完全观测）。 - \(Z_{ij}\)：子群\(ij\)的基线协变量向量（可能包含群层变量）。 - \(W_i\)：群\(i\)的基线协变量向量。

缺失指示变量（关键）： - \(R_i\)：群\(i\)是否被观测到（1=观测到，0=缺失）。若\(R_i=0\)，则该群所有子群和个体的结局都缺失。 - \(R_{ij}\)：子群\(ij\)是否被观测到（1=观测到，0=缺失）。注意：\(R_{ij}=1\)仅当\(R_i=1\)。 - \(R_{ijk}\)：个体\(ijk\)的结局是否被观测到（1=观测到，0=缺失）。注意：\(R_{ijk}=1\)仅当\(R_{ij}=1\)且\(R_i=1\)。

可观测数据：研究者实际能观测到的是： - 所有群的\(A_i, W_i\)（处理分配和群层协变量）。 - 对于\(R_i=1\)的群：子群\(Z_{ij}\)和\(R_{ij}\)。 - 对于\(R_{ij}=1\)的子群：个体\(X_{ijk}\)和\(R_{ijk}\)。 - 对于\(R_{ijk}=1\)的个体：结局\(Y_{ijk}\)。 - 缺失的结局（\(R_{ijk}=0\)或\(R_{ij}=0\)或\(R_i=0\)）完全不可观测。

想要但观测不到的量：每个个体的潜在结局（potential outcome）\(Y_{ijk}(a)\)（若群\(i\)被分配处理\(a\)时的结局）。边际处理效应定义为：

\[\tau = \mathbb{E}[Y_{ijk}(1) - Y_{ijk}(0)]\]

其中期望对总体中所有个体（包括缺失的）取平均。

模型： - 处理分配机制：CRT中\(A_i\)是随机化的，通常假设\(A_i \perp (Y_{ijk}(0), Y_{ijk}(1), X_{ijk}, Z_{ij}, W_i)\)（无混淆）。 - 缺失机制：假设缺失是条件随机（conditional at random, CAR）的，即给定可观测协变量，缺失概率与未观测结局独立。具体地，在每个层级： - 群层：\(P(R_i=1 | A_i, W_i, \text{所有潜在结局}) = P(R_i=1 | A_i, W_i)\) - 子群层：\(P(R_{ij}=1 | R_i=1, A_i, W_i, Z_{ij}, \text{所有潜在结局}) = P(R_{ij}=1 | R_i=1, A_i, W_i, Z_{ij})\) - 个体层：\(P(R_{ijk}=1 | R_{ij}=1, A_i, W_i, Z_{ij}, X_{ijk}, \text{所有潜在结局}) = P(R_{ijk}=1 | R_{ij}=1, A_i, W_i, Z_{ij}, X_{ijk})\) 注意：这是层级条件独立假设——给定上一层级被观测到和当前层级的协变量，缺失与结局独立。这是本文的核心识别假设。

参数/estimand： - \(\tau = \mathbb{E}[Y_{ijk}(1) - Y_{ijk}(0)]\)：边际处理效应（participant-average treatment effect）。 - 倾向性得分模型（每个层级一个）： - \(\pi_i(W_i; \alpha) = P(R_i=1 | A_i, W_i)\)：群层缺失概率。 - \(\pi_{ij}(Z_{ij}; \beta) = P(R_{ij}=1 | R_i=1, A_i, W_i, Z_{ij})\)：子群层缺失概率。 - \(\pi_{ijk}(X_{ijk}; \gamma) = P(R_{ijk}=1 | R_{ij}=1, A_i, W_i, Z_{ij}, X_{ijk})\)：个体层缺失概率。这些模型是参数化的（如logistic回归），但本文的乘性稳健性允许每个层级有多个候选模型。

第二步：讲最小内核¶

最简特例：假设只有两个层级（群层和个体层），没有子群。即：\(n_i=1\)（每个群只有一个子群），\(R_{ij}=R_i\)（子群缺失等价于群缺失）。此时问题退化为：群可能完全缺失（\(R_i=0\)），或群被观测到但个体结局可能缺失（\(R_{ijk}=0\)）。

在这个特例下： - 可观测数据：\((A_i, W_i, R_i)\)对所有群；若\(R_i=1\)，还观测到\((X_{ijk}, R_{ijk})\)；若\(R_{ijk}=1\)，还观测到\(Y_{ijk}\)。 - 边际处理效应：\(\tau = \mathbb{E}[Y_{ijk}(1) - Y_{ijk}(0)]\)。 - 缺失机制假设： - 群层：\(P(R_i=1 | A_i, W_i, \text{潜在结局}) = \pi_i(W_i)\)（给定\(W_i\)，群缺失与结局独立）。 - 个体层：\(P(R_{ijk}=1 | R_i=1, A_i, W_i, X_{ijk}, \text{潜在结局}) = \pi_{ijk}(X_{ijk})\)（给定\(X_{ijk}\)，个体缺失与结局独立）。

核心思路：用逆概率权重修正两个层级的缺失。估计量形式为：

\[\hat{\tau} = \frac{1}{m} \sum_{i=1}^m \frac{A_i R_i}{\hat{\pi}_i(W_i)} \cdot \frac{1}{n_i} \sum_{k=1}^{n_i} \frac{R_{ijk} Y_{ijk}}{\hat{\pi}_{ijk}(X_{ijk})} - \frac{1}{m} \sum_{i=1}^m \frac{(1-A_i) R_i}{\hat{\pi}_i(W_i)} \cdot \frac{1}{n_i} \sum_{k=1}^{n_i} \frac{R_{ijk} Y_{ijk}}{\hat{\pi}_{ijk}(X_{ijk})}\]

其中\(\hat{\pi}_i\)和\(\hat{\pi}_{ijk}\)是估计的倾向性得分。

为什么这个估计量一致（直觉）： - 在群层，权重\(1/\pi_i(W_i)\)修正了群缺失的偏倚：给定\(W_i\)，观测到的群是群总体的一个“加权代表”。 - 在个体层，权重\(1/\pi_{ijk}(X_{ijk})\)修正了个体缺失的偏倚：给定\(X_{ijk}\)，观测到的个体是个体总体的一个“加权代表”。 - 乘积权重\(R_i R_{ijk} / (\pi_i \pi_{ijk})\)修正了两个层级的联合缺失偏倚。 - 关键：只要群层模型\(\pi_i\)正确（即使个体层模型\(\pi_{ijk}\)错误），或个体层模型\(\pi_{ijk}\)正确（即使群层模型\(\pi_i\)错误），估计量都一致。这就是乘性稳健性——两个层级各有一个模型正确即可，不需要两个都正确。

数学上：在正确模型下，\(\mathbb{E}[R_i R_{ijk} Y_{ijk} / (\pi_i \pi_{ijk}) | A_i, W_i, X_{ijk}] = \mathbb{E}[Y_{ijk} | A_i, W_i, X_{ijk}]\)，然后对\(W_i, X_{ijk}\)取期望得到\(\mathbb{E}[Y_{ijk}(a)]\)。如果群层模型正确但个体层模型错误，则\(\mathbb{E}[R_i R_{ijk} Y_{ijk} / (\pi_i \pi_{ijk}) | A_i, W_i] = \mathbb{E}[Y_{ijk} | A_i, W_i] \cdot \mathbb{E}[R_{ijk} / \pi_{ijk} | A_i, W_i]\)，但\(\mathbb{E}[R_{ijk} / \pi_{ijk} | A_i, W_i] = 1\)（因为\(\pi_{ijk}\)是给定\(X_{ijk}\)的条件概率，但这里对\(X_{ijk}\)取期望后，只要\(\pi_{ijk}\)是合理的模型，这个期望仍为1？——实际上需要更细致的论证，见第三节证明路线）。

这个特例抓住了本文的核心：多层级缺失下的乘性稳健估计。一般情形（三个层级）只是这个两层级特例的“加壳”——增加一个子群层，权重变为三重乘积，乘性稳健性变为“每个层级至少有一个模型正确”。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在整群随机试验（CRT）中，当结局数据存在个体、子群、群三个层级的缺失时，如何一致地估计边际处理效应。
核心工具/方法：提出基于加权GEE的多层级乘性稳健（multiply robust）估计量，在每个层级分别设定多个候选倾向性得分模型，估计量在每个层级至少有一个模型正确时保持相合和渐近正态。
主要结论：证明了乘性稳健性（定理1）、渐近正态性（定理2），给出了方差估计（定理3），并通过模拟和真实数据（马达加斯加疟疾CRT）验证了有限样本表现。

关键设定与假设¶

完整设定（在第二节最小记号基础上补充）： - 数据层级结构：群（cluster）→ 子群（subcluster）→ 个体（individual）。每个群有\(n_i\)个子群，每个子群有\(n_{ij}\)个个体。 - 处理分配：\(A_i \in \{0,1\}\)，在群层随机化。假设无混淆：\(A_i \perp (Y_{ijk}(0), Y_{ijk}(1))\)（给定群层协变量\(W_i\)）。 - 缺失机制：假设层级条件随机（hierarchical conditional at random, HCAR）： - 群层：\(R_i \perp Y_{ijk}(a) \mid A_i, W_i\) - 子群层：\(R_{ij} \perp Y_{ijk}(a) \mid R_i=1, A_i, W_i, Z_{ij}\) - 个体层：\(R_{ijk} \perp Y_{ijk}(a) \mid R_{ij}=1, A_i, W_i, Z_{ij}, X_{ijk}\) 注意：这是强假设——它要求每个层级的缺失只依赖于该层级的协变量，不依赖于未观测的结局或其他层级的协变量。相比已有文献： - 放宽了Prague et al. (2015)的“个体层MAR”假设（允许群层缺失）。 - 强化了层级间条件独立性（子群缺失只依赖于\(Z_{ij}\)，不依赖于\(X_{ijk}\)或\(Y_{ijk}\)）。这个假设在实际中可能不成立（例如，子群缺失可能依赖于个体特征），但作者未讨论其敏感性。

倾向性得分模型： - 每个层级设定\(K\)个候选模型（\(K\)可以不同）： - 群层：\(\pi_i^{(k)}(W_i; \alpha_k)\)，\(k=1,\dots,K_c\) - 子群层：\(\pi_{ij}^{(l)}(Z_{ij}; \beta_l)\)，\(l=1,\dots,K_s\) - 个体层：\(\pi_{ijk}^{(r)}(X_{ijk}; \gamma_r)\)，\(r=1,\dots,K_i\) - 模型形式：logistic回归（论文中假设），但理论上可以是任何参数模型。

乘性稳健性假设（核心）： - 存在至少一个\(k \in \{1,\dots,K_c\}\)使得群层模型正确。 - 存在至少一个\(l \in \{1,\dots,K_s\}\)使得子群层模型正确。 - 存在至少一个\(r \in \{1,\dots,K_i\}\)使得个体层模型正确。 - 注意：这三个“至少一个”是独立的——即群层正确的模型、子群层正确的模型、个体层正确的模型可以是不同的候选模型。这是“乘性”的含义：每个层级各有一个正确模型即可，不需要同一个候选模型在所有层级都正确。

主要结果¶

定理1（乘性稳健性）：在HCAR假设和正则条件下，多层级乘性稳健估计量\(\hat{\tau}_{MR}\)是\(\tau\)的相合估计，只要每个层级至少有一个倾向性得分模型正确设定。 - 直觉：证明通过迭代期望，将乘积权重分解为三个层级的条件期望。每个层级，正确的模型使得该层级的权重期望为1，从而整体权重无偏。 - 必要条件：每个层级的候选模型集合中至少有一个正确。如果某个层级所有模型都错误，则估计量可能不一致。 - 解决的技术难点：如何将单层级的双重稳健性扩展到多层级？关键在于乘积权重的结构——每个层级的权重独立修正该层级的缺失偏倚，且乘性结构使得偏倚不累积。

定理2（渐近正态性）：在更强的正则条件下（包括倾向性得分模型的估计速率），\(\sqrt{m}(\hat{\tau}_{MR} - \tau) \xrightarrow{d} N(0, V)\)。 - 直觉：估计量是M-估计量的特例，其渐近方差由影响函数（influence function）给出。 - 必要条件：群数\(m \to \infty\)（而非个体数）。这是CRT的典型渐近框架——群数足够大，每个群内的个体数可以固定或增长。 - 解决的技术难点：多层级权重估计引入了额外的变异性，方差估计需要同时考虑权重估计的不确定性。作者采用分位数函数方法（quantile function approach）推导渐近方差，避免了复杂的U-统计量展开。

定理3（方差估计）：给出了一个相合的方差估计量\(\hat{V}\)，基于经验影响函数（empirical influence function）。 - 方法：用“plug-in”原则，将未知参数替换为估计值，然后计算样本方差。 - 注意：方差估计需要正确指定所有层级的倾向性得分模型（即使乘性稳健性只需要每个层级一个正确模型）。这是一个不对称：点估计是乘性稳健的，但方差估计不是。作者在模拟中验证了方差估计在正确模型下的覆盖概率。

证明路线与技术技巧¶

整体路线（3-5步逻辑主干）：

构造估计量：将边际处理效应\(\tau\)表示为加权期望的形式：
\[\tau = \mathbb{E}\left[ \frac{A_i R_i R_{ij} R_{ijk} Y_{ijk}}{\pi_i(W_i) \pi_{ij}(Z_{ij}) \pi_{ijk}(X_{ijk})} \right] - \mathbb{E}\left[ \frac{(1-A_i) R_i R_{ij} R_{ijk} Y_{ijk}}{\pi_i(W_i) \pi_{ij}(Z_{ij}) \pi_{ijk}(X_{ijk})} \right]\]
其中期望对总体分布取。这个表达式成立依赖于HCAR假设和正确的倾向性得分。
替换为样本估计：用样本均值替换期望，用估计的倾向性得分\(\hat{\pi}\)替换真实\(\pi\)：
\[\hat{\tau}_{MR} = \frac{1}{m} \sum_{i=1}^m \frac{A_i R_i}{\hat{\pi}_i(W_i)} \cdot \frac{1}{n_i} \sum_{j=1}^{n_i} \frac{R_{ij}}{\hat{\pi}_{ij}(Z_{ij})} \cdot \frac{1}{n_{ij}} \sum_{k=1}^{n_{ij}} \frac{R_{ijk} Y_{ijk}}{\hat{\pi}_{ijk}(X_{ijk})} - \text{(类似的控制组项)}\]
证明相合性（定理1）：
步骤3a：假设每个层级至少有一个正确模型。不失一般性，设群层模型\(\pi_i^{(1)}\)正确，子群层模型\(\pi_{ij}^{(1)}\)正确，个体层模型\(\pi_{ijk}^{(1)}\)正确。
步骤3b：将估计量分解为“oracle”部分（用真实\(\pi\)）和“估计误差”部分。证明估计误差部分在\(m\to\infty\)时趋于0（需要倾向性得分估计的相合性）。
步骤3c：对oracle部分，用迭代期望：
\[\mathbb{E}\left[ \frac{A_i R_i R_{ij} R_{ijk} Y_{ijk}}{\pi_i \pi_{ij} \pi_{ijk}} \right] = \mathbb{E}\left[ A_i \cdot \mathbb{E}\left[ \frac{R_i}{\pi_i} \cdot \mathbb{E}\left[ \frac{R_{ij}}{\pi_{ij}} \cdot \mathbb{E}\left[ \frac{R_{ijk} Y_{ijk}}{\pi_{ijk}} \mid R_i=1, A_i, W_i, Z_{ij}, X_{ijk} \right] \mid R_i=1, A_i, W_i, Z_{ij} \right] \mid A_i, W_i \right] \right]\]
由于个体层模型正确，\(\mathbb{E}[R_{ijk} / \pi_{ijk} \mid \cdots] = \mathbb{E}[Y_{ijk} \mid \cdots]\)；然后子群层模型正确使得\(\mathbb{E}[R_{ij} / \pi_{ij} \cdot \mathbb{E}[Y_{ijk} \mid \cdots] \mid \cdots] = \mathbb{E}[Y_{ijk} \mid A_i, W_i, Z_{ij}]\)；最后群层模型正确得到\(\mathbb{E}[Y_{ijk}(a)]\)。
关键跳跃点：当某个层级的正确模型不是“第一个”候选时，需要证明估计量自动选择正确的权重组合。作者通过模型平均（model averaging）或最小化某个准则（如交叉验证）来实现，但论文中假设每个层级只有一个候选模型（即\(K=1\)），因此乘性稳健性退化为“每个层级的模型都正确”——这实际上不是真正的乘性稳健性。这是一个重要的技术细节：论文的定理陈述是“每个层级至少有一个模型正确”，但证明中假设每个层级只有一个模型。真正的多模型选择（如多个候选模型时如何组合）被回避了。
证明渐近正态性（定理2）：
步骤4a：将\(\hat{\tau}_{MR}\)表示为M-估计量：\((\hat{\tau}, \hat{\alpha}, \hat{\beta}, \hat{\gamma})\)联合求解估计方程。
步骤4b：推导影响函数，考虑权重估计的不确定性。作者使用分位数函数方法（quantile function approach）——将估计量表示为分位数函数的泛函，然后应用Delta方法。
技术技巧：分位数函数方法避免了直接处理高阶U-统计量，简化了方差推导。这是本文的一个技术亮点。
步骤4c：证明影响函数的经验版本是渐近正态的，需要验证随机 equicontinuity 条件（通过Donsker定理或经验过程理论）。
方差估计（定理3）：
用影响函数的样本方差作为方差估计。需要将未知参数替换为估计值，并调整自由度（考虑群数\(m\)而非个体数）。

技术技巧点名： - 分位数函数方法：用于推导渐近方差，避免复杂的U-统计量展开。这是本文区别于Prague et al. (2015)的主要技术贡献之一。 - M-估计框架：将估计量嵌入联合估计方程系统，统一处理参数估计的不确定性。 - 经验过程理论：用于验证随机 equicontinuity，确保影响函数估计的相合性（论文中假设正则条件满足，未详细展开）。

真实例子与应用¶

数据：马达加斯加疟疾风险降低CRT（Ratovoson et al., 2022 [1]）。 - 场景：22个fokontany（最小行政单位，即群）被随机分配1:1到主动社区病例管理（pro-CCM，干预）或传统综合社区病例管理（iCCM，对照）。干预从2017年3月到10月，每两周由社区卫生工作者上门筛查发热，阳性者用RDT检测并治疗。疟疾患病率在干预前后用RDT评估。 - 缺失结构：论文指出存在多层级缺失——有些群完全退出（群层缺失），有些群内的子群（如村庄）未完全参与（子群层缺失），有些个体未接受检测（个体层缺失）。 - 如何应用本文方法：作者在每个层级设定倾向性得分模型： - 群层：用群层协变量（如基线患病率、人口密度）预测群缺失概率。 - 子群层：用子群层协变量（如到卫生中心的距离）预测子群缺失概率。 - 个体层：用个体协变量（如年龄、性别）预测个体缺失概率。然后计算乘性稳健估计量，并与忽略群层缺失的IPW-GEE（只处理个体层缺失）比较。 - 结果：本文方法估计的干预效应（pro-CCM降低疟疾患病率）与IPW-GEE方向一致，但置信区间更窄（效率更高？论文未明确说，但暗示了）。更重要的是，当群层缺失与结局相关时（例如，退出群有更高的基线患病率），IPW-GEE产生偏倚，而本文方法修正了该偏倚。 - 这个例子想说明什么：验证多层级缺失确实存在且信息性，本文方法能修正被忽略的群层缺失偏倚。但注意：真实数据中无法知道真实效应，因此这个例子主要是说明性（illustrative）而非验证性（confirmatory）。

🔎 结论是否比证明窄¶

是。具体地： - 定理1的乘性稳健性在证明中假设每个层级只有一个候选模型（即\(K=1\)），但陈述中说的是“每个层级至少有一个模型正确”。当有多个候选模型时，如何自动选择正确的模型（或如何组合）并未在证明中处理。这是一个gap：真正的乘性稳健性需要模型选择/平均机制，但论文只给出了“假设每个层级只有一个正确模型”的证明。 - 方差估计（定理3）的相合性依赖于所有倾向性得分模型正确，但点估计的乘性稳健性只需要每个层级一个模型正确。这意味着：在乘性稳健性成立但某些模型错误的情况下，方差估计可能不一致。作者在模拟中只报告了正确模型下的覆盖概率，未报告模型错误时的方差表现。 - HCAR假设（层级条件随机）是强假设，但论文未讨论其敏感性。在实际中，子群缺失可能依赖于个体特征（如更健康的个体更可能参与），这违反HCAR。作者在conclusion中提到了这一点作为limitation，但未给出解决方案。

四、开放问题¶

多模型选择与真正的乘性稳健性：当每个层级有多个候选模型时，如何构造一个自动选择正确模型组合的估计量？这需要模型平均或交叉验证机制，但本文的证明只处理了单模型情形。扎根于：定理1的证明假设每个层级只有一个模型，但陈述允许多个模型。
方差估计的乘性稳健性：能否构造一个方差估计，在点估计乘性稳健（即每个层级至少一个模型正确）时仍然相合？目前方差估计需要所有模型正确。扎根于：定理3的证明依赖所有模型正确。
HCAR假设的放松：当子群缺失依赖于个体特征（违反HCAR）时，边际处理效应是否仍可识别？需要什么替代假设？扎根于：论文conclusion中提到的limitation。
群数少时的有限样本表现：当群数\(m\)很小（如10-20）时，多层级权重估计的方差很大，本文的渐近理论是否仍然可靠？是否有有限样本修正（如bootstrap）？扎根于：模拟中\(m=50\)，但真实例子中\(m=22\)，作者未讨论小\(m\)下的表现。

提醒：要确认这些是不是真gap，建议去读同子领域近期约5篇的intro（如Prague 2015, Balzer 2021, Mitani 2022, Kahan 2022, Lee et al. 2023）——如果都指向多层级缺失问题，则本文是共识性进展；如果互相打架（如TMLE vs. IPW），则存在方法论张力，值得深入。

Maintained by 陈星宇 · Homepage · Source on GitHub