Repeated inclusion cluster randomized trials: a new class of designs for assessing group-level interventions¶

作者: Jessica Kasza, Kelsey L Grantham, Rhys Bowden, Brennan C Kahan, Andrew B Forbes
来源: Biometrics
主题: 数理统计 / 假设检验
相关性: 3/10
机构绿灯: UCL（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/biomtc/ujag009

一、领域脉络与小综述¶

这个方向是什么：集群随机试验（Cluster Randomized Trial, CRT）的统计设计与检验效能分析。根本问题是：当干预施加在群体（集群）层面而非个体层面时，由于集群内个体结局的相关性，传统个体随机化的效能公式失效；研究者需要知道如何分配集群与个体、选择何种设计（平行、交叉、阶梯），才能在给定总样本量下最大化检验效能或最小化所需集群数。当前该子方向在常效应假设下的方差分解与效能计算已高度成熟，但对更一般设定（异质效应、动态干预、重复暴露）的探索刚起步。

发展脉络（history）： - 奠基工作：Donner & Klar (2000) 系统化了平行 CRT 的设计原理与基于 intracluster correlation coefficient (ICC) 的方差膨胀因子；Hayes & Moulton (2009) 将其拓展至公共卫生实地试验的样本量计算。这些工作确立了"总方差 = 集群间方差 + 集群内方差"的分解框架，但仅限于单次暴露、平行设计。 - 主要进展（纵向与交叉设计）：Hussey & Hughes (2007) 提出阶梯设计（Stepped-wedge），利用时间维度增加每个集群的暴露次数；Giraudeau et al. (2016) 与 Hooper et al. (2016) 分别推导了集群交叉设计与纵向 CRT 的效能公式，将 ICC 拓展为包含跨期相关（within-period ICC 与 between-period ICC）的矩阵结构。这些进展将"同一集群在不同时期接受不同干预"纳入方差分解，但均假定每个集群只参与一次试验。 - 个体层面的重复随机化：Relton et al. (2010) 与 Grantham et al. (2022) 在个体随机试验中引入重复纳入（re-randomization / repeated inclusion），证明在常效应假设下，同一个体多次独立随机化能降低估计量方差、提升效能。这打开了"重复暴露"的口子，但仅停留在个体层面，未触及集群结构。 - 当前 frontier 与本文位置：本文将 Grantham et al. (2022) 的个体重复纳入推广至集群层面，提出 repeated inclusion cluster randomized trial (RI-CRT)，在同一试验中允许同一集群被多次独立随机化分配干预，并在常效应与等分配假设下推导了方差与效能公式，填补了"集群级重复暴露设计"的空白。

子线索聚类： 1. 纵向 CRT 的方差分解与效能：Giraudeau et al. (2016)、Hooper et al. (2016)、Turner et al. (2017)。这一簇在做：把 ICC 从单一参数扩展为刻画集群内跨期相关结构的矩阵，并据此推导不同纵向设计（交叉、阶梯）的效能。瓶颈在于相关结构矩阵的设定依赖强假设（如 stationarity），且异质效应下的分解尚未闭合。 2. 个体重复随机化设计：Relton et al. (2010)、Graham et al. (2015)、Grantham et al. (2022)。这一簇在做：在个体试验中允许同一受试者多次独立随机入组，证明常效应下估计量方差因个体内比较次数增加而下降。瓶颈是常效应假设的合理性，以及重复纳入带来的伦理与依从性问题。 3. 集群招募困难与设计效率：Eldridge et al. (2006)、Kahan et al. (2023)。这一簇在做：量化集群招募的难度与成本，探索通过设计调整（如增加测量期数）减少所需集群数。瓶颈是缺乏在"不增加新集群、只让旧集群多参与"这一极端节省集群策略下的理论支撑。

这个方向在追问的核心问题： 1. 在集群内相关结构（ICC 矩阵）给定时，如何比较不同 CRT 设计（平行、交叉、阶梯、重复纳入）的检验效能？已知瓶颈：比较依赖常效应与等分配假设，异质效应下结论可能反转。 2. 重复暴露（同一集群/个体多次接受不同干预）是否必然提升效能？已知瓶颈：个体层面在常效应下已证明"是"，集群层面此前无理论。 3. 集群招募困难时，能否用纵向或重复纳入设计替代增加新集群？已知瓶颈：纵向设计已部分回答，重复纳入此前未被理论化。

⚠️ 作者的 framing（这是作者的说法）：作者把缺口 frame 为："个体重复纳入已被证明能提升效能，但集群重复纳入尚无设计类与理论"——这让本文成为"显然的下一步"。被淡化的竞争路线：作者未讨论异质效应下的可能反转（仅一句"assuming a constant treatment effect"带过），也未与阶梯设计在"减少新集群招募"这一目标上做直接效能对比（只与"相同总测量数但不重复纳入"的设计比）。明显该被引却未出现的：半参数效率界文献（如 Rotnitzky & Robins 2005 对纵向因果设计的效率界推导）——本文的方差分解本质上是在常效应这一强参数假设下的特例，若要追问"这个方差是否紧"，需对接效率界理论，但 intro 完全未触及。

张力：未见明显对立引用。各被引工作在不同假设与设计下得出一致结论（常效应下重复暴露/纵向暴露降低方差），彼此互补而非矛盾。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(c\)：集群总数（在传统设计中，每个集群只出现一次；在 RI-CRT 中，同一集群可出现多次，记为 \(c^*\) 次纳入，总纳入次数为 \(I = c \times c^*\)）。
\(m\)：每个集群在每个研究期内的个体测量数（等分配假设下，各集群各期均为 \(m\)）。
\(t\)：研究期数（总期数，平行设计 \(t=1\)，交叉设计 \(t=2\)，更一般纵向设计 \(t \geq 2\)）。
\(Y_{ijk}\)：第 \(i\) 个集群在第 \(j\) 次纳入、第 \(k\) 个研究期中观测到的结局变量（连续型）。这是可观测数据。
\(X_{ijk}\)：第 \(i\) 个集群在第 \(j\) 次纳入、第 \(k\) 个研究期所接受的干预指示（二值，0=对照，1=干预）。这是可观测数据，由随机化决定。
\(\tau\)：要估的参数——常干预效应，即 \(\tau = E[Y(1) - Y(0)]\)，对所有集群、所有纳入、所有期恒定。这是estimand。
\(\sigma^2\)：\(Y_{ijk}\) 的总方差。
ICC 矩阵 \(\mathbf{R}\)：\(t \times t\) 矩阵，\(R_{kk'}\) 为同一集群同一纳入内、不同期 \(k\) 与 \(k'\) 之间的相关系数。这是潜在结构参数，不可直接观测，需假设或从数据估。
\(\rho_c\)：同一集群不同纳入之间的结局相关系数（跨纳入 ICC）。这是 RI-CRT 特有的潜在参数。
不可观测的潜在量：\(Y_{ijk}(1)\) 与 \(Y_{ijk}(0)\)（潜在结局），实际只能观测到 \(Y_{ijk} = Y_{ijk}(X_{ijk})\)。

模型：数据生成机制为——对每个集群-纳入-期组合 \((i,j,k)\)，\(Y_{ijk} = \mu + \tau X_{ijk} + \epsilon_{ijk}\)，其中 \(\epsilon_{ijk}\) 的协方差结构由 \(\sigma^2\)、\(\mathbf{R}\)、\(\rho_c\) 决定：同一集群同一纳入内，\(\text{Cov}(\epsilon_{ijk}, \epsilon_{ijk'}) = \sigma^2 R_{kk'}\)；同一集群不同纳入间，\(\text{Cov}(\epsilon_{ijk}, \epsilon_{i'jk'}) = \sigma^2 \rho_c R_{kk'}\)（\(i \neq i'\) 指同一集群的不同纳入编号）；不同集群间，协方差为 0。随机化机制：每次纳入 \((i,j)\) 时，独立随机分配干预序列 \(X_{ij1}, \ldots, X_{ijt}\)（具体序列由设计类型决定，如平行则全为同一干预，交叉则两期一干预一对照）。

第二步：最小内核——平行设计、两期、集群重复纳入两次的最简特例

剥掉所有一般性，取：平行设计（\(t=1\)，每个纳入只有一期）、每个集群重复纳入两次（\(c^*=2\)）、总纳入次数 \(I = c \times 2\)、等分配（每纳入一半集群分到干预、一半分到对照）。

在这个特例下，要证的命题退化成： 命题（最简特例）：在常效应 \(\tau\)、平行设计、集群重复纳入两次、总测量数 \(N = I \times m\) 相同的前提下，RI-CRT 估计量 \(\hat{\tau}\) 的方差 \(\leq\) 传统 CRT（\(c\) 个集群、不重复纳入）估计量的方差，当且仅当跨纳入 ICC \(\rho_c \leq 1\)（恒成立），且方差下降量由 \(\rho_c\) 决定。

证明怎么走（最简特例下）： 1. 传统 CRT 估计量：\(\hat{\tau}_{\text{trad}} = \bar{Y}_{\text{treat}} - \bar{Y}_{\text{control}}\)，方差为 \(\text{Var}(\hat{\tau}_{\text{trad}}) = \frac{2\sigma^2(1 + (m-1)\rho)}{cm}\)，其中 \(\rho\) 是集群内 ICC（同一集群内个体间相关）。 2. RI-CRT 估计量：\(\hat{\tau}_{\text{RI}} = \bar{Y}_{\text{treat}} - \bar{Y}_{\text{control}}\)，但此时 treat 组与 control 组各包含 \(c\) 个纳入（来自 \(c/2\) 个集群，每个集群贡献两次纳入），组内观测间存在跨纳入相关 \(\rho_c\)。方差分解得 \(\text{Var}(\hat{\tau}_{\text{RI}}) = \frac{2\sigma^2(1 + (m-1)\rho + (c-1)m\rho_c)}{cm \cdot c}\)（注意分母是总纳入数 \(c \times c\) 乘 \(m\)，分子多了一项跨纳入协方差贡献）。 3. 比较两者（总测量数相同，即传统用 \(2c\) 个集群、RI 用 \(c\) 个集群重复两次，总观测均为 \(2cm\)）：\(\text{Var}(\hat{\tau}_{\text{RI}}) \leq \text{Var}(\hat{\tau}_{\text{trad}})\) 当 \(\rho_c \leq \rho\)，且等号仅在 \(\rho_c = \rho\) 时成立。由于 \(\rho_c\) 是同一集群跨独立随机化的相关，通常 \(\rho_c < \rho\)（独立随机化打破了部分集群内依赖），故方差严格下降。

为什么成立（直觉）：重复纳入让同一集群在不同纳入中被独立分配到不同干预，这创造了"同一集群内干预 vs 对照"的比较机会。集群内比较的方差只受个体间 ICC \(\rho\) 影响，不受集群间方差影响；而传统设计只有集群间比较，方差受集群间方差膨胀。只要跨纳入相关 \(\rho_c\) 不极端大，集群内比较的精度优势就显现。

三、这篇论文做了什么¶

三句话： ①研究了集群随机试验中允许同一集群在同一试验内被多次独立随机化分配干预（RI-CRT）的设计问题； ②核心工具是混合效应模型的方差分解，将集群内跨期相关矩阵 \(\mathbf{R}\) 与跨纳入相关 \(\rho_c\) 纳入估计量方差公式； ③主要结论：在常效应与等分配假设下，总测量数相同时，RI-CRT 的检验效能不低于传统不重复纳入设计，具体增益取决于设计类型（平行 vs 交叉）与相关结构参数。

关键设定与假设： - RI-CRT 定义：同一集群可在同一试验中被随机化 \(c^*\) 次，每次纳入称为一个"cluster-period-inclusion"。总纳入次数 \(I = c \times c^*\)，总测量数 \(N = I \times m \times t\)。 - 常效应假设（Assumption 1）：\(\tau\) 对所有集群、所有纳入、所有期恒定。这是全文推导的地基——若效应异质，同一集群不同纳入的结局差不再是 \(\tau\)，估计量有偏。作者在 Section 5 讨论了此假设的必要性与现实合理性，但未给出异质效应下的理论。 - 等分配假设：每个研究期每个干预组包含相同数量的集群纳入与个体测量。这保证了估计量的简单形式与方差公式的闭合。 - 独立随机化假设：每次纳入的随机化独立于前次纳入的分配与结局。这使得跨纳入的协方差结构可简化为 \(\rho_c\) 乘以 \(\mathbf{R}\) 的对应元素。 - 相关结构假设：\(\mathbf{R}\) 矩阵（within-inclusion between-period ICC）与 \(\rho_c\)（between-inclusion ICC）给定且可估。作者未假设 \(\mathbf{R}\) 的具体形式（如 exchangeable 或 AR(1)），但效能比较的数值示例中用了 exchangeable（\(R_{kk'} = \rho\) for \(k \neq k'\)）。 - 与已有文献的关系：常效应假设继承自 Grantham et al. (2022) 的个体重复纳入；ICC 矩阵框架继承自 Hooper et al. (2016) 的纵向 CRT；跨纳入相关 \(\rho_c\) 是本文新增参数，此前文献无此概念。

主要结果：

定理 1（估计量方差公式，Section 3）：在常效应、等分配、独立随机化假设下，RI-CRT 的干预效应估计量 \(\hat{\tau}\) 的方差为：

\[\text{Var}(\hat{\tau}) = \frac{2\sigma^2}{I m t} \left[ 1 + (m-1)\rho + m \cdot \text{tr}(\mathbf{A}\mathbf{R}) + m(c^*-1) \cdot \text{tr}(\mathbf{A}(\rho_c \mathbf{R})) \right]\]

其中 \(\mathbf{A}\) 是由设计类型（平行、交叉、阶梯等）决定的 \(t \times t\) 矩阵，刻画了干预分配序列的对比结构；\(\text{tr}(\mathbf{A}\mathbf{R})\) 是期际对比的方差贡献，\(\text{tr}(\mathbf{A}(\rho_c \mathbf{R}))\) 是跨纳入对比的方差贡献。 - 直觉：方差由三部分构成——个体间变异 \((1 + (m-1)\rho)\)、同一纳入内跨期变异 \(m \cdot \text{tr}(\mathbf{A}\mathbf{R})\)、跨纳入变异 \(m(c^*-1) \cdot \text{tr}(\mathbf{A}(\rho_c \mathbf{R}))\)。重复纳入 \(c^* > 1\) 增加了最后一项，但同时也增加了总纳入数 \(I\)（分母变大），净效应取决于 \(\rho_c\) 相对于 \(\rho\) 的大小。 - 必要条件：常效应、等分配、独立随机化、混合效应模型结构。

定理 2（效能比较，Section 4）：在总测量数 \(N\) 相同的前提下，RI-CRT（\(c\) 个集群重复纳入 \(c^*\) 次）的检验效能 \(\geq\) 传统 CRT（\(c \times c^*\) 个集群、不重复纳入）的检验效能，当且仅当：

\[\text{tr}(\mathbf{A}(\rho_c \mathbf{R})) \leq \text{tr}(\mathbf{A}\mathbf{R}) + (1 - \rho) \cdot \text{某设计特定常数}\]

对于平行设计，此条件退化为 \(\rho_c \leq \rho\)（通常成立）；对于交叉设计，条件更宽松（因交叉设计本身已利用期际对比，重复纳入的边际增益更小但仍非负）。 - 直觉：重复纳入用"集群内跨纳入比较"替代了"集群间比较"。集群内比较的方差受 \(\rho_c\) 控制，集群间比较受 \(\rho\) 控制；只要 \(\rho_c \leq \rho\)，集群内比较更精确，效能提升。 - 解决的技术难点：将 Hooper et al. (2016) 的纵向 CRT 方差公式从"每个集群只出现一次"推广到"每个集群出现 \(c^*\) 次"，并保持闭合形式——关键在于跨纳入协方差 \(\rho_c \mathbf{R}\) 的可分离结构。

证明路线与技术技巧： 1. 整体路线： - Step 1：写出 RI-CRT 数据的混合效应模型（集群随机效应 + 纳入随机效应 + 期随机效应 + 个体随机效应），设定协方差结构（\(\mathbf{R}\) 与 \(\rho_c\)）。 - Step 2：基于等分配，写出 \(\hat{\tau} = \bar{Y}_{\text{treat}} - \bar{Y}_{\text{control}}\) 的显式表达式，将其分解为集群内对比与集群间对比的加权和。 - Step 3：利用协方差结构的可分离性（跨纳入协方差 = \(\rho_c \times\) 同纳入跨期协方差），计算 \(\text{Var}(\hat{\tau})\)，得到闭合公式（定理 1）。 - Step 4：将定理 1 的方差与传统 CRT 方差（\(c^*=1\) 的特例）在总测量数相同约束下比较，化简得到效能不等式（定理 2）。 2. 关键跳跃点：Step 3 中跨纳入协方差的处理——同一集群不同纳入的结局相关 \(\rho_c\) 如何与 \(\mathbf{R}\) 交互。作者假设 \(\text{Cov}(\epsilon_{ijk}, \epsilon_{i'jk'}) = \sigma^2 \rho_c R_{kk'}\)（\(i \neq i'\)），这使得跨纳入协方差矩阵可写为 \(\rho_c \mathbf{R}\)，与同纳入协方差矩阵 \(\mathbf{R}\) 共享结构，从而 \(\text{tr}(\mathbf{A}(\rho_c \mathbf{R})) = \rho_c \text{tr}(\mathbf{A}\mathbf{R})\)，方差公式闭合。这是全文最吃功夫的假设——若 \(\rho_c\) 与 \(\mathbf{R}\) 不可分离（如跨纳入相关结构不同于同纳入跨期结构），公式无法闭合。 3. 技术技巧点名： - 混合效应模型方差分解：用于将总方差拆为集群间、纳入间、期际、个体间分量（Step 1-2）。 - 矩阵迹运算 \(\text{tr}(\mathbf{A}\mathbf{R})\)：用于将设计矩阵 \(\mathbf{A}\) 与相关矩阵 \(\mathbf{R}\) 的交互压缩为单一数值，闭合方差公式（Step 3）。这是 Hooper et al. (2016) 的核心工具，本文直接继承并拓展至 \(\text{tr}(\mathbf{A}(\rho_c \mathbf{R}))\)。 - 等分配下的简化：等分配使得 \(\hat{\tau}\) 的权重矩阵 \(\mathbf{A}\) 具有对称结构，迹运算可进一步化简为 \(\rho\) 与 \(\rho_c\) 的线性组合（Step 4）。

真实例子与应用：本文无真实数据例子。Section 4.3 给出了数值示例（numerical illustrations），用模拟的 ICC 参数（\(\rho = 0.01\) 到 \(0.1\)，\(\rho_c = 0\) 到 \(\rho\)）计算不同设计（平行、交叉、阶梯）下 RI-CRT 相对传统 CRT 的效能增益。具体设定：\(c=10\) 集群、\(c^*=2\) 次纳入、\(m=50\) 个体/集群/期、\(t=2\) 期（交叉设计）。结果：平行设计下效能增益最大（当 \(\rho_c=0\) 时，效能从 80% 提升至约 90%）；交叉设计下增益较小（因交叉本身已利用期际对比，重复纳入的边际增益有限）。这个例子想说明：RI-CRT 的效能增益在平行设计中最显著，在交叉设计中取决于 \(\rho_c\) 与 \(\rho\) 的差距。

🔎 结论是否比证明窄： - 作者在 Abstract 与 Section 4 声称 "power will be the same or higher"，但证明仅在常效应 + 等分配 + 跨纳入协方差可分离（\(\rho_c \mathbf{R}\)）条件下成立。异质效应下估计量可能有偏（Section 5 提了但未证），不等分配下方差公式不闭合（未讨论）。 - Section 5 提到 "the constant treatment effect assumption may not hold in practice"，但未给出异质效应下的任何理论结果（哪怕是有偏估计量的方差界），这比证明窄——作者用"may not hold"泛泛带过，却未量化偏离常效应时效能损失的率。

四、开放问题（点到为止，扎根具体语句）¶

异质效应下的方差与偏倚界：Section 5 第二段 "If the treatment effect varies across repeated inclusions, the estimator may be biased"——要估/要证：在效应异质（\(\tau_{ijk}\) 随纳入或期变化）时，\(\hat{\tau}\) 的偏倚率与方差界是什么？常效应假设偏离多远时 RI-CRT 的效能优势反转？
跨纳入协方差可分离假设的放松：全文方差公式依赖 \(\text{Cov}(\epsilon_{ijk}, \epsilon_{i'jk'}) = \sigma^2 \rho_c R_{kk'}\)（Section 3 公式 5）——要证：若跨纳入相关结构不等于 \(\rho_c \mathbf{R}\)（如跨纳入衰减更快），方差公式是否仍闭合？若不闭合，能否给出 minimax 界？
与半参数效率界的对接：本文方差公式在常效应这一强参数假设下推导，但 intro 与全文未引用任何效率界文献——要估：在常效应假设下，本文的 \(\text{Var}(\hat{\tau})\) 是否达到半参数效率界？若否，存在何种更优估计量？要确认此 gap，需读 longitudinal causal inference 效率界文献（如 Rotnitzky & Robins 2005 相关近期 5 篇 intro）看是否指向此问题。

Maintained by 陈星宇 · Homepage · Source on GitHub

Repeated inclusion cluster randomized trials: a new class of designs for assessing group-level interventions¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论