A sensitivity analysis approach to principal stratification with a continuous longitudinal intermediate outcome: applications to a cohort stepped wedge trial¶

作者: Lei Yang, Michael J Daniels, Fan Li
来源: Biostatistics
主题: 因果推断
相关性: 8/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么 Principal stratification (PS) 要解决的根本统计问题是：当处理（treatment）与结局（outcome）之间存在一个受处理影响的中间变量（intermediate/post-treatment variable，如依从性、死亡、中介变量）时，如何定义并估计异质性因果效应。由于中间变量本身受处理影响，直接按观测到的中间变量分层会引入选择偏差；PS 通过按潜在中间变量 \((M(0), M(1))\) 的联合取值定义“主层”，在层内估计因果效应，从而避免这一偏差。当前该方向在二值中间变量下已有较成熟的点识别与估计框架，但连续型中间变量下的识别与估计仍是瓶颈，本文正是切入这一瓶颈，并将其嵌入 stepped wedge cluster randomized trial (SW-CRT) 的特定设计结构中。

发展脉络 - 奠基工作：Frangakis & Rubin (2002) 提出 PS 框架（虽未在 intro 显式引用，但属领域共识起点）；Angrist et al. (1996) 用工具变量处理依从性（引用句指出其属于“treatment compliance”类早期工作）。 - 主要进展（点识别路线）：传统 PS 依赖 exclusion restriction (ER) 等强假设。Ding and Lu (2017); Jiang et al. (2022) and Tong et al. (2028/2025) 用 principal ignorability (PI) 替代 ER，发展出 principal score weighting 与 multiply robust 估计器，实现了二值中间变量下 PCE 的点识别（引用句明确指出这一替代路线）。 - 连续中间变量的 frontier：二值设定下主层有限，连续设定下主层无限细化、联合分布 \((M(0), M(1))\) 不可观测导致识别困难。Kim et al. (2019) 处理多个连续中间变量，提出 Gaussian copula 与 homogeneity 假设来识别 PCE（引用句直接点明其方法）；Magnusson et al. (2019) 假设完全参数模型识别联合分布（引用句将其归为“fully parametric model”路线）；Antonelli et al. (2023) 推广到连续处理与连续中间变量（引用句指出其扩展了 PS 框架）。Daniels et al. (2012) 在中介分析中引入 copula 处理联合潜在变量（引用句说明本文的 copula 思路受其启发）。 - SW-CRT 设计中的演进：SW-CRT 是一种单向交叉设计，集群在不同时间点随机切换至干预。Li et al. (2021) 建立了广泛使用的 mixed-effects model 框架（引用句表明本文在此基础上扩展）；Maleyeff et al. (2022) 与 Kenny et al. (2021) 关注 exposure-time（干预时长）的异质性（引用句提及本文需参数化 treatment duration）；Chen and Li (2025) 与 Wang et al. (2024) 提供了 SW-CRT 下的 no interference 假设与 model-robust 推断（引用句用于支撑本文的 estimand 定义与假设体系）。 - 本文的位置：在连续中间变量导致 \((M(0), M(1))\) 联合分布不可识别的瓶颈处，本文不依赖完全参数化或强 ER，而是沿用 copula 路线引入 sensitivity parameter \(\rho\)，并利用 SW-CRT 时变处理分配结构产生的纵向中间变量数据，为 \(\rho\) 提供校准，实现 partial identification 与 Bayesian 估计。

子线索聚类 1. PS 识别假设演进：从 ER (Angrist et al. 1996) → PI (Ding & Lu 2017, Jiang et al. 2022, Tong et al. 2025) → 连续中间变量的 Copula + Sensitivity (Kim et al. 2019, Daniels et al. 2012, 本文)。这一簇在解决“主层潜在变量联合分布不可观测”的识别卡点。 2. SW-CRT 因果推断与 Estimand：从 Mixed model (Li et al. 2021) → Exposure-time heterogeneity (Maleyeff 2022, Kenny 2021) → Robust estimands/No interference (Chen & Li 2025, Kahan et al. 2024, Wang et al. 2024)。这一簇在厘清 SW-CRT 复杂设计下的目标量与稳健推断。 3. Bayesian 非参数与聚类数据中的 PS/Mediation：BNP 方法 (Xu et al. 2019, Ohnishi & Li 2024) 与聚类数据 SACE (Tong et al. 2023)。这一簇在处理复杂数据结构（半竞争风险、多中介、聚类）下的估计问题。

核心追问与瓶颈 1. 连续中间变量下 PCE 如何识别？ 联合潜在变量 \((M(0), M(1))\) 只有边际可观测，非参数识别不可能。瓶颈在于：要么依赖强参数假设，要么引入不可检验的 sensitivity 参数，缺乏数据驱动的校准机制。 2. SW-CRT 的时变结构能为因果识别提供什么额外信息？ SW-CRT 中同一单元在不同时期接受不同处理，这种纵向结构是否可以转化为对不可检验假设的约束？ 3. 聚类数据下的 PCE estimand 如何定义才避免混淆？ 集群平均 vs 个体平均、边际 vs 条件效应（Kahan et al. 2024 指出此张力）。

⚠️ 作者的 framing - 作者把缺口 frame 成什么：现有 PS 方法“主要关注二值中间变量”，连续中间变量下“联合分布不可识别”，而 SW-CRT 的时变结构“可以用来校准 sensitivity 参数”。这使得本文的“copula + SW-CRT 校准”成为填补连续 PS 空白的“显然下一步”。 - 竞争路线被淡化或回避：Causal mediation analysis (Imai et al. 2010) 是处理连续中间变量的另一大路线（通过 sequential ignorability 识别自然直接/间接效应），作者仅在 intro 一句带过其“探索中间变量下的因果路径”，未对比 PS 与 Mediation 在连续设定下的优劣（PS 关注层内总效应，Mediation 关注路径分解，两者 estimand 根本不同，作者未显式讨论为何选 PS 而非 Mediation 定义目标量）。 - 明显该被引却未出现的：关于连续中间变量 partial identification bounds 的纯理论工作（如纯数学上刻画连续联合潜在变量可达到的 sharp bounds），若存在，应在此处引用以对比本文的 copula 参数化路线是否牺牲了过多识别空间，这值得研究者去查证。

张力未见明显对立引用。Ding & Lu (2017) 等用 PI 替代 ER 是假设上的演进而非矛盾；Kim et al. (2019) 的 copula 与 Magnusson et al. (2019) 的全参数模型是不同识别策略，无相反结论。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代

\(i\)：集群指标（\(i=1,\dots,I\)）。
\(j\)：集群内个体指标（\(j=1,\dots,n_i\)）。
\(t\)：时间周期指标（\(t=1,\dots,T\)）。
\(Z_{it}\)：处理分配变量（0=控制，1=干预）。在 SW-CRT 中，\(Z_{it}\) 一旦从 0 变为 1，后续周期保持为 1（单向交叉）。
\(M_{ijt}(z)\)：潜在中间变量（如社会规范评分，连续型）。个体 \((i,j)\) 在周期 \(t\) 若接受处理 \(z\) 会展现的中间变量值。
\(Y_{ijt}(z, m)\)：潜在结局变量（如 HIV 检测行为，二值或连续）。个体 \((i,j)\) 在周期 \(t\) 若接受处理 \(z\) 且中间变量取值为 \(m\) 时的结局。
\(X_{ij}\)：基线协变量（可观测，不受处理影响）。
可观测数据：在 SW-CRT 中，研究者观测到 \((X_{ij}, Z_{it}, M_{ijt}^{obs}, Y_{ijt}^{obs})\)。其中 \(M_{ijt}^{obs} = M_{ijt}(Z_{it})\)，\(Y_{ijt}^{obs} = Y_{ijt}(Z_{it}, M_{ijt}(Z_{it}))\)。
不可观测的潜在量：对同一 \((i,j)\) 在同一 \(t\)，\(M_{ijt}(1-Z_{it})\) 永远不可观测（反事实中间变量）。主层由 \((M_{ijt}(0), M_{ijt}(1))\) 的联合取值定义，由于 \(M\) 是连续的，主层不可数，且其联合分布不可观测。

第二步：最小内核

剥掉 SW-CRT 的多周期与聚类结构，考虑单个时间点、无聚类、二值处理 \(Z \in \{0,1\}\)、连续中间变量 \(M\) 的最简特例。

核心数学困难：要估计主层因果效应 (PCE)，例如 \(E[Y(1, M(1)) - Y(0, M(0)) \mid M(0)=m_0, M(1)=m_1]\)，必须知道主层 \((m_0, m_1)\) 的分布，即 \((M(0), M(1))\) 的联合分布 \(P(M(0), M(1)\)。但观测数据只提供边际分布 \(P(M(0) \mid Z=0)\) 与 \(P(M(1) \mid Z=1)\)。从两个边际分布无法非参数恢复联合分布（等价于已知二维分布的两个边际，求联合，有无穷多解）。
本文怎么破：
引入 Copula 假设：假设 \((M(0), M(1))\) 的联合分布由一个 Gaussian copula 连结，其相关性由单一参数 \(\rho \in [-1, 1]\) 决定。此时，联合分布被边际与 \(\rho\) 完全确定。\(\rho\) 即为 sensitivity parameter。
SW-CRT 校准 \(\rho\)（最简内核的推广）：在普通二值实验中，\(\rho\) 完全不可检验。但在 SW-CRT 中，个体 \(j\) 在 \(t=1\) 和 \(t=2\) 都被观测。假设处理在 \(t=2\) 交叉，则观测到 \(M_{j1}(0)\)（\(t=1\) 时在控制下）和 \(M_{j2}(1)\)（\(t=2\) 时在干预下）。如果假设中间变量在不同时间的潜在值相关性，与同一时间内不同处理下的潜在值相关性结构相同或可约束（即时间序列上的相关性为 \(\rho_{time}\)，跨处理的相关性为 \(\rho_{treat}\)，假设 \(\rho_{time}\) 可提供 \(\rho_{treat}\) 的信息），那么观测到的纵向中间变量相关性 \(\text{Corr}(M_{j1}^{obs}, M_{j2}^{obs})\) 就为不可观测的 \(\rho\) 提供了校准锚点。
一句话总结内核：用 Gaussian copula 参数 \(\rho\) 将连续中间变量的不可识别联合分布参数化，再利用 SW-CRT 纵向观测提供的中间变量跨期相关性，为 \(\rho\) 这个原本纯主观的 sensitivity 参数提供数据驱动的校准约束。

三、这篇论文做了什么¶

三句话 ① 研究了 SW-CRT 中连续型中间变量下主层因果效应 (PCE) 的识别与估计问题；② 核心方法是假设潜在中间变量联合分布服从 Gaussian copula（以 \(\rho\) 为 sensitivity 参数），并利用 SW-CRT 纵向结构对 \(\rho\) 进行校准，结合 Bayesian 框架进行推断；③ 主要结论是在合理假设（no interference, partial exchangeability, copula + homogeneity）下实现了 PCE 的 partial identification，并在 HIV 检测数据中展示了社会规范作为连续中间变量的异质性因果效应。

关键设定与假设 在最小记号基础上补全： - Estimand 定义：定义了时间特定主层因果效应 (time-specific PCE)，如 \(\tau_t(m_0, m_1) = E[Y_{ijt}(1, m_1) - Y_{ijt}(0, m_0) \mid M_{ijt}(0)=m_0, M_{ijt}(1)=m_1]\)。由于连续主层不可数，实际关注聚合版（如对 \(m_0, m_1\) 的某区域积分，或条件期望 \(\tau_t(m_0)\)）。同时区分了 cluster-average 与 individual-average estimand（引用 Kahan et al. 2024 的定义体系）。 - Assumption 1 (No interference among clusters)：集群间无干扰（引用 Chen and Li 2025）。集群内可能存在干扰，但本文在估计阶段暂未显式处理集群内干扰对 PCE 的影响。 - Assumption 2 (Partial exchangeability / Ignorability)：\((M_{ijt}(0), M_{ijt}(1), Y_{ijt}(0), Y_{ijt}(1)) \perp Z_{it} \mid X_{ij}\)。在 SW-CRT 中，处理分配由设计决定，此假设由随机化保证。 - Assumption 3 (Super-population sampling)：集群从超总体中抽样（引用 Kahan et al. 2024），使得随机化推断可过渡到模型推断。 - Assumption 4 (Gaussian Copula for \((M(0), M(1))\))：\((M_{ijt}(0), M_{ijt}(1))\) 的联合分布由 Gaussian copula 连结各自的边际分布（边际可非参数），相关系数为 \(\rho_{treat}\)。这是核心识别假设，将无穷维识别问题降维至单一参数 \(\rho_{treat}\)。 - Assumption 5 (Homogeneity / Stationarity for calibration)：跨处理的相关性 \(\rho_{treat}\) 与跨时间的中间变量相关性 \(\rho_{time}\) 存在结构联系（如相等或函数关系），使得 \(\rho_{treat}\) 可由纵向观测校准。相比已有文献（Kim et al. 2019 假设了 homogeneity 但无纵向校准），本文利用了 SW-CRT 的时变设计来放宽纯主观指定 \(\rho\) 的任意性。

主要结果 1. Partial Identification of PCE：在 \(\rho_{treat}\) 固定时，PCE 被点识别；当 \(\rho_{treat}\) 在某区间 \([\rho_{L}, \rho_{U}]\) 变动时（区间由纵向校准给出），PCE 形成一个识别区间。定理给出了从边际分布、结局模型与 \(\rho\) 构造 PCE 识别公式的显式表达。 2. Bayesian Estimation via Stan：由于 PCE 涉及连续主层的积分与潜在变量的联合建模，本文采用 Bayesian 方法（Stan, Carpenter et al. 2017），对边际中间变量模型、结局模型及 copula 参数 \(\rho\) 联合推断。\(\rho\) 的先验由纵向校准信息构造（如以观测的跨期相关性为先验均值）。 3. Sensitivity Analysis：通过变动 \(\rho_{treat}\) 的先验/固定值，展示 PCE 随 \(\rho\) 变化的敏感度曲线，提供比传统“纯主观指定 sensitivity 参数”更客观的参照系。

证明路线与技术技巧 - 整体路线： 1. 定义 Estimand：在潜在结果框架下写出连续主层的 PCE，显式区分集群与个体层面。 2. 识别分解：将 PCE 中的 \(E[Y(z) \mid M(0)=m_0, M(1)=m_1]\) 分解为 \(E[Y(z) \mid M(z)=m_z, X] \times P(M(1-z)=m_{1-z} \mid M(z)=m_z, X) \times P(M(z)=m_z \mid X)\) 的积分形式。 3. Copula 参数化：用 Gaussian copula 将不可观测的 \(P(M(1-z) \mid M(z), X)\) 表达为可观测的边际 \(P(M(z) \mid X)\)、\(P(M(1-z) \mid X)\) 与 \(\rho_{treat}\) 的函数。 4. 纵向校准：在 SW-CRT 的 mixed-effects model 框架下（引用 Li et al. 2021），推导同一个体跨期中间变量观测值的相关性 \(\rho_{time}\)，建立 \(\rho_{time}\) 与 \(\rho_{treat}\) 的约束关系。 5. Bayesian 实现：将上述识别公式转化为 Stan 的似然/先验结构，进行 MCMC 推断。 - 关键跳跃点：从“不可观测的跨处理联合分布”到“由 copula 参数化的可计算条件概率”是第一跳；从“不可检验的 \(\rho_{treat}\)”到“由 SW-CRT 纵向结构提供校准的 \(\rho_{time}\)”是第二跳（最吃功夫，依赖对 SW-CRT 随机化结构与时间序列模型的联合推导）。 - 技术技巧点名： - Gaussian Copula：用于连结连续潜在中间变量的边际分布，解决联合分布不可识别问题（源自 Daniels et al. 2012, Kim et al. 2019）。 - Mixed-effects Model for SW-CRT：用于刻画集群随机效应与时间趋势，提取纵向中间变量的相关性结构以校准 \(\rho\)（源自 Li et al. 2021）。 - Bayesian MCMC (Stan)：用于处理复杂积分与潜在变量模型，避免数值积分的维度灾难。

真实例子与应用 - 数据：Tang et al. (2018) 的中国 MSM 人群 HIV 检测 SW-CRT。8 个城市（集群），4 个序列，封闭队列。 - 变量映射：\(Z\) = 众包干预（是否暴露于干预活动）；\(M\) = 社会规范评分（连续，基于问卷构建，衡量个体对 HIV 检测社会规范的感知）；\(Y\) = HIV 检测行为（二值，过去 3 个月是否检测）。 - 怎么用上去：将社会规范作为连续中间变量，按本文的 copula+SW-CRT 框架建模。估计不同社会规范主层下众包干预对检测行为的 PCE。\(\rho\) 的校准利用了同一 MSM 在不同周期的社会规范评分相关性。 - 结果说明什么：展示了在不同 \(\rho\) 假设下，PCE 的识别区间如何变化；验证了社会规范确实是干预影响检测行为的重要路径（某些主层下 PCE 显著异于零）；同时展示了 SW-CRT 纵向数据如何缩小 \(\rho\) 的合理范围，从而缩小 PCE 的识别区间（相比无校准的纯 sensitivity 分析，识别区间更窄）。

🔎 结论是否比证明窄 本文在理论部分严格证明了在 \(\rho\) 固定下的点识别与 \(\rho\) 区间下的 partial identification。但在应用部分，对集群内干扰的忽略（Assumption 1 仅假设集群间无干扰）是一个被泛泛 claim 但未显式处理的点——如果集群内个体间的社会规范存在溢出，\(M_{ijt}(z)\) 实际上依赖于同集群其他个体的处理，此时主层定义与识别公式需修改，而本文的估计实践暂未调整此点。此外，\(\rho_{time} = \rho_{treat}\) 的 homogeneity 假设在证明中被作为条件使用，但在应用中被承认是“strong且不可检验的”，仅作为 sensitivity 分析的锚点而非严格成立。

四、开放问题（点到为止，扎根具体语句）¶

集群内干扰对连续主层识别的影响：本文假设集群间无干扰，但集群内干扰（同一集群内个体的社会规范互相影响）未被纳入主层定义（见 Assumption 1 讨论处）。若放宽此假设，\(M_{ijt}(z)\) 将依赖集群内他人的 \(Z\)，主层需扩展为 \((M_{ijt}(0_{-j}), M_{ijt}(1_{-j}))\)，识别公式如何重构？（扎根于 Ohnishi & Li 2024 的引用语境与本文 Assumption 1 的局限性声明）。
非忽略缺失与死亡截断：SW-CRT 中常存在非随机脱落。Gasparini et al. (2024) 处理了无中间变量下的脱落，本文在 Discussion 明确指出“expand that approach in our setting with an intermediate outcome”是未来方向。此时需在 copula 联合建模中引入生存子模型，识别带截断的连续 PCE（扎根于 Discussion 末段对 Gasparini et al. 2025 的引用）。
Copula 假设的半参数突破：当前识别依赖 Gaussian copula，若放宽至非参数 copula，\(\rho\) 不再是单一参数，partial identification bounds 的数学形式是什么？能否得到不依赖特定 copula 族的 sharp bounds？（扎根于 Kim et al. 2019 与本文对 copula 假设的依赖，以及 Magnusson et al. 2019 全参数路线的对比张力）。
Principal Ignorability vs Latent Ignorability 在连续设定下的检验/敏感度：本文在识别中使用了某种 ignorability 假设（条件独立），在连续设定下该假设的违背如何参数化并进行 sensitivity 分析，目前只随 \(\rho\) 联动，未独立参数化（扎根于 Ding & Lu 2017, Jiang et al. 2022 对 PI 的 sensitivity 分析，本文未显式平行展开）。

Maintained by 陈星宇 · Homepage · Source on GitHub

A sensitivity analysis approach to principal stratification with a continuous longitudinal intermediate outcome: applications to a cohort stepped wedge trial¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论