跳转至

A sensitivity analysis approach to principal stratification with a continuous longitudinal intermediate outcome: applications to a cohort stepped wedge trial

作者: Lei Yang, Michael J Daniels, Fan Li
来源: Biostatistics
主题: 因果推断
相关性: 8/10
链接: 期刊页 · arXiv


一、领域脉络与小综述

这个方向是什么 Principal stratification (PS) 要解决的根本统计问题是:当处理(treatment)与结局(outcome)之间存在一个受处理影响的中间变量(intermediate/post-treatment variable,如依从性、死亡、中介变量)时,如何定义并估计异质性因果效应。由于中间变量本身受处理影响,直接按观测到的中间变量分层会引入选择偏差;PS 通过按潜在中间变量 \((M(0), M(1))\) 的联合取值定义“主层”,在层内估计因果效应,从而避免这一偏差。当前该方向在二值中间变量下已有较成熟的点识别与估计框架,但连续型中间变量下的识别与估计仍是瓶颈,本文正是切入这一瓶颈,并将其嵌入 stepped wedge cluster randomized trial (SW-CRT) 的特定设计结构中。

发展脉络 - 奠基工作:Frangakis & Rubin (2002) 提出 PS 框架(虽未在 intro 显式引用,但属领域共识起点);Angrist et al. (1996) 用工具变量处理依从性(引用句指出其属于“treatment compliance”类早期工作)。 - 主要进展(点识别路线):传统 PS 依赖 exclusion restriction (ER) 等强假设。Ding and Lu (2017); Jiang et al. (2022) and Tong et al. (2028/2025) 用 principal ignorability (PI) 替代 ER,发展出 principal score weighting 与 multiply robust 估计器,实现了二值中间变量下 PCE 的点识别(引用句明确指出这一替代路线)。 - 连续中间变量的 frontier:二值设定下主层有限,连续设定下主层无限细化、联合分布 \((M(0), M(1))\) 不可观测导致识别困难。Kim et al. (2019) 处理多个连续中间变量,提出 Gaussian copula 与 homogeneity 假设来识别 PCE(引用句直接点明其方法);Magnusson et al. (2019) 假设完全参数模型识别联合分布(引用句将其归为“fully parametric model”路线);Antonelli et al. (2023) 推广到连续处理与连续中间变量(引用句指出其扩展了 PS 框架)。Daniels et al. (2012) 在中介分析中引入 copula 处理联合潜在变量(引用句说明本文的 copula 思路受其启发)。 - SW-CRT 设计中的演进:SW-CRT 是一种单向交叉设计,集群在不同时间点随机切换至干预。Li et al. (2021) 建立了广泛使用的 mixed-effects model 框架(引用句表明本文在此基础上扩展);Maleyeff et al. (2022) 与 Kenny et al. (2021) 关注 exposure-time(干预时长)的异质性(引用句提及本文需参数化 treatment duration);Chen and Li (2025) 与 Wang et al. (2024) 提供了 SW-CRT 下的 no interference 假设与 model-robust 推断(引用句用于支撑本文的 estimand 定义与假设体系)。 - 本文的位置:在连续中间变量导致 \((M(0), M(1))\) 联合分布不可识别的瓶颈处,本文不依赖完全参数化或强 ER,而是沿用 copula 路线引入 sensitivity parameter \(\rho\),并利用 SW-CRT 时变处理分配结构产生的纵向中间变量数据,为 \(\rho\) 提供校准,实现 partial identification 与 Bayesian 估计。

子线索聚类 1. PS 识别假设演进:从 ER (Angrist et al. 1996) → PI (Ding & Lu 2017, Jiang et al. 2022, Tong et al. 2025) → 连续中间变量的 Copula + Sensitivity (Kim et al. 2019, Daniels et al. 2012, 本文)。这一簇在解决“主层潜在变量联合分布不可观测”的识别卡点。 2. SW-CRT 因果推断与 Estimand:从 Mixed model (Li et al. 2021) → Exposure-time heterogeneity (Maleyeff 2022, Kenny 2021) → Robust estimands/No interference (Chen & Li 2025, Kahan et al. 2024, Wang et al. 2024)。这一簇在厘清 SW-CRT 复杂设计下的目标量与稳健推断。 3. Bayesian 非参数与聚类数据中的 PS/Mediation:BNP 方法 (Xu et al. 2019, Ohnishi & Li 2024) 与聚类数据 SACE (Tong et al. 2023)。这一簇在处理复杂数据结构(半竞争风险、多中介、聚类)下的估计问题。

核心追问与瓶颈 1. 连续中间变量下 PCE 如何识别? 联合潜在变量 \((M(0), M(1))\) 只有边际可观测,非参数识别不可能。瓶颈在于:要么依赖强参数假设,要么引入不可检验的 sensitivity 参数,缺乏数据驱动的校准机制。 2. SW-CRT 的时变结构能为因果识别提供什么额外信息? SW-CRT 中同一单元在不同时期接受不同处理,这种纵向结构是否可以转化为对不可检验假设的约束? 3. 聚类数据下的 PCE estimand 如何定义才避免混淆? 集群平均 vs 个体平均、边际 vs 条件效应(Kahan et al. 2024 指出此张力)。

⚠️ 作者的 framing - 作者把缺口 frame 成什么:现有 PS 方法“主要关注二值中间变量”,连续中间变量下“联合分布不可识别”,而 SW-CRT 的时变结构“可以用来校准 sensitivity 参数”。这使得本文的“copula + SW-CRT 校准”成为填补连续 PS 空白的“显然下一步”。 - 竞争路线被淡化或回避:Causal mediation analysis (Imai et al. 2010) 是处理连续中间变量的另一大路线(通过 sequential ignorability 识别自然直接/间接效应),作者仅在 intro 一句带过其“探索中间变量下的因果路径”,未对比 PS 与 Mediation 在连续设定下的优劣(PS 关注层内总效应,Mediation 关注路径分解,两者 estimand 根本不同,作者未显式讨论为何选 PS 而非 Mediation 定义目标量)。 - 明显该被引却未出现的:关于连续中间变量 partial identification bounds 的纯理论工作(如纯数学上刻画连续联合潜在变量可达到的 sharp bounds),若存在,应在此处引用以对比本文的 copula 参数化路线是否牺牲了过多识别空间,这值得研究者去查证。

张力 未见明显对立引用。Ding & Lu (2017) 等用 PI 替代 ER 是假设上的演进而非矛盾;Kim et al. (2019) 的 copula 与 Magnusson et al. (2019) 的全参数模型是不同识别策略,无相反结论。


二、最核心、最简单的例子 / 数学问题

第一步:符号、模型、可观测数据交代

  • \(i\):集群指标(\(i=1,\dots,I\))。
  • \(j\):集群内个体指标(\(j=1,\dots,n_i\))。
  • \(t\):时间周期指标(\(t=1,\dots,T\))。
  • \(Z_{it}\):处理分配变量(0=控制,1=干预)。在 SW-CRT 中,\(Z_{it}\) 一旦从 0 变为 1,后续周期保持为 1(单向交叉)。
  • \(M_{ijt}(z)\):潜在中间变量(如社会规范评分,连续型)。个体 \((i,j)\) 在周期 \(t\) 若接受处理 \(z\) 会展现的中间变量值。
  • \(Y_{ijt}(z, m)\):潜在结局变量(如 HIV 检测行为,二值或连续)。个体 \((i,j)\) 在周期 \(t\) 若接受处理 \(z\) 且中间变量取值为 \(m\) 时的结局。
  • \(X_{ij}\):基线协变量(可观测,不受处理影响)。
  • 可观测数据:在 SW-CRT 中,研究者观测到 \((X_{ij}, Z_{it}, M_{ijt}^{obs}, Y_{ijt}^{obs})\)。其中 \(M_{ijt}^{obs} = M_{ijt}(Z_{it})\)\(Y_{ijt}^{obs} = Y_{ijt}(Z_{it}, M_{ijt}(Z_{it}))\)
  • 不可观测的潜在量:对同一 \((i,j)\) 在同一 \(t\)\(M_{ijt}(1-Z_{it})\) 永远不可观测(反事实中间变量)。主层由 \((M_{ijt}(0), M_{ijt}(1))\) 的联合取值定义,由于 \(M\) 是连续的,主层不可数,且其联合分布不可观测。

第二步:最小内核

剥掉 SW-CRT 的多周期与聚类结构,考虑单个时间点、无聚类、二值处理 \(Z \in \{0,1\}\)、连续中间变量 \(M\) 的最简特例。

  • 核心数学困难:要估计主层因果效应 (PCE),例如 \(E[Y(1, M(1)) - Y(0, M(0)) \mid M(0)=m_0, M(1)=m_1]\),必须知道主层 \((m_0, m_1)\) 的分布,即 \((M(0), M(1))\) 的联合分布 \(P(M(0), M(1)\)。但观测数据只提供边际分布 \(P(M(0) \mid Z=0)\)\(P(M(1) \mid Z=1)\)。从两个边际分布无法非参数恢复联合分布(等价于已知二维分布的两个边际,求联合,有无穷多解)。
  • 本文怎么破
  • 引入 Copula 假设:假设 \((M(0), M(1))\) 的联合分布由一个 Gaussian copula 连结,其相关性由单一参数 \(\rho \in [-1, 1]\) 决定。此时,联合分布被边际与 \(\rho\) 完全确定。\(\rho\) 即为 sensitivity parameter。
  • SW-CRT 校准 \(\rho\)(最简内核的推广):在普通二值实验中,\(\rho\) 完全不可检验。但在 SW-CRT 中,个体 \(j\)\(t=1\)\(t=2\) 都被观测。假设处理在 \(t=2\) 交叉,则观测到 \(M_{j1}(0)\)\(t=1\) 时在控制下)和 \(M_{j2}(1)\)\(t=2\) 时在干预下)。如果假设中间变量在不同时间的潜在值相关性,与同一时间内不同处理下的潜在值相关性结构相同或可约束(即时间序列上的相关性为 \(\rho_{time}\),跨处理的相关性为 \(\rho_{treat}\),假设 \(\rho_{time}\) 可提供 \(\rho_{treat}\) 的信息),那么观测到的纵向中间变量相关性 \(\text{Corr}(M_{j1}^{obs}, M_{j2}^{obs})\) 就为不可观测的 \(\rho\) 提供了校准锚点。
  • 一句话总结内核:用 Gaussian copula 参数 \(\rho\) 将连续中间变量的不可识别联合分布参数化,再利用 SW-CRT 纵向观测提供的中间变量跨期相关性,为 \(\rho\) 这个原本纯主观的 sensitivity 参数提供数据驱动的校准约束。

三、这篇论文做了什么

三句话 ① 研究了 SW-CRT 中连续型中间变量下主层因果效应 (PCE) 的识别与估计问题;② 核心方法是假设潜在中间变量联合分布服从 Gaussian copula(以 \(\rho\) 为 sensitivity 参数),并利用 SW-CRT 纵向结构对 \(\rho\) 进行校准,结合 Bayesian 框架进行推断;③ 主要结论是在合理假设(no interference, partial exchangeability, copula + homogeneity)下实现了 PCE 的 partial identification,并在 HIV 检测数据中展示了社会规范作为连续中间变量的异质性因果效应。

关键设定与假设 在最小记号基础上补全: - Estimand 定义:定义了时间特定主层因果效应 (time-specific PCE),如 \(\tau_t(m_0, m_1) = E[Y_{ijt}(1, m_1) - Y_{ijt}(0, m_0) \mid M_{ijt}(0)=m_0, M_{ijt}(1)=m_1]\)。由于连续主层不可数,实际关注聚合版(如对 \(m_0, m_1\) 的某区域积分,或条件期望 \(\tau_t(m_0)\))。同时区分了 cluster-average 与 individual-average estimand(引用 Kahan et al. 2024 的定义体系)。 - Assumption 1 (No interference among clusters):集群间无干扰(引用 Chen and Li 2025)。集群内可能存在干扰,但本文在估计阶段暂未显式处理集群内干扰对 PCE 的影响。 - Assumption 2 (Partial exchangeability / Ignorability)\((M_{ijt}(0), M_{ijt}(1), Y_{ijt}(0), Y_{ijt}(1)) \perp Z_{it} \mid X_{ij}\)。在 SW-CRT 中,处理分配由设计决定,此假设由随机化保证。 - Assumption 3 (Super-population sampling):集群从超总体中抽样(引用 Kahan et al. 2024),使得随机化推断可过渡到模型推断。 - Assumption 4 (Gaussian Copula for \((M(0), M(1))\))\((M_{ijt}(0), M_{ijt}(1))\) 的联合分布由 Gaussian copula 连结各自的边际分布(边际可非参数),相关系数为 \(\rho_{treat}\)。这是核心识别假设,将无穷维识别问题降维至单一参数 \(\rho_{treat}\)。 - Assumption 5 (Homogeneity / Stationarity for calibration):跨处理的相关性 \(\rho_{treat}\) 与跨时间的中间变量相关性 \(\rho_{time}\) 存在结构联系(如相等或函数关系),使得 \(\rho_{treat}\) 可由纵向观测校准。相比已有文献(Kim et al. 2019 假设了 homogeneity 但无纵向校准),本文利用了 SW-CRT 的时变设计来放宽纯主观指定 \(\rho\) 的任意性。

主要结果 1. Partial Identification of PCE:在 \(\rho_{treat}\) 固定时,PCE 被点识别;当 \(\rho_{treat}\) 在某区间 \([\rho_{L}, \rho_{U}]\) 变动时(区间由纵向校准给出),PCE 形成一个识别区间。定理给出了从边际分布、结局模型与 \(\rho\) 构造 PCE 识别公式的显式表达。 2. Bayesian Estimation via Stan:由于 PCE 涉及连续主层的积分与潜在变量的联合建模,本文采用 Bayesian 方法(Stan, Carpenter et al. 2017),对边际中间变量模型、结局模型及 copula 参数 \(\rho\) 联合推断。\(\rho\) 的先验由纵向校准信息构造(如以观测的跨期相关性为先验均值)。 3. Sensitivity Analysis:通过变动 \(\rho_{treat}\) 的先验/固定值,展示 PCE 随 \(\rho\) 变化的敏感度曲线,提供比传统“纯主观指定 sensitivity 参数”更客观的参照系。

证明路线与技术技巧 - 整体路线: 1. 定义 Estimand:在潜在结果框架下写出连续主层的 PCE,显式区分集群与个体层面。 2. 识别分解:将 PCE 中的 \(E[Y(z) \mid M(0)=m_0, M(1)=m_1]\) 分解为 \(E[Y(z) \mid M(z)=m_z, X] \times P(M(1-z)=m_{1-z} \mid M(z)=m_z, X) \times P(M(z)=m_z \mid X)\) 的积分形式。 3. Copula 参数化:用 Gaussian copula 将不可观测的 \(P(M(1-z) \mid M(z), X)\) 表达为可观测的边际 \(P(M(z) \mid X)\)\(P(M(1-z) \mid X)\)\(\rho_{treat}\) 的函数。 4. 纵向校准:在 SW-CRT 的 mixed-effects model 框架下(引用 Li et al. 2021),推导同一个体跨期中间变量观测值的相关性 \(\rho_{time}\),建立 \(\rho_{time}\)\(\rho_{treat}\) 的约束关系。 5. Bayesian 实现:将上述识别公式转化为 Stan 的似然/先验结构,进行 MCMC 推断。 - 关键跳跃点:从“不可观测的跨处理联合分布”到“由 copula 参数化的可计算条件概率”是第一跳;从“不可检验的 \(\rho_{treat}\)”到“由 SW-CRT 纵向结构提供校准的 \(\rho_{time}\)”是第二跳(最吃功夫,依赖对 SW-CRT 随机化结构与时间序列模型的联合推导)。 - 技术技巧点名: - Gaussian Copula:用于连结连续潜在中间变量的边际分布,解决联合分布不可识别问题(源自 Daniels et al. 2012, Kim et al. 2019)。 - Mixed-effects Model for SW-CRT:用于刻画集群随机效应与时间趋势,提取纵向中间变量的相关性结构以校准 \(\rho\)(源自 Li et al. 2021)。 - Bayesian MCMC (Stan):用于处理复杂积分与潜在变量模型,避免数值积分的维度灾难。

真实例子与应用 - 数据:Tang et al. (2018) 的中国 MSM 人群 HIV 检测 SW-CRT。8 个城市(集群),4 个序列,封闭队列。 - 变量映射\(Z\) = 众包干预(是否暴露于干预活动);\(M\) = 社会规范评分(连续,基于问卷构建,衡量个体对 HIV 检测社会规范的感知);\(Y\) = HIV 检测行为(二值,过去 3 个月是否检测)。 - 怎么用上去:将社会规范作为连续中间变量,按本文的 copula+SW-CRT 框架建模。估计不同社会规范主层下众包干预对检测行为的 PCE。\(\rho\) 的校准利用了同一 MSM 在不同周期的社会规范评分相关性。 - 结果说明什么:展示了在不同 \(\rho\) 假设下,PCE 的识别区间如何变化;验证了社会规范确实是干预影响检测行为的重要路径(某些主层下 PCE 显著异于零);同时展示了 SW-CRT 纵向数据如何缩小 \(\rho\) 的合理范围,从而缩小 PCE 的识别区间(相比无校准的纯 sensitivity 分析,识别区间更窄)。

🔎 结论是否比证明窄 本文在理论部分严格证明了在 \(\rho\) 固定下的点识别与 \(\rho\) 区间下的 partial identification。但在应用部分,对集群内干扰的忽略(Assumption 1 仅假设集群间无干扰)是一个被泛泛 claim 但未显式处理的点——如果集群内个体间的社会规范存在溢出,\(M_{ijt}(z)\) 实际上依赖于同集群其他个体的处理,此时主层定义与识别公式需修改,而本文的估计实践暂未调整此点。此外,\(\rho_{time} = \rho_{treat}\) 的 homogeneity 假设在证明中被作为条件使用,但在应用中被承认是“strong且不可检验的”,仅作为 sensitivity 分析的锚点而非严格成立。


四、开放问题(点到为止,扎根具体语句)

  1. 集群内干扰对连续主层识别的影响:本文假设集群间无干扰,但集群内干扰(同一集群内个体的社会规范互相影响)未被纳入主层定义(见 Assumption 1 讨论处)。若放宽此假设,\(M_{ijt}(z)\) 将依赖集群内他人的 \(Z\),主层需扩展为 \((M_{ijt}(0_{-j}), M_{ijt}(1_{-j}))\),识别公式如何重构?(扎根于 Ohnishi & Li 2024 的引用语境与本文 Assumption 1 的局限性声明)。
  2. 非忽略缺失与死亡截断:SW-CRT 中常存在非随机脱落。Gasparini et al. (2024) 处理了无中间变量下的脱落,本文在 Discussion 明确指出“expand that approach in our setting with an intermediate outcome”是未来方向。此时需在 copula 联合建模中引入生存子模型,识别带截断的连续 PCE(扎根于 Discussion 末段对 Gasparini et al. 2025 的引用)。
  3. Copula 假设的半参数突破:当前识别依赖 Gaussian copula,若放宽至非参数 copula,\(\rho\) 不再是单一参数,partial identification bounds 的数学形式是什么?能否得到不依赖特定 copula 族 的 sharp bounds?(扎根于 Kim et al. 2019 与本文对 copula 假设的依赖,以及 Magnusson et al. 2019 全参数路线的对比张力)。
  4. Principal Ignorability vs Latent Ignorability 在连续设定下的检验/敏感度:本文在识别中使用了某种 ignorability 假设(条件独立),在连续设定下该假设的违背如何参数化并进行 sensitivity 分析,目前只随 \(\rho\) 联动,未独立参数化(扎根于 Ding & Lu 2017, Jiang et al. 2022 对 PI 的 sensitivity 分析,本文未显式平行展开)。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论