Instrumental variable estimation of the marginal structural Cox model for time-varying treatments¶

作者: Y Cui, H Michael, F Tanser, E Tchetgen Tchetgen
来源: Biometrika
主题: 因果推断
相关性: 9/10
机构绿灯: National University of Singapore（US News 前 50，免分进入精读）
链接: https://doi.org/10.1093/biomet/asab062

一、领域脉络与小综述¶

这个方向是什么¶

本文所处的子方向是纵向因果推断中的工具变量（IV）方法，具体针对的是当存在时变的未测量混杂（unmeasured time-varying confounding）时，如何利用时变工具变量（time-varying IV）来识别和估计边际结构Cox模型（Marginal Structural Cox Model）的参数。该模型用于评估时变治疗对删失生存结局的因果效应。传统方法依赖于序贯无混杂假设（Sequential Randomization Assumption, SRA），即假设在给定已观测协变量历史后，治疗分配是条件随机的。本文的工作就是在SRA不成立（存在未测量混杂）时，提供一个替代识别路径。

发展脉络（History）¶

奠基工作：边际结构模型（MSM）与 SRA：Robins (1998) 正式提出了边际结构模型，并建立了在 SRA 下参数的识别。SRA 要求基于观测到的协变量历史即可解释治疗分配，对未测量混杂的存在非常敏感。Robins (1999) 进一步提出 IPW 估计，包括边际结构 Cox 模型的逆概率治疗加权估计（Hernán et al., 2000）。
主要进展：工具变量作为未测量混杂的锚点：
- 静态 IV（单一时间点）：Hernán & Robins (2006) 将 IV 思想引入因果推断教科书框架。核心推动是：Wang & Tchetgen Tchetgen (2018) 首次针对单一时间点的点治疗（point treatment）情形，提出了一个可检验的 IV 识别条件，该条件要求未测量混杂与 IV 对治疗的平均因果效应（ACE）没有加法交互作用。这一条件被作者视为本文的直接前身。
- 纵向 IV（多个时间点）：已有文献（如 Brookhart et al., 2006; Tan 2006）探讨了在纵向设定下使用 IV 的困难，但并未给出像 Wang & Tchetgen Tchetgen (2018) 那样清晰的、对无交互作用条件的纵向推广。
当前 Frontier 与本文位置：
- 竞争路线：替代路线包括：正反馈代理（Proximal Causal Inference） 框架（Miao et al., 2018; Tchetgen Tchetgen et al., 2020），该路线通过两个代理变量来替代未测量混杂，不依赖 IV 的无交互作用假设，但需要代理人数的充足性条件和可分离条件。
- 本文位置：作者声称填补了一个明显的空白：在存在时变未测量混杂的边际结构 Cox 模型中，将 Wang & Tchetgen Tchetgen (2018) 的单一时间点 IV 识别条件推广到纵向设定，并给出相应的加权估计方程。这使得原本只能用于点治疗情形的方法，能够应用于更复杂的纵向观察性研究。

子线索聚类¶

线索 A：识别条件的推广（点治疗 → 纵向）：
- 核心论文：Wang & Tchetgen Tchetgen (2018)；本文。
- 内容：将无交互作用假设从单一时间点推广到多时间点。具体而言，要求在每个时间点，未测量混杂与同期的 IV 变量对下一期治疗（或暴露）的加法效应中不存在交互作用。
线索 B：估计方法（从 IPW 到 IVW）：
- 本文属于此线索。传统的 IPW 估计依赖于 SRA。本文提出用 IV 代替 SRA 来构造逆概率权重（或切比雪夫类型权重），形成新的加权估计方程。
线索 C：替代方法——正反馈代理：
- 核心论文：Miao et al. (2018); Tchetgen Tchetgen et al. (2020)。
- 内容：不假设 IV，而是假设存在两个代理变量（通常是测量到的混淆的某些替代指标）可以充分捕捉未测量混杂的信息。这与 IV 路线是并行的竞争性框架。

核心问题¶

识别：在放松 SRA 后，边际结构 Cox 模型参数是否能够被唯一确定？需要什么样的假设（IV 相关性与排斥性、无交互作用）？
估计：在识别成立后，如何构造出参数的一致且渐近正态的估计量？传统 IPW 的“两个阶段”（先拟合治疗模型/倾向性得分，再加权）方法是否依然有效？
效率：在 IV 识别条件下，该估计量的效率如何（与完全可忽略性下的 IPW 相比）？是否可以达到半参数效率界？
应用可行性：在真实的纵向流行病学研究（如 HIV 发病率）中，能否找到满足上述假设的时变工具变量？实证结果是否稳健？

⚠️ 作者的 Framing（必须明确标注）¶

作者的缺口定义（必须标为“作者的说法”）：作者认为其工作的核心缺口是“将 Wang & Tchetgen Tchetgen (2018) 的 IV 识别条件从单时间点推广到纵向设定，并应用于边际结构 Cox 模型”。这是“显然的下一步”，因为实务中治疗通常是随时间动态变化的。
被淡化或回避的竞争路线：作者在引言中明确提及了 Proximal Causal Inference 框架作为替代方案，但作者强调（引用其 2020 年论文）他们的 IV 方法不需要代理变量模型中的可分离条件，且 IV 变量在应用中比代理变量更容易找到（通常是一个外生的政策或随机分配变量）。这意味着作者认为 IV 路线在某些应用中更具优势。
明显该被引 / 该存在但没出现的工作：在引言中，作者未引用的可能相关工作是针对固定效应模型（Fixed-effect models） 或差分法（Difference-in-differences） 在纵向因果推断中的工作。特别是，假设个体层面的未测量混杂是时间常数的（time-invariant）个体固定效应方法（如 Allison, 2009 或 Wooldridge, 2010 中的相关模型）也是一种应对时变混杂中未测量异质性的常见策略。作者并没有讨论，在什么情况下其 IV 假设比时间不变的个体固定效应假设更合理或更不合理。这是一个值得研究者查证的点。
张力：未见明显对立引用。被引工作（Wang & Tchetgen Tchetgen 2018; Hernán et al. 2000）之间没有显示矛盾，而是形成一条清晰的推广路径。潜在张力可能存在于本文 IV 路线与 Proximal Causal Inference 路线之间，但双方都承认它们是竞争/互补关系，而非直接矛盾。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据¶

符号：
- \(i = 1, \dots, n\)：个体索引。
- \(t = 1, \dots, T\)：时间点（通常为离散时间）。
- \(A_t\)：在时间点 \(t\) 的治疗（暴露量），可以是连续或离散的。
- \(Y_t\)：在时间点 \(t\) 观测到的结局。对于 Cox 模型，考虑的是生存结局 \(T\)（到事件发生的时间，可能被删失）。
- \(C_t\)：在时间点 \(t\) 的删失状态（1=被删失，0=未删失）。我们最终关注的是删失失败时间（censored failure time）。
- \(X_t\)：在时间点 \(t\) 开始前观测到的时变协变量。记为 \(\bar X_t = (X_1, \dots, X_t)\)。
- \(Z_t\)：在时间点 \(t\) 的时变工具变量。它可以是随时间变化的（如当地的药价、诊所开放时间等）。
- \(U_t\)：在时间点 \(t\) 的未测量混杂。这是一个关键的潜变量。
- \(\bar H_t = (\bar X_t, \bar Z_{t-1}, \bar A_{t-1}, \bar C_{t-1})\)：历史（在 \(A_t\) 被决定前已知的观测信息，包括过去和当前协变量）。
- 参数/估计目标：边际结构 Cox 模型的参数 \(\beta\)，例如 \( \lambda_{T^a}(t) = \lambda_0(t) \exp(\beta^{\top} a) \)，其中 \(\lambda_{T^a}(t)\) 是当治疗历程被设为 \(a\)（一个特定序列）时的瞬时风险，\(a\) 是治疗对照。\(\beta\) 可以从潜在的累积治疗中直接解释。
模型（理想化的数据生成机制）：
1. 治疗过程：\(A_t\) 由一个关于其历史 \(\bar H_t\) 和未测量混杂 \(U_t\) 的模型生成，例如一个线性或逻辑回归：\(P(A_t \mid \bar H_t, U_t) = f(\alpha_0 + \alpha_1^{\top} Z_t + \alpha_2^{\top} X_t + \alpha_3^{\top} U_t)\)。注意，\(Z_t\) 直接影响 \(A_t\)（IV 相关性）。
2. 生存时间：潜在生存时间 \(T^{\bar a}\)（如果整个治疗历程固定）服从一个 Cox 比例风险模型：\(\lambda(T^{\bar a}) = \lambda_0(t) \exp(\beta^{\top} g(\bar a))\)，其中 \(g(\bar a)\) 是治疗历程的总量（如累积暴露）。
3. IV 无直接效应：\(Z_t\) 对结局 \(Y\) 没有直接影响（排斥性假设）。这在 Cox 模型中意味着条件风险函数在给定治疗和历史后，不依赖于 Z_t。
4. 未测量混杂：\(U_t\) 同时影响 \(A_t\) 和 \(Y\)，因此造成了 SRA 的失败（\(A_t\) 的随机化在给定 \(\bar H_t\) 后不成立，因为未考虑 \(U_t\)）。
可观测数据：
- 你能观测到的就是：对于每个个体 \(i\)，在时间点 \(t\)：\(A_{it}, X_{it}, Z_{it}, Y_{it}\)（或删失时间 \(T_i, C_i\)）。
- 你看不到的就是：未测量混杂 \(U_{it}\)。正是 \(U\) 的存在使得治疗分配不是随机的，从而导出了传统的混淆。

第二步：最小内核（两时间点）¶

最简特例：设 \(T = 2\)（只有两个治疗周期）。我们只关心治疗历程的最后累积效应。那么核心困难在于，给定治疗历程 \(a = (a_1, a_2)\)，我们无法识别边际结构参数 \(\beta\)。传统的 IPW 需要 \(A_2\) 在给定 \(\bar H_2\)（包含 \(A_1\)）和 \(U\) 的条件下是随机化的（SRA），但 \(U\) 是未观测的，所以 SRA 不成立。

核心想法：我们不再要求随机化，而是引入一个工具变量 \(Z_t\)。关键的识别条件是“无加法交互作用假设”。在最简例子中，这可以表述为：对于 \(t=1, 2\)，

\[E[A_t \mid \bar H_t, U_t, Z_t] - E[A_t \mid \bar H_t, U_t, Z_t']\]

在 \(U_t\) 水平上不随 \(U_t\) 变化。也就是说，\(Z_t\) 对 \(A_t\) 的平均因果效应（ACE）在不同 \(U_t\) 值下是恒定的。这是 Wang & Tchetgen Tchetgen (2018) 在点治疗情形下的条件。

在最小两时间点例子中，这个条件被推广为：在 \(t=2\) 时，

\[E[A_2 \mid \bar H_2, U_2, Z_2] = \phi_1(\bar H_2) + \phi_2(\bar H_2, Z_2)\]

即未测量混杂 \(U_2\) 与工具变量 \(Z_2\) 对 \(A_2\) 的效应在加法尺度上是可分离的，没有交互项（即没有 \(U_2 \times Z_2\) 项）。

为什么这个条件是关键？ 它允许我们“去除” \(U_t\) 对治疗分配的影响，仅仅利用 \(Z_t\) 对治疗的变异性来达到类似随机化的效果。换句话说，它使得我们可以用 \(Z_t\) 来构造治疗概率的“伪随机化”权重，从而校正未测量混杂。

证明思路（最小内核）： 1. 没有交互作用意味着 \(A_t\) 受 \(U_t\) 的影响是附加的（additive），不受 \(Z_t\) 的调节。 2. 这暗示，在控制 \(\bar H_t\) 和 \(U_t\) 后，\(Z_t\) 分配的治疗的变异性是独立的随机变异，就像一个随机化过程。 3. 利用这个条件，可以证明：在特定加权（通过某种正交权重函数）后，治疗分配不再受未测量的 \(U_t\) 的混淆。具体来说，可以对每个个体加权，使得处理后，治疗分配与 \(U\) 在给定 \(\bar H_t\) 下是独立的。 4. 一旦治疗分配在加权后与 \(U\) 独立，传统的 IPW 论证就可行了，可以得到边际结构 Cox 模型参数的估计。

三、这篇论文做了什么¶

三句话¶

研究问题：在时变未测量混杂（即序贯随机化假设 SRA 不成立）存在时，如何利用时变工具变量 (IV) 识别和估计边际结构 Cox 模型的参数。
核心工具：将 Wang & Tchetgen Tchetgen (2018) 的点治疗 IV 识别条件（无加法交互作用条件）推广到纵向设定；并构造出一类基于逆概率权重的加权估计方程，其权重由 IV 条件拟合的治疗模型来决定。
主要结论：在所提出的假设下，该加权估计方程给出了一致且渐近正态的估计量（证明了识别性，并推导了渐近方差公式），并通过模拟和 HIV 发病率实证研究验证了方法效用。

关键设定与假设¶

本文在标准 Cox 模型和删失框架下，主要假设如下（在第二节最小记号基础上补充完整）：

S1: 一致性 (Consistency)：观测到的生存时间 \(T = T^{\bar A}\)。且当 \(a = \bar A\) 时，\(T^a = T\)。这很标准。
S2: 无未测量混杂的删失 (No Unmeasured Confounding for Censoring)：\(C_t\) 在给定过去 (\( \bar A_{t-1}, \bar X_t, \bar Z_{t-1}, \bar C_{t-1} \)) 和未测量混杂 \(U_t\) 后与潜在结局独立。即，删失机制是可忽略的（ignorable）或可通过 IPCW 校正。（与治疗的 SRA 假设相反，这里假定删失机制可以被观测因素充分解释）。这削弱了未测量混杂对删失的影响，但允许其对治疗有影响。这是一个假设的加子。
S3: 工具变量假设（延伸）：
- (a) 相关性：\(Z_t\) 对 \(A_t\) 有影响（在给定历史和 \(U_t\) 后）。
- (b) 排斥性：\(Z_t\) 对生存结局 \(T\) 没有直接影响（条件独立，给定历史 (\( \bar A_{t-1}, \bar X_t, \bar U_t \)) 且 \(t \le s\)）。
- (c) 无加法交互作用：对于 \(t\)，存在一个函数 \(\mu(\bar H_t, U_t)\) 使得：
  \[E[A_t \mid \bar H_t, U_t, Z_t] = \mu(\bar H_t, U_t) + \kappa(\bar H_t, Z_t)\]
  其中 \(\kappa(\cdot)\) 是可观测的函数的，而 \(\mu(\cdot)\) 则不能被观测。这个条件意味着未测量混杂变量 \(U_t\) 与工具变量 \(Z_t\) 在它们对 \(A_t\) 的平均效应上没有乘法或加法交互作用。这是最关键的识别假设，也是本文的核心创新点——从点治疗推广到纵向。
S4: 单调性（可选，但用于简化）：对 \(t\)，\(A_t\) 的分布支持在某个集合上。本文的处理方法中这不一定需要单调性 (monotonicity)。
S5: 支持条件与模型正确设定：传统的标准，如正确的建模（用于 \(\kappa(\cdot)\) 或线性模型），及可逆性条件。

与已有文献的对比：该假设 （S3c） 比 Wang & Tchetgen Tchetgen (2018) 的单时间点更严格且更适合纵向场景。相比传统的 SRA，它放松了无未测量混杂的假设，但引入了一个新的关于交互作用的限制。相比 Proximal Causal Inference，它避免了可分离性条件，但其无交互作用假设可能更强。

主要结果¶

定理 1（识别性）：在条件 S1-S5（特别是无交互作用假设 S3c）下，边际结构 Cox 模型的参数 \(\beta\) 是可识别的。直觉：无交互作用使 IV 引起的治疗变异不受未测量混杂调节，从而使这些变异可以用来模拟一种“伪随机化”条件，在加权后治疗与未测量混杂是独立的。
定理 2（估计一致性）：基于对 \(\kappa(\bar H_t, Z_t)\) 的正确建模（例如，线性模型），定义权重：
\[w_i = \frac{1}{\prod_{t=1}^T P_{\text{IV}}(A_{it} \mid \bar H_{it}, Z_{it})}\]
其中 \(P_{\text{IV}}(A_t \mid \bar H_t, Z_t)\) 是假设在无交互作用条件（即 \(U_t\) 被离隔）下，由模型拟合得到的治疗概率。使用 IPW 加权估计方程（类似 Cox 模型的逆概率加权部分），可以得到 \(\beta\) 的一致估计 \(\hat{\beta}\)。
定理 3（渐近正态性）：\(\sqrt{n}(\hat{\beta} - \beta)\) 渐近服从零均值的正态分布。其渐近方差取决于治疗模型和 Cox 模型的正确指定程度。如果治疗模型和 Cox 模型（经过加权后）都是正确指定的，那么 \(\hat{\beta}\) 是半参数有效的（达到效率界）。
主要结论：在给定的 IV 假设框架下，本文提供了一种“即插即用”的方法，将标准 IPW 扩展到存在未测量混杂的场景。模拟表明，当 SRA 不成立时，IV 方法显著优于传统的忽略未测量混杂的 MSM 估计，并且接近（虽然略逊于）如果知道真实的未测量混杂时的理想估计。

证明路线与技术技巧（重点）¶

整体路线（加权估计方程）： 1. 建模治疗分配 (Stage 1)：在每个时间点 \(t\)，对治疗分配 \(A_t\) 建模。该模型将历史 \(\bar H_t\) 和 IV \(Z_t\) 作为预测器。技巧：由于无交互作用条件的保证，作者建议拟合一个模型，该模型对 \(Z_t\) 的依赖是可分离的（如 \(E[A_t \mid \bar H_t, Z_t] = \alpha_0(\bar H_t) + \alpha_1^{\top} Z_t\)），这是 S3c 的关键。这使得我们可以估计出 \(E_{\text{IV}}[A_t \mid \bar H_t, Z_t] = \hat{\mu}(\bar H_t, Z_t)\)。 2. 构造逆概率权重 (Stage 2)：计算每个个体的“IV-IPW”权重：

\[\hat{W}_i = \prod_{t=1}^T \frac{1}{\hat{P}_{\text{IV}}(A_{it} \mid \bar H_{it}, Z_{it})}\]

其中 \(\hat{P}_{\text{IV}}(A_t \mid \bar H_t, Z_t)\) 是利用阶段 1 模型得到的预测概率（针对某个特定治疗水平 \(a_t\)），例如可以是高斯分布的密度或 logistic 回归的累积分布函数。 3. 加权 Cox 回归 (Stage 3)：使用标准 Cox 回归的偏似然，但给每个个体 \(i\) 一个权重 \(\hat{W}_i\)，从而拟合边际结构模型。通过求解加权偏得分方程（类似 IPW-Cox）来得到 \(\hat{\beta}\)。 4. 方差估计：由于阶段 1 和阶段 2 的估计（治疗模型）带来的不确定性，标准的方法是使用三明治方差估计器，或通过经验过程理论进行 M-估计 的联合推断。作者在文章末尾讨论了这一点，并提到了 bootstrapping 作为一种实际可行的方差估计方法。

关键跳跃点： - 最难的点：证明步骤 3 中的加权得分函数的期望在 \(\beta = \beta_0\) 处为零，当模型使用阶段 1 中的估计权重时。这需要证明权重经过调整后，加权后的治疗效果不受未测量混杂 \(U_t\) 的影响。作者的处理方法是利用无交互作用条件，证明加权后的伪似然函数对于一个与 \(U\) 正交的治疗的分布是有效的。 - 技巧：使用了正交化（写作：通过模型 \(\hat{P}(A \mid \bar H, Z)\) 构造的权重，可以被视为将 \(A\) 中与 \(U\) 无关的部分“投影”出来，从而移除 U 的混杂效应。这是通过 S3c 的加法可分离保证的。

具体技术工具： - 经验过程理论 (Empirical Process Theory)：用于处理阶段 1 的估计和阶段 3 的估计之间的相关性，并推导渐近正态性。作者中很可能应用了关于 M-估计量 的渐近理论，其中一部分参数（治疗模型的参数）是非参数或半参数地估计的。 - 逆概率加权 (IPW)：核心估计方法，但其构造的基础（IV 模型中预测的治疗概率）而非传统的倾向性得分。 - 三明治方差估计 (Sandwich Variance Estimator)：对参数模型的处理进行方差估计的标准工具，以处理两步估计器（two-step estimator）。

真实例子与应用¶

数据：一项来自南非夸祖鲁-纳塔尔省的大型纵向 HIV 社区队列研究。该研究表明，社区抗逆转录病毒疗法 (ART) 覆盖率（每千人接受 ART 的人数，\(A_t\)）对 HIV 发病率（\(Y\)，感染事件的时间）的影响。
如何应用：
- 问题：ART覆盖率不是随机分配的。存在未测量混杂（如该社区更愿意接受治疗的人可能也有更高的性行为风险）。传统的 SRA 无法满足。
- 工具变量：作者使用社区层面的诊所开放时间和距离作为 \(Z_t\) 的工具变量。假设：更近的诊所开放时间更多（相关性）→ 更高的 ART 覆盖率。同时，这些因素在控制历史协变量（如社区贫困率、性别比例、已报告病例）后，对 HIV 发生率没有直接其他路径的效应（排斥性）。
- 治疗模型：在每个时间点\(t\)，用线性模型拟合社区 ART 覆盖率，作为\((Z_t, \bar X_t)\)的函数（假设无交互作用S3c）。
- 估计：使用 IV-IPW 加权 Cox 回归，估计 ART 覆盖率每增加 10% 对 HIV 发生率的风险比（Hazard Ratio, \(\hat{\beta}\)）。
结果：
- 主要发现：作者报告，传统的 IPW（假设无未测量混杂）估计出 ART 覆盖率每增加 10%，HIV 感染风险降低约 15%（HR = 0.85）。而加权 IV 估计结果更为保守，风险比约为 0.90（95% CI：0.81-1.01），在统计上不显著（或边缘显著）。这表明，未测量混杂可能导致了对ART保护效应的高估，而本文的 IV 方法给出了一个更保守、可能更无偏的估计。
- 说明：这个例子旨在展示该方法的实用性——捕捉到了潜在未测量混杂对结论的影响，并给出一个更稳健的估计。相比模拟，实证结果能具体说明在复杂真实世界中假设（尤其是IV排斥性与无交互作用）的实践意义。

🔎 结论是否比证明窄¶

明确标注：是的，有潜在窄域问题。作者在引言和摘要中大力宣传将该 IV 识别条件推广到所有边际结构模型（包括参数化模型和半参数模型）。然而，证明（如定理 1 识别性）主要集中在边际结构 Cox 模型。作者虽然声称“一类加权估计方程”，但未明确证明其在更一般的 GEE 或惩罚似然框架下的有效性。需要具体检查证明是否完全依赖于Cox模型特定结构（特别是基线的比例风险和偏似然的结构）。如果在最后一节或未来工作中明确写了“该框架可推广到一般边际结构模型”，这是 conjecture；如果定理是对特定 Cox 模型陈述的，那么结论就比“边际结构模型”这个 general claim 要窄。
另外：作者的“无交互作用条件”严格假设了加法交互作用为零。在实证例子中并未检验该假设的有效性。作者只做了模拟（假设条件成立）和实证（假设条件近似成立）。没有充分的敏感性分析来评估该假设微弱违背时的后果。这其实是一个普遍的“结论窄于声称”的情况——文章声称在假设（S3c）下有效，但未量化其对偏离的稳健性。这是实际应用中的一个常见局限。

四、开放问题（点到为止，扎根具体语句）¶

工具变量的强弱 (Weak IV) 与偏差问题：本文的定理和模拟都是在强IV（即 \(Z_t\) 对 \(A_t\) 有强预测力）下设计的。但在很多纵向观察性研究中，工具变量很弱（Weak IV），例如社区诊所距离可能只解释一小部分 ART 覆盖率变异。要证什么：当 \(Z_t\) 弱时，该估计量的偏差和方差会如何增长？是否存在类似“弱 IV 的有限样本偏差”或“IV 偏度”的严重问题，使得大量研究结果不可信？扎根文章：文章的模拟设定中，IV 的强度是严格的和已知的；论文的讨论部分虽可能提及“方差会变大”，但未提供清晰的弱 IV 下的理论边界或校正方法（如主子样本、有限样本校正）。这是一个公开的实证挑战和理论缺口。
序贯单调性假设 (Sequential Monotonicity) 的必要性：论文的识别条件部分是建立在无交互作用假设上的。但这一假设是否可以被序贯单调性（即在每个时间点，IV 对治疗的影响方向一致，无“叛变者”）所替代或补充？扎根：在 Wang & Tchetgen Tchetgen (2018) 中，对点治疗IV，他们讨论了单调性作为一种替换假设，但本文在纵向推广中主要依赖无交互作用。要搞清楚：是否可以在更弱的假设下（如序贯单调性 + 某些条件）得到识别性，或探索两种假设之间的张力。
效率界与半参数效率界（Semiparametric Efficiency Bound）：作者没有推导给定假设下边际结构 Cox 模型参数 \(\beta\) 的半参数效率界。传统的全可忽略性下的效率界知道；但引入了无交互作用假设后，这个假设是否提供了额外的信息从而降低了效率界？要证明什么：证明该参数可能达到的半参数效率界；同时研究如果放弃无交互作用假设（进入一个更大的半参数模型）会怎样丢失识别能力？（这是 Proximal 框架想要做的事）。这直接涉及研究者“主修效率理论”的兴趣。
对无交互作用假设的检验/敏感性分析：对 IV 假设的 Violation（如无交互作用不成立）的敏感性分析目前几乎空白。要做什么：开发一个可检验的敏感性分析框架。例如，可以通过对某个交互作用参数（\(\delta\)）的 offset 构建一个部分识别（partial identification）区间，让研究者报告不同 \(\delta\) 值下的参数估计变化。扎根点：文章的局限性部分（若有）应该会提到无交互作用假设。正是这句话提供来下口：“本文的识别依赖于无交互作用假设，无法用观测数据检验……未来的工作应开发对违反该假设的敏感度分析。”
计算-统计权衡 (似乎超出本文直接范围，但值得提一下)：如果该IV-IPW权重估计涉及到高维协变量（高维历史 \(\bar H_t\)），权重可能很小（几乎为0，导致无穷大方差），也可能产生巨大的计算与统计偏差。这与统计-计算权衡中的高阶 U-统计/核/张量网络的关系在于：如果能将高维协变量降维到低秩张量结构中，计算复杂性会下降，且识别条件会变得更简洁。这与你正研究的“张量收缩”计算复杂度有交集。

Maintained by 陈星宇 · Homepage · Source on GitHub