Nonparametric tests of the causal null with non-discrete exposures¶

讲者: Ted Westling
讨论人: Oliver Dukes
来源: OCIS (Online Causal Inference Seminar)
日期: 2021-09-21
主题: 因果推断
视频: https://youtu.be/kwfLbgrf4L0 · 幻灯片

本页据讲座录音的自动转写（ASR）生成。人名 / 术语 / 公式 / 具体的率与界可能被听错，关键处请对照视频或讲者论文核对。

相关论文¶

2001.05344 （尚未精读 — talks read --id … --read-papers 可补）

一、这场报告在讲哪条工作线¶

这条工作线属于因果推断中非参数假设检验的子领域，具体是：在仅有可观测混杂的观测研究中，如何非参数地检验一个单变量暴露（可离散、连续或混合）对结局是否存在平均因果效应（即因果剂量-反应曲线是否为常值）。

子方向的核心追问：在无未观测混杂条件下，我们已有一整套成熟的因果效应估计与推断方法（如 AIPTW、TMLE），但其中绝大多数聚焦于二元暴露。当暴露是多值离散乃至连续时，同样的框架面临两个根本挑战：(1) 每一点上的剂量-反应函数 θ₀(a) 在非参数模型中收敛速度慢于 n^{-1/2}（点wise rate 受光滑性限制），(2) 当暴露有很多水平时（甚至 n 个观测有接近 n 个唯一值），传统方法（如基于每个 level 的 AIPTW 再做卡方检验）的渐近理论失效。
奠基与主流路线：对于二元暴露（A∈{0,1}），AIPTW 与 TMLE 提供的非参数渐进有效测试已很成熟，基于 EIF 构造的 Wald 型检验或 score 检验可得 n^{-1/2} 速率的局部检验力。对于固定有限多值暴露（如 A∈{1,…,K}，K 固定且远小于 n），类似方法可自然推广：先对每个 level 做 AIPTW/TMLE 估计 θ₀(a)，再基于其联合渐近正态性做 χ² 检验。但鲜有工作处理 K 随 n 增长、连续暴露或混合分布暴露的全局检验。Kennedy et al. (2017, JRSS-B) 与 Westling, Gilbert, Carone (2020, JRSS-B) 等提出了连续暴露下的点wise 推断（比如非参估计 θ₀(a) 及逐点置信区间），但全局性检验（整个曲面是否为常值）未被系统处理过。
这场报告站在哪：它提出了第一种对于任意单变量暴露（离散/连续/混合）的非参数、双稳健的全局零假设检验。核心创新是：不直接检验 θ₀(a)≡c（因为 θ₀ 在非参数模型里难估），而是将其等价转化为检验一个更易估的原始函数 Ω₀(a)=0，该函数有可估计的有效影响函数，从而可以构建 n^{-1/2} 速率的测试统计量，且像经典二元情形一样具有双稳健一致性与局部 n^{-1/2} 检验力。

点名相关关键工作（部分姓名可能有ASR误差，待核实）： - Kennedy et al. (2017, JRSS-B): 连续暴露下的双稳健非参数估计，点wise 推断。 - Westling, Gilbert, Carone (2020, JRSS-B): 因果等距回归，同样提供连续暴露的点wise 推断与同时置信带。 - Robins (1986) 的 G-formula 引入，以及 Young et al. (2019, JASA) 关于代表性干预下的逆概率加权。 - 注意：转写稿中提到"Gill and Robins (2001)"也讨论了连续因果推断，此处不做扩展。

二、最小内核 / 一个最简例子¶

符号与模型¶

可观测数据：对每个单元，观测到 O = (Y, A, W)：
A：暴露，取值于 A ⊂ ℝ（支持可以是任意子集：离散、连续或混合），marginal CDF 为 F₀(a) = P(A ≤ a)；
Y：结局；
W：d 维观测协变量。
潜在结果：对每个 a∈A，Y(a) 是分配 A=a 时的反事实结果。
目标参数（因果剂量-反应函数）：θ₀(a) = E[Y(a)]（若赋值为 a 时的平均结局）。
估计目标（识别后）：在无未观测混杂（Y(a)⊥A|W）与一致性假设下，θ₀(a) = E[μ₀(a,W)]，其中 μ₀(a,w)=E(Y|A=a,W=w)。

原假设 H₀¶

“剂量-反应曲线是平坦的”：对于所有 a∈A，θ₀(a) = 常数（记为 γ₀）。
等价表述：θ₀(a) = γ₀ ∀a，其中 γ₀ = ∫θ₀(a) dF₀(a)。

最简特例¶

假设暴露 A 是混合分布：50% 概率取值为 0，另 50% 概率在区间 [0.5,1] 上均匀分布。只有一个二元协变量 W∈{0,1}。

识别：θ₀(a) = E[μ₀(a,W)]，其中 μ₀(a,w)=E(Y|A=a,W=w)。
直接检验困难：对 a∈[0.5,1]，θ₀(a) 在非参模型里收敛慢于 n^{-1/2}，无法直接做 Wald 检验。
核心转化：定义
F₀(a)=P(A≤a)；
Γ₀(a)=∫_{−∞}^{a} θ₀(u) dF₀(u)（累积加权剂量-反应）；
Ω₀(a)=Γ₀(a) − γ₀ F₀(a)。
关键命题：如果 θ₀ 连续，那么
H₀（θ₀ 平坦 ⇔ Ω₀(a)=0 ∀a）。
在例子中，若 H₀ 成立，则 Ω₀(a) 在所有 a 处恒为 0；否则在某个 a 处非零。
为什么 Ω₀ 更好估计：Ω₀(a) 是路径可微的（pathwise differentiable），它的 EIF 可显式计算（包含 μ₀ 与倾向得分）。因此可以用交叉拟合（sample splitting）+ 一步估计（one-step）构建 n^{-1/2} 一致估计 Ω̂ₙ(a)。而且无论 A 是离散还是连续，这个结构都成立——因为 Ω₀ 本质上是对原始函数做积分平滑，不依赖单独一点的 θ₀ 估计。
最终测试：选择一个范数 p∈[1,∞]，计算 T = √n ||Ω̂ₙ||_{F₀,p}，并与从 EIF 估计的渐近分布的分位数比较。

三、报告主体：讲者讲了什么¶

[0:00:05–0:06:58] — 开场与问题设置¶

讲者 Westling（UMass Amherst）介绍论文《Nonparametric Tests of the Causal Null with Non-Discrete Exposures》即将发表在 JASA。
定义了 A、Y(a)、θ₀(a) 等符号；说明假设 SUTVA、无未观测混杂与 positivity。
关键公式：θ₀(a)=E[μ₀(a,W)]（G-formula），H₀: θ₀(a)≡γ₀ ∀a。

[0:06:58–0:11:05] — 已有方法回顾 vs. 新挑战¶

二元暴露：AIPTW/TMLE 可做。离散多值（K 固定）：可推广，但 K 随 n 增长时 χ² 检验渐近失效。连续暴露：Kernel 或等距回归用于估计但未解决全局检验。
讲者展示一个实证例子：PA 2004 年吸烟数据，暴露为“孕妇每周平均吸烟数”，多达约 150 个唯一值，且分布有跳点（在 5、10、15 处明显的堆积）。指出这种情况的数据是“混合分布”，难以单纯归类为离散或连续。

[0:11:05–0:19:00] — 核心方法：原始函数转化+检验构建¶

密度测试类比：(a) 直接估密度（难）。(b) 用 CDF 转化：H₀:“密度均匀”⇔ CDF 为线性。这里类似：将 θ₀(a) 的平直性等价转化为 Ω₀(a)=0。
Proposition (slides P.12)：若 θ₀ 连续，则 H₀ ⇔ Ω₀(a)=0 ∀a。
测试流程 (slides P.13)：
选择范数 p（报告模拟用 p=1,2,∞）。
用交叉拟合一步估计 Ω̂ₙ（需要 μ̂ₙ 与 ĝₙ——后者是“混合标准化倾向得分”, 对离散点用 P(A=a|W)/P(A=a)，对连续点用 p(a|w)/f(a)）。
从 EIF 估计渐近分布的分位数 T̂ₙ,α,p。
若 √n ||Ω̂ₙ||_{F₀,p} > T̂ₙ,α,p 则拒绝 H₀。

[0:19:00–0:30:00] — 渐近性质 (slides P.14–16)¶

双稳健一致性：只要 μ₀ 或 g₀ 之一被一致估计，则对任意固定备择，检验功效 → 1。
渐近正确尺寸：若 ||μ̂ₙ−μ₀||·||ĝₙ−g₀|| = oₚ(n^{-1/2})（乘积速率快于 n^{-1/2}），则 H₀ 下类型 I 误差 → α。
局部 n^{-1/2} 检验力：能在 n^{-1/2} 邻域内检测备择，不要求 θ₀(a) 本身点wise n^{-1/2} 一致估计。讲者强调：“虽然 θ₀(a) 在连续暴露下收敛慢，但全局零假设是整体性质，所以可达该速率”。

[0:30:00–0:45:00] — 数值模拟与讨论¶

模拟 1（混合分布暴露）：4 种备择（线性斜率递增与二次型）与 2 种零假设（弱/强 null）。与 Dichotomized TMLE（把 A 二值化为 ≥0 与否）比较。结果：线性备择下两者相当，二次型备择下本文方法明显优于 TMLE（后者功率很低，因为二值化抹平了二次效应）。
模拟 2（离散暴露，K 从 5 到 n/2）：与基于 cross-fitted AIPTW 的 χ² 检验比较。AIPTW-based 测试仅当 K 很小时控制好，随着 K 增大类型 I 误差迅速膨胀；本文方法在 K 变化下保持稳定。
讨论：作者指出交叉拟合有效降低了有限样本偏差。

[0:45:00–0:58:00] — 讨论者 Oliver Dukes + 回应¶

Dukes 核心点评：(a) 连续暴露导致剂量-反应曲线可能难以解释具体干预（如 BMI 为多少的哲学意义）；(b) 若存在强 positivity 违反，对 θ₀(a) 的全局检验可能功率很低；(c) 提出替代目标：考虑“shift intervention”（将所有人 A 增加 δ）或加权人口。
Westling 回应：承认剂量-反应的局限性，但认为它提供“效应形状”的定性描述，并且仍有很多科学问题会受益；鼓励该领域更多工作。

四、对应论文与开放问题¶

对应论文¶

Westling, T. (2022). Nonparametric Tests of the Causal Null With Nondiscrete Exposures. Journal of the American Statistical Association, 117(538), 805–817. DOI: 10.1080/01621459.2021.2023025.
arXiv: 2001.05344（与转写/摘要一致）。
代码 R 包 ctsCausal（github.com/tedwestling/ctsCausal）。
转写与幻灯片均指向该论文，无合作者（slides 作者仅一人）。

开放问题（每一条扎根于转写具体部分）¶

混合倾向得分 g₀(a,w) 的高效非参估计 (slides P.13, 转写 [0:26:00–0:28:30])
讲者明确提到：“there's certainly open work to be done in developing flexible estimators of these types of objects”。该 g₀ 对离散点要用比率，连续点用密度比，很难用什么现成的非参框架统一估计。两个不同的正则化方案会有什么代价？
弱 null 下的解释与在哪些场景有意义 (转写 [0:09:30–0:10:30] 与讨论部分 [0:50:00–0:56:00])
讲者定义了 weak null（θ₀(a) 常数，即使 μ₀(a,w) 仍依赖于 a），Dukes 质疑：“this may not represent a realistic intervention”。论文里用一个实际应用（BMI 对疫苗免疫反应）做了演示，但是否存在更自然的检验目标（如 Shift null、stochastic intervention null）也可以在本文框架下做类似的原函数转化？
有测量误差时的表现 (转写 [0:31:00–0:34:45])
提问者指出吸烟数据中的 round number pile-ups 可能是测量误差。Westling 承认“haven't thought about that”。若 A 被 mismeasured，本文假设的 independence Y(a)⊥A|W 失效，那么 Ω₀(a)=0 检验还能否提供有效的因果结论？
高维协变量 W 下的理论 (slides 与转写均只在低维语境讨论)
本文假设 W 是固定维数。在 W 的维数 d 随 n 增长时，交叉拟合 + 一步估计的 n^{-1/2} 速率对两个 nuisance 的乘积速率要求（o(n^{-1/2})）可能难以满足。这在高维缺失数据/高维因果推断领域常见的问题，在此论文背景下没有讨论。
序贯/纵贯暴露设定下的推广 (未被转写提到，但符合听众可能的追问方向)
转写完全在横截面的单时间点设置。对于纵贯暴露（如每个时间点 A_t），剂量-反应曲线是 a(t) 的函数，原函数 Ω 的类似转化是否存在？是否是另一篇独立的论文？

Maintained by 陈星宇 · Homepage · Source on GitHub