Nonparametric tests of the causal null with non-discrete exposures¶
讲者: Ted Westling
讨论人: Oliver Dukes
来源: OCIS (Online Causal Inference Seminar)
日期: 2021-09-21
主题: 因果推断
视频: https://youtu.be/kwfLbgrf4L0 · 幻灯片
本页据讲座录音的自动转写(ASR)生成。人名 / 术语 / 公式 / 具体的率与界可能被听错,关键处请对照视频或讲者论文核对。
相关论文¶
- 2001.05344 (尚未精读 —
talks read --id … --read-papers可补)
一、这场报告在讲哪条工作线¶
这条工作线属于因果推断中非参数假设检验的子领域,具体是:在仅有可观测混杂的观测研究中,如何非参数地检验一个单变量暴露(可离散、连续或混合)对结局是否存在平均因果效应(即因果剂量-反应曲线是否为常值)。
- 子方向的核心追问:在无未观测混杂条件下,我们已有一整套成熟的因果效应估计与推断方法(如 AIPTW、TMLE),但其中绝大多数聚焦于二元暴露。当暴露是多值离散乃至连续时,同样的框架面临两个根本挑战:(1) 每一点上的剂量-反应函数 θ₀(a) 在非参数模型中收敛速度慢于 n^{-1/2}(点wise rate 受光滑性限制),(2) 当暴露有很多水平时(甚至 n 个观测有接近 n 个唯一值),传统方法(如基于每个 level 的 AIPTW 再做卡方检验)的渐近理论失效。
- 奠基与主流路线:对于二元暴露(A∈{0,1}),AIPTW 与 TMLE 提供的非参数渐进有效测试已很成熟,基于 EIF 构造的 Wald 型检验或 score 检验可得 n^{-1/2} 速率的局部检验力。对于固定有限多值暴露(如 A∈{1,…,K},K 固定且远小于 n),类似方法可自然推广:先对每个 level 做 AIPTW/TMLE 估计 θ₀(a),再基于其联合渐近正态性做 χ² 检验。但鲜有工作处理 K 随 n 增长、连续暴露或混合分布暴露的全局检验。Kennedy et al. (2017, JRSS-B) 与 Westling, Gilbert, Carone (2020, JRSS-B) 等提出了连续暴露下的点wise 推断(比如非参估计 θ₀(a) 及逐点置信区间),但全局性检验(整个曲面是否为常值)未被系统处理过。
- 这场报告站在哪:它提出了第一种对于任意单变量暴露(离散/连续/混合)的非参数、双稳健的全局零假设检验。核心创新是:不直接检验 θ₀(a)≡c(因为 θ₀ 在非参数模型里难估),而是将其等价转化为检验一个更易估的原始函数 Ω₀(a)=0,该函数有可估计的有效影响函数,从而可以构建 n^{-1/2} 速率的测试统计量,且像经典二元情形一样具有双稳健一致性与局部 n^{-1/2} 检验力。
点名相关关键工作(部分姓名可能有ASR误差,待核实): - Kennedy et al. (2017, JRSS-B): 连续暴露下的双稳健非参数估计,点wise 推断。 - Westling, Gilbert, Carone (2020, JRSS-B): 因果等距回归,同样提供连续暴露的点wise 推断与同时置信带。 - Robins (1986) 的 G-formula 引入,以及 Young et al. (2019, JASA) 关于代表性干预下的逆概率加权。 - 注意:转写稿中提到"Gill and Robins (2001)"也讨论了连续因果推断,此处不做扩展。
二、最小内核 / 一个最简例子¶
符号与模型¶
- 可观测数据:对每个单元,观测到
O = (Y, A, W): - A:暴露,取值于 A ⊂ ℝ(支持可以是任意子集:离散、连续或混合),marginal CDF 为 F₀(a) = P(A ≤ a);
- Y:结局;
- W:d 维观测协变量。
- 潜在结果:对每个 a∈A,Y(a) 是分配 A=a 时的反事实结果。
- 目标参数(因果剂量-反应函数):
θ₀(a) = E[Y(a)](若赋值为 a 时的平均结局)。 - 估计目标(识别后):在无未观测混杂(Y(a)⊥A|W)与一致性假设下,
θ₀(a) = E[μ₀(a,W)],其中μ₀(a,w)=E(Y|A=a,W=w)。
原假设 H₀¶
“剂量-反应曲线是平坦的”:对于所有 a∈A,θ₀(a) = 常数(记为 γ₀)。
等价表述:θ₀(a) = γ₀ ∀a,其中 γ₀ = ∫θ₀(a) dF₀(a)。
最简特例¶
假设暴露 A 是混合分布:50% 概率取值为 0,另 50% 概率在区间 [0.5,1] 上均匀分布。只有一个二元协变量 W∈{0,1}。
- 识别:θ₀(a) = E[μ₀(a,W)],其中 μ₀(a,w)=E(Y|A=a,W=w)。
- 直接检验困难:对 a∈[0.5,1],θ₀(a) 在非参模型里收敛慢于 n^{-1/2},无法直接做 Wald 检验。
- 核心转化:定义
- F₀(a)=P(A≤a);
- Γ₀(a)=∫_{−∞}^{a} θ₀(u) dF₀(u)(累积加权剂量-反应);
- Ω₀(a)=Γ₀(a) − γ₀ F₀(a)。
- 关键命题:如果 θ₀ 连续,那么
- H₀(θ₀ 平坦 ⇔ Ω₀(a)=0 ∀a)。
- 在例子中,若 H₀ 成立,则 Ω₀(a) 在所有 a 处恒为 0;否则在某个 a 处非零。
- 为什么 Ω₀ 更好估计:Ω₀(a) 是路径可微的(pathwise differentiable),它的 EIF 可显式计算(包含 μ₀ 与倾向得分)。因此可以用交叉拟合(sample splitting)+ 一步估计(one-step)构建 n^{-1/2} 一致估计 Ω̂ₙ(a)。而且无论 A 是离散还是连续,这个结构都成立——因为 Ω₀ 本质上是对原始函数做积分平滑,不依赖单独一点的 θ₀ 估计。
- 最终测试:选择一个范数 p∈[1,∞],计算 T = √n ||Ω̂ₙ||_{F₀,p},并与从 EIF 估计的渐近分布的分位数比较。
三、报告主体:讲者讲了什么¶
[0:00:05–0:06:58] — 开场与问题设置¶
- 讲者 Westling(UMass Amherst)介绍论文《Nonparametric Tests of the Causal Null with Non-Discrete Exposures》即将发表在 JASA。
- 定义了 A、Y(a)、θ₀(a) 等符号;说明假设 SUTVA、无未观测混杂与 positivity。
- 关键公式:θ₀(a)=E[μ₀(a,W)](G-formula),H₀: θ₀(a)≡γ₀ ∀a。
[0:06:58–0:11:05] — 已有方法回顾 vs. 新挑战¶
- 二元暴露:AIPTW/TMLE 可做。离散多值(K 固定):可推广,但 K 随 n 增长时 χ² 检验渐近失效。连续暴露:Kernel 或等距回归用于估计但未解决全局检验。
- 讲者展示一个实证例子:PA 2004 年吸烟数据,暴露为“孕妇每周平均吸烟数”,多达约 150 个唯一值,且分布有跳点(在 5、10、15 处明显的堆积)。指出这种情况的数据是“混合分布”,难以单纯归类为离散或连续。
[0:11:05–0:19:00] — 核心方法:原始函数转化+检验构建¶
- 密度测试类比:(a) 直接估密度(难)。(b) 用 CDF 转化:H₀:“密度均匀”⇔ CDF 为线性。这里类似:将 θ₀(a) 的平直性等价转化为 Ω₀(a)=0。
- Proposition (slides P.12):若 θ₀ 连续,则 H₀ ⇔ Ω₀(a)=0 ∀a。
- 测试流程 (slides P.13):
- 选择范数 p(报告模拟用 p=1,2,∞)。
- 用交叉拟合一步估计 Ω̂ₙ(需要 μ̂ₙ 与 ĝₙ——后者是“混合标准化倾向得分”, 对离散点用 P(A=a|W)/P(A=a),对连续点用 p(a|w)/f(a))。
- 从 EIF 估计渐近分布的分位数 T̂ₙ,α,p。
- 若 √n ||Ω̂ₙ||_{F₀,p} > T̂ₙ,α,p 则拒绝 H₀。
[0:19:00–0:30:00] — 渐近性质 (slides P.14–16)¶
- 双稳健一致性:只要 μ₀ 或 g₀ 之一被一致估计,则对任意固定备择,检验功效 → 1。
- 渐近正确尺寸:若 ||μ̂ₙ−μ₀||·||ĝₙ−g₀|| = oₚ(n^{-1/2})(乘积速率快于 n^{-1/2}),则 H₀ 下类型 I 误差 → α。
- 局部 n^{-1/2} 检验力:能在 n^{-1/2} 邻域内检测备择,不要求 θ₀(a) 本身点wise n^{-1/2} 一致估计。讲者强调:“虽然 θ₀(a) 在连续暴露下收敛慢,但全局零假设是整体性质,所以可达该速率”。
[0:30:00–0:45:00] — 数值模拟与讨论¶
- 模拟 1(混合分布暴露):4 种备择(线性斜率递增与二次型)与 2 种零假设(弱/强 null)。与 Dichotomized TMLE(把 A 二值化为 ≥0 与否)比较。结果:线性备择下两者相当,二次型备择下本文方法明显优于 TMLE(后者功率很低,因为二值化抹平了二次效应)。
- 模拟 2(离散暴露,K 从 5 到 n/2):与基于 cross-fitted AIPTW 的 χ² 检验比较。AIPTW-based 测试仅当 K 很小时控制好,随着 K 增大类型 I 误差迅速膨胀;本文方法在 K 变化下保持稳定。
- 讨论:作者指出交叉拟合有效降低了有限样本偏差。
[0:45:00–0:58:00] — 讨论者 Oliver Dukes + 回应¶
- Dukes 核心点评:(a) 连续暴露导致剂量-反应曲线可能难以解释具体干预(如 BMI 为多少的哲学意义);(b) 若存在强 positivity 违反,对 θ₀(a) 的全局检验可能功率很低;(c) 提出替代目标:考虑“shift intervention”(将所有人 A 增加 δ)或加权人口。
- Westling 回应:承认剂量-反应的局限性,但认为它提供“效应形状”的定性描述,并且仍有很多科学问题会受益;鼓励该领域更多工作。
四、对应论文与开放问题¶
对应论文¶
- Westling, T. (2022). Nonparametric Tests of the Causal Null With Nondiscrete Exposures. Journal of the American Statistical Association, 117(538), 805–817. DOI: 10.1080/01621459.2021.2023025.
- arXiv: 2001.05344(与转写/摘要一致)。
- 代码 R 包
ctsCausal(github.com/tedwestling/ctsCausal)。 - 转写与幻灯片均指向该论文,无合作者(slides 作者仅一人)。
开放问题(每一条扎根于转写具体部分)¶
-
混合倾向得分 g₀(a,w) 的高效非参估计 (slides P.13, 转写 [0:26:00–0:28:30])
讲者明确提到:“there's certainly open work to be done in developing flexible estimators of these types of objects”。该 g₀ 对离散点要用比率,连续点用密度比,很难用什么现成的非参框架统一估计。两个不同的正则化方案会有什么代价? -
弱 null 下的解释与在哪些场景有意义 (转写 [0:09:30–0:10:30] 与讨论部分 [0:50:00–0:56:00])
讲者定义了 weak null(θ₀(a) 常数,即使 μ₀(a,w) 仍依赖于 a),Dukes 质疑:“this may not represent a realistic intervention”。论文里用一个实际应用(BMI 对疫苗免疫反应)做了演示,但是否存在更自然的检验目标(如 Shift null、stochastic intervention null)也可以在本文框架下做类似的原函数转化? -
有测量误差时的表现 (转写 [0:31:00–0:34:45])
提问者指出吸烟数据中的 round number pile-ups 可能是测量误差。Westling 承认“haven't thought about that”。若 A 被 mismeasured,本文假设的 independence Y(a)⊥A|W 失效,那么 Ω₀(a)=0 检验还能否提供有效的因果结论? -
高维协变量 W 下的理论 (slides 与转写均只在低维语境讨论)
本文假设 W 是固定维数。在 W 的维数 d 随 n 增长时,交叉拟合 + 一步估计的 n^{-1/2} 速率对两个 nuisance 的乘积速率要求(o(n^{-1/2}))可能难以满足。这在高维缺失数据/高维因果推断领域常见的问题,在此论文背景下没有讨论。 -
序贯/纵贯暴露设定下的推广 (未被转写提到,但符合听众可能的追问方向)
转写完全在横截面的单时间点设置。对于纵贯暴露(如每个时间点 A_t),剂量-反应曲线是 a(t) 的函数,原函数 Ω 的类似转化是否存在?是否是另一篇独立的论文?
Maintained by 陈星宇 · Homepage · Source on GitHub