Causal inference of Plackett-Burman designs in applications¶
作者: Shuchen Chang, Zhi-ming Li
主题: 因果推断
相关性: 7/10
链接: https://arxiv.org/abs/2606.06961
一、领域脉络与小综述¶
这个方向是什么: 这个子方向要解决的根本统计问题是:在有限总体潜在结果框架下,如何为多因子实验设计(Factorial Designs)定义因果效应、构造无偏/保守的方差估计、并实施基于随机化分配的假设检验与置信区间。它当前已形成一套相对成熟的"设计基"(design-based)推断体系,与依赖模型假设的回归推断分属不同范式。
发展脉络: - 奠基工作:Splawa-Neyman et al. (1990) 将潜在结果引入农业实验,定义了有限总体平均因果效应;Rubin (1980) 正式确立 SUTVA 假设。这为随机化推断奠定了 estimand 定义。 - 主要进展(2^K 全因子设计):Dasgupta et al. (2015) 首次将 Neymanian/Fisherian 随机化推断完整移植到 \(2^K\) 全因子设计,定义了主效应及交互效应的因果 estimand,并给出方差估计与检验框架。作者引用原话:"Dasgupta et al. (2015) first proposed a causal inference framework based on potential outcomes for 2 K full factorial designs." - 主要进展(方差优化与二值结局):Lu (2016, 2019a, 2019b) 将该框架扩展至匹配对设计及二值结局,推导了更紧的方差下界以修正 Neymanian 方差的过度保守。Li et al. (2020) 研究了重随机化下的 \(2^K\) 设计,证明其分布更集中。 - 主要进展(回归推断与设计推断的统一):Zhao and Ding (2022b) 证明了因子回归系数在设计基视角下的因果解释,并给出稳健标准误的理论保证;Lu (2016) 证明了随机化推断与回归推断的等价性。 - 当前 frontier(分式因子与复杂结构):Pashley and Bind (2023) 将因果推断推向 \(2^{K-p}\) 分式因子设计(正规分式设计),处理了非饱和设计下的推断。Mukerjee and Dasgupta (2022), Zhao and Ding (2022a) 处理了 Split-plot 设计下的因果推断。Zhu et al. (2025), Liu et al. (2024) 处理了区组设计下的 Lasso 调整与协变量调整。 - 本文的位置:本文将此框架进一步推向 Plackett-Burman (PB) 设计。作者引用原话:"Although PB designs are two-level factorial designs, most of them are neither 2 K full factorial designs nor 2K−p fractional factorial designs... the related research on causal inference is limited to PB designs, and existing results cannot be directly applied to them."
子线索聚类: 1. Estimand 与方差估计线索:从 Neyman (1923) 到 Dasgupta (2015) 到 Lu (2019) 到 Pashley (2023)。这一簇在解决:如何在复杂分配下定义 \(\tau(k)\),如何推导 \(\text{Var}(\hat{\tau}(k))\),如何处理不可观测的 \(S^2_k\) 导致的保守性。 2. Fisher 随机化检验线索:从 Fisher (1935) 到 Luo et al. (2021)(置信分布与 FRT 融合)。这一簇在解决:Sharp null \(H_0: \tau_i(k) = \eta_k\) 下的 imputation 逻辑,p-value 的单调性,以及如何通过二分法构造置信区间。 3. 设计扩展与协变量调整线索:从 Li et al. (2020)(重随机化)到 Zhao and Ding (2022a)(Split-plot)到 Zhu et al. (2025)(Lasso 调整)。这一簇在解决:当实验有物理限制(如 whole-plot)或有高维协变量时,如何提高精度。
这个方向在追问的核心问题: 1. 识别问题:在部分别名结构下,因果效应是否可分离?(PB 设计中交互效应与主效应部分别名,当前文献多假设交互为 0 或只看主效应)。 2. 方差保守性:Neymanian 方差因 \(S^2_k\) 不可估而必然保守,如何给出更紧的估计或下界? 3. Fisher 与 Neyman 的张力:在有限总体下,Fisher 方差与 Neymanian 方差谁大?Ding (2017) 揭示了 \(2^K\) 下的 paradox,本文将其推至 PB 设计。
⚠️ 作者的 framing: - 作者把缺口 frame 成什么:PB 设计"不是 \(2^K\) 也不是 \(2^{K-p}\)",所以现有结果"不能直接用",本文是"显然的下一步"。 - 哪些竞争路线被他淡化或回避了:作者完全回避了模型基推断(回归/ANOVA)在 PB 设计中的效率优势。PB 设计在工程界几乎全用回归分析,作者在例子中只说回归找出的因子被 Neymanian 覆盖,但未比较精度/效率。同时,作者回避了 PB 设计最核心的统计痛点——部分别名,只在 Remark 1 说"本文只关注主效应",将交互效应直接忽略。 - 什么明显该被引/该存在、却没出现在 intro 里:PB 设计别名结构下的因果识别文献(如 Wu & Hamada 2000 提到的复杂别名关系如何影响效应解释);有限总体下协变量调整的近期工作(如 Zhu et al. 2025 的 Lasso 调整,本文引用了但未纳入推断框架);高维筛选设计下的 post-selection inference(如 Shi et al. 2025,本文引用了但未讨论 PB 筛选后的选择偏差)。
张力: 被引工作之间未见明显对立结论。Ding (2017) 指出 Neyman 与 Fisher 方差的 paradox(Fisher 方差在某些条件下更大),本文 Theorem 5 证实了在 PB 设计下 Fisher 方差同样更大,这是顺延而非对立。
二、这篇论文做了什么¶
类型判断:方法/应用型(理论推导为将已有框架适配到 PB 结构,核心贡献为算法与实证演示)。
三句话: ①研究了 Plackett-Burman (PB) 筛选实验设计下的有限总体因果推断问题; ②核心工具是潜在结果矩阵表示与 Fisher 随机化检验的 Monte Carlo 二分法; ③主要结论是给出了 PB 设计下 Neymanian 方差的保守估计、证明了 Fisher p-value 的单调性、并证实 Fisher 方差大于 Neymanian 方差。
关键设定与假设: - 有限总体潜在结果:\(Y_i = (Y_i(z_1), \dots, Y_i(z_N))^\top\),每个单元有 \(N\) 个潜在结果(\(N\) 为 PB 设计的 run 数)。 - SUTVA:单元 \(i\) 的观测结果只受自身分配的处理组合 \(z_j\) 影响,无干扰。 - PB 设计矩阵 \(G\):\(G = (g_0, g_1, \dots, g_{N-1})\),其中 \(g_k\) 为第 \(k\) 个因子的水平向量(取值 \(\pm 1\))。关键性质:\(G^{-1} = \frac{1}{N} G^\top\)(正交性)。 - 随机化分配 \(W_i(z_j)\):单元 \(i\) 被分配到处理组合 \(z_j\) 的指示变量,\(P(W_i(z_j)=1) = n_j/n\)。 - 不平衡条件:允许 \(n_j \neq n_{j'}\)(不同处理组合的重复次数不同),相比 Dasgupta (2015) 的平衡设定放宽了。 - Sharp null \(H_0^\eta\):\(\tau_i(k) = \eta_k\) 对所有 \(i\) 成立,这是 Fisher 检验的前提。
主要结果: 1. Theorem 1 & 2(Neymanian 估计与方差): - 估计量 \(\hat{\tau}(k) = \frac{2}{N} g_k^\top \bar{Y}^{obs}\) 无偏。 - 方差 \(\text{Var}_N(\hat{\tau}(k)) = \frac{4}{N^2} \sum_{j=1}^N \frac{1}{n_j} S^2(z_j) - \frac{1}{n} S^2_k\)。 - 协方差 \(\text{Cov}(\hat{\tau}(k), \hat{\tau}(k'))\) 包含不可估项 \(S^2_{k,k'}\)。 - 直觉:正交矩阵 \(G\) 使得效应估计退化为观测均值的线性组合,方差推导完全依赖有限总体抽样方差公式。\(-S^2_k/n\) 项导致保守性。 2. Theorem 3(渐近正态性): - 条件:(i) \(S^2(z_j)\) 与 \(S^2_{k,k'}\) 有极限值;(ii) 最大偏差趋于 0;(iii) \(n_j/n\) 有正极限。 - 结论:\(\sqrt{n}\hat{\tau} - E(\hat{\tau}) \xrightarrow{d} N(0, V)\)。 - 依据:直接引用 Li and Ding (2017) 的有限总体 CLT,未重写证明。 3. Proposition 1(p-value 单调性): - 在 \(H_0^\eta\) 下,imputation 后的检验统计量 \(\hat{\tau}(k, W^b, \bar{Y}^{b,obs}) = a + b\eta_k\),且 \(b \geq 0\)。 - 因此 \(\hat{p}(\eta_k)\) 关于 \(\eta_k\) 单调非降。 - 直觉:这是构造 Fisherian 置信区间(二分法)的数学前提。\(b \geq 0\) 来自 \(z_{jk} \in \{-1, 1\}\) 和 \(\bar{z}^{obs}_k \in [0, 1]\) 的约束。 4. Theorem 4 & 5(Fisher 与 Neyman 方差差异): - Fisher 方差 \(\text{Var}_F(\hat{\tau}^b(k) | H_0^\eta) = \frac{4}{N^2} \sum \frac{1}{n_j} s^2\)。 - 在平衡设计下,\(\text{Var}_F - \text{cVar}_N = \frac{2}{N^3 r} \sum_{j, j'} (\bar{\mu}(z_j) - \bar{\mu}(z_{j'}))^2 + o_p(r^{-1})\)。 - 直觉:Fisher 方差基于 imputation 后的基线值 \(\mu_i\) 的变异,而 Neymanian 方差基于潜在结局 \(Y_i(z_j)\) 的变异。因为 \(\mu_i\) 跨组的变异通常更大,Fisher 方差 > Neymanian 方差。
证明路线与技术技巧: - 整体路线: 1. 利用 PB 设计的正交矩阵 \(G\),将因果效应 \(\tau\) 定义为 \(\bar{Y}\) 的线性变换(公式 3)。 2. 将观测均值 \(\bar{Y}^{obs}\) 代入,得估计量 \(\hat{\tau}\)。 3. 利用有限总体抽样理论(无偏性、方差分解),推导 \(\hat{\tau}\) 的精确方差(Theorem 1)。 4. 在 Sharp null 下,用 \(\mu_i = Y_i^{obs} - \frac{1}{2} z_i^{obs} \eta\) impute 缺失潜在结局,重构完整数据表。 5. 对重构表做随机化检验,证明统计量是 \(\eta_k\) 的线性函数且系数非负(Proposition 1)。 6. 比较 Fisher 方差(基于 \(\mu_i\))与 Neymanian 方差(基于 \(Y_i(z_j)\)),代数展开得差异公式(Theorem 5)。 - 关键跳跃点: - Proposition 1 的证明中,将 \(\hat{\tau}(k, W^b, \bar{Y}^{b,obs})\) 展开为 \(a + b\eta_k\) 并证明 \(b \geq 0\)。这里的关键是处理 \(\bar{z}^{obs}_k(z_j, W^b)\)(观测分配下第 \(k\) 因子的组内平均),利用 \(0 \leq z_{jk} \bar{z}^{obs}_k \leq 1\) 绕过复杂的分配概率计算。 - 技术技巧点名: - 矩阵代数与正交性:用 \(G^{-1} = \frac{1}{N} G^\top\) 将 \(\bar{Y}\) 与 \(\tau\) 互逆转换,简化了效应定义。 - 有限总体 CLT:直接调用 Li and Ding (2017) 的 Theorem 5,避免重写条件验证。 - Monte Carlo 随机化检验与二分法:Algorithm 1 用 \(B\) 次置换近似 p-value 曲线,再用二分法找 \(\hat{p}(\eta_k) = \alpha/2\) 的根。这是 Luo et al. (2021) 置信分布思想的算法实现。 - Imputation:Fisher 检验的核心技巧,在 Sharp null 下用 \(Y_i^{obs} - \frac{1}{2} z_i^{obs} \eta\) 补全缺失的 \(Y_i(z_j)\)。
真实例子与应用: 论文包含 4 个真实数据例子,全部来自工程/生物医学的 PB 筛选实验: 1. Example 1(海洋微塑料提取):8-run 几何 PB 设计,7 因子,2 响应变量(纤维/碎片)。数据格式为 mean ± SD。如何用:直接将 mean 视为 \(\bar{Y}^{obs}(z_j)\),SD^2 视为 \(s^2(z_j)\),套用 Neymanian 公式 (5)(7)(8)。结果:Neymanian CI 找出纤维的因子 4、碎片的因子 1-3,6,7 有非零效应,覆盖了原文献用"效应 > 2×平均 SD"找出的因子。 2. Example 2(脂质体制备):12-run 非几何 PB 设计,11 因子,4 响应变量。数据格式为 mean ± SD。如何用:同 Example 1。结果:Neymanian CI 找出的非零效应因子覆盖了原文献 ANOVA 选出的因子 1,2,3,9,11。 3. Example 3(纳米沉淀药物):12-run 非几何不完整 PB 设计(8 因子,4 个 dummy 列),4 响应变量。如何用:Neymanian 推断同上;后续原文献做了 \(2^3\) 全因子设计,本文也对其做了 Neymanian 推断(Table 9)。结果:PB 阶段筛选出因子 4,5,6,与原文献一致;\(2^3\) 阶段找出了交互效应。 4. Example 4(电化学传感器):12-run 非几何不完整 PB 设计(10 因子),1 响应变量。关键区别:数据给出了每次重复的原始观测值(而非 mean ± SD),因此可以做 Fisherian 推断。如何用:加 1 个 dummy 因子(效应假设为 0)补全为 11 因子完整 PB 设计,运行 Algorithm 1。结果:Neymanian 找出因子 1-6,9;Fisherian 只找出因子 2-4,且 CI 更宽,验证了 Theorem 5(Fisher 方差 > Neymanian 方差)。
🔎 结论是否比证明窄: - Theorem 3 的 CLT 是在条件 下严格证明的(通过引用 Li & Ding 2017),但论文未给出具体的收敛速率(如 Berry-Esseen 界),这在 \(N\) 较小(如 \(N=12\))的 PB 设计中是个实践隐患。 - Algorithm 1 的 Fisherian 区间依赖 Monte Carlo 置换次数 \(B\) 和二分法精度,论文未给出 \(B\) 需多大才能保证区间覆盖率的渐近有效性,只说"choose \(B\) random permutations"。 - Theorem 5 的方差差异公式在平衡设计下严格成立,但在不平衡设计下(公式上半部分),论文未证明差异一定非负,只说"Thus, the variance of Fisherian is greater than that of Neymanian"(此结论在平衡下严格,不平衡下未严格证明)。
三、开放问题¶
- 部分别名下的交互效应识别:PB 设计的核心特征是交互效应与主效应部分别名(\(0 < |g_0^\top g_k| < N\))。本文 Remark 1 明确说"we focus hereafter on the main causal effect",将交互效应直接忽略。要证/估什么:在部分别名结构下,若交互效应不为 0,主效应的因果 estimand 如何被污染?能否在有限总体框架下给出别名偏差的界?扎根点:Remark 1 与 Section 5 "we examine PB design in causal inference from a design perspective, though it could also be approached through modeling"。
- 模型基推断与设计基推断的统一:作者在 Section 5 提出未来可从建模视角看 PB 设计。要估什么:在 PB 设计下,回归系数的因果解释是什么?稳健标准误是否仍能保证设计基下的覆盖率?扎根点:Section 5 "First, we examine PB design... though it could also be approached through modeling"。
- 高维协变量调整与 Post-selection 推断:PB 设计用于筛选大量因子,必然面临选择后推断的问题。本文引用了 Shi et al. (2025)(Forward selection and post-selection inference),但未纳入框架。要估什么:在 PB 筛选后,选出的因子的效应估计如何修正选择偏差?扎根点:Introduction 引用 Shi et al. (2025) 但未展开,Section 4 的例子均未做选择后修正。
四、最核心、最简单的例子 / 数学问题¶
最简特例:平衡的 12-run PB 设计(\(N=12, n_j = r\))
剥掉不平衡条件、非几何结构、Monte Carlo 算法等外壳,这篇论文的数学内核是:正交设计矩阵 \(G\) 如何让因果效应估计变成观测均值的线性组合,以及 Fisher 与 Neyman 方差的代数差异。
在 \(N=12, n_j = r\)(每个处理组合重复 \(r\) 次,总样本 \(n = 12r\))的平衡 PB 设计下: 1. 效应定义:第 \(k\) 个因子的平均因果效应 \(\tau(k) = \frac{2}{12} g_k^\top \bar{Y}\)。因为 \(G\) 正交,这等价于把 12 个组均值按 \(g_k\) 的 \(\pm 1\) 权重做对比。 2. Neymanian 方差:\(\text{Var}_N(\hat{\tau}(k)) = \frac{4}{144} \sum_{j=1}^{12} \frac{1}{r} S^2(z_j) - \frac{1}{12r} S^2_k\)。保守估计 \(\text{cVar}_N = \frac{4}{144r} \sum s^2(z_j)\),多估了 \(S^2_k / 12r\)。 3. Fisher 方差:在 Sharp null \(\tau_i(k) = \eta_k\) 下,imputation 后基线值 \(\mu_i = Y_i^{obs} - \frac{1}{2} z_i^{obs} \eta\)。Fisher 方差 \(\text{Var}_F = \frac{4}{144r} s^2\),其中 \(s^2\) 是 \(\mu_i\) 的总体方差。 4. 核心数学差异:将 \(s^2\) 展开(公式 19),得 \(s^2 = \frac{1}{12} \sum s^2(z_j) + \frac{1}{12} \sum (\bar{\mu}(z_j) - \bar{\mu})^2 + o_p(r^{-1})\)。代入后: \(\text{Var}_F - \text{cVar}_N = \frac{4}{144r} \left( \frac{1}{12} \sum (\bar{\mu}(z_j) - \bar{\mu})^2 \right) = \frac{2}{1728r} \sum_{j, j'} (\bar{\mu}(z_j) - \bar{\mu}(z_{j'}))^2\)。 为什么成立:因为 \(\mu_i\) 是单元基线值,它在不同处理组下的均值 \(\bar{\mu}(z_j)\) 必然有变异(除非单元完全同质),而 Neymanian 方差只看组内变异 \(s^2(z_j)\)。Fisher 方差额外吃进了组间基线变异,所以必然更大。
这个特例揭示了论文的本质:它不是在解决一个新的数学困难(如半参数效率界或高维惩罚),而是在做结构适配——把有限总体随机化推断的既有公式,通过 \(G\) 矩阵的正交性,嫁接到 PB 设计的对比向量 \(g_k\) 上。
Maintained by 陈星宇 · Homepage · Source on GitHub