Causal inference of Plackett-Burman designs in applications¶

作者: Shuchen Chang, Zhi-ming Li
主题: 因果推断
相关性: 7/10
链接: https://arxiv.org/abs/2606.06961

一、领域脉络与小综述¶

这个方向是什么：这个子方向要解决的根本统计问题是：在有限总体潜在结果框架下，如何为多因子实验设计（Factorial Designs）定义因果效应、构造无偏/保守的方差估计、并实施基于随机化分配的假设检验与置信区间。它当前已形成一套相对成熟的"设计基"（design-based）推断体系，与依赖模型假设的回归推断分属不同范式。

发展脉络： - 奠基工作：Splawa-Neyman et al. (1990) 将潜在结果引入农业实验，定义了有限总体平均因果效应；Rubin (1980) 正式确立 SUTVA 假设。这为随机化推断奠定了 estimand 定义。 - 主要进展（2^K 全因子设计）：Dasgupta et al. (2015) 首次将 Neymanian/Fisherian 随机化推断完整移植到 \(2^K\) 全因子设计，定义了主效应及交互效应的因果 estimand，并给出方差估计与检验框架。作者引用原话："Dasgupta et al. (2015) first proposed a causal inference framework based on potential outcomes for 2 K full factorial designs." - 主要进展（方差优化与二值结局）：Lu (2016, 2019a, 2019b) 将该框架扩展至匹配对设计及二值结局，推导了更紧的方差下界以修正 Neymanian 方差的过度保守。Li et al. (2020) 研究了重随机化下的 \(2^K\) 设计，证明其分布更集中。 - 主要进展（回归推断与设计推断的统一）：Zhao and Ding (2022b) 证明了因子回归系数在设计基视角下的因果解释，并给出稳健标准误的理论保证；Lu (2016) 证明了随机化推断与回归推断的等价性。 - 当前 frontier（分式因子与复杂结构）：Pashley and Bind (2023) 将因果推断推向 \(2^{K-p}\) 分式因子设计（正规分式设计），处理了非饱和设计下的推断。Mukerjee and Dasgupta (2022), Zhao and Ding (2022a) 处理了 Split-plot 设计下的因果推断。Zhu et al. (2025), Liu et al. (2024) 处理了区组设计下的 Lasso 调整与协变量调整。 - 本文的位置：本文将此框架进一步推向 Plackett-Burman (PB) 设计。作者引用原话："Although PB designs are two-level factorial designs, most of them are neither 2 K full factorial designs nor 2K−p fractional factorial designs... the related research on causal inference is limited to PB designs, and existing results cannot be directly applied to them."

子线索聚类： 1. Estimand 与方差估计线索：从 Neyman (1923) 到 Dasgupta (2015) 到 Lu (2019) 到 Pashley (2023)。这一簇在解决：如何在复杂分配下定义 \(\tau(k)\)，如何推导 \(\text{Var}(\hat{\tau}(k))\)，如何处理不可观测的 \(S^2_k\) 导致的保守性。 2. Fisher 随机化检验线索：从 Fisher (1935) 到 Luo et al. (2021)（置信分布与 FRT 融合）。这一簇在解决：Sharp null \(H_0: \tau_i(k) = \eta_k\) 下的 imputation 逻辑，p-value 的单调性，以及如何通过二分法构造置信区间。 3. 设计扩展与协变量调整线索：从 Li et al. (2020)（重随机化）到 Zhao and Ding (2022a)（Split-plot）到 Zhu et al. (2025)（Lasso 调整）。这一簇在解决：当实验有物理限制（如 whole-plot）或有高维协变量时，如何提高精度。

这个方向在追问的核心问题： 1. 识别问题：在部分别名结构下，因果效应是否可分离？（PB 设计中交互效应与主效应部分别名，当前文献多假设交互为 0 或只看主效应）。 2. 方差保守性：Neymanian 方差因 \(S^2_k\) 不可估而必然保守，如何给出更紧的估计或下界？ 3. Fisher 与 Neyman 的张力：在有限总体下，Fisher 方差与 Neymanian 方差谁大？Ding (2017) 揭示了 \(2^K\) 下的 paradox，本文将其推至 PB 设计。

⚠️ 作者的 framing： - 作者把缺口 frame 成什么：PB 设计"不是 \(2^K\) 也不是 \(2^{K-p}\)"，所以现有结果"不能直接用"，本文是"显然的下一步"。 - 哪些竞争路线被他淡化或回避了：作者完全回避了模型基推断（回归/ANOVA）在 PB 设计中的效率优势。PB 设计在工程界几乎全用回归分析，作者在例子中只说回归找出的因子被 Neymanian 覆盖，但未比较精度/效率。同时，作者回避了 PB 设计最核心的统计痛点——部分别名，只在 Remark 1 说"本文只关注主效应"，将交互效应直接忽略。 - 什么明显该被引/该存在、却没出现在 intro 里：PB 设计别名结构下的因果识别文献（如 Wu & Hamada 2000 提到的复杂别名关系如何影响效应解释）；有限总体下协变量调整的近期工作（如 Zhu et al. 2025 的 Lasso 调整，本文引用了但未纳入推断框架）；高维筛选设计下的 post-selection inference（如 Shi et al. 2025，本文引用了但未讨论 PB 筛选后的选择偏差）。

张力：被引工作之间未见明显对立结论。Ding (2017) 指出 Neyman 与 Fisher 方差的 paradox（Fisher 方差在某些条件下更大），本文 Theorem 5 证实了在 PB 设计下 Fisher 方差同样更大，这是顺延而非对立。

二、这篇论文做了什么¶

类型判断：方法/应用型（理论推导为将已有框架适配到 PB 结构，核心贡献为算法与实证演示）。

三句话： ①研究了 Plackett-Burman (PB) 筛选实验设计下的有限总体因果推断问题； ②核心工具是潜在结果矩阵表示与 Fisher 随机化检验的 Monte Carlo 二分法； ③主要结论是给出了 PB 设计下 Neymanian 方差的保守估计、证明了 Fisher p-value 的单调性、并证实 Fisher 方差大于 Neymanian 方差。

关键设定与假设： - 有限总体潜在结果：\(Y_i = (Y_i(z_1), \dots, Y_i(z_N))^\top\)，每个单元有 \(N\) 个潜在结果（\(N\) 为 PB 设计的 run 数）。 - SUTVA：单元 \(i\) 的观测结果只受自身分配的处理组合 \(z_j\) 影响，无干扰。 - PB 设计矩阵 \(G\)：\(G = (g_0, g_1, \dots, g_{N-1})\)，其中 \(g_k\) 为第 \(k\) 个因子的水平向量（取值 \(\pm 1\)）。关键性质：\(G^{-1} = \frac{1}{N} G^\top\)（正交性）。 - 随机化分配 \(W_i(z_j)\)：单元 \(i\) 被分配到处理组合 \(z_j\) 的指示变量，\(P(W_i(z_j)=1) = n_j/n\)。 - 不平衡条件：允许 \(n_j \neq n_{j'}\)（不同处理组合的重复次数不同），相比 Dasgupta (2015) 的平衡设定放宽了。 - Sharp null \(H_0^\eta\)：\(\tau_i(k) = \eta_k\) 对所有 \(i\) 成立，这是 Fisher 检验的前提。

主要结果： 1. Theorem 1 & 2（Neymanian 估计与方差）： - 估计量 \(\hat{\tau}(k) = \frac{2}{N} g_k^\top \bar{Y}^{obs}\) 无偏。 - 方差 \(\text{Var}_N(\hat{\tau}(k)) = \frac{4}{N^2} \sum_{j=1}^N \frac{1}{n_j} S^2(z_j) - \frac{1}{n} S^2_k\)。 - 协方差 \(\text{Cov}(\hat{\tau}(k), \hat{\tau}(k'))\) 包含不可估项 \(S^2_{k,k'}\)。 - 直觉：正交矩阵 \(G\) 使得效应估计退化为观测均值的线性组合，方差推导完全依赖有限总体抽样方差公式。\(-S^2_k/n\) 项导致保守性。 2. Theorem 3（渐近正态性）： - 条件：(i) \(S^2(z_j)\) 与 \(S^2_{k,k'}\) 有极限值；(ii) 最大偏差趋于 0；(iii) \(n_j/n\) 有正极限。 - 结论：\(\sqrt{n}\hat{\tau} - E(\hat{\tau}) \xrightarrow{d} N(0, V)\)。 - 依据：直接引用 Li and Ding (2017) 的有限总体 CLT，未重写证明。 3. Proposition 1（p-value 单调性）： - 在 \(H_0^\eta\) 下，imputation 后的检验统计量 \(\hat{\tau}(k, W^b, \bar{Y}^{b,obs}) = a + b\eta_k\)，且 \(b \geq 0\)。 - 因此 \(\hat{p}(\eta_k)\) 关于 \(\eta_k\) 单调非降。 - 直觉：这是构造 Fisherian 置信区间（二分法）的数学前提。\(b \geq 0\) 来自 \(z_{jk} \in \{-1, 1\}\) 和 \(\bar{z}^{obs}_k \in [0, 1]\) 的约束。 4. Theorem 4 & 5（Fisher 与 Neyman 方差差异）： - Fisher 方差 \(\text{Var}_F(\hat{\tau}^b(k) | H_0^\eta) = \frac{4}{N^2} \sum \frac{1}{n_j} s^2\)。 - 在平衡设计下，\(\text{Var}_F - \text{cVar}_N = \frac{2}{N^3 r} \sum_{j, j'} (\bar{\mu}(z_j) - \bar{\mu}(z_{j'}))^2 + o_p(r^{-1})\)。 - 直觉：Fisher 方差基于 imputation 后的基线值 \(\mu_i\) 的变异，而 Neymanian 方差基于潜在结局 \(Y_i(z_j)\) 的变异。因为 \(\mu_i\) 跨组的变异通常更大，Fisher 方差 > Neymanian 方差。

证明路线与技术技巧： - 整体路线： 1. 利用 PB 设计的正交矩阵 \(G\)，将因果效应 \(\tau\) 定义为 \(\bar{Y}\) 的线性变换（公式 3）。 2. 将观测均值 \(\bar{Y}^{obs}\) 代入，得估计量 \(\hat{\tau}\)。 3. 利用有限总体抽样理论（无偏性、方差分解），推导 \(\hat{\tau}\) 的精确方差（Theorem 1）。 4. 在 Sharp null 下，用 \(\mu_i = Y_i^{obs} - \frac{1}{2} z_i^{obs} \eta\) impute 缺失潜在结局，重构完整数据表。 5. 对重构表做随机化检验，证明统计量是 \(\eta_k\) 的线性函数且系数非负（Proposition 1）。 6. 比较 Fisher 方差（基于 \(\mu_i\)）与 Neymanian 方差（基于 \(Y_i(z_j)\)），代数展开得差异公式（Theorem 5）。 - 关键跳跃点： - Proposition 1 的证明中，将 \(\hat{\tau}(k, W^b, \bar{Y}^{b,obs})\) 展开为 \(a + b\eta_k\) 并证明 \(b \geq 0\)。这里的关键是处理 \(\bar{z}^{obs}_k(z_j, W^b)\)（观测分配下第 \(k\) 因子的组内平均），利用 \(0 \leq z_{jk} \bar{z}^{obs}_k \leq 1\) 绕过复杂的分配概率计算。 - 技术技巧点名： - 矩阵代数与正交性：用 \(G^{-1} = \frac{1}{N} G^\top\) 将 \(\bar{Y}\) 与 \(\tau\) 互逆转换，简化了效应定义。 - 有限总体 CLT：直接调用 Li and Ding (2017) 的 Theorem 5，避免重写条件验证。 - Monte Carlo 随机化检验与二分法：Algorithm 1 用 \(B\) 次置换近似 p-value 曲线，再用二分法找 \(\hat{p}(\eta_k) = \alpha/2\) 的根。这是 Luo et al. (2021) 置信分布思想的算法实现。 - Imputation：Fisher 检验的核心技巧，在 Sharp null 下用 \(Y_i^{obs} - \frac{1}{2} z_i^{obs} \eta\) 补全缺失的 \(Y_i(z_j)\)。

真实例子与应用：论文包含 4 个真实数据例子，全部来自工程/生物医学的 PB 筛选实验： 1. Example 1（海洋微塑料提取）：8-run 几何 PB 设计，7 因子，2 响应变量（纤维/碎片）。数据格式为 mean ± SD。如何用：直接将 mean 视为 \(\bar{Y}^{obs}(z_j)\)，SD^2 视为 \(s^2(z_j)\)，套用 Neymanian 公式 (5)(7)(8)。结果：Neymanian CI 找出纤维的因子 4、碎片的因子 1-3,6,7 有非零效应，覆盖了原文献用"效应 > 2×平均 SD"找出的因子。 2. Example 2（脂质体制备）：12-run 非几何 PB 设计，11 因子，4 响应变量。数据格式为 mean ± SD。如何用：同 Example 1。结果：Neymanian CI 找出的非零效应因子覆盖了原文献 ANOVA 选出的因子 1,2,3,9,11。 3. Example 3（纳米沉淀药物）：12-run 非几何不完整 PB 设计（8 因子，4 个 dummy 列），4 响应变量。如何用：Neymanian 推断同上；后续原文献做了 \(2^3\) 全因子设计，本文也对其做了 Neymanian 推断（Table 9）。结果：PB 阶段筛选出因子 4,5,6，与原文献一致；\(2^3\) 阶段找出了交互效应。 4. Example 4（电化学传感器）：12-run 非几何不完整 PB 设计（10 因子），1 响应变量。关键区别：数据给出了每次重复的原始观测值（而非 mean ± SD），因此可以做 Fisherian 推断。如何用：加 1 个 dummy 因子（效应假设为 0）补全为 11 因子完整 PB 设计，运行 Algorithm 1。结果：Neymanian 找出因子 1-6,9；Fisherian 只找出因子 2-4，且 CI 更宽，验证了 Theorem 5（Fisher 方差 > Neymanian 方差）。

🔎 结论是否比证明窄： - Theorem 3 的 CLT 是在条件下严格证明的（通过引用 Li & Ding 2017），但论文未给出具体的收敛速率（如 Berry-Esseen 界），这在 \(N\) 较小（如 \(N=12\)）的 PB 设计中是个实践隐患。 - Algorithm 1 的 Fisherian 区间依赖 Monte Carlo 置换次数 \(B\) 和二分法精度，论文未给出 \(B\) 需多大才能保证区间覆盖率的渐近有效性，只说"choose \(B\) random permutations"。 - Theorem 5 的方差差异公式在平衡设计下严格成立，但在不平衡设计下（公式上半部分），论文未证明差异一定非负，只说"Thus, the variance of Fisherian is greater than that of Neymanian"（此结论在平衡下严格，不平衡下未严格证明）。

三、开放问题¶

部分别名下的交互效应识别：PB 设计的核心特征是交互效应与主效应部分别名（\(0 < |g_0^\top g_k| < N\)）。本文 Remark 1 明确说"we focus hereafter on the main causal effect"，将交互效应直接忽略。要证/估什么：在部分别名结构下，若交互效应不为 0，主效应的因果 estimand 如何被污染？能否在有限总体框架下给出别名偏差的界？扎根点：Remark 1 与 Section 5 "we examine PB design in causal inference from a design perspective, though it could also be approached through modeling"。
模型基推断与设计基推断的统一：作者在 Section 5 提出未来可从建模视角看 PB 设计。要估什么：在 PB 设计下，回归系数的因果解释是什么？稳健标准误是否仍能保证设计基下的覆盖率？扎根点：Section 5 "First, we examine PB design... though it could also be approached through modeling"。
高维协变量调整与 Post-selection 推断：PB 设计用于筛选大量因子，必然面临选择后推断的问题。本文引用了 Shi et al. (2025)（Forward selection and post-selection inference），但未纳入框架。要估什么：在 PB 筛选后，选出的因子的效应估计如何修正选择偏差？扎根点：Introduction 引用 Shi et al. (2025) 但未展开，Section 4 的例子均未做选择后修正。

四、最核心、最简单的例子 / 数学问题¶

最简特例：平衡的 12-run PB 设计（\(N=12, n_j = r\)）

剥掉不平衡条件、非几何结构、Monte Carlo 算法等外壳，这篇论文的数学内核是：正交设计矩阵 \(G\) 如何让因果效应估计变成观测均值的线性组合，以及 Fisher 与 Neyman 方差的代数差异。

在 \(N=12, n_j = r\)（每个处理组合重复 \(r\) 次，总样本 \(n = 12r\)）的平衡 PB 设计下： 1. 效应定义：第 \(k\) 个因子的平均因果效应 \(\tau(k) = \frac{2}{12} g_k^\top \bar{Y}\)。因为 \(G\) 正交，这等价于把 12 个组均值按 \(g_k\) 的 \(\pm 1\) 权重做对比。 2. Neymanian 方差：\(\text{Var}_N(\hat{\tau}(k)) = \frac{4}{144} \sum_{j=1}^{12} \frac{1}{r} S^2(z_j) - \frac{1}{12r} S^2_k\)。保守估计 \(\text{cVar}_N = \frac{4}{144r} \sum s^2(z_j)\)，多估了 \(S^2_k / 12r\)。 3. Fisher 方差：在 Sharp null \(\tau_i(k) = \eta_k\) 下，imputation 后基线值 \(\mu_i = Y_i^{obs} - \frac{1}{2} z_i^{obs} \eta\)。Fisher 方差 \(\text{Var}_F = \frac{4}{144r} s^2\)，其中 \(s^2\) 是 \(\mu_i\) 的总体方差。 4. 核心数学差异：将 \(s^2\) 展开（公式 19），得 \(s^2 = \frac{1}{12} \sum s^2(z_j) + \frac{1}{12} \sum (\bar{\mu}(z_j) - \bar{\mu})^2 + o_p(r^{-1})\)。代入后： \(\text{Var}_F - \text{cVar}_N = \frac{4}{144r} \left( \frac{1}{12} \sum (\bar{\mu}(z_j) - \bar{\mu})^2 \right) = \frac{2}{1728r} \sum_{j, j'} (\bar{\mu}(z_j) - \bar{\mu}(z_{j'}))^2\)。 为什么成立：因为 \(\mu_i\) 是单元基线值，它在不同处理组下的均值 \(\bar{\mu}(z_j)\) 必然有变异（除非单元完全同质），而 Neymanian 方差只看组内变异 \(s^2(z_j)\)。Fisher 方差额外吃进了组间基线变异，所以必然更大。

这个特例揭示了论文的本质：它不是在解决一个新的数学困难（如半参数效率界或高维惩罚），而是在做结构适配——把有限总体随机化推断的既有公式，通过 \(G\) 矩阵的正交性，嫁接到 PB 设计的对比向量 \(g_k\) 上。

Maintained by 陈星宇 · Homepage · Source on GitHub

Causal inference of Plackett-Burman designs in applications¶

一、领域脉络与小综述¶

二、这篇论文做了什么¶

三、开放问题¶

四、最核心、最简单的例子 / 数学问题¶

评论