跳转至

Experimental Design When N Equals One

作者: Wenxuan Guo, Tengyuan Liang
主题: 因果推断
相关性: 7/10
链接: https://arxiv.org/abs/2606.28200


一、领域脉络与小综述

这个方向是什么

本文研究的子方向是 N-of-1 试验(单个体时间序列实验)的最优实验设计。根本的科学问题是:当只有一个实验单元(如一个病人、一个在线平台)在长时间序列上被反复分配处理时,如何设计处理分配序列(何时切换处理、切换频率如何),以最小化对特定因果效应的估计误差。该方向当前处于 从“经验性设计”向“理论指导的最优设计”过渡 的阶段:已有大量应用(临床、在线平台),但针对不同目标效应(如累积效应 vs. 滞后特定效应)的最优设计理论尚不完整。

发展脉络(history)

  1. 奠基工作:N-of-1 试验的因果推断框架

    • Bojinov and Shephard [2019]:在潜在结果框架下定义了单时间序列实验的因果 estimand,并发展了基于随机化的推断方法(精确 p 值、CLT)。留下口子:其 estimand 是设计依赖的(design-dependent),且未系统研究最优设计。
    • Liang and Recht [2025]:结合控制论中的线性时不变系统模型,提出脉冲响应模型(impulse-response model),并证明了矩估计量的渐近正态性。留下口子:其分析主要针对独立处理分配(i.i.d. Bernoulli),未探索更优的依赖结构。
  2. 主要进展:针对特定效应的设计优化

    • Bojinov et al. [2023]:针对累积效应(carryover effects),将最优设计问题形式化为 minimax 离散优化,并推导了最优的“switchback”设计(固定长度窗口内保持处理不变)。留下口子:其设计针对的是“累积效应”这一特定 estimand,且假设 carryover 效应有界。
    • Lin and Ding [2025]:统一了基于回归和基于设计的推断,证明 OLS 在适当的工作模型下可以一致估计滞后特定效应。留下口子:其分析主要针对独立处理分配,且未系统研究设计优化。
  3. 当前 Frontier:统一框架与理论刻画

    • Chen and Simchi-Levi [2025]:利用替代变量(surrogate variables)处理时间干扰,提出了具有近最优最坏情况保证的实验设计。留下口子:其方法依赖于存在合适的替代变量。
    • 本文(Guo and Liang):提出一个统一的马尔可夫框架,将设计参数化为转移矩阵,并针对脉冲响应模型下的 OLS 估计误差,建立了随机切换和周期切换两类设计的完整大 T 渐近理论。位置:本文是第一个在统一框架下,同时刻画“累积效应”和“滞后特定效应”的最优设计,并给出闭式解的。

子线索聚类

  1. 设计-推断框架:Bojinov and Shephard [2019], Liang and Recht [2025], Lin and Ding [2025]。这一簇主要关注在给定设计下如何定义 estimand 并进行推断,设计本身是给定的(通常是 i.i.d. Bernoulli 或简单的 switchback)。
  2. 针对特定效应的最优设计:Bojinov et al. [2023], Chen and Simchi-Levi [2025], Basse et al. [2023]。这一簇针对特定的因果效应(如累积效应、habituation 效应)推导最优设计,但方法通常依赖于特定的效应结构,难以统一。
  3. 模型-辅助的设计优化:Xiong et al. [2024], Guo et al. [2026](本文作者的另一篇工作)。这一簇利用历史数据或高斯化方法辅助设计,但通常不提供理论上的最优性刻画。
  4. 经典最优实验设计:Kiefer and Wolfowitz [1959], Cox and Reid [2000]。这一簇提供了 D-, G-, E-最优性等准则,但主要针对横截面回归设计,未考虑时间序列中的依赖结构。

这个方向在追问的核心问题

  1. 设计-效应匹配:对于给定的目标 estimand(如累积效应 vs. 滞后特定效应),最优的处理分配时间依赖结构是什么?
  2. 稳健性 vs. 针对性:是否存在一个“万能”设计,对所有线性组合的效应都表现良好?还是必须为每个效应定制设计?
  3. 有限样本 vs. 渐近理论:大 T 渐近理论给出的最优设计,在有限样本下是否仍然有效?如何刻画有限样本下的最优设计?
  4. 模型依赖 vs. 设计依赖:基于模型(如脉冲响应模型)的最优设计,在模型误设下是否仍然稳健?

⚠️ 作者的 framing(必须明确标注成“这是作者的说法”)

  • 作者把缺口 frame 成什么:作者声称,现有文献要么只针对特定效应(如累积效应)设计,要么只使用独立分配(i.i.d. Bernoulli),缺乏一个 统一的设计框架 来灵活地针对不同目标效应提供最优性保证。作者将马尔可夫框架和脉冲响应模型结合,声称这是“显然的下一步”。
  • 哪些竞争路线被他淡化或回避了
    • 设计-基于方法(design-based):作者在 Remark 3.4 和 Section D 中承认其模型-基于方法可以与设计-基于方法连接,但正文中主要强调模型-基于方法的“可解释性”和“统一性”。作者淡化了设计-基于方法(如 Bojinov and Shephard [2019])的 非参数性更弱的假设,而将其描述为“estimand 是设计依赖的”这一缺点。
    • g-methods 框架:作者在 Related Work 中提到了 Robins 等人的 g-methods,但仅将其定位为“观察性纵向研究”,而本文是“实验性”的。作者回避了 g-methods 在处理 时变混杂 方面的强大能力,而本文的模型假设处理是外生的(exogenous)。
  • 什么明显该被引 / 该存在、却没出现在 intro 里?
    • Hu and Wager [2025]:这篇论文(在本文参考文献中)研究了“geometric mixing”下的 switchback 实验,处理了 无限 carryover 的情况。本文假设有限 carryover(K 阶),但未讨论其与无限 carryover 文献的关系。这是一个明显的张力点。
    • 动态处理机制(Dynamic Treatment Regimes, DTR):Murphy [2003], Robins [2004] 等文献是因果推断中处理时间序列的经典工作,但本文的 intro 仅将其作为背景提及,未深入讨论其与本文设计问题的联系。DTR 关注的是 根据历史信息自适应地分配处理,而本文关注的是 固定设计。这是一个值得研究者去查的 gap:固定设计的最优性是否在自适应设计下仍然成立?

张力

  • 未见明显对立引用。但存在一个 隐含的张力:Bojinov et al. [2023] 的最优 switchback 设计(针对累积效应)与本文的 i.i.d. Bernoulli 设计(针对滞后特定效应)在最优性上存在冲突。本文通过理论分析(Theorem 4.2 和 Theorem 5.8)明确刻画了这一冲突,并指出最优设计取决于目标 estimand。

二、最核心、最简单的例子 / 数学问题

第一步:把符号、模型、可观测数据交代清楚

  • 符号

    • \(T\):总时间点(样本量)。
    • \(K\):脉冲响应模型的阶数(固定,有限)。
    • \(Z_t \in \{0, 1\}\):时间 \(t\) 的处理分配(0=对照,1=处理)。这是 可观测的随机变量
    • \(Y_t\):时间 \(t\) 的观测结果。这是 可观测的随机变量
    • \(\beta = (\beta_1, \ldots, \beta_K)^\top\):脉冲响应系数。\(\beta_k\)\(k-1\) 期前的处理对当前结果的影响。这是 要估计的参数
    • \(\alpha\):基线均值。这是 要估计的 nuisance 参数
    • \(\epsilon_t\):独立同分布的高斯误差,均值为 0,方差为 \(\sigma^2\)。这是 不可观测的随机变量
    • \(X_t = (Z_t, Z_{t-1}, \ldots, Z_{t-K+1})^\top \in \mathbb{R}^K\):滞后处理向量。这是 可观测的
    • \(w = (w_1, \ldots, w_K)^\top\):目标 estimand 的权重向量。这是 研究者指定的
    • \(\tau_w = w^\top \beta\):目标处理效应。这是 要估计的 estimand
    • \(\hat{\beta}\)\(\beta\) 的 OLS 估计量。这是 可计算的
    • \(\hat{\tau}_w = w^\top \hat{\beta}\)\(\tau_w\) 的 OLS 估计量。这是 可计算的
    • \(\Sigma = \frac{1}{T_{\text{eff}}} \sum_{t=K}^T (X_t - \bar{X})(X_t - \bar{X})^\top\):Gram 矩阵(Fisher 信息矩阵)。这是 可计算的
    • \(\rho_t, \gamma_t\):马尔可夫转移概率。\(\rho_t = P(Z_{t+1}=1 | Z_t=0)\)\(\gamma_t = P(Z_{t+1}=0 | Z_t=1)\)。这是 设计参数
    • \(\rho, \gamma\):随机切换设计中的常数转移概率。
    • \(l\):周期切换设计中的块长度(处理或对照的连续时间点数)。
  • 模型

    • 数据生成机制\(Y_t = \alpha + \sum_{k=1}^K \beta_k Z_{t-k+1} + \epsilon_t\),其中 \(\epsilon_t \overset{iid}{\sim} N(0, \sigma^2)\),且 \(\epsilon_t\) 独立于所有 \(Z\)
    • 设计模型:处理分配 \(\{Z_t\}_{t=1}^T\) 是一个马尔可夫链,转移矩阵为 \(P_t = \begin{pmatrix} 1-\rho_t & \rho_t \\ \gamma_t & 1-\gamma_t \end{pmatrix}\)
    • 已知\(K, T, w\)
    • 要估的对象\(\beta\)(进而 \(\tau_w\))。
  • 可观测数据

    • 可观测\(\{Z_t\}_{t=1}^T\)(处理分配序列)和 \(\{Y_t\}_{t=K}^T\)(结果序列)。
    • 不可观测\(\beta, \alpha, \sigma^2, \epsilon_t\),以及任何反事实结果。

第二步:讲最小内核

本文的核心数学问题可以归结为 一个关于“切换概率”的优化问题。我们剥去所有一般性设定,考虑一个最简特例:

  • 最简特例\(K=2\)(结果只依赖于当前和上一期的处理),目标 estimand 是 滞后特定效应 \(w = e_1 = (1, 0)^\top\)(即只关心 \(\beta_1\),当前处理的即时效应)。设计采用 随机切换设计\(\rho_t = \rho, \gamma_t = \gamma\))。

  • 在这个特例下

    • 模型:\(Y_t = \alpha + \beta_1 Z_t + \beta_2 Z_{t-1} + \epsilon_t\)
    • 目标:\(\tau_w = \beta_1\)
    • 设计参数:\(\rho, \gamma\)
    • 可观测数据:\(\{Z_t, Y_t\}_{t=2}^T\)
  • 核心思路

    1. OLS 估计量的方差:对于 OLS 估计量 \(\hat{\beta}_1\),其方差(条件于设计)正比于 Gram 矩阵 \(\Sigma\) 的逆的 \((1,1)\) 元素。在大 \(T\) 下,\(\Sigma\) 收敛到其期望 \(\mathbb{E}[\Sigma]\)
    2. 期望 Gram 矩阵:利用马尔可夫链的平稳性,可以计算出 \(\mathbb{E}[\Sigma]\) 的极限形式。对于 \(K=2\),它是一个 \(2 \times 2\) 矩阵,其元素是 \(\rho, \gamma\) 的函数。具体地,\(\mathbb{E}[\Sigma]_{11} = \alpha(1-\alpha)\),其中 \(\alpha = \rho/(\rho+\gamma)\) 是平稳处理概率。
    3. 设计目标:最小化 \(\text{Var}(\hat{\beta}_1) \propto w^\top (\mathbb{E}[\Sigma])^{-1} w = \frac{1}{\alpha(1-\alpha)}\)
    4. 优化:最小化 \(\frac{1}{\alpha(1-\alpha)}\) 等价于最大化 \(\alpha(1-\alpha)\),其唯一解是 \(\alpha = 1/2\),即 \(\rho = \gamma\)。进一步,可以证明当 \(\rho = \gamma = 1/2\) 时,\(\mathbb{E}[\Sigma]\) 的对角线元素最大,非对角线元素最小,从而最小化方差。这对应于 i.i.d. Bernoulli(1/2) 设计
  • 为什么这个特例抓住了核心

    • 它展示了本文的核心思想:设计优化问题可以转化为一个关于马尔可夫参数的优化问题
    • 它揭示了 最优设计取决于目标 estimand:对于滞后特定效应,最优设计是独立随机化(\(\rho=\gamma=1/2\))。
    • 它提供了一个可解析求解的基准,而论文的一般情形(任意 \(K\),任意 \(w\))只是在这个基准上增加了更复杂的矩阵代数(Kac-Murdock-Szego 矩阵的逆)和更一般的优化条件(Theorem 4.2 中的二次方程)。

三、这篇论文做了什么

三句话

  1. 研究了什么问题:在 N-of-1 试验(单个体时间序列实验)中,针对脉冲响应模型下的线性处理效应,如何设计最优的处理分配序列(马尔可夫链)以最小化 OLS 估计量的方差。
  2. 核心工具 / 方法:提出了一个 马尔可夫设计框架,将设计参数化为转移矩阵;推导了期望 Gram 矩阵的闭式表达式;针对 随机切换设计(常数转移概率)和 周期切换设计(确定性块切换)两类结构化设计,建立了完整的大 \(T\) 渐近理论。
  3. 主要结论:最优设计强烈依赖于目标 estimand。对于滞后特定效应和稳健设计,i.i.d. Bernoulli(1/2) 是最优的;对于累积效应,最优设计倾向于长块(周期切换设计中的块长 \(l^* \approx K-1+\sqrt{K-1}\),随机切换设计中的切换概率趋于 0)。

关键设定与假设

  • 设定

    • 数据生成:有限阶脉冲响应模型(式 3.1):\(Y_t = \alpha + \sum_{k=1}^K \beta_k Z_{t-k+1} + \epsilon_t\)\(\epsilon_t \overset{iid}{\sim} N(0, \sigma^2)\)
    • 设计:马尔可夫分配设计(Definition 2.1),处理分配 \(\{Z_t\}\) 是一个两状态马尔可夫链。
    • 估计:OLS 估计 \(\hat{\beta}\)(式 3.2),目标 estimand \(\tau_w = w^\top \beta\)
    • 设计目标:渐近设计目标 \(L_{\text{asy}} = w^\top (\mathbb{E}[\Sigma])^{-1} w\)(Definition 3.6),作为真实方差 \(w^\top \mathbb{E}[\Sigma^{-1}] w\) 的代理。
  • 关键假设

    • A1 (有限 carryover):结果只依赖于最近 \(K\) 期的处理(式 3.1)。相比 Bojinov et al. [2023] 的有限 carryover 假设,本文的假设更具体(线性形式)。相比 Liang and Recht [2025] 的无限 carryover,本文的假设更强。
    • A2 (外生性):误差 \(\epsilon_t\) 独立于处理分配过程。这是一个很强的假设,排除了时变混杂。相比设计-基于方法(如 Bojinov and Shephard [2019]),这是一个额外的模型假设。
    • A3 (平稳性):对于随机切换设计,初始分布设为平稳分布(Definition 4.1)。这简化了分析,但可能不适用于所有实际场景。
    • A4 (正则性条件):对于 Theorem 4.2,要求 estimand 向量 \(w\) 既不满足 \(w_k = w_{k+1}\) 也不满足 \(w_k = -w_{k+1}\)。这排除了累积效应等边界情况,需要单独用周期切换设计处理。

主要结果

  • Theorem 4.2 (随机切换设计,目标优化):对于满足正则条件的 \(w\),最优的随机切换设计满足 \(\rho^* = \gamma^*\)(平稳处理概率为 1/2),且最优切换概率 \(\rho^*\) 由二次方程 \(4\rho^2 \sum_{k=1}^{K-1} w_k w_{k+1} + (2\rho-1) \sum_{k=1}^{K-1} (w_k - w_{k+1})^2 = 0\) 决定。

    • 直觉:最优设计平衡了“处理概率”和“时间依赖”。\(\rho=\gamma\) 确保处理概率为 1/2,最大化边际变异。\(\rho\) 的具体值则根据 \(w\) 的“平滑度”调整:如果 \(w\) 变化剧烈(如滞后特定效应),则 \(\rho=1/2\)(独立);如果 \(w\) 平滑(如累积效应),则 \(\rho \to 0\)(强依赖)。
    • 解决的技术难点:推导了期望 Gram 矩阵 \(\mathbb{E}[\Sigma]\) 的闭式表达式(Lemma B.3),并将其与 Kac-Murdock-Szego 矩阵联系起来,从而将优化问题转化为一个可解析求解的二次方程。
  • Theorem 4.6 (随机切换设计,稳健优化):对于稳健设计(最小化最坏情况方差),最优解是 \(\rho^* = \gamma^* = 1/2\),即 i.i.d. Bernoulli(1/2) 设计。

    • 直觉:稳健设计保护最差的估计方向。在随机切换设计中,引入时间依赖会降低某些方向的估计精度,因此独立设计是最稳健的。
    • 解决的技术难点:将稳健优化问题等价于 E-最优性(最大化 \(\lambda_{\min}(\mathbb{E}[\Sigma])\)),并利用 KMS 矩阵的谱性质证明唯一最优解。
  • Theorem 5.5 (周期切换设计,目标优化):对于周期切换设计,当块长 \(l \ge K\) 时,设计目标有闭式解:\(w^\top \tilde{\Sigma}^{-1} w = l A(w) + \frac{l}{l-K+1} B(w)\),其中 \(A(w) = \sum_{k=1}^{K-1} (w_k - w_{k+1})^2\)(内部变异),\(B(w) = (w_1 + w_K)^2\)(边界项)。

    • 直觉:目标分解为“内部变异”和“边界项”。块长 \(l\) 越大,内部变异项 \(l A(w)\) 越大(方差越大),但边界项 \(\frac{l}{l-K+1} B(w)\) 越小(因为分母变大)。最优 \(l\) 平衡了这两项。
    • Corollary 5.6 (累积效应):对于累积效应,最优块长 \(l^* \approx K-1 + \sqrt{K-1}\)
    • Corollary 5.7 (滞后特定效应):对于滞后特定效应,最优块长 \(l^* = \max\{k, K-k+1\}\),且当 \(l < \max\{k, K-k+1\}\) 时,效应不可识别。
  • Theorem 5.8 (周期切换设计,稳健优化):对于稳健设计,最优块长 \(l^* = K\)

    • 直觉\(l < K\) 时,某些效应不可识别(方差无穷大)。\(l \ge K\) 时,最坏情况方差随 \(l\) 线性增长。因此最优解在边界 \(l=K\) 处取得。

证明路线与技术技巧

  • 整体路线(以 Theorem 4.2 为例)

    1. 推导期望 Gram 矩阵:利用马尔可夫链的平稳性,计算 \(\mathbb{E}[\Sigma]\) 的闭式表达式(Lemma B.3),发现其主项是 \(\alpha(1-\alpha) \Sigma_K(q)\),其中 \(\Sigma_K(q)\) 是 Kac-Murdock-Szego (KMS) 矩阵,\(q=1-\rho-\gamma\)
    2. 渐近等价:证明当 \(T \to \infty\) 时,设计目标 \(L_{\text{asy}}\) 一致收敛到其极限 \(l(\rho, \gamma; w) = \frac{1}{\alpha(1-\alpha)} w^\top \Sigma_K(q)^{-1} w\)
    3. 分解优化:极限目标可以分解为 \(\alpha\)-部分和 \(q\)-部分。\(\alpha\)-部分 \(\frac{1}{\alpha(1-\alpha)}\)\(\alpha=1/2\) 时最小,推出 \(\rho=\gamma\)\(q\)-部分 \(w^\top \Sigma_K(q)^{-1} w\) 是一个关于 \(q\) 的有理函数。
    4. 解析求解:利用 KMS 矩阵逆的闭式表达式(三对角矩阵),将 \(q\)-部分写成一个关于 \(q\) 的二次有理函数。求导得到关于 \(q\) 的二次方程,其唯一在 \((-1,1)\) 内的根即为最优 \(q^*\)
    5. 转换回设计参数:利用 \(\rho = \alpha(1-q)/2\)\(\gamma = (1-\alpha)(1-q)/2\),得到关于 \(\rho\) 的二次方程(式 4.3)。
    6. 收敛性:利用 argmin 定理,证明有限 \(T\) 下的最优解收敛到极限最优解。
  • 关键跳跃点

    • \(\mathbb{E}[\Sigma^{-1}]\)\((\mathbb{E}[\Sigma])^{-1}\):这是本文设计目标的核心近似(Definition 3.6)。作者通过 Jensen 不等式和渐近等价性论证其合理性。这个跳跃使得问题从计算期望的逆矩阵(困难)变为计算逆矩阵的期望(相对容易)。
    • KMS 矩阵的引入:将 \(\mathbb{E}[\Sigma]\) 的主项识别为 KMS 矩阵,是连接设计参数和估计方差的关键。KMS 矩阵的谱性质和逆矩阵的闭式解是后续解析求解的基础。
    • 周期切换设计的秩分析:Theorem 5.3 揭示了当块长 \(l < K\) 时,设计矩阵是秩亏的,导致某些效应不可识别。这个发现是理解周期切换设计局限性的关键。
  • 技术技巧点名

    • Kac-Murdock-Szego (KMS) 矩阵:用于建模平稳马尔可夫链的协方差结构。其逆矩阵的闭式解(三对角 Toeplitz 矩阵)被用于解析求解最优切换概率。
    • Sherman-Morrison-Woodbury 恒等式:用于推导周期切换设计中 \(\tilde{\Sigma}^{-1}\) 的闭式表达式(Lemma C.2)。
    • argmin 定理:用于证明有限样本最优解收敛到渐近最优解。
    • 几何级数求和:用于推导期望 Gram 矩阵的闭式表达式(Lemma B.3)。
    • E-最优性:将稳健设计优化等价于最大化最小特征值。

真实例子与应用

  • 本文为纯理论 + 模拟验证,无真实数据例子。所有实证结果来自 Section 6 的模拟实验。
  • 模拟场景
    • 数据:根据脉冲响应模型(式 3.1)生成,\(K=5\)\(T \in \{20, 30, \ldots, 100\}\)
    • 方法:比较了 i.i.d. Bernoulli(1/2)、最优随机切换设计(Algorithm 1 在 500x500 网格上搜索)、最优周期切换设计(Algorithm 1 在 \(l=1\)\(T\) 上搜索)、以及 Bojinov et al. [2023] 的最优规则 switchback 设计(ORSB)。
    • 结果
      • 滞后特定效应(Figure 5a):随机切换设计和 i.i.d. Bernoulli 表现最好,周期切换设计次之,ORSB 最差。最优随机切换设计近似为 \((\rho^*, \gamma^*) = (0.5, 0.5)\),验证了 Theorem 4.2 和 Example 4.3。
      • 累积效应(Figure 5b):周期切换设计表现最好,随机切换设计和 ORSB 次之,i.i.d. Bernoulli 最差。最优周期切换设计的块长 \(l^* = 7\),验证了 Corollary 5.6(\(K=5\)\(l^* \approx 4 + \sqrt{4} = 6\),接近 7)。
    • 稳健性检验(Table 2):
      • 时间趋势误设:随机切换设计相对稳健(MSE 与 Bernoulli 相当),周期切换设计出现较大偏差。
      • 误差过程误设(AR(1)):两种设计都相对稳健。
      • 滞后阶数误设:两种设计都相对稳健,但周期切换设计 MSE 更小。
    • 模拟想说明什么
      1. 验证了理论结果(最优设计参数)。
      2. 展示了针对性设计(周期切换用于累积效应)相对于通用设计(i.i.d. Bernoulli)的优势。
      3. 揭示了不同设计对模型误设的稳健性差异(随机切换更稳健,周期切换在特定误设下更脆弱)。

🔎 结论是否比证明窄

  • 。作者在 Theorem 4.2 中声称“存在唯一解 \((\rho^*, \gamma^*)\)”,但该定理的证明依赖于 排除边界情况\(w_k = w_{k+1}\)\(w_k = -w_{k+1}\))。对于累积效应(\(w = (1, \ldots, 1)\)),该定理不适用,作者只能通过周期切换设计(Section 5)来近似处理。作者在 Section 4.1 末尾明确承认了这一点,并指出“边界情况导致最优解在边界上”。
  • 另一个窄化:Theorem 4.2 的证明假设 \(\rho, \gamma \in [\delta, 1-\delta]\),即排除了边界点 0 和 1。对于累积效应,最优解在边界 \(\rho=\gamma=0\) 上,因此该定理无法直接应用。作者通过周期切换设计来研究这个边界情况,但周期切换设计是确定性的,与随机切换设计的“随机性”本质不同。因此,对于累积效应,随机切换设计的最优性结论是“不完整”的,作者只能给出“最优设计倾向于边界”的定性结论,而非精确解。
  • 稳健性结论的窄化:Theorem 4.6 和 Theorem 5.8 的稳健性结论是针对 所有归一化线性组合\(\|w\| \le 1\))的。如果研究者只关心一个 特定的有限集合 的 estimand,最优设计可能不是 i.i.d. Bernoulli 或 \(l=K\)。作者在 Algorithm 1 中提供了一个更通用的框架,但理论分析只覆盖了最坏情况。

四、开放问题

  1. 无限 carryover 下的最优设计:本文假设有限阶脉冲响应模型(\(K\) 固定)。当 carryover 效应无限长(如 Liang and Recht [2025] 的设定)时,最优设计是什么?马尔可夫框架是否仍然适用?扎根点:作者在 Section 3 中明确提到“Infinite carryover has also been studied [Liang and Recht, 2025, Hu and Wager, 2025], and here we focus on finite carryover to obtain tractable design optimizations.”

  2. 自适应设计:本文研究的是固定设计(设计在实验前确定)。如果允许根据历史结果 自适应地调整 处理分配(如动态处理机制),能否获得更优的估计效率?扎根点:作者在 Related Work 中提到了 Murphy [2003] 和 Robins [2004] 的动态处理机制,但未将其与本文的固定设计框架连接。这是一个明显的 gap。

  3. 面板实验的扩展:本文只考虑单个实验单元(\(N=1\))。当有多个单元(面板数据)时,如何处理单元间的干扰(interference)?如何设计跨单元的处理分配?扎根点:作者在 Conclusions 中明确提到“One promising direction for future work is to extend the framework to panel experiments”。

  4. 模型误设下的理论保证:本文的模拟展示了随机切换设计对某些误设的稳健性,但缺乏理论保证。能否在更一般的非参数模型下,证明本文提出的设计(如随机切换设计)具有 minimax 最优性或某种稳健性?扎根点:作者在 Remark 3.1 中提到了模型误设的风险,并在 Section 6.2 中进行了模拟,但未提供理论分析。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论