Experimental Design When N Equals One¶

作者: Wenxuan Guo, Tengyuan Liang
主题: 因果推断
相关性: 7/10
链接: https://arxiv.org/abs/2606.28200

一、领域脉络与小综述¶

这个方向是什么¶

本文研究的子方向是 N-of-1 试验（单个体时间序列实验）的最优实验设计。根本的科学问题是：当只有一个实验单元（如一个病人、一个在线平台）在长时间序列上被反复分配处理时，如何设计处理分配序列（何时切换处理、切换频率如何），以最小化对特定因果效应的估计误差。该方向当前处于 从“经验性设计”向“理论指导的最优设计”过渡 的阶段：已有大量应用（临床、在线平台），但针对不同目标效应（如累积效应 vs. 滞后特定效应）的最优设计理论尚不完整。

发展脉络（history）¶

奠基工作：N-of-1 试验的因果推断框架
- Bojinov and Shephard [2019]：在潜在结果框架下定义了单时间序列实验的因果 estimand，并发展了基于随机化的推断方法（精确 p 值、CLT）。留下口子：其 estimand 是设计依赖的（design-dependent），且未系统研究最优设计。
- Liang and Recht [2025]：结合控制论中的线性时不变系统模型，提出脉冲响应模型（impulse-response model），并证明了矩估计量的渐近正态性。留下口子：其分析主要针对独立处理分配（i.i.d. Bernoulli），未探索更优的依赖结构。
主要进展：针对特定效应的设计优化
- Bojinov et al. [2023]：针对累积效应（carryover effects），将最优设计问题形式化为 minimax 离散优化，并推导了最优的“switchback”设计（固定长度窗口内保持处理不变）。留下口子：其设计针对的是“累积效应”这一特定 estimand，且假设 carryover 效应有界。
- Lin and Ding [2025]：统一了基于回归和基于设计的推断，证明 OLS 在适当的工作模型下可以一致估计滞后特定效应。留下口子：其分析主要针对独立处理分配，且未系统研究设计优化。
当前 Frontier：统一框架与理论刻画
- Chen and Simchi-Levi [2025]：利用替代变量（surrogate variables）处理时间干扰，提出了具有近最优最坏情况保证的实验设计。留下口子：其方法依赖于存在合适的替代变量。
- 本文（Guo and Liang）：提出一个统一的马尔可夫框架，将设计参数化为转移矩阵，并针对脉冲响应模型下的 OLS 估计误差，建立了随机切换和周期切换两类设计的完整大 T 渐近理论。位置：本文是第一个在统一框架下，同时刻画“累积效应”和“滞后特定效应”的最优设计，并给出闭式解的。

子线索聚类¶

设计-推断框架：Bojinov and Shephard [2019], Liang and Recht [2025], Lin and Ding [2025]。这一簇主要关注在给定设计下如何定义 estimand 并进行推断，设计本身是给定的（通常是 i.i.d. Bernoulli 或简单的 switchback）。
针对特定效应的最优设计：Bojinov et al. [2023], Chen and Simchi-Levi [2025], Basse et al. [2023]。这一簇针对特定的因果效应（如累积效应、habituation 效应）推导最优设计，但方法通常依赖于特定的效应结构，难以统一。
模型-辅助的设计优化：Xiong et al. [2024], Guo et al. [2026]（本文作者的另一篇工作）。这一簇利用历史数据或高斯化方法辅助设计，但通常不提供理论上的最优性刻画。
经典最优实验设计：Kiefer and Wolfowitz [1959], Cox and Reid [2000]。这一簇提供了 D-, G-, E-最优性等准则，但主要针对横截面回归设计，未考虑时间序列中的依赖结构。

这个方向在追问的核心问题¶

设计-效应匹配：对于给定的目标 estimand（如累积效应 vs. 滞后特定效应），最优的处理分配时间依赖结构是什么？
稳健性 vs. 针对性：是否存在一个“万能”设计，对所有线性组合的效应都表现良好？还是必须为每个效应定制设计？
有限样本 vs. 渐近理论：大 T 渐近理论给出的最优设计，在有限样本下是否仍然有效？如何刻画有限样本下的最优设计？
模型依赖 vs. 设计依赖：基于模型（如脉冲响应模型）的最优设计，在模型误设下是否仍然稳健？

⚠️ 作者的 framing（必须明确标注成“这是作者的说法”）¶

作者把缺口 frame 成什么：作者声称，现有文献要么只针对特定效应（如累积效应）设计，要么只使用独立分配（i.i.d. Bernoulli），缺乏一个 统一的设计框架 来灵活地针对不同目标效应提供最优性保证。作者将马尔可夫框架和脉冲响应模型结合，声称这是“显然的下一步”。
哪些竞争路线被他淡化或回避了：
- 设计-基于方法（design-based）：作者在 Remark 3.4 和 Section D 中承认其模型-基于方法可以与设计-基于方法连接，但正文中主要强调模型-基于方法的“可解释性”和“统一性”。作者淡化了设计-基于方法（如 Bojinov and Shephard [2019]）的 非参数性 和 更弱的假设，而将其描述为“estimand 是设计依赖的”这一缺点。
- g-methods 框架：作者在 Related Work 中提到了 Robins 等人的 g-methods，但仅将其定位为“观察性纵向研究”，而本文是“实验性”的。作者回避了 g-methods 在处理 时变混杂 方面的强大能力，而本文的模型假设处理是外生的（exogenous）。
什么明显该被引 / 该存在、却没出现在 intro 里？：
- Hu and Wager [2025]：这篇论文（在本文参考文献中）研究了“geometric mixing”下的 switchback 实验，处理了 无限 carryover 的情况。本文假设有限 carryover（K 阶），但未讨论其与无限 carryover 文献的关系。这是一个明显的张力点。
- 动态处理机制（Dynamic Treatment Regimes, DTR）：Murphy [2003], Robins [2004] 等文献是因果推断中处理时间序列的经典工作，但本文的 intro 仅将其作为背景提及，未深入讨论其与本文设计问题的联系。DTR 关注的是 根据历史信息自适应地分配处理，而本文关注的是 固定设计。这是一个值得研究者去查的 gap：固定设计的最优性是否在自适应设计下仍然成立？

张力¶

未见明显对立引用。但存在一个 隐含的张力：Bojinov et al. [2023] 的最优 switchback 设计（针对累积效应）与本文的 i.i.d. Bernoulli 设计（针对滞后特定效应）在最优性上存在冲突。本文通过理论分析（Theorem 4.2 和 Theorem 5.8）明确刻画了这一冲突，并指出最优设计取决于目标 estimand。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
- \(T\)：总时间点（样本量）。
- \(K\)：脉冲响应模型的阶数（固定，有限）。
- \(Z_t \in \{0, 1\}\)：时间 \(t\) 的处理分配（0=对照，1=处理）。这是 可观测的随机变量。
- \(Y_t\)：时间 \(t\) 的观测结果。这是 可观测的随机变量。
- \(\beta = (\beta_1, \ldots, \beta_K)^\top\)：脉冲响应系数。\(\beta_k\) 是 \(k-1\) 期前的处理对当前结果的影响。这是 要估计的参数。
- \(\alpha\)：基线均值。这是 要估计的 nuisance 参数。
- \(\epsilon_t\)：独立同分布的高斯误差，均值为 0，方差为 \(\sigma^2\)。这是 不可观测的随机变量。
- \(X_t = (Z_t, Z_{t-1}, \ldots, Z_{t-K+1})^\top \in \mathbb{R}^K\)：滞后处理向量。这是 可观测的。
- \(w = (w_1, \ldots, w_K)^\top\)：目标 estimand 的权重向量。这是 研究者指定的。
- \(\tau_w = w^\top \beta\)：目标处理效应。这是 要估计的 estimand。
- \(\hat{\beta}\)：\(\beta\) 的 OLS 估计量。这是 可计算的。
- \(\hat{\tau}_w = w^\top \hat{\beta}\)：\(\tau_w\) 的 OLS 估计量。这是 可计算的。
- \(\Sigma = \frac{1}{T_{\text{eff}}} \sum_{t=K}^T (X_t - \bar{X})(X_t - \bar{X})^\top\)：Gram 矩阵（Fisher 信息矩阵）。这是 可计算的。
- \(\rho_t, \gamma_t\)：马尔可夫转移概率。\(\rho_t = P(Z_{t+1}=1 | Z_t=0)\)，\(\gamma_t = P(Z_{t+1}=0 | Z_t=1)\)。这是 设计参数。
- \(\rho, \gamma\)：随机切换设计中的常数转移概率。
- \(l\)：周期切换设计中的块长度（处理或对照的连续时间点数）。
模型：
- 数据生成机制：\(Y_t = \alpha + \sum_{k=1}^K \beta_k Z_{t-k+1} + \epsilon_t\)，其中 \(\epsilon_t \overset{iid}{\sim} N(0, \sigma^2)\)，且 \(\epsilon_t\) 独立于所有 \(Z\)。
- 设计模型：处理分配 \(\{Z_t\}_{t=1}^T\) 是一个马尔可夫链，转移矩阵为 \(P_t = \begin{pmatrix} 1-\rho_t & \rho_t \\ \gamma_t & 1-\gamma_t \end{pmatrix}\)。
- 已知：\(K, T, w\)。
- 要估的对象：\(\beta\)（进而 \(\tau_w\)）。
可观测数据：
- 可观测：\(\{Z_t\}_{t=1}^T\)（处理分配序列）和 \(\{Y_t\}_{t=K}^T\)（结果序列）。
- 不可观测：\(\beta, \alpha, \sigma^2, \epsilon_t\)，以及任何反事实结果。

第二步：讲最小内核¶

本文的核心数学问题可以归结为 一个关于“切换概率”的优化问题。我们剥去所有一般性设定，考虑一个最简特例：

最简特例：\(K=2\)（结果只依赖于当前和上一期的处理），目标 estimand 是 滞后特定效应 \(w = e_1 = (1, 0)^\top\)（即只关心 \(\beta_1\)，当前处理的即时效应）。设计采用 随机切换设计（\(\rho_t = \rho, \gamma_t = \gamma\)）。
在这个特例下：
- 模型：\(Y_t = \alpha + \beta_1 Z_t + \beta_2 Z_{t-1} + \epsilon_t\)。
- 目标：\(\tau_w = \beta_1\)。
- 设计参数：\(\rho, \gamma\)。
- 可观测数据：\(\{Z_t, Y_t\}_{t=2}^T\)。
核心思路：
1. OLS 估计量的方差：对于 OLS 估计量 \(\hat{\beta}_1\)，其方差（条件于设计）正比于 Gram 矩阵 \(\Sigma\) 的逆的 \((1,1)\) 元素。在大 \(T\) 下，\(\Sigma\) 收敛到其期望 \(\mathbb{E}[\Sigma]\)。
2. 期望 Gram 矩阵：利用马尔可夫链的平稳性，可以计算出 \(\mathbb{E}[\Sigma]\) 的极限形式。对于 \(K=2\)，它是一个 \(2 \times 2\) 矩阵，其元素是 \(\rho, \gamma\) 的函数。具体地，\(\mathbb{E}[\Sigma]_{11} = \alpha(1-\alpha)\)，其中 \(\alpha = \rho/(\rho+\gamma)\) 是平稳处理概率。
3. 设计目标：最小化 \(\text{Var}(\hat{\beta}_1) \propto w^\top (\mathbb{E}[\Sigma])^{-1} w = \frac{1}{\alpha(1-\alpha)}\)。
4. 优化：最小化 \(\frac{1}{\alpha(1-\alpha)}\) 等价于最大化 \(\alpha(1-\alpha)\)，其唯一解是 \(\alpha = 1/2\)，即 \(\rho = \gamma\)。进一步，可以证明当 \(\rho = \gamma = 1/2\) 时，\(\mathbb{E}[\Sigma]\) 的对角线元素最大，非对角线元素最小，从而最小化方差。这对应于 i.i.d. Bernoulli(1/2) 设计。
为什么这个特例抓住了核心：
- 它展示了本文的核心思想：设计优化问题可以转化为一个关于马尔可夫参数的优化问题。
- 它揭示了 最优设计取决于目标 estimand：对于滞后特定效应，最优设计是独立随机化（\(\rho=\gamma=1/2\)）。
- 它提供了一个可解析求解的基准，而论文的一般情形（任意 \(K\)，任意 \(w\)）只是在这个基准上增加了更复杂的矩阵代数（Kac-Murdock-Szego 矩阵的逆）和更一般的优化条件（Theorem 4.2 中的二次方程）。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在 N-of-1 试验（单个体时间序列实验）中，针对脉冲响应模型下的线性处理效应，如何设计最优的处理分配序列（马尔可夫链）以最小化 OLS 估计量的方差。
核心工具 / 方法：提出了一个 马尔可夫设计框架，将设计参数化为转移矩阵；推导了期望 Gram 矩阵的闭式表达式；针对 随机切换设计（常数转移概率）和 周期切换设计（确定性块切换）两类结构化设计，建立了完整的大 \(T\) 渐近理论。
主要结论：最优设计强烈依赖于目标 estimand。对于滞后特定效应和稳健设计，i.i.d. Bernoulli(1/2) 是最优的；对于累积效应，最优设计倾向于长块（周期切换设计中的块长 \(l^* \approx K-1+\sqrt{K-1}\)，随机切换设计中的切换概率趋于 0）。

关键设定与假设¶

设定：
- 数据生成：有限阶脉冲响应模型（式 3.1）：\(Y_t = \alpha + \sum_{k=1}^K \beta_k Z_{t-k+1} + \epsilon_t\)，\(\epsilon_t \overset{iid}{\sim} N(0, \sigma^2)\)。
- 设计：马尔可夫分配设计（Definition 2.1），处理分配 \(\{Z_t\}\) 是一个两状态马尔可夫链。
- 估计：OLS 估计 \(\hat{\beta}\)（式 3.2），目标 estimand \(\tau_w = w^\top \beta\)。
- 设计目标：渐近设计目标 \(L_{\text{asy}} = w^\top (\mathbb{E}[\Sigma])^{-1} w\)（Definition 3.6），作为真实方差 \(w^\top \mathbb{E}[\Sigma^{-1}] w\) 的代理。
关键假设：
- A1 (有限 carryover)：结果只依赖于最近 \(K\) 期的处理（式 3.1）。相比 Bojinov et al. [2023] 的有限 carryover 假设，本文的假设更具体（线性形式）。相比 Liang and Recht [2025] 的无限 carryover，本文的假设更强。
- A2 (外生性)：误差 \(\epsilon_t\) 独立于处理分配过程。这是一个很强的假设，排除了时变混杂。相比设计-基于方法（如 Bojinov and Shephard [2019]），这是一个额外的模型假设。
- A3 (平稳性)：对于随机切换设计，初始分布设为平稳分布（Definition 4.1）。这简化了分析，但可能不适用于所有实际场景。
- A4 (正则性条件)：对于 Theorem 4.2，要求 estimand 向量 \(w\) 既不满足 \(w_k = w_{k+1}\) 也不满足 \(w_k = -w_{k+1}\)。这排除了累积效应等边界情况，需要单独用周期切换设计处理。

主要结果¶

Theorem 4.2 (随机切换设计，目标优化)：对于满足正则条件的 \(w\)，最优的随机切换设计满足 \(\rho^* = \gamma^*\)（平稳处理概率为 1/2），且最优切换概率 \(\rho^*\) 由二次方程 \(4\rho^2 \sum_{k=1}^{K-1} w_k w_{k+1} + (2\rho-1) \sum_{k=1}^{K-1} (w_k - w_{k+1})^2 = 0\) 决定。
- 直觉：最优设计平衡了“处理概率”和“时间依赖”。\(\rho=\gamma\) 确保处理概率为 1/2，最大化边际变异。\(\rho\) 的具体值则根据 \(w\) 的“平滑度”调整：如果 \(w\) 变化剧烈（如滞后特定效应），则 \(\rho=1/2\)（独立）；如果 \(w\) 平滑（如累积效应），则 \(\rho \to 0\)（强依赖）。
- 解决的技术难点：推导了期望 Gram 矩阵 \(\mathbb{E}[\Sigma]\) 的闭式表达式（Lemma B.3），并将其与 Kac-Murdock-Szego 矩阵联系起来，从而将优化问题转化为一个可解析求解的二次方程。
Theorem 4.6 (随机切换设计，稳健优化)：对于稳健设计（最小化最坏情况方差），最优解是 \(\rho^* = \gamma^* = 1/2\)，即 i.i.d. Bernoulli(1/2) 设计。
- 直觉：稳健设计保护最差的估计方向。在随机切换设计中，引入时间依赖会降低某些方向的估计精度，因此独立设计是最稳健的。
- 解决的技术难点：将稳健优化问题等价于 E-最优性（最大化 \(\lambda_{\min}(\mathbb{E}[\Sigma])\)），并利用 KMS 矩阵的谱性质证明唯一最优解。
Theorem 5.5 (周期切换设计，目标优化)：对于周期切换设计，当块长 \(l \ge K\) 时，设计目标有闭式解：\(w^\top \tilde{\Sigma}^{-1} w = l A(w) + \frac{l}{l-K+1} B(w)\)，其中 \(A(w) = \sum_{k=1}^{K-1} (w_k - w_{k+1})^2\)（内部变异），\(B(w) = (w_1 + w_K)^2\)（边界项）。
- 直觉：目标分解为“内部变异”和“边界项”。块长 \(l\) 越大，内部变异项 \(l A(w)\) 越大（方差越大），但边界项 \(\frac{l}{l-K+1} B(w)\) 越小（因为分母变大）。最优 \(l\) 平衡了这两项。
- Corollary 5.6 (累积效应)：对于累积效应，最优块长 \(l^* \approx K-1 + \sqrt{K-1}\)。
- Corollary 5.7 (滞后特定效应)：对于滞后特定效应，最优块长 \(l^* = \max\{k, K-k+1\}\)，且当 \(l < \max\{k, K-k+1\}\) 时，效应不可识别。
Theorem 5.8 (周期切换设计，稳健优化)：对于稳健设计，最优块长 \(l^* = K\)。
- 直觉：\(l < K\) 时，某些效应不可识别（方差无穷大）。\(l \ge K\) 时，最坏情况方差随 \(l\) 线性增长。因此最优解在边界 \(l=K\) 处取得。

证明路线与技术技巧¶

整体路线（以 Theorem 4.2 为例）：
1. 推导期望 Gram 矩阵：利用马尔可夫链的平稳性，计算 \(\mathbb{E}[\Sigma]\) 的闭式表达式（Lemma B.3），发现其主项是 \(\alpha(1-\alpha) \Sigma_K(q)\)，其中 \(\Sigma_K(q)\) 是 Kac-Murdock-Szego (KMS) 矩阵，\(q=1-\rho-\gamma\)。
2. 渐近等价：证明当 \(T \to \infty\) 时，设计目标 \(L_{\text{asy}}\) 一致收敛到其极限 \(l(\rho, \gamma; w) = \frac{1}{\alpha(1-\alpha)} w^\top \Sigma_K(q)^{-1} w\)。
3. 分解优化：极限目标可以分解为 \(\alpha\)-部分和 \(q\)-部分。\(\alpha\)-部分 \(\frac{1}{\alpha(1-\alpha)}\) 在 \(\alpha=1/2\) 时最小，推出 \(\rho=\gamma\)。\(q\)-部分 \(w^\top \Sigma_K(q)^{-1} w\) 是一个关于 \(q\) 的有理函数。
4. 解析求解：利用 KMS 矩阵逆的闭式表达式（三对角矩阵），将 \(q\)-部分写成一个关于 \(q\) 的二次有理函数。求导得到关于 \(q\) 的二次方程，其唯一在 \((-1,1)\) 内的根即为最优 \(q^*\)。
5. 转换回设计参数：利用 \(\rho = \alpha(1-q)/2\) 和 \(\gamma = (1-\alpha)(1-q)/2\)，得到关于 \(\rho\) 的二次方程（式 4.3）。
6. 收敛性：利用 argmin 定理，证明有限 \(T\) 下的最优解收敛到极限最优解。
关键跳跃点：
- 从 \(\mathbb{E}[\Sigma^{-1}]\) 到 \((\mathbb{E}[\Sigma])^{-1}\)：这是本文设计目标的核心近似（Definition 3.6）。作者通过 Jensen 不等式和渐近等价性论证其合理性。这个跳跃使得问题从计算期望的逆矩阵（困难）变为计算逆矩阵的期望（相对容易）。
- KMS 矩阵的引入：将 \(\mathbb{E}[\Sigma]\) 的主项识别为 KMS 矩阵，是连接设计参数和估计方差的关键。KMS 矩阵的谱性质和逆矩阵的闭式解是后续解析求解的基础。
- 周期切换设计的秩分析：Theorem 5.3 揭示了当块长 \(l < K\) 时，设计矩阵是秩亏的，导致某些效应不可识别。这个发现是理解周期切换设计局限性的关键。
技术技巧点名：
- Kac-Murdock-Szego (KMS) 矩阵：用于建模平稳马尔可夫链的协方差结构。其逆矩阵的闭式解（三对角 Toeplitz 矩阵）被用于解析求解最优切换概率。
- Sherman-Morrison-Woodbury 恒等式：用于推导周期切换设计中 \(\tilde{\Sigma}^{-1}\) 的闭式表达式（Lemma C.2）。
- argmin 定理：用于证明有限样本最优解收敛到渐近最优解。
- 几何级数求和：用于推导期望 Gram 矩阵的闭式表达式（Lemma B.3）。
- E-最优性：将稳健设计优化等价于最大化最小特征值。

真实例子与应用¶

本文为纯理论 + 模拟验证，无真实数据例子。所有实证结果来自 Section 6 的模拟实验。
模拟场景：
- 数据：根据脉冲响应模型（式 3.1）生成，\(K=5\)，\(T \in \{20, 30, \ldots, 100\}\)。
- 方法：比较了 i.i.d. Bernoulli(1/2)、最优随机切换设计（Algorithm 1 在 500x500 网格上搜索）、最优周期切换设计（Algorithm 1 在 \(l=1\) 到 \(T\) 上搜索）、以及 Bojinov et al. [2023] 的最优规则 switchback 设计（ORSB）。
- 结果：
  - 滞后特定效应（Figure 5a）：随机切换设计和 i.i.d. Bernoulli 表现最好，周期切换设计次之，ORSB 最差。最优随机切换设计近似为 \((\rho^*, \gamma^*) = (0.5, 0.5)\)，验证了 Theorem 4.2 和 Example 4.3。
  - 累积效应（Figure 5b）：周期切换设计表现最好，随机切换设计和 ORSB 次之，i.i.d. Bernoulli 最差。最优周期切换设计的块长 \(l^* = 7\)，验证了 Corollary 5.6（\(K=5\) 时 \(l^* \approx 4 + \sqrt{4} = 6\)，接近 7）。
- 稳健性检验（Table 2）：
  - 时间趋势误设：随机切换设计相对稳健（MSE 与 Bernoulli 相当），周期切换设计出现较大偏差。
  - 误差过程误设（AR(1)）：两种设计都相对稳健。
  - 滞后阶数误设：两种设计都相对稳健，但周期切换设计 MSE 更小。
- 模拟想说明什么：
  1. 验证了理论结果（最优设计参数）。
  2. 展示了针对性设计（周期切换用于累积效应）相对于通用设计（i.i.d. Bernoulli）的优势。
  3. 揭示了不同设计对模型误设的稳健性差异（随机切换更稳健，周期切换在特定误设下更脆弱）。

🔎 结论是否比证明窄¶

是。作者在 Theorem 4.2 中声称“存在唯一解 \((\rho^*, \gamma^*)\)”，但该定理的证明依赖于 排除边界情况（\(w_k = w_{k+1}\) 或 \(w_k = -w_{k+1}\)）。对于累积效应（\(w = (1, \ldots, 1)\)），该定理不适用，作者只能通过周期切换设计（Section 5）来近似处理。作者在 Section 4.1 末尾明确承认了这一点，并指出“边界情况导致最优解在边界上”。
另一个窄化：Theorem 4.2 的证明假设 \(\rho, \gamma \in [\delta, 1-\delta]\)，即排除了边界点 0 和 1。对于累积效应，最优解在边界 \(\rho=\gamma=0\) 上，因此该定理无法直接应用。作者通过周期切换设计来研究这个边界情况，但周期切换设计是确定性的，与随机切换设计的“随机性”本质不同。因此，对于累积效应，随机切换设计的最优性结论是“不完整”的，作者只能给出“最优设计倾向于边界”的定性结论，而非精确解。
稳健性结论的窄化：Theorem 4.6 和 Theorem 5.8 的稳健性结论是针对 所有归一化线性组合（\(\|w\| \le 1\)）的。如果研究者只关心一个 特定的有限集合 的 estimand，最优设计可能不是 i.i.d. Bernoulli 或 \(l=K\)。作者在 Algorithm 1 中提供了一个更通用的框架，但理论分析只覆盖了最坏情况。

四、开放问题¶

无限 carryover 下的最优设计：本文假设有限阶脉冲响应模型（\(K\) 固定）。当 carryover 效应无限长（如 Liang and Recht [2025] 的设定）时，最优设计是什么？马尔可夫框架是否仍然适用？扎根点：作者在 Section 3 中明确提到“Infinite carryover has also been studied [Liang and Recht, 2025, Hu and Wager, 2025], and here we focus on finite carryover to obtain tractable design optimizations.”
自适应设计：本文研究的是固定设计（设计在实验前确定）。如果允许根据历史结果 自适应地调整 处理分配（如动态处理机制），能否获得更优的估计效率？扎根点：作者在 Related Work 中提到了 Murphy [2003] 和 Robins [2004] 的动态处理机制，但未将其与本文的固定设计框架连接。这是一个明显的 gap。
面板实验的扩展：本文只考虑单个实验单元（\(N=1\)）。当有多个单元（面板数据）时，如何处理单元间的干扰（interference）？如何设计跨单元的处理分配？扎根点：作者在 Conclusions 中明确提到“One promising direction for future work is to extend the framework to panel experiments”。
模型误设下的理论保证：本文的模拟展示了随机切换设计对某些误设的稳健性，但缺乏理论保证。能否在更一般的非参数模型下，证明本文提出的设计（如随机切换设计）具有 minimax 最优性或某种稳健性？扎根点：作者在 Remark 3.1 中提到了模型误设的风险，并在 Section 6.2 中进行了模拟，但未提供理论分析。

Maintained by 陈星宇 · Homepage · Source on GitHub