Ranking Treatment Saturations under Clustered Network Interference¶

作者: Seungjin Han, Julius Owusu, Youngki Shin
主题: 因果推断
相关性: 7/10
链接: https://arxiv.org/abs/2606.18590

一、领域脉络与小综述¶

这个方向是什么¶

本子方向研究的是如何在存在集群网络干扰（clustered network interference）的情况下，基于实验数据对一个有限集合内的“处理饱和度”（treatment saturation）水平进行排序。集群网络干扰是指个体结局不仅取决于自身处理，还取决于同一集群内其他个体的处理状态，这是一个典型的非参数干扰结构。该领域当前的主要理论瓶颈是：如何在提供有限样本保障的前提下，设计出无需观测网络结构且具备良好统计性质的排序规则。

发展脉络（history）¶

奠基工作：没有干扰的统计决策理论。
- Manski (2004)：建立了在个体独立反应（无干扰）假设下，基于可加可分离遗憾损失的经验成功（ES）排序规则的有限样本分析框架，并推导了极大遗憾的上界。这是整个领域的基础，但明确排除了干扰。
- Hirano and Porter (2009)：使用Le Cam局部渐近正态性将Manski的框架扩展到半参数情形，证明了该ES规则在极限实验中的渐近最优性。这个工作为渐近分析提供了标准路径。
- Stoye (2009), Tetenov (2012), Kitagawa and Tetenov (2018) 等：进一步拓展了这一框架，但所有工作都假设个体主义回应（no interference），即一个单位的结果不受其他单位处理分配的影响。
主要进展：集群随机化实验与饱和实验设计。
- Hudgens and Halloran (2008)：奠定了在存在干扰的情况下进行因果推断的两阶段随机化饱和实验设计框架，并提出了在这些设计下对平均潜在结果的无偏估计。这是实验设计层面的关键进展。
- Baird et al. (2018)：在Hudgens和Halloran的基础上，明确提出了“两阶段随机化饱和设计”，并研究了在干扰存在时最大化统计检验功效的最优第一阶段分配。这标志着设计从实证应用走向理论优化。
- Crépon et al. (2013), Egger et al. (2022), Banerjee et al. (2013)：这些实证工作利用饱和实验来研究不同政策（如就业援助、现金转移、信息传播）在集群层面的溢出效应，但它们在政策评估后，没有提供一个通用框架来正式地对这些饱和度水平进行排序和选择。
当前Frontier与本文的位置。
- 网络干扰下的政策学习： Zhang and Imai (2023), Park et al. (2024), Viviano (2025) 开发了基于网络的经验福利最大化（EWM）规则，用于在存在网络干扰时指导个体化处理分配。他们利用协变量来设计个体化政策。
- 本文的切入点是互补的： 本文不是寻找个体化的最优分配规则，而是研究如何选择单一的、种群水平的处理饱和度。它填补了Manski/Hirano-Porter框架（无干扰）与Hudgens/Baird设计（有干扰，但关注点在于推断/假设检验而非排序/决策）之间的空白。作者将Manski的决策理论框架与Baird的两阶段设计框架结合起来，将排序问题置于一个有限样本遗憾保障的严格分析之下。

子线索聚类¶

统计决策理论与经验福利最大化（EWM）： 这一簇以Manski (2004), Hirano and Porter (2009), Kitagawa and Tetenov (2018), Athey and Wager (2021) 为代表。它们关注在给定实验数据下如何做出最优决策（选择最优政策），通常假设无干扰。本文将其核心框架（ES规则、可加可分离遗憾）作为技术基底。
干扰下的实验设计与推断： 这一簇以Hudgens and Halloran (2008), Baird et al. (2018), Viviano (2022) 为代表。它们专注于设计能够处理干扰的实验（如两阶段随机化设计），为处理效应的无偏估计而设计，并优化设计以最大化统计检验功效。本文直接采用了Baird et al. (2018)的两阶段设计框架，但将其目标从“最大化功效”替换为“最小化决策规则的遗憾上界”。
对固定排序和获胜者的推断： 这一簇以Mogstad et al. (2024), Andrews et al. (2024), Gu and Koenker (2023) 为代表。它们解决的是对固定总体排序（如地区排序）的推断问题，而非产生一个决策规则。本文明确区分了这一点，指出其目标是导出一种具有有限样本遗憾保障的决策规则，而不是对固定排序进行推断。

这个方向在追问的核心问题与已知瓶颈¶

如何在有干扰时进行排序？ 核心问题。无干扰假设是经典理论（Manski, 2004）的基础。当存在干扰，尤其是在集群内部网络未知时，个体结果不再独立，经典理论失效。
如何提供有限样本保障？ Manski (2004) 的界依赖于个体独立性。在干扰和实验设计（尤其是无放回完全随机化）共同作用下，结果间的依赖关系变得复杂，使得经典的Hoeffding不等式等工具不适用。这导致遗憾界可能不收缩（as in the paper’s main bound）或需要新的依赖度量化工具（如Janson不等式）。
如何设计最优实验以支持排序？ 传统的功效分析导向的设计（Baird et al., 2018）不直接优化排序的准确性或决策规则的风险。需要将设计目标和决策目标对齐，即设计一个旨在最小化遗憾上界的实验。
在渐近情况下，最优排序规则的特征是什么？ 当无干扰时，ES规则已被证明是渐近最优的（Hirano and Porter, 2009）。本文率先试图在考虑干扰的极限实验中刻画渐近最优（在最小化最坏情况遗憾上界这个意义上）的“阈值排序规则”。

⚠️ 作者的 framing（必须明确标注成"这是作者的说法"）¶

作者把缺口 frame 成什么： 作者将缺口定位在“Manski式的统计决策理论与存在集群干扰的饱和实验之间的结合”。他们声称，虽然Manski (2004) 和 Hirano and Porter (2009) 处理了排序/选择，但假设无干扰；而Hudgens和Halloran (2008) 和 Baird et al. (2018) 处理了干扰，但关注点在于估计和检验而非决策排序。所以本文是“显然的下一步”。
哪些竞争路线被他淡化或回避了：
- 网络EWM方法： 论文将自身与 (Zhang and Imai, 2023; Park et al., 2024; Viviano, 2025) 等网络EWM方法区分开来，声称它们处理的是“个体化处理分配”问题，而本文处理的是“单一总体水平饱和度”选择。这是一个非常明确的切割，但它可能回避了当网络信息可用时，排序规则是否可以改进。作者明确假设网络G_i是未观测到的。如果网络信息可用，EWM方法可能更优。
- 成对比较的 2^{T} 动作问题： 论文将排序问题分解为成对比较，并使用可加可分离遗憾损失来聚合。这隐含地假设了没有全局一致性约束。对于K>2，一个更直接的“排序”问题可能需要一个单一的、排序最大的饱和度，而不仅仅是所有的成对胜出关系。作者将其框架为一个 2^{T} 动作问题，这可能是标准的，但值得注意。
什么明显该被引 / 该存在、却没出现在 intro 里？
- 这篇文章完全没有讨论统计-计算权衡 (statistical-computational tradeoff)。虽然这是一个纯理论/方法论文，但对于一个计算统计背景的研究者来说，这是一个值得注意的缺失。作者从未讨论过ES规则的实现复杂度，或计算“拟最优”设计是否比经典均衡设计更难。
- 作者引用了Janson (2004) 的图依赖不等式，但没提及Stein方法与相依性的文献，这提供了另一种获取集中不等式的方式。

张力¶

在被引文献中未见明显对立引用。Baird et al. (2018) 关注功效最大化，而本文关注遗憾最小化，这是设计目标的转换，而非矛盾。一个更微妙的张力在于：无干扰的Manski (2004) 界被本文指出，在干扰强时可能低估实际风险，从而失效。本文的界对干扰更稳健但更保守（不随C收缩），这在模拟中体现为Manski界被违反而本文界保持有效。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
- n_i: 集群i中的单元数。
- Z_ij ∈ {0,1}: 集群i中单元j的可观测的二元处理分配。
- Y_ij ∈ [0,1]: 集群i中单元j的可观测的有界结局。
- G_i: 集群i内部未观测的无向网络图，定义了干扰结构。
- π ∈ [0,1]: 处理饱和度，即集群中被处理单元的期望比例。
- Π = {π_1, …, π_K}: 待排序的有限个处理饱和度水平集合（参数/estimand）。
- ¯Y_{ij}(π): 当集群i采用比例π的完全随机化处理政策时，单元j的个体平均潜在结局（潜在量，由Y_ij(z)通过γ(π, z)平均得到）。
- ¯Y_i(π): 集群水平的平均潜在结局。
- U(π, θ) = ¯Y(π) := E_θ[¯Y_i(π)]: 饱和度为π时的总体福利（主要estimand）。
- C: 实验中被抽样的集群总数（样本量）。
- C_k: 被分配到饱和度π_k的集群数（设计参数）。与总体均值E[C_k] = α_k C相关。
- S_i ∈ Π: 集群i可观测的第一阶段饱和度分配。
- bU(π_k, θ) = b¯Y(π_k): 基于实验数据的总体福利可观测的估计量（公式2）。
- Δ_{kk'} = |U(π_k, θ) - U(π_{k'}, θ)|: 两个饱和度之间的福利差距（参数）。
- χ_f(G): 图的分数色数（未知，但被界量化）。
模型：
- 潜在结局模型： Y_ij(z_i) 是完全非参数的，取决于集群i内所有单元的处理向量。
- 总体模型： 集群从超总体I中独立同分布地抽样。¯Y_i(π) 的分布是F_π，但未知。
- 政策模型（目标政策）： 规划者计划部署一个政策，该政策在集群内以完全随机化（exact-count）方式处理比例为π的单元。这是定义福利U(π,θ)的基准。
- 实验模型（数据生成机制）： 实验采用两阶段完全随机化设计。第一阶段：C个被抽样的集群通过无放回完全随机化分配到不同饱和度。第二阶段：在集群内部，精确的n_i * π_k个单元被无放回地随机分配到处理组。
可观测数据：
- 研究者可以看到整个数据集：{Z_ij, Y_ij, S_i, n_i} for all i=1,...,C and j=1,...,n_i。
- 研究者知道的“分配机制”是两阶段完全随机化的（见Assumption 3）。
- 研究者无法观测到集群内部网络G_i、潜在结局函数Y_ij(z_i)、以及潜在结局¯Y_i(π_k)本身。
- 研究者需要根据实验数据来估计U(π_k, θ)。关键的识别假设在于，通过实验随机化，公式(2)中的简单样本均值b¯Y(π_k)是目标U(π_k, θ)在整体设计下的无偏估计。这里没有“识别”问题，因为潜在结果被设计平均化所校准。

第二步：讲最小内核¶

最简特例：K=2 个饱和度（π_1 vs. π_2），等规模集群（n_i = n_0），均衡阶段1设计（C_1 = C_2 = C/2）。

在这个特例下：

要证明的命题是什么： ES排序规则 δ_{ES} = 1(bU(π_1) ≥ bU(π_2)) 在可加可分离遗憾损失下的最大遗憾上界是 Δ_{12} * exp( - (2 Δ_{12}^2) / (χ_f(G) * (2/C)) )，其中Δ_{12} = |U(π_1) - U(π_2)|，χ_f(G) = C * n_0。
核心思路（易懂版）：
1. 问题化简： 在这个特例下，遗憾损失（risk）简化为： R = E[L] = Δ_{12} * Pr( ES规则选错了“更好”的饱和度 )。因为如果你选对了，损失为0；选错了，你损失的福利就是两个政策的差距 Δ_{12}。
2. 错误概率的界限： 错误概率就是 Pr( bU(π_1) - bU(π_2) < 0 或者 > 0 )，取决于哪个是真实更优的。本质上，它等于Pr( D_{12} - E[D_{12}] ≥ Δ_{12} )，其中D_{12} = bU(π_1) - bU(π_2)。
3. 为什么经典Chernoff/Hoeffding界失败： 因为两阶段完全随机化，D_{12} 是由 C * n_0 个严重依赖的单元结果构成的。n_0 个单元在同一集群内由于网络干扰完全相关；且由于第一、二阶段都是无放回分配，所有被分配到π_1或π_2个单元之间的结果都是随机依赖的（一个完全依赖图）。
4. Janson不等式的贡献： 作者使用Janson不等式来bound这个错误概率。Janson不等式的一个关键要素是图的分数色数 χ_f(G)，它量化了依赖结构的复杂度。在完全依赖图中（所有变量都相互依赖），χ_f(G) 等于变量总数，这里是 (C_1 + C_2) * n_0 = C * n_0。
5. 界的形式与含义： 代入Janson不等式得到 Pr( error ) ≤ exp( -2 * Δ_{12}^2 / (χ_f(G) * (2/C)) )。
  - 分子有n_0吗？ 因为D_{12}的每个加项的范围是 1/(C_k * n_0)。Janson不等式的||c||_2^2是C_k * (1/(C_k*n_0))^2 = 1/(C_k * n_0)。
  - 关键抵消！ 把 χ_f(G) = C * n_0 和 ||c||_2^2 = C * (1/(C*n_0))^2 = 1/(C * n_0) 代入Janson不等式： bound = exp( -2 * Δ_{12}^2 / ( (C * n_0) * (2/C) ) )。 C * n_0 与 2/C 相乘，n_0完全抵消。
  - 大C的影响： 最终指数是 -Δ_{12}^2 / (2)（因为 (C * n_0) * (2/C) = 2 n_0? 等一下，这里需要仔细检查我的代数，以确保准确捕捉推论1的逻辑。）
    
    更正计算： 在推论1中，对于单元级别界 (10)，作者说明 χ_f(G_{kk'}) = (C_k + C_{k'}) n_0 = C n_0。而C_k = C/2，所以(C_k^{-1} + C_{k'}^{-1}) = 2/C + 2/C = 4/C。代入定理1(ii)： exp( -2 * n_0 * Δ^2 / (χ_f(G) * (C_k^{-1} + C_{k'}^{-1}) ) ) -> exp( -2 * n_0 * Δ^2 / (C * n_0 * (4/C)) ) = exp( -Δ^2 / 2 )。 是的！最终上界是 exp(-Δ^2/2)，与C无关！ 这是论文最反直觉的核心发现：在完全依赖图下，界不收缩；即使在均衡分配下，增加集群数量C也不会收窄遗憾上界。
为什么这个特例揭示核心困难：
- 它展示了实验设计导致的“完整依赖图”是问题的根源。两阶段完全随机化在极端层面耦合了结果，这使得传统的大样本方法失效。
- 它揭示了分数色数是量化该复杂性的自然工具，并且其在完全图中的值直接导致遗憾上界对C不敏感。这个“不敏感性”是最简洁、最核心的数学事实，它驱动了第4节“拟最优设计”的结论（界不收缩，因此设计优化只看α）。整个论文的大部分推导，都是在这个最小特例上的推广。

三、这篇论文做了什么¶

三句话概述：
1. 研究问题： 如何基于两阶段随机化饱和实验的数据，在存在集群网络干扰下，对一个有限集合内的处理饱和度水平进行排名，并保证有限样本遗憾。
2. 核心工具/方法： 基于Janson (2004) 的图依赖随机变量集中不等式（用于推导有限样本上界）和Le Cam的局部渐近正态性（用于推导渐近结果），提出经验成功（ES）排名规则。
3. 主要结论： 推导了ES规则关于最坏情况遗憾的非渐近上界，该上界仅通过分数色数依赖于网络结构，并因两阶段完全随机化实验设计导致的完全依赖图而对集群数C不敏感；利用该界刻画了均衡阶段1分配在最小化该界时的拟最优性质；并在一个秩一结构条件下证明ES规则在阈值排序规则中是最优的。
关键设定与假设：
- 假设1 (Integrality of n_iπ): n_i * π 必须是整数。这个假设是为了让精确计数完全随机化在集群内部是良好定义的。它排除了部分情况，作者承认可以放宽。
- 假设2 (Discrete Choice Set): 处理饱和度是有限离散集合 Π = {π_1, …, π_K}，K < ∞。这是典型的有限动作集问题。
- 假设3 (Two-stage complete randomization design): 两阶段都是完全随机化（无放回）。这是论文推导核心结果的主要设计，优点是简单、无偏，缺点是产生完全依赖图，导致界不收缩。论文附录B提供了两阶段伯努利设计的扩展。
- 假设4 / 5 (Cluster size bounds / equality): 用于推导单元级别的界。这个假设比作者所说的更具限制性。
- 假设6 (One-dimensional stochastic variation): 在极限实验中，福利对比的协方差矩阵秩为1。这是一个很强的结构假设，用以简化渐近分析。作者举例了线性均值模型（LIM）来证明其合理性。
- 假设7 (Regularity conditions for asymptotic results): 存在最佳正则估计器和协方差的一致估计，这是标准局部渐近理论的条件。
主要结果：
- 定理1 (有限样本风险界): 给出了ES规则风险的非渐近上界，形式为 ∑ exp(-2 * Δ^2 / (χ_f(G)*(1/C_k + 1/C_{k'}))) * Δ。
  - 直觉： 遗憾是福利差距 Δ 乘上错误排序概率的上界。该界指数衰减于福利差距的平方。
  - 技术难点： 将Janson不等式应用于由两阶段完全随机化产生的完全依赖图，并处理结果变量的多重缩放（scale factors: 1/(C_k*n_i) 等）。
- 推论1 (封闭形式界): 对于完全依赖图，分数色数等于顶点数。代入定理1后发现，在等规模集群下，单元级别的界和集群级别的界重合，且不依赖于集群总数C。
- 定理2 (拟最优设计): 在最小化风险上界的意义下（使用定理1的界），第一阶段均衡分配（α_k = 1/K）是拟最优的。
  - 直觉： 因为界不收缩，唯一能优化的是不同成对比较的“成本”之和 (α_k + α_{k'})/√(α_k α_{k'})，该和受对称性和凸性的约束，在平衡点时最小化。
- 定理3 (渐近最优性与可容许性): 在秩一假设（假设6）和可加可分离遗憾损失下，阈值排序规则（包括ES规则）在整个阈值规则类中是渐近“最小化最坏情况遗憾上界”的最优规则。这一结论需要仔细解读：它说ES规则在其所属的规则类中，在最小化最坏情况风险的一个上界这个意义上是最优的，并未声称它是最小化真实最坏情况风险的最优规则。
- 定理4 (汇合): 在假设6/7下，有限样本ES规则收敛于极限实验中最小化最坏情况风险上界的阈值规则。
证明路线与技术技巧（重点）:
- 整体路线：
  1. 定义风险/遗憾： 将排序问题分解为成对比较的决策问题，遗憾损失是可加可分离的。
  2. 有限样本上界： 对每个成对比较，其贡献是由福利差距 Δ_{kk'} 乘上错误概率 p_{kk'} 构成。
  3. 核心跳跃（使用Janson）： 错误概率是估计量之差 D_{kk'} 的尾部概率。经典的Hoeffding界在此不适用，因为由于干扰和完全随机化设计，D_{kk'} 由高度依赖的变量构成。作者用Janson (2004) 不等式代替Hoeffding不等式，该不等式用 分数色数 χ_f(G) 量化依赖度。
  4. 计算 χ_f： 在完全随机化下，D_{kk'} 涉及的所有结果形成一个完全依赖图，因此χ_f(G)等于涉及的单元（或集群）总数。
  5. 分析界不收缩性： 在完全图的情况下，χ_f 与归一化项 1/(C_k + C_{k'}) 完美抵消，得到一个与总体C无关的界。
  6. 渐近理论： 使用Le Cam的极限实验框架。他们定义一个极限实验，其中估计量是高斯分布。在这个框架中，对福利对比gradient向量施加秩一假设（假设6），使得问题在极限中可处理。然后通过应用 Cohen and Sackrowitz (2005) 的单侧多重比较理论结果来证明可容许性和最优性。
- 关键跳跃点：
  - 第一个也是最关键的跳跃是：认识到并证明两阶段完全随机化会导致所有结果之间产生一个“完全依赖图”。这是核心困难所在。作者通过使用集群层面的有界性来绕过单位层面的复杂性，从而轻轻绕过这个问题。
  - 第二个跳跃是：使用Janson不等式。需要将Janson不等式的参数（c_i，即每个加项的范围）匹配到ES规则估计量 D_{kk'} 的特定形式（其是1/C_k级别的，因为均值是除以C_k做的）。附录中确实包含了证明。
  - 第三个跳跃是：在极限实验中应用Cohen and Sackrowitz (2005)。这要求仔细证明极限实验的协方差矩阵是“类内”（intra-class）结构，或满足秩一假设。
- 技术技巧：
  - Janson (2004) 不等式： 这是整个有限样本分析的中流砥柱，用于处理完全依赖图。
  - Le Cam LAN / 极限实验： 这是渐近分析的基础。关键点是仔细定义极限实验，使得ES规则在其中的对应物是“阈值排序规则”。
  - Cohen and Sackrowitz (2005) 多重比较定理： 用于证明在极限中阈值规则的可容许性和Bayes最优性。
  - 秩一条件 (Assumption 6)： 这是一个很巧妙的技巧。它使高维参数 h 在极限实验中坍缩为一维，从而能够求解minimax最优阈值。形式上它等同于假设福利对比的梯度向量是成比例的，这一条件在作者给出的“线性均值模型”例子中自然满足。
真实例子与应用：
- 数据生成流程： 在模拟部分（第6节），作者使用了Manski (1993)的线性均值模型 (LIM) 作为模拟场景。这个模型直接生成了具有滋扰性（endogenous peer effects）的集群网络干扰（通过η_1系数产生）。在这个模型中，结果Y_ij依赖于集群平均值¯Y_i和集群处理比例Π_i（见公式18）。作者明确提供了模型的简化形式（公式19），清楚地展示了结果对集群处理的依赖。
- 如何应用ES规则： 模拟使用不同的参数（C, n_0, η_1, η_2, η_3）生成数据。ES规则通过比较两个饱和度水平的估计福利 bU(π_k, θ) 来实施，如论文所述。
- 结果与启示：
  - 验证界： 模拟结果显示，ES规则的风险（Monte Carlo风险）始终低于论文推导的风险界（定理1和推论1），特别是集群层面或单元层面的界。这证实了界的有效性（是有效的上界，而非紧致界）。
  - Manski界在干扰下的失败： 这是模拟最有力的部分。当网络干扰强度通过η_1 → 1增强时，Manski (2004) 的独立观察界严重低估了实际风险，甚至被实际Monte Carlo风险”违反“（即Manski上界低于实际风险）。相比之下，论文的界仍然有效，从而清晰地展示了为什么无干扰理论在集群干扰场景下是无效的。
  - 均衡分配的最优性： 模拟比较了不同的第一阶段分配方案，以测试定理2。结果显示，在蒙特卡洛风险的最大值方面，均衡分配（1/4 each）确实优于极端倾斜分配（.50/.20/.20/.10）和随机狄利克雷分配（Dirichlet），从而证实了该理论。
  - 完全随机化 vs 伯努利分配： 附录B.2的模拟表明，当你为目标福利（完全随机化政策）进行实验时，匹配的完全随机化实验表现优于伯努利实验。即使使用IPW调整后，伯努利实验由于“命中率”低（γ_IPW权重的样本量小）而表现更差。

🔎 结论是否比证明窄¶

是的，在部分有限样本上界的紧致性方面，结论比证明窄。模拟中（见表1），论文的界与Monte Carlo风险之间的差距是实质性的（在C=192时，界是0.20，但风险是0.08）。作者在论文中坦诚地承认了这个差距（“The true bound...is a finite worst-case regret governed by the allocation shares...”；“The true risk may still contract with C...but the complete-graph structure does not capture that contraction”）。作者将界定位为“最坏情况上界”，而非紧致界，这与证明结果一致。问题在于，消费者可能会认为“界不收缩”等同于“真实风险不收缩”，但模拟中风险确实在收缩。作者的证明并未排除真实风险可以收缩的可能性，因此，这是一个边界较窄的结论（保守的界），而不是对现实表现的边界较宽的结论。
另外，定理3的最优性结论更窄。定理3声称ES规则在最小化最坏情况风险的一个上界这个意义上是最优的。它并没有证明ES规则在最坏情况风险本身上是渐近最优的。作者明确写道：“in the sense of minimizing an upper bound on the worst-case regret”。这是一个重要的限定。除非能够同时证明这个界是紧致的（论文没有证明），否则读者不能认为ES规则是“最优的”。

四、开放问题¶

更紧致的有限样本界： 是否可以推导出更紧的界，捕获集群数量C带来的收缩？例如，能否证明或反驳一个 O(exp(-C)) 的界是可能的？这扎根于定理1中界不收缩这一明显事实。研究者需要回答：“由两阶段完全随机化产生的依赖图是否严格阻止了指数界随C收缩，还是说Janson不等式的保守性是主要原因？”
高秩（Rank > 1）下的渐近最优性： 定理3的关键局限是秩一假设（Assumption 6）。作者将此视为“未来工作”：“extending these results to higher-rank settings is left for future work”。一个开放的问题是：当福利对比的梯度向量不是成比例时，ES规则是否能被推广，或者是否有其他规则在最小化最坏情况风险的意义上是最优的？
自适应/动态排序： 作者在第7节（结论）中提到了“dynamic optimal saturation design with repeated experiments”。如何迭代地设计实验以更新性质未知的饱和度排名？由于界不收缩，在非自适应实验中可能存在不确定性的“下限”。自适应实验是否可以“绕过”这个下限？
统一Hoeffding/Janson界： 附注3（原文）提到，当干扰较弱时，应用Hoeffding不等式得出的界可能是有效的。这暗示了一个开放的、更广泛的图论/概率论问题：是否存在一个统一的集中不等式，在依赖是“局部”或“弱”的某些条件下自动从Janson界降级为Hoeffding界？或者，能否为Hoeffding和Janson界之间的特定依赖结构（例如，已知集群内部网络是一个树形结构而不是完全图）找出一个“弱化点”？这扎根于一个被列入”未来工作“的模糊提及。

Maintained by 陈星宇 · Homepage · Source on GitHub