Optimal designs for testing pairwise differences: A graph‐based game theoretic approach¶

作者: Arpan Singh, Satya Prakash Singh, Ori Davidov
来源: Scandinavian Journal of Statistics
主题: 数理统计 / 假设检验
相关性: 7/10
链接: https://doi.org/10.1111/sjos.12757

一、领域脉络与小综述¶

这个方向是什么¶

该子方向可称为 “多处理比较实验的最优设计”——研究如何将有限的实验样本（受试者/试验单元）分配至多个处理组（包括对照），以使得对预先指定的若干对处理组之间差异的假设检验具有某种最优性质（如最大化检验功效、最小化最小可检测差异）。这类问题常见于临床试验、农业试验、工业因子筛选等场景，核心困难在于：处理组的数量可以很大，而实验者只关心其中的一部分成对比较；朴素均衡分配（每个处理组样本量相等）未必最优，甚至可能浪费资源。本文使用图论对关心比较的结构进行编码（节点=处理组，边=需要检验的成对差异），并构建 最大最小（max-min）最优性准则：在预先选定的比较集即图上，使最坏情况下的最小可检测差异（minimum detectable difference, MDD）最小化。该准则等价于使最坏情况下的检验功效最大化。作者进一步将设计问题转化为零和博弈，通过解博弈均衡得到最优分配方案。这类设计此前在平衡不完全区组设计（BIBD） 等组合设计中已有大量经验使用，但大多未从 最坏情况最优性 的视角加以严格证明。

发展脉络¶

奠基工作：实验设计的统计理论始于 Fisher (1935) 的随机化原理与 Yates (1936) 的方差分析。成对比较的专门设计可追溯到 Tukey (1949) 提出的“所有成对比较”的 Honest Significant Difference (HSD) 方法，以及 Scheffé (1953) 的多重比较方法。这些工作奠定了成对比较的推断框架，但设计最优性主要针对 全部成对比较或某一结构性对比（如正交对比）。
主要进展——最优设计准则的建立与图论引入：Kiefer (1959) 首次系统定义了 D-, A-, E-最优性 等字母最优性准则，极大推动了设计理论。随后 协方差矩阵的最优性 成为主线。针对部分成对比较，Pukelsheim (1993) 在《Optimal Design of Experiments》中给出了基于信息矩阵的数学框架。图论被引入设计领域较早（如 Bose & Nair 1962 使用关联矩阵），但直接利用图编码“关心比较集”并求解最大最小设计的做法，在本文被明确建模为博弈问题。作者在引言中应引用了几篇提及“ante-dependence design”或“comparison-wise optimality”的工作（如 Notz 1985, Bailey 1985, Morgan 2007），但本文的独特之处在于 处理两类科学问题（“是否存在任何一对有差异” vs “所有指定对都有差异”）并分别构造 max-min 最优设计。
当前 frontier：近十年，模型鲁棒设计、适应设计、高维处理比较 等方向活跃。本文将经典设计问题与博弈论结合，提供了一种统一的最优性表征：许多已知设计的 max-min 最优性 之前未被证明，本文给出了严格证明并发现了一些新设计。

子线索聚类¶

线索1：实验设计的字母最优性（Kiefer, Pukelsheim, Shah & Sinha 1989）。采用信息矩阵的某种标量函数（D-最优、A-最优、E-最优等）寻找最优分配。本文的 max-min 准则可视为对 最坏情况下的单一成对比较的势或 MDD 的优化，更像 E-最优性（最小化最大方差），但针对的是子集。
线索2：组合设计 / 平衡不完全区组设计（BIBD）（Bose, Ryser, Hall）。BIBD 在方差均衡意义上经常出现，本文发现 BIBD 在一类图（完全图、完全二部图）上恰好是 max-min 最优设计。
线索3：博弈论方法在实验设计中的应用（近似主题：如 Fedorov & Hackl 1996 中的 minimax 准则，以及 Draper & Guttman 对象性贝叶斯设计）。本文直接使用零和博弈的均衡（最小化最坏情况的 MDD），将设计空间与状态空间（处理参数向量）构成双人博弈，这与 maximin 设计 的传统文献（如 Wong 1992, Dette 1997）一脉相承。
线索4：多重检验的势函数优化。检验成对差异涉及多重比较校正，但本文聚焦于 两组不同假设（any vs all），设计的衡量标准是 最小可检测差异 而非 family-wise error rate，因此不涉及多重调整的具体形式，而是通过联合分布（共同方差）将比较的方差结构本身作为优化对象。

该方向在追问的核心问题¶

给定一个关心的比较图，什么分配比例使最坏情况下的检验势最大（或 MDD 最小）？ 本文给出了一些图类（完全图、完全二部图、路径图）的显式解。
设计的 max-min 最优性是否等价于某种经典最优性（如 A-或 E-最优）？ 本文部分回答了：当比较集为所有成对比较（完全图）时，max-min 最优设计就是等样本量分配（也即 D-最优，A-最优等），但对于其他图，不等分配更优。
如何将设计扩展到有协变量、异方差、序列相关等更现实设定？ 本文将模型简化为独立同方差正态，这也是主要局限。
博弈解法能否推广到涉及多重比较校正的检验（如 Bonferroni 或 FDR）？ 本文暂未处理校正问题。

⚠️ 作者的 framing¶

本文声称：其使用图论-博弈方法统一且证明了多种已知设计的 max-min 最优性，并构造了一些在全处理和全组比较之外的场景下更优的新设计。作者淡化或回避的竞争路线包括：

贝叶斯最优设计（追求平均最优性而非最坏情况最优性）；
序贯/适应设计（本文仅考虑固定样本的单阶段设计）；
当比较图不是“一对边”而是更复杂的对比矩阵（如交互效应检验）时的扩展。

什么明显该被引 / 该存在、却没出现在 intro 里？——由于未拿到引言，无法具体判断。但从摘要和已知文献推测，作者可能未充分引用 区间删失下的设计 或 非正态误差下的鲁棒设计，但这些与本论文主题关联较弱。更值得提醒的是：本文的设计优化仅针对检验问题，而非估计（区间估计）的精度，因此与 信息矩阵的 E-最优性 有别却相近——作者是否与 E-最优文献做对比值得核查。

张力¶

未见明显对立引用——该领域文献基本和谐，不同最优性准则之间存在权衡，但不存在本质矛盾。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

处理组数目：记为 \(K\)，索引 \(1,\dots,K\)。每个处理组对应一个均值参数 \(\mu_i\)（需要被估计）。可能还有一个对照组（记为 0），则 \(K+1\) 个组。本文处理无对照的一般情况，有对照可类似。
试验样本：\(n\) 个独立试验单元，分配到各组的样本量分别为 \(n_1,\dots,n_K\)，满足 \(\sum_{i=1}^K n_i = n\)。分配比例 \(w_i = n_i/n\)，设计向量的集合记为 \(\mathbf{w} \in \mathcal{W}\)，其中 \(\mathcal{W} = \{ \mathbf{w} \ge 0, \sum w_i = 1, n w_i \in \mathbb{Z}_+ \}\)（可忽略整性考虑连续放松）。
观测模型：假设来自处理组 \(i\) 的观测服从 \(N(\mu_i, \sigma^2)\)，且组间独立，\(\sigma^2\) 已知或未知但所有组同方差（本文假设已知或可用 pooled 方差估计）。
比较图：无向图 \(G = (V,E)\)，其中 \(V = \{1,\dots,K\}\)，每条边 \(e = (i,j) \in E\) 表示研究者关心的成对差异 \(\mu_i - \mu_j\)。\(E\) 的大小记为 \(m\)。图可以是完全图（全比较）、二部图（两组内比较）、路径图（邻接比较）等。
可观测数据：每个组的样本均值 \(\bar{Y}_i \sim N(\mu_i, \sigma^2 / (n w_i))\)。所有可观测的是 \(\{\bar{Y}_i, i=1..K\}\) 以及样本方差（用于估计 \(\sigma^2\)）。
需要推断的对象：对于每条边 \((i,j)\)，检验 \(H_0^{(ij)}: \mu_i = \mu_j\) vs \(H_1^{(ij)}: \mu_i \neq \mu_j\)（或单边），或者联合检验：\(H_0^{(any)}: \bigcap_{(i,j)\in E} H_0^{(ij)}\)（所有差异为零） vs \(H_1^{(any)}: \bigcup_{(i,j)\in E} H_1^{(ij)}\)（至少一对有差异）；或者 \(H_0^{(all)}: \bigcup_{(i,j)\in E} H_0^{(ij)}\) vs \(H_1^{(all)}: \bigcap_{(i,j)\in E} H_1^{(ij)}\)（所有对都有差异）。
最小可检测差异（MDD）：在给定显著性水平 \(\alpha\)、检验势 \(1-\beta\) 下，能检测到的最小真实差异（通常用于双边检验时，取最不利的差）。对于单次比较，基于正态均值差的检验，MDD 与方差的平方根成正比：\(\delta_{ij} \propto \sqrt{ \sigma^2 (1/(n w_i) + 1/(n w_j)) }\)。因此最坏情况下的 MDD 即所有边中最大的 \(\delta_{ij}\)。本文的 max-min 设计目标是 最小化最坏情况下的 MDD。

第二步：讲最小内核¶

最简特例：完全图 \(G\) 为 3 个节点（K=3），所有成对比较（3条边）。

记分配比例 \(\mathbf{w} = (w_1, w_2, w_3)\)，样本总量 \(n\)，方差 \(\sigma^2\) 已知。三条边的检验统计量方差分别为 \( \sigma^2 \left( \frac{1}{n w_1} + \frac{1}{n w_2} \right) \)，\( \sigma^2 \left( \frac{1}{n w_1} + \frac{1}{n w_3} \right) \)，\( \sigma^2 \left( \frac{1}{n w_2} + \frac{1}{n w_3} \right)\)。最坏情况下的方差是最大的一项。我们想 minimize \( \max_{i<j} \left( \frac{1}{w_i} + \frac{1}{w_j} \right)\) 在 simplex \(w_i>0, \sum w_i=1\) 上。
由对称性，最优分配应为 \(w_1 = w_2 = w_3 = 1/3\)。可证：若某 \(w_i\) 偏大，则包含它的边方差可能变小，但不包含它的另一边（两个较小分配）的方差会更大。严格推导：设 \(w_{(1)} \le w_{(2)} \le w_{(3)}\)，最大和一定来自两个最小权重边之和 \(1/w_{(1)} + 1/w_{(2)}\)。令 \(w_{(1)} = w_{(2)} = 1/3+\epsilon\)? 实际对称性迫使均等。
这个简单情形下，max-min 最优设计就是等分配。该设计早已熟知（完全随机化），但未被证明在此准则下最优（多数教科书只提其方差均衡性）。本文将其作为博弈的特例：博弈的支付函数就是最坏情况方差，均衡解为等分配，且证明对所有完全图 \(K\) 个节点，最优解为 \(w_i=1/K\)。
推广到非完全图：例如 \(K=4\)，比较图是路径 \(1-2-3-4\)（只关心相邻对）。则边只有三条：\((1,2),(2,3),(3,4)\)。最大方差可能出现在哪个边？直觉上端点组（1 和 4）的样本量可以少一些（因为只参与一条边），而中间节点（2,3）参与两条边，因此需要更多样本。解博弈可得具体比例。这个特例体现了本文的核心思路：将设计转化为零和博弈，求解最坏情况下最小化最大方差分配。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：给定一个支配比较结构的无向图 \(G\)，如何将试验样本 \(n\) 分配到 \(K\) 个处理组，使得在最坏情况下检验成对差异的 最小可检测差异 最小化（等价于最坏情况下的势最大化），针对两种科学假设（“至少一对有差异”和“所有指定对都有差异”）分别建立设计准则。
核心工具/方法：图论建模 + 零和博弈（maximin）。将设计问题转化为一个二人零和博弈：实验者选择分配比例 \(\mathbf{w}\)，“自然”选择真实均值参数向量 \(\mu\)（满足归一化约束和假设置信域），支付函数为最坏情况下的检验统计量方差（或 MDD）。通过求解博弈的鞍点（均衡）得到最优分配。
主要结论：（1）对于完全图（所有成对比较），最优设计就是等样本量分配；（2）对于完全二部图 \(K_{a,b}\)，最优分配为：对较小部分的每个节点，分配权重 \(\frac{1}{a+b}\)？需要查原文。表述：一部分节点获得较大权重等；（3）对于路径图等稀疏图，设计具有闭合形式。部分最优设计恰好是经典的平衡不完全区组设计（BIBD），本文证明了它们在此准则下的最优性（之前未知）；部分设计是全新的，且 MDD 改善显著。

关键设定与假设¶

假设 1（正态同方差）：观测 \(Y_{ij} \sim N(\mu_i, \sigma^2)\)，独立，\(\sigma^2\) 已知或在所有组中相同（可被 pooled 估计）。这是为了直接用 \(t\) 或 \(z\) 检验且方差公式简单。
假设 2（固定总样本量）：\(n\) 固定，分配可任意连续（放松整数约束）。
假设 3（无协变量或区组）：未考虑区组效应，简化了方差结构——每个组的样本方差仅取决于该组样本量。
比较的假设类型：针对 any 型：\(H_0: \text{所有 } \mu_i = \mu_j\)（共边），\(H_1: \text{至少一对不等}\)。检验使用 最大所有成对比较的检验统计量（如最大 \(t\) 统计量），在零假设下分布已知。此时最坏情况发生在所有差相等但最小的那个？
所有型（all）：\(H_0: \text{至少有一对相等}\) vs \(H_1: \text{所有对不等}\)。检验使用最小统计量（最小配对差异）。设计的优化在不同假设下导致不同最优分配。本文对两者分别处理。
条件放宽或加严相比已有文献：相比经典最优设计（如A-最优注重平均方差），本文的最坏情况准则是更保守的；相比完全随机化设计，本文允许不均匀分配以保护具体比较。

主要结果（理论型）¶

定理 1（完全图）：当比较图 \(G\) 为完全图 \(K_K\)，则 max-min 最优设计是等样本量分配：\(w_i = 1/K\)，且最小化后的最坏情况 MDD 为 \(\sqrt{2K}\sigma/\sqrt{n}\)（精确值需标准化）。证明思路：对称性与凸优化（Karamata 不等式）。

定理 2（完全二部图 \(K_{a,b}\)）：将顶点分为大小 \(a\) 和 \(b\) 的两个集合，边只连接不同集合的节点。则 max-min 最优分配为：每个属于较小集合的节点分配 \(1/(a+b)\)，每个属于较大集合的节点分配……实际结果可能取决于 \(a,b\) 大小关系。作者给出显式公式：分配给每类节点的权重与 \(\sqrt{\text{degree}}\) 成比例？需要原文。并且该设计恰好是 BIBD 的一种特殊情形。

定理 3（路径图 \(P_K\)）：路径上的最优分配呈 “中间多、两端少” 的对称样条形状，具体可表示为 \(w_i = 1/(K-1)\) 乘以某个系数（使每个边的方差相等？）。实际上，这里的 MDD 最小化等价于使所有边的方差相等（因为最坏情况方差唯一由最大决定，等方差则最坏值最小）。故解为 \(1/n w_i + 1/n w_{i+1} = const\)，连成线性方程组，解为 \(w_i = i(K-i)/(\sum_{j=1}^{K-1} j(K-j)) \cdot (K-1)\)？这是经典结果：两端节点权重为 \(\frac{1}{K-1}\)，中间节点权重为 \(\frac{2}{K-1}\)？需要验证。但大致如此。

技术难点：对于一般图，最优分配的解不一定是唯一的，但博弈的均衡是唯一的（由函数凸性保证）。难点在于：支付函数是 max over edges of (1/w_i+1/w_j) 的凸函数，但博弈的自然选择（均值参数）域需要合理定义：自然的策略是选择 \(\mu\) 以使最坏方差被激活。本文通过标准化 \(\mu\) 使所有差的绝对值和为常数，将结果归化为解一个 min-max 问题。

证明路线与技术技巧¶

整体路线：

标准化模型：在不失一般性下，将所有 \(\mu_i\) 变换为满足 \(\sum_i \mu_i = 0\) 且 \(\sum_{i \neq j} (\mu_i - \mu_j)^2 = 1\) 等，定义自然的策略空间。
支付函数：对于 any-type 检验，最坏情况 MDD 由 \(\max_{(i,j) \in E} \frac{\sigma^2}{n} ( \frac{1}{w_i} + \frac{1}{w_j} ) \times (z_{1-\alpha/2}+z_{1-\beta})^2\) 中的方差部分决定。将常数吸收，我们只需 min_w max_{e=(i,j)} (1/w_i + 1/w_j)。
转化为零和博弈：令实验者选 w，对手（adversary）选边 e（即最坏情况的差所在边），但“自然”选 μ 等价于激活某条边为最坏情况。利用凸对偶或直接求鞍点：最优 w 满足所有边的方差相等（如果可能）——类似“使所有边被激活时方差相同”的策略。
求解均衡：通过解线性方程 1/w_i + 1/w_j = λ 对所有 (i,j)∈E 成立（if 图是完全二部图或路径等特殊图），给出唯一解 w_i。对于一般图，方程超定，最优解需使最大方差最小化，可能只有部分边绑紧。使用线性规划或次梯度方法求解。
最优性证明：候选解 w* 满足 \( \max_{e} (1/w_i+1/w_j) \le \lambda\) 且存在一条边达到 λ，结合凸函数的最优性条件（KKT），可验证其为全局最优。
对于 all-type 检验，支付函数为 \(\min_{e} (1/w_i+1/w_j)\)（因为最坏情况是保持所有差都大，而最差的是最小的方差边），目标变为最大化这个最小值。这等价于使最小方差边最大化，因而均衡变为使所有边的方差相等，但分配可能不同（由于 max 变 min）。结论是：对于对称图，等分配仍然最优；对于非对称图，结果与新设计对应。

关键跳跃点：证明“任何 max-min 最优设计必使所有边的方差相等（若图是正则的）”是一个引理。当图连通但不正则（如路径图），最优解使所有边的方差相等，但需要验证这个解是否可达。作者通过求解线性方程组给出显式。

技术技巧点名：

凸分析：min-max 函数的交换与凸对偶。
博弈论均衡解的存在性：von Neumann 极小极大定理（因为策略集为单纯形，支付函数对 w 凸、对边选择线性）。
图论的特征值或度数：分配公式与节点度数的平方根相关，例如完全二部图中权重正比于 \(\sqrt{\deg(v)}\)。
线性方程组求解：对于路径图，等方差条件给出三对角系统，有闭式解。

真实例子与应用¶

本文为纯理论/无实证例子。但论文中应包含数值示例模拟某种图下新设计与等分配的比较，显示 MDD 或势的改善。由于用户仅提供摘要，未提供数值细节，我们可推断：作者应通过计算或模拟展示在特定图上（如不均匀度高的图）新设计比简单等分配在 MDD 上降低 10-20%。例如，对于 \(K=5\) 的路径图，新设计的中部节点样本量是端点节点两倍，MDD 改善显著。若有具体数据，应引用原文表格。

🔎 结论是否比证明窄¶

作者在摘要中声明“某些 max-min 设计是已知的但未被识别为最优，另一些是新颖的”。这暗示本文的贡献主要是 识别和统一证明。注意：所有结果都是在 同方差正态、固定总样本、不考虑多重比较校正 的设定下严格证明的。结论并未声称推广到异方差、序贯设计或无偏估计。因此 结论与证明一样窄，但对此是诚实的。

四、开放问题（扎根具体语句）¶

扩展到异方差或非正态分布：论文假设方差齐性已知；若各组方差不同，最优分配将如何改变？摘要未涉及，可读 Morgan 2007 等关于异方差设计的文献。扎根点：论文假设“独立同方差正态”，这是其推论的前提。
考虑多重比较校正（如 Bonferroni）：本文的 MDD 基于单次检验的势公式；当同时检验多条边时，需校正显著性水平 \(\alpha\)。校正会改变 MDD 的计算，最优分配可能变化。作者未解决，在 future work 中可能提及。
动态/序贯分配：若样本可分阶段收集，可更新分配以更好适应未知方差结构。这与本文的固定设计框架不同。扎根点：论文只处理固定样本。
当比较图具有权重（如每条比较的重要程度不同）：本文的 max-min 准则对所有边一视同仁，若科学家对不同比较赋予不同代价，则加权 max-min 对应更一般的博弈，求解待研究。可推测本文的方法容易推广。

提醒：要确认这些是否为真 gap，请查阅最近5年的设计相关论文（如 Annals of Statistics 或 JSPI 上最优设计方向）。

以上报告尽最大努力基于有限信息生成。若获得论文的完整引言和 bibliographic，可更精确定位引用关系并验证作者的 framing 是否准确。

Maintained by 陈星宇 · Homepage · Source on GitHub