Distributional Granger Causality: Identification, Sequential Inference, and Adaptive Testing¶

作者: Ayush Jha
主题: 因果推断
相关性: 8/10
链接: https://arxiv.org/abs/2606.22230

一、领域脉络与小综述¶

这个方向是什么¶

本方向研究时间序列中的预测因果关系，核心问题是：如何判断一个时间序列 \(X_t\) 的过去值是否有助于预测另一个时间序列 \(Y_t\) 的未来值，而不仅限于条件均值。经典 Granger 因果检验在条件均值框架下工作，但对于许多经济金融数据，预测相关可能出现在条件方差、尾部行为、分位数、高阶矩等多个维度。该方向试图将 Granger 因果从单一矩条件扩展到整个条件分布，同时解决识别、检验和多重比较的统计推断问题。目前该领域已积累了大量通道（channel）特定的检验方法，但缺乏统一的框架来同时处理多个可能的预测依赖性来源，以及如何自适应地分配有限检验资源。

发展脉络（history）¶

奠基工作：Granger (1969) 和 Sims (1972) 定义了基于线性预测能力的因果概念；Geweke (1982, 1984) 通过 VAR 中的滞后排除限制给出了简洁操作化。这是经典条件均值框架。
主要进展（多方向拓展）：
均值之外的通道：Cheung & Ng (1996) 提出因果方差检验；Hong et al. (2009) 和 White et al. (2015) 关注风险与尾部事件中的因果；Jeong et al. (2012) 和 Song & Taamouti (2021) 提出分位数上的因果检验；Hiemstra & Jones (1994), Diks & Panchenko (2006), Nishiyama et al. (2011) 发展非参数非线性因果检验；Bouezmarni et al. (2012) 使用 copula 度量条件独立；Barnett et al. (2009) 证明转移熵与高斯下经典 Granger 因果等价。
非高斯识别：Shimizu et al. (2006) 利用非高斯性进行结构因果发现；Lanne et al. (2017), Gouriéroux et al. (2017), Montiel Olea et al. (2022) 利用高阶矩识别结构 VAR。Arevalillo & Navarro (2026) 利用四阶累积量张量表征非正态分布形状。
序贯多重检验：Foster & Stine (2008) 提出 alpha-investing 用于在线 FDR 控制；Aharoni & Rosset (2014) 推广；Javanmard & Montanari (2018), Ramdas et al. (2018) 开发在线 FDR 程序；Ramdas et al. (2023), Grünwald et al. (2024) 发展 anytime-valid inference 和测试鞅。
自适应分配：多臂老虎机框架（Auer et al., 2002; Lattimore & Szepesvári, 2020; Kaufmann et al., 2016）提供探索-利用权衡标准工具；Chernozhukov et al. (2018), Farrell et al. (2021) 推动自适应/数据驱动方法在计量经济学中的应用。
当前 frontier：现有工作要么提出单个新通道的检验，要么在已知通道下处理多重检验，但缺少一个同时完成三件事的框架：① 将分布 Granger 非因果识别为一组有限通道条件的等价命题（identification）；② 在通道未知时，自适应分配检验资源并控制族系错误率（sequential multiple testing）；③ 保证分配规则渐近达到 oracle 基准的效率（asymptotic efficiency）。本文正是在这三点上定位。
本文位置：作者提出分布型 Granger 因果的通道分解（Section 3），证明菜单完备性定理，然后开发自适应序贯检验程序，给出 policy-invariant FWER 控制和渐近效率定理。

子线索聚类¶

通道特定检验：条件方差（Cheung & Ng, 1996）、风险/尾部（Hong et al., 2009; White et al., 2015）、分位数（Jeong et al., 2012; Song & Taamouti, 2021）、非线性/非参数（Diks & Panchenko, 2006; Nishiyama et al., 2011）、转移熵（Barnett et al., 2009）、copula（Bouezmarni et al., 2012）。这一簇关注单个特征，但互不通。
利用高阶矩/非高斯性进行识别：Lanne et al. (2017), Gouriéroux et al. (2017), Montiel Olea et al. (2022), Arevalillo & Navarro (2026)。这一簇关注从分布形状中提取因果信号，与本文的通道菜单（特别是高阶累积量通道）有概念交集。
序贯多重检验与在线推断：alpha-investing（Foster & Stine, 2008; Aharoni & Rosset, 2014），在线 FDR（Javanmard & Montanari, 2018; Ramdas et al., 2018），anytime-valid 方法（Ramdas et al., 2023; Grünwald et al., 2024）。这一簇提供 FWER/FDR 控制的框架，但通常假设假设序列是外生的。
自适应分配与多臂老虎机：UCB 等（Auer et al., 2002; Lattimore & Szepesvári, 2020; Kaufmann et al., 2016）。这一簇提供分配策略，但不直接与检验有效性结合。

核心问题与瓶颈¶

该方向追问的核心问题： - 识别：分布 Granger 非因果能否通过有限个可检验的条件来等价刻画？——本文给出确定类下的完备性答案。 - 多重检验：当多个候选通道都存在时，如何控制族系错误率？——经典 Bonferroni 过于保守；naive 多重检验严重膨胀；本文用 alpha-investing 结合自适应选择提出新解法。 - 分配效率：在通道未知的情况下，能否将检验资源尽可能分配给最可能拒绝的通道，且不损失渐近功效？——本文证明 UCB 型分配规则达到 oracle 渐近效率。现有瓶颈：大部分工作将通道检验视为独立工具，未系统讨论组合时的多重比较问题；且缺少对分配规则的理论保证。

⚠️ 作者的 framing¶

作者将缺口 frame 为：“If predictive dependence may arise through multiple dimensions of the conditional distribution, how should inference be conducted when the relevant channel is unknown ex ante?”（引言第2段）。然后作者声称自己的贡献是 统一框架（identification + sequential testing + adaptive allocation）。竞争路线被他淡化或回避：例如，用户可能自然想到用一个全局非参数检验（如 KS 型检验）直接检验分布 Granger 非因果，而不是分解为多个通道。作者在 Remark 1 中承认有限截断的菜单不再完备，但未与复杂的全局检验（如 Candelon & Tokpavi, 2016 的分布非参数检验）进行直接比较。另外，作者引用了 Barnett et al. (2009) 的转移熵等价性，但未讨论转移熵本身是否可以作为单一全局度量来替代多通道检验。

什么明显该被引 / 该存在、却没出现在 intro 里？ 论文标题强调“Distributional Granger Causality”，但未引用近期关于“Granger causality in distribution”的非参数检验文献（例如 Candelon & Tokpavi, 2016 已经提出一个直接检验分布 Granger 非因果的非参数方法）——虽然该工作被列在参考文献中，但在引言中只是作为“分布因果”的一个例子轻描淡写（“causality in distribution (Candelon and Tokpavi, 2016)”），并未详细讨论它与本文通道方法的比较优劣。此外，因果推断中的 Do-calculus / DAG 文献（如 Pearl 系列）完全未出现——虽然 Granger 因果与干预因果概念不同，但本文的“识别”部分涉及条件分布可识别性，与结构因果模型的连接可能值得讨论，但本文完全局限于时间序列框架。

张力¶

未见明显对立引用。作者引用的各组工作通常被描述为互补而非冲突。唯一可能张力的点：通道特定检验的支持者可能认为“只需选择自己感兴趣的那个通道即可”，而本文认为这样可能错失其他通道的信息，但作者未深辨。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

符号： - \( (X_t, Y_t) \): 可观测的二元时间序列，\(t \in \mathbb{Z}\)。\(X_t\) 是潜在的原因变量，\(Y_t\) 是结果变量。严格平稳。 - \(\mathcal{I}_{t-1} = \sigma\{ X_{t-j}, Y_{t-j} \}_{j \ge 1}\): 截至 \(t-1\) 的全部历史信息（含 \(X\) 和 \(Y\)）。 - \(\mathcal{I}_{t-1}^{(-X)} = \sigma\{ Y_{t-j} \}_{j \ge 1}\): 仅含 \(Y\) 历史的信息集（排除 \(X\)）。 - \(F_{Y_t \mid \mathcal{J}}\): \(Y_t\) 给定 \(\sigma\)-域 \(\mathcal{J}\) 的正则条件分布函数。 - \(Q_{Y_t}(\tau \mid \mathcal{J})\): 相应的条件 \(\tau\)-分位数。 - \(\phi_k\): 第 \(k\) 个通道函数，是条件分布的一个可测泛函（如均值、方差、分位数、累积量）。 - \(M = \{1,\dots,K\}\): 有限通道索引集。 - \(H_{0,k}\): 第 \(k\) 个通道的零假设：\(\phi_k(F_{Y_t \mid \mathcal{I}_{t-1}}) = \phi_k(F_{Y_t \mid \mathcal{I}_{t-1}^{(-X)}})\) a.s.。 - 样本量 \(T\)，置换次数 \(B\)，检验预算（B 是另一符号，注意区分）。 - \(P_k\): 通道 \(k\) 的置换 p 值。 - \(W_r\): 第 \(r\) 阶段后的检验财富（alpha-investing 余额）。 - \(\alpha_k\): 为通道 \(k\) 承诺的检验水平。 - \(\lambda_k(\delta,T)\): 通道 \(k\) 在局部备择下的非中心参数。

模型：数据由某个严格平稳的 \(\beta\)-混合过程生成，满足 \(4+\epsilon\) 阶矩有限，条件密度有界且 Lipschitz。研究的因果对象是：\(X\) 的过去是否改善了对 \(Y_t\) 整个条件分布的预测。特别地，希望检验“分布 Granger 非因果”这一无限维假设。

可观测数据：研究者实际能观测到的是长度为 \(T\) 的样本 \(\{(X_t, Y_t)\}_{t=1}^T\)。不可观测的是：真正的条件分布函数 \(F_{Y_t \mid \mathcal{I}_{t-1}}\) 和 \(F_{Y_t \mid \mathcal{I}_{t-1}^{(-X)}}\)——只能通过样本推断。另外，潜在反事实量未涉及，因为 Granger 因果不涉及干预。

第二步：讲最小内核¶

论文的核心数学思想是：在非高斯条件下，条件分布的差异性可以通过一组有限的特征（通道）来捕获。最简特例是 Proposition 2 中的高斯边界，但那个特例实际上是退化情形（所有高阶通道自动为零），不能展示论文核心。更好的最小内核是：考虑一个最简单的非高斯设定——例如 \(Y_t\) 的条件分布由条件均值和条件方差两个参数决定，但两个参数都可能受 \(X_{t-1}\) 影响。然而论文的通道菜单包含更多。为了展示“菜单完备性”的本质，我们考虑一个极端的数学例子：

假设给定信息集 \(\mathcal{I}_{t-1}\)，\(Y_t\) 的条件分布属于一个由累积量序列和尾部分位唯一确定的分布族 \(D\)（即 Assumption 2 中的确定类）。在这个类中，如果两个条件分布的所有累积量及左右尾分位数都相等，则两个分布相等。因此，检验分布 Granger 非因果等价于检验所有对应通道的相等性。论文的 Theorem 1 正是这个命题：在 \(D\) 之下，\(X\) 不 Granger 导致 \(Y\) 在分布上 \(\iff\) 所有通道零假设成立。

要理解“最小内核”，可以想象一个特殊情形：\(Y_t\) 的条件分布属于一个 Cox 型混合模型，比如条件分布是均值为 \(\mu(\mathcal{I}_{t-1})\)、方差为 \(\sigma^2(\mathcal{I}_{t-1})\) 的某个已知参数族（如 skew-t），但该分布族由其均值、方差、偏度、峰度唯一确定。则检验分布 Granger 非因果等价于检验这四个通道函数的逐点相等。这就是论文在有限截断菜单（Remark 1）中采用的现实版本，虽然不再完全等价于分布非因果，但提供了操作化目标。

最小问题：给定一个严格平稳混合序列，我们希望检验“\(X\) 的过去对 \(Y\) 的条件分布无任何预测贡献”这个全局零假设。直接检验不可行（无限维）。论文核心想法是：扩展现有单通道检验，将它们视为刻画同一条件分布的不同坐标，然后通过一个自适应多重检验程序来决定哪个通道（如果有）被拒绝。证明路线中最吃劲的部分是：如何保证自适应选择不破坏检验有效性（Theorem 2）以及如何使分配策略渐近达到 oracle 功效（Theorem 3）。

三、这篇论文做了什么¶

三句话¶

研究问题：当预测相关可能出现在条件分布的多个维度（均值、方差、尾部、高阶矩）时，如何对分布 Granger 因果进行识别、序贯检验并自适应分配检验资源？
核心工具：通道分解将分布 Granger 非因果转化为有限个可检验的通道零假设；alpha-investing 序贯多重检验框架结合 circular-block permutation 获得有效 p 值；自适应分配采用上置信界（UCB）规则。
主要结论：① 在确定类假设下，通道菜单完备：分布非因果等价于所有通道零成立（Theorem 1）；② 任意自适应可容许选择规则都保持有限样本 FWER 控制（Theorem 2）；③ 基于置信界的分配规则渐近达到 oracle 基准的功效（Theorem 3）。

关键设定与假设¶

Assumption 1（数据生成基本条件）：严格平稳、绝对正则（几何混合，多项式衰减 \(O(m^{-b}), b>2\) 也够）、\(4+\epsilon\) 阶有界矩、条件密度有界且 Lipschitz。这些是推导 p 值条件超均匀性和统计量集中的基础。
Assumption 2（确定类）：条件分布属于一个唯一由累积量序列及左右尾分位数函数确定的族 \(D\)，且在条件作用下封闭。这是 Theorem 1（菜单完备性）的关键。作者声称“skewed scale-mixture families commonly employed in financial econometrics”满足该假设，但未给出具体验证。这一假设的强度决定了定理的适用范围。
Assumption 3（有效 p 值条件）：通道 p 值在相应零假设下条件超均匀。Theorem 5 从原始假设和 circular-block permutation 中推导出此条件。
Assumption 4（识别与间隔）：诊断统计量 \(G_r\) 随非中心性递增，且存在唯一的最高非中心性通道，非中心性差值 \(\Delta>0\)。此外通道统计量满足指数集中不等式（Theorem 6）。这是 Theorem 3 的基础。

相比已有文献，本文的假设更混合：一方面要求高阶矩和混合条件（对非参数检验是标准的），另一方面要求确定类条件（对识别是新的，且较强）。强化：相比经典线性 Granger 检验只需矩条件，本文需要更多分布光滑性；放宽：相比直接检验分布相等（如 KS 型），本文通过通道分解允许仅对部分特征检验，减轻了维数诅咒。

主要结果¶

Theorem 1（菜单完备性）：在确定类 D 中，分布 Granger 非因果等价于所有通道零假设同时成立。这是识别定理。证明方向 (a)⇒(b) 平凡，反向使用 D 的唯一性。
Theorem 2（政策不变 FWER 控制）：在全局零假设（分布 Granger 非因果）下，alpha-investing 程序（初始财富 \(W_0=\alpha\)，奖励 \(\psi\le\alpha\)）保证任何可容许自适应选择规则下的 FWER ≤ \(\alpha\)。证明使用检验上鞅（test-supermartingale）和 Ville 不等式。直觉：p 值条件超均匀保证了财富递减的期望非正，最终累积拒绝概率不超过初始财富。
Theorem 3（渐近效率）：对 UCB 型分配规则，功效缺口 \(\beta^* - \beta^\pi \le C \log B / (\Delta^2 \sqrt{T}) + o(1)\)，因此随 \(T\to\infty\) 缺口趋于 0。证明通过将非中心性视为 arm 均值，运用标准 UCB 引理界定期望采样次数，再结合功效函数的连续性。关键点：分配规则渐近一致选择最优通道，所以功效趋近 oracle。

证明路线与技术技巧¶

Theorem 2 证明路线（3-5步逻辑主干）¶

财富过程构造：定义初始财富 \(W_0=\alpha\)，每次检验消耗 \(\alpha_k/(1-\alpha_k)\)，若拒绝则奖励 \(\psi\)。Lemma 1 证明累积消耗 ≤ \(\alpha + \psi N_\tau\)，其中 \(N_\tau\) 是拒绝次数。
定义过程 \(E_r\)：设 \(E_0=1\)，\(E_r = \prod_{j=1}^r (1-\alpha_{k_j} + \mathbf{1}\{P_{k_j}\le\alpha_{k_j}\})\)。Lemma 2 证明在全局零下 \(E_r\) 是上鞅（利用超均匀性）。
停时与拒绝事件：停时 \(\tau\) 为首次拒绝时刻。拒绝事件 \(\{\tau\le B, P_{k_\tau}\le\alpha_{k_\tau}\}\)。
Ville 不等式：由于 \(E_\tau \ge 1/\alpha\) 当拒绝发生（利用 Lemma 1 和 \(W_\tau\ge 0\)），应用 Ville 不等式得 \(\Pr(\text{reject}) \le \alpha\)。
政策不变性：上述论证仅依赖于 p 值的条件超均匀性，该性质对任意可容许自适应选择规则（适应于 filtration）都成立，因为选择规则不影响给定通道下的 p 值分布。

关键跳跃点：如何从财富过程到上鞅？论文通过 \(E_r\) 的定义巧妙地将检验水平转化为乘性因子，从而利用积分不等式。难点在于：为什么拒绝事件能保证 \(E_\tau \ge 1/\alpha\)？这需要 Lemma 1 的财富关系，而 Lemma 1 对任意自适应规则都成立。

Theorem 3 证明路线¶

将分配问题建模为有限臂老虎机：通道是非中心性未知的臂，每个臂的即时回报是“拒绝该通道 null 的概率”，但实际只能通过 p 值观察到二元结果。
UCB 指标：\(I_k(r) = \hat{\lambda}_k(r) + c U_k(r)\)，其中 \(U_k(r)\) 是置信半径。Lemma 3 使用标准的 UCB 分析（如 Auer et al., 2002）界定期望采样次数：对次优通道 \(k \neq k^*\)，\(E[n_k(B)] \le 8\sigma^2 \log B / \Delta_k^2 + 1 + \pi^2/3\)。
采样最优通道的概率：Proposition 3 证明 \(\Pr(\text{最优通道至少被采样一次}) \ge 1 - O(\log B/(\Delta^2 B))\)。
功效比较：条件于采样到最优通道，功效至少为 \(\beta^\pi \ge \Pr(P_{k^*}\le\alpha_{\text{min}})\)（其中 \(\alpha_{\text{min}}\) 为可用的最小检验水平，与财富有关）。利用功效函数的 \(T^{-1/2}\) 连续性和水平衰减，合并后得总缺口 bound。

关键跳跃点：如何将非中心性估计与 p 值的拒绝概率联系起来？论文利用了 Theorem 6 的集中不等式保证 \(\hat{\lambda}_k\) 的 \(T^{-1/2}\) 一致性，因此假设所有通道统计量是正态平移（位置族），这允许将功率函数与 \(\lambda_k\) 直接挂钩。另外，水平衰减问题：由于 alpha-investing 财富可能被前期消耗，实际可分配的水平可能低于名义 \(\alpha\)，论文通过假设本地备择下功率函数的光滑性，将水平衰减影响吸收进 \(O(T^{-1/2})\) 项。

技术技巧点名¶

Circular-block permutation（Definition 1）：用于生成条件超均匀 p 值。通过循环移位破坏 X 与 Y 的预测关联，同时保持 X 的边际分布和自相关结构。在 Appendix OA.2 中，作者用 Berbee 耦合和 Berry-Esseen 混合序列界证明渐近有效性。
Test-supermartingale 构造（Theorem 2）：将检验财富过程转化为乘积型上鞅，利用 Ville 不等式给出有限样本 FWER 控制。此技巧常见于 anytime-valid 推断文献（Ramdas et al., 2023）。
UCB 分配规则：标准的多臂老虎机工具，用于平衡探索与利用。论文将其嵌入序贯检验，但与传统遗憾最小化不同，目标是最优通道识别效率。
Bernstein 型不等式 for β-mixing（Theorem 6）：用于推导通道统计量的指数集中，是保证 UCB 分析可行的关键。利用了 Berbee 耦合和独立化技术。

真实例子与应用¶

本文包含蒙特卡洛模拟（Section 5），不包含真实数据例子。模拟设计： - 数据：DGP 分四种通道特定备择（S1 条件均值、S2 条件尺度、S3 非线性、S4 状态相关尺度），样本量 \(T=250,500\)，创新分布为高斯或 skew-t。每个设计下信号强度 \(s\ge 0\)，\(s=0\) 为全局零。 - 方法使用：作者用 alpha-investing 程序（初始财富 0.05，奖励 0.05，UCB 分配规则，B=100 次置换），对比 naive（不经多重校正）、Bonferroni 和 oracle（预知活跃通道）四种基准。 - 结果： - 全局零下，自适应程序 FWER 保持在 0.05 附近，而 naive 程序膨胀到 0.13-0.16（Figure 1, Table 1）。 - 备择下，自适应程序功效接近 oracle，远优于固定单通道程序（Figure 2）。例如，S2（尺度）下，自适应程序功效 0.548 (T=250) vs oracle 0.600；而均值通道固定程序功效几乎为零。 - 功效缺口随 T 从 250 增加到 500 缩小（Figure 3），符合 Theorem 3。 - 该例想说明什么：验证 Theorem 2 的 FWER 控制和 Theorem 3 的渐近效率；展示自适应分配对通道误设的鲁棒性，避免选择错误通道带来的极低功效。

🔎 结论是否比证明窄¶

是。需要注意几点： 1. Theorem 1 的完备性依赖于确定类 D（Assumption 2），但 D 的具体成员未明确定义，作者仅举了金融中常用的 skewed scale-mixture 族作为例子，未给出充分必要条件。因此实际使用时，若真实条件分布不属于 D，完备性可能不成立。 2. 有限菜单的合理性：Remark 1 承认实际操作中只使用截断菜单（方差、尾部、三/四阶累积量），此时 Theorem 1 不再成立，只能检测分布差异的一部分。作者声称“finite-sample and asymptotic guarantees are stated relative to this operational null”，但 operational null 的含义仅仅是“所选通道不变”，而非真正的分布 Granger 非因果。这意味着论文的检验目标实际上比标题中“Distributional Granger Causality”要弱。 3. Theorem 3 的渐近效率：证明假设备择下非中心性差 \(\Delta>0\)，且唯一最优通道存在。但现实中可能多个通道同时非零且非中心性接近，此时 gap 可忽略且分配效率难以达到 oracle。 4. Theorem 2 的有限样本有效性：证明依赖 p 值条件超均匀性，而 Theorem 5 给出的渐近版本（\(O_p(T^{-1/2})\)）仅在大样本下近似成立。对有限 \(T\)，作者未提供精确有限样本界，因此实际应用中小样本可能存在轻微偏差。 5. 模拟中的 naive 程序：作者将其描述为“naive”，但实际上是一种同时检验所有通道且不调整多重性的方法，其膨胀率与预期一致，但用户可能会问：为什么不直接使用 e.g. Holm 或 min-P 校正？论文未与此类更有效的多重比较方法比较，仅与 Bonferroni（太保守）和 naive 比较。

四、开放问题¶

有限样本下 p 值条件超均匀性的精确界：Theorem 5 给出 \(O_p(T^{-1/2})\)，但能否得到有限样本界（如用混合条件下的 Berry-Esseen 常数）？这直接影响 Theorem 2 在较小 \(T\) 时的可靠性。（扎根于 Theorem 5 陈述及 Appendix OA.2 的渐近框架。）
确定类 D 的必要可验证条件：Assumption 2 要求条件分布属于一个由累积量和尾部分位唯一决定的族。但对使用者而言，如何检验该假设？能否基于数据构造一个有效性（如用密度估计判断族是否足够丰富）？或者是否存在一个更弱的充要条件，使得有限菜单仍能识别分布 Granger 非因果？（扎根于 Section 3.5 的讨论及 Remark 1 的承认。）
高阶计算复杂度：第五通道涉及条件累积量估计（尤其是 \(k_3, k_4\)），这在高维情况下可能涉及大量协方差/累积量运算。论文未讨论计算效率。研究者若利用其熟悉的 U-统计量/张量收缩技术，可能改进计算——例如将高阶累积量的估计转化为张量收缩，并用 treewidth 优化计算成本。（扎根于 Section 3.3 中 ϕ5 定义，但论文未涉计算。）
多时间序列（网络）扩展：论文 conclusion 提到“network-based versions...allocated jointly across channels and graph structures”。对高维系统，每个节点对都可能有无穷多通道，如何将自适应检验扩展到高维？这涉及 Poisson 或稀疏模式假设下的多重比较控制。（扎根于 Conclusion 第2段：“One direction is the development of network-based versions...”）
与统计-计算权衡的潜在联系：论文中的通道选择本质上是有限 arms 的试验问题，但若通道数目随维数爆炸（例如考虑无穷多个分位点），则变成连续臂问题。此时是否会出现信息-计算缺口（即统计上可检测但多项式时间算法无法达到最优功效）？论文未触及，但对有计算复杂性背景的研究者是一个自然衔接点。（扎根于 Section 2.3 的有限武器假设，但未讨论 K 大的情形。）

Maintained by 陈星宇 · Homepage · Source on GitHub