跳转至

Distributional Granger Causality: Identification, Sequential Inference, and Adaptive Testing

作者: Ayush Jha
主题: 因果推断
相关性: 8/10
链接: https://arxiv.org/abs/2606.22230


一、领域脉络与小综述

这个方向是什么

本方向研究时间序列中的预测因果关系,核心问题是:如何判断一个时间序列 \(X_t\) 的过去值是否有助于预测另一个时间序列 \(Y_t\) 的未来值,而不仅限于条件均值。经典 Granger 因果检验在条件均值框架下工作,但对于许多经济金融数据,预测相关可能出现在条件方差、尾部行为、分位数、高阶矩等多个维度。该方向试图将 Granger 因果从单一矩条件扩展到整个条件分布,同时解决识别、检验和多重比较的统计推断问题。目前该领域已积累了大量通道(channel)特定的检验方法,但缺乏统一的框架来同时处理多个可能的预测依赖性来源,以及如何自适应地分配有限检验资源。

发展脉络(history)

  • 奠基工作:Granger (1969) 和 Sims (1972) 定义了基于线性预测能力的因果概念;Geweke (1982, 1984) 通过 VAR 中的滞后排除限制给出了简洁操作化。这是经典条件均值框架。
  • 主要进展(多方向拓展)
  • 均值之外的通道:Cheung & Ng (1996) 提出因果方差检验;Hong et al. (2009) 和 White et al. (2015) 关注风险与尾部事件中的因果;Jeong et al. (2012) 和 Song & Taamouti (2021) 提出分位数上的因果检验;Hiemstra & Jones (1994), Diks & Panchenko (2006), Nishiyama et al. (2011) 发展非参数非线性因果检验;Bouezmarni et al. (2012) 使用 copula 度量条件独立;Barnett et al. (2009) 证明转移熵与高斯下经典 Granger 因果等价。
  • 非高斯识别:Shimizu et al. (2006) 利用非高斯性进行结构因果发现;Lanne et al. (2017), Gouriéroux et al. (2017), Montiel Olea et al. (2022) 利用高阶矩识别结构 VAR。Arevalillo & Navarro (2026) 利用四阶累积量张量表征非正态分布形状。
  • 序贯多重检验:Foster & Stine (2008) 提出 alpha-investing 用于在线 FDR 控制;Aharoni & Rosset (2014) 推广;Javanmard & Montanari (2018), Ramdas et al. (2018) 开发在线 FDR 程序;Ramdas et al. (2023), Grünwald et al. (2024) 发展 anytime-valid inference 和测试鞅。
  • 自适应分配:多臂老虎机框架(Auer et al., 2002; Lattimore & Szepesvári, 2020; Kaufmann et al., 2016)提供探索-利用权衡标准工具;Chernozhukov et al. (2018), Farrell et al. (2021) 推动自适应/数据驱动方法在计量经济学中的应用。
  • 当前 frontier:现有工作要么提出单个新通道的检验,要么在已知通道下处理多重检验,但缺少一个同时完成三件事的框架:① 将分布 Granger 非因果识别为一组有限通道条件的等价命题(identification);② 在通道未知时,自适应分配检验资源并控制族系错误率(sequential multiple testing);③ 保证分配规则渐近达到 oracle 基准的效率(asymptotic efficiency)。本文正是在这三点上定位。
  • 本文位置:作者提出分布型 Granger 因果的通道分解(Section 3),证明菜单完备性定理,然后开发自适应序贯检验程序,给出 policy-invariant FWER 控制和渐近效率定理。

子线索聚类

  1. 通道特定检验:条件方差(Cheung & Ng, 1996)、风险/尾部(Hong et al., 2009; White et al., 2015)、分位数(Jeong et al., 2012; Song & Taamouti, 2021)、非线性/非参数(Diks & Panchenko, 2006; Nishiyama et al., 2011)、转移熵(Barnett et al., 2009)、copula(Bouezmarni et al., 2012)。这一簇关注单个特征,但互不通。
  2. 利用高阶矩/非高斯性进行识别:Lanne et al. (2017), Gouriéroux et al. (2017), Montiel Olea et al. (2022), Arevalillo & Navarro (2026)。这一簇关注从分布形状中提取因果信号,与本文的通道菜单(特别是高阶累积量通道)有概念交集。
  3. 序贯多重检验与在线推断:alpha-investing(Foster & Stine, 2008; Aharoni & Rosset, 2014),在线 FDR(Javanmard & Montanari, 2018; Ramdas et al., 2018),anytime-valid 方法(Ramdas et al., 2023; Grünwald et al., 2024)。这一簇提供 FWER/FDR 控制的框架,但通常假设假设序列是外生的。
  4. 自适应分配与多臂老虎机:UCB 等(Auer et al., 2002; Lattimore & Szepesvári, 2020; Kaufmann et al., 2016)。这一簇提供分配策略,但不直接与检验有效性结合。

核心问题与瓶颈

该方向追问的核心问题: - 识别:分布 Granger 非因果能否通过有限个可检验的条件来等价刻画?——本文给出确定类下的完备性答案。 - 多重检验:当多个候选通道都存在时,如何控制族系错误率?——经典 Bonferroni 过于保守;naive 多重检验严重膨胀;本文用 alpha-investing 结合自适应选择提出新解法。 - 分配效率:在通道未知的情况下,能否将检验资源尽可能分配给最可能拒绝的通道,且不损失渐近功效?——本文证明 UCB 型分配规则达到 oracle 渐近效率。 现有瓶颈:大部分工作将通道检验视为独立工具,未系统讨论组合时的多重比较问题;且缺少对分配规则的理论保证。

⚠️ 作者的 framing

作者将缺口 frame 为:“If predictive dependence may arise through multiple dimensions of the conditional distribution, how should inference be conducted when the relevant channel is unknown ex ante?”(引言第2段)。然后作者声称自己的贡献是 统一框架(identification + sequential testing + adaptive allocation)。竞争路线被他淡化或回避:例如,用户可能自然想到用一个全局非参数检验(如 KS 型检验)直接检验分布 Granger 非因果,而不是分解为多个通道。作者在 Remark 1 中承认有限截断的菜单不再完备,但未与复杂的全局检验(如 Candelon & Tokpavi, 2016 的分布非参数检验)进行直接比较。另外,作者引用了 Barnett et al. (2009) 的转移熵等价性,但未讨论转移熵本身是否可以作为单一全局度量来替代多通道检验。

什么明显该被引 / 该存在、却没出现在 intro 里? 论文标题强调“Distributional Granger Causality”,但未引用近期关于“Granger causality in distribution”的非参数检验文献(例如 Candelon & Tokpavi, 2016 已经提出一个直接检验分布 Granger 非因果的非参数方法)——虽然该工作被列在参考文献中,但在引言中只是作为“分布因果”的一个例子轻描淡写(“causality in distribution (Candelon and Tokpavi, 2016)”),并未详细讨论它与本文通道方法的比较优劣。此外,因果推断中的 Do-calculus / DAG 文献(如 Pearl 系列)完全未出现——虽然 Granger 因果与干预因果概念不同,但本文的“识别”部分涉及条件分布可识别性,与结构因果模型的连接可能值得讨论,但本文完全局限于时间序列框架。

张力

未见明显对立引用。作者引用的各组工作通常被描述为互补而非冲突。唯一可能张力的点:通道特定检验的支持者可能认为“只需选择自己感兴趣的那个通道即可”,而本文认为这样可能错失其他通道的信息,但作者未深辨。


二、最核心、最简单的例子 / 数学问题

第一步:符号、模型、可观测数据交代清楚

符号: - \( (X_t, Y_t) \): 可观测的二元时间序列,\(t \in \mathbb{Z}\)\(X_t\) 是潜在的原因变量,\(Y_t\) 是结果变量。严格平稳。 - \(\mathcal{I}_{t-1} = \sigma\{ X_{t-j}, Y_{t-j} \}_{j \ge 1}\): 截至 \(t-1\) 的全部历史信息(含 \(X\)\(Y\))。 - \(\mathcal{I}_{t-1}^{(-X)} = \sigma\{ Y_{t-j} \}_{j \ge 1}\): 仅含 \(Y\) 历史的信息集(排除 \(X\))。 - \(F_{Y_t \mid \mathcal{J}}\): \(Y_t\) 给定 \(\sigma\)-域 \(\mathcal{J}\) 的正则条件分布函数。 - \(Q_{Y_t}(\tau \mid \mathcal{J})\): 相应的条件 \(\tau\)-分位数。 - \(\phi_k\): 第 \(k\) 个通道函数,是条件分布的一个可测泛函(如均值、方差、分位数、累积量)。 - \(M = \{1,\dots,K\}\): 有限通道索引集。 - \(H_{0,k}\): 第 \(k\) 个通道的零假设:\(\phi_k(F_{Y_t \mid \mathcal{I}_{t-1}}) = \phi_k(F_{Y_t \mid \mathcal{I}_{t-1}^{(-X)}})\) a.s.。 - 样本量 \(T\),置换次数 \(B\),检验预算(B 是另一符号,注意区分)。 - \(P_k\): 通道 \(k\) 的置换 p 值。 - \(W_r\): 第 \(r\) 阶段后的检验财富(alpha-investing 余额)。 - \(\alpha_k\): 为通道 \(k\) 承诺的检验水平。 - \(\lambda_k(\delta,T)\): 通道 \(k\) 在局部备择下的非中心参数。

模型:数据由某个严格平稳的 \(\beta\)-混合过程生成,满足 \(4+\epsilon\) 阶矩有限,条件密度有界且 Lipschitz。研究的因果对象是:\(X\) 的过去是否改善了对 \(Y_t\) 整个条件分布的预测。特别地,希望检验“分布 Granger 非因果”这一无限维假设。

可观测数据:研究者实际能观测到的是长度为 \(T\) 的样本 \(\{(X_t, Y_t)\}_{t=1}^T\)不可观测的是:真正的条件分布函数 \(F_{Y_t \mid \mathcal{I}_{t-1}}\)\(F_{Y_t \mid \mathcal{I}_{t-1}^{(-X)}}\)——只能通过样本推断。另外,潜在反事实量未涉及,因为 Granger 因果不涉及干预。

第二步:讲最小内核

论文的核心数学思想是:在非高斯条件下,条件分布的差异性可以通过一组有限的特征(通道)来捕获。最简特例是 Proposition 2 中的高斯边界,但那个特例实际上是退化情形(所有高阶通道自动为零),不能展示论文核心。更好的最小内核是:考虑一个最简单的非高斯设定——例如 \(Y_t\) 的条件分布由条件均值和条件方差两个参数决定,但两个参数都可能受 \(X_{t-1}\) 影响。然而论文的通道菜单包含更多。为了展示“菜单完备性”的本质,我们考虑一个极端的数学例子:

假设给定信息集 \(\mathcal{I}_{t-1}\)\(Y_t\) 的条件分布属于一个由累积量序列和尾部分位唯一确定的分布族 \(D\)(即 Assumption 2 中的确定类)。在这个类中,如果两个条件分布的所有累积量及左右尾分位数都相等,则两个分布相等。因此,检验分布 Granger 非因果等价于检验所有对应通道的相等性。论文的 Theorem 1 正是这个命题:在 \(D\) 之下,\(X\) 不 Granger 导致 \(Y\) 在分布上 \(\iff\) 所有通道零假设成立。

要理解“最小内核”,可以想象一个特殊情形:\(Y_t\) 的条件分布属于一个 Cox 型混合模型,比如条件分布是均值为 \(\mu(\mathcal{I}_{t-1})\)、方差为 \(\sigma^2(\mathcal{I}_{t-1})\) 的某个已知参数族(如 skew-t),但该分布族由其均值、方差、偏度、峰度唯一确定。则检验分布 Granger 非因果等价于检验这四个通道函数的逐点相等。这就是论文在有限截断菜单(Remark 1)中采用的现实版本,虽然不再完全等价于分布非因果,但提供了操作化目标。

最小问题:给定一个严格平稳混合序列,我们希望检验“\(X\) 的过去对 \(Y\) 的条件分布无任何预测贡献”这个全局零假设。直接检验不可行(无限维)。论文核心想法是:扩展现有单通道检验,将它们视为刻画同一条件分布的不同坐标,然后通过一个自适应多重检验程序来决定哪个通道(如果有)被拒绝。证明路线中最吃劲的部分是:如何保证自适应选择不破坏检验有效性(Theorem 2)以及如何使分配策略渐近达到 oracle 功效(Theorem 3)。


三、这篇论文做了什么

三句话

  1. 研究问题:当预测相关可能出现在条件分布的多个维度(均值、方差、尾部、高阶矩)时,如何对分布 Granger 因果进行识别、序贯检验并自适应分配检验资源?
  2. 核心工具:通道分解将分布 Granger 非因果转化为有限个可检验的通道零假设;alpha-investing 序贯多重检验框架结合 circular-block permutation 获得有效 p 值;自适应分配采用上置信界(UCB)规则。
  3. 主要结论:① 在确定类假设下,通道菜单完备:分布非因果等价于所有通道零成立(Theorem 1);② 任意自适应可容许选择规则都保持有限样本 FWER 控制(Theorem 2);③ 基于置信界的分配规则渐近达到 oracle 基准的功效(Theorem 3)。

关键设定与假设

  • Assumption 1(数据生成基本条件):严格平稳、绝对正则(几何混合,多项式衰减 \(O(m^{-b}), b>2\) 也够)、\(4+\epsilon\) 阶有界矩、条件密度有界且 Lipschitz。这些是推导 p 值条件超均匀性和统计量集中的基础。
  • Assumption 2(确定类):条件分布属于一个唯一由累积量序列及左右尾分位数函数确定的族 \(D\),且在条件作用下封闭。这是 Theorem 1(菜单完备性)的关键。作者声称“skewed scale-mixture families commonly employed in financial econometrics”满足该假设,但未给出具体验证。这一假设的强度决定了定理的适用范围。
  • Assumption 3(有效 p 值条件):通道 p 值在相应零假设下条件超均匀。Theorem 5 从原始假设和 circular-block permutation 中推导出此条件。
  • Assumption 4(识别与间隔):诊断统计量 \(G_r\) 随非中心性递增,且存在唯一的最高非中心性通道,非中心性差值 \(\Delta>0\)。此外通道统计量满足指数集中不等式(Theorem 6)。这是 Theorem 3 的基础。

相比已有文献,本文的假设更混合:一方面要求高阶矩和混合条件(对非参数检验是标准的),另一方面要求确定类条件(对识别是新的,且较强)。强化:相比经典线性 Granger 检验只需矩条件,本文需要更多分布光滑性;放宽:相比直接检验分布相等(如 KS 型),本文通过通道分解允许仅对部分特征检验,减轻了维数诅咒。

主要结果

  • Theorem 1(菜单完备性):在确定类 D 中,分布 Granger 非因果等价于所有通道零假设同时成立。这是识别定理。证明方向 (a)⇒(b) 平凡,反向使用 D 的唯一性。
  • Theorem 2(政策不变 FWER 控制):在全局零假设(分布 Granger 非因果)下,alpha-investing 程序(初始财富 \(W_0=\alpha\),奖励 \(\psi\le\alpha\))保证任何可容许自适应选择规则下的 FWER ≤ \(\alpha\)。证明使用检验上鞅(test-supermartingale)和 Ville 不等式。直觉:p 值条件超均匀保证了财富递减的期望非正,最终累积拒绝概率不超过初始财富。
  • Theorem 3(渐近效率):对 UCB 型分配规则,功效缺口 \(\beta^* - \beta^\pi \le C \log B / (\Delta^2 \sqrt{T}) + o(1)\),因此随 \(T\to\infty\) 缺口趋于 0。证明通过将非中心性视为 arm 均值,运用标准 UCB 引理界定期望采样次数,再结合功效函数的连续性。关键点:分配规则渐近一致选择最优通道,所以功效趋近 oracle。

证明路线与技术技巧

Theorem 2 证明路线(3-5步逻辑主干)
  1. 财富过程构造:定义初始财富 \(W_0=\alpha\),每次检验消耗 \(\alpha_k/(1-\alpha_k)\),若拒绝则奖励 \(\psi\)。Lemma 1 证明累积消耗 ≤ \(\alpha + \psi N_\tau\),其中 \(N_\tau\) 是拒绝次数。
  2. 定义过程 \(E_r\):设 \(E_0=1\)\(E_r = \prod_{j=1}^r (1-\alpha_{k_j} + \mathbf{1}\{P_{k_j}\le\alpha_{k_j}\})\)。Lemma 2 证明在全局零下 \(E_r\) 是上鞅(利用超均匀性)。
  3. 停时与拒绝事件:停时 \(\tau\) 为首次拒绝时刻。拒绝事件 \(\{\tau\le B, P_{k_\tau}\le\alpha_{k_\tau}\}\)
  4. Ville 不等式:由于 \(E_\tau \ge 1/\alpha\) 当拒绝发生(利用 Lemma 1 和 \(W_\tau\ge 0\)),应用 Ville 不等式得 \(\Pr(\text{reject}) \le \alpha\)
  5. 政策不变性:上述论证仅依赖于 p 值的条件超均匀性,该性质对任意可容许自适应选择规则(适应于 filtration)都成立,因为选择规则不影响给定通道下的 p 值分布。

关键跳跃点:如何从财富过程到上鞅?论文通过 \(E_r\) 的定义巧妙地将检验水平转化为乘性因子,从而利用积分不等式。难点在于:为什么拒绝事件能保证 \(E_\tau \ge 1/\alpha\)?这需要 Lemma 1 的财富关系,而 Lemma 1 对任意自适应规则都成立。

Theorem 3 证明路线
  1. 将分配问题建模为有限臂老虎机:通道是非中心性未知的臂,每个臂的即时回报是“拒绝该通道 null 的概率”,但实际只能通过 p 值观察到二元结果。
  2. UCB 指标\(I_k(r) = \hat{\lambda}_k(r) + c U_k(r)\),其中 \(U_k(r)\) 是置信半径。Lemma 3 使用标准的 UCB 分析(如 Auer et al., 2002)界定期望采样次数:对次优通道 \(k \neq k^*\)\(E[n_k(B)] \le 8\sigma^2 \log B / \Delta_k^2 + 1 + \pi^2/3\)
  3. 采样最优通道的概率:Proposition 3 证明 \(\Pr(\text{最优通道至少被采样一次}) \ge 1 - O(\log B/(\Delta^2 B))\)
  4. 功效比较:条件于采样到最优通道,功效至少为 \(\beta^\pi \ge \Pr(P_{k^*}\le\alpha_{\text{min}})\)(其中 \(\alpha_{\text{min}}\) 为可用的最小检验水平,与财富有关)。利用功效函数的 \(T^{-1/2}\) 连续性和水平衰减,合并后得总缺口 bound。

关键跳跃点:如何将非中心性估计与 p 值的拒绝概率联系起来?论文利用了 Theorem 6 的集中不等式保证 \(\hat{\lambda}_k\)\(T^{-1/2}\) 一致性,因此假设所有通道统计量是正态平移(位置族),这允许将功率函数与 \(\lambda_k\) 直接挂钩。另外,水平衰减问题:由于 alpha-investing 财富可能被前期消耗,实际可分配的水平可能低于名义 \(\alpha\),论文通过假设本地备择下功率函数的光滑性,将水平衰减影响吸收进 \(O(T^{-1/2})\) 项。

技术技巧点名

  • Circular-block permutation(Definition 1):用于生成条件超均匀 p 值。通过循环移位破坏 X 与 Y 的预测关联,同时保持 X 的边际分布和自相关结构。在 Appendix OA.2 中,作者用 Berbee 耦合和 Berry-Esseen 混合序列界证明渐近有效性。
  • Test-supermartingale 构造(Theorem 2):将检验财富过程转化为乘积型上鞅,利用 Ville 不等式给出有限样本 FWER 控制。此技巧常见于 anytime-valid 推断文献(Ramdas et al., 2023)。
  • UCB 分配规则:标准的多臂老虎机工具,用于平衡探索与利用。论文将其嵌入序贯检验,但与传统遗憾最小化不同,目标是最优通道识别效率。
  • Bernstein 型不等式 for β-mixing(Theorem 6):用于推导通道统计量的指数集中,是保证 UCB 分析可行的关键。利用了 Berbee 耦合和独立化技术。

真实例子与应用

本文包含蒙特卡洛模拟(Section 5),不包含真实数据例子。模拟设计: - 数据:DGP 分四种通道特定备择(S1 条件均值、S2 条件尺度、S3 非线性、S4 状态相关尺度),样本量 \(T=250,500\),创新分布为高斯或 skew-t。每个设计下信号强度 \(s\ge 0\)\(s=0\) 为全局零。 - 方法使用:作者用 alpha-investing 程序(初始财富 0.05,奖励 0.05,UCB 分配规则,B=100 次置换),对比 naive(不经多重校正)、Bonferroni 和 oracle(预知活跃通道)四种基准。 - 结果: - 全局零下,自适应程序 FWER 保持在 0.05 附近,而 naive 程序膨胀到 0.13-0.16(Figure 1, Table 1)。 - 备择下,自适应程序功效接近 oracle,远优于固定单通道程序(Figure 2)。例如,S2(尺度)下,自适应程序功效 0.548 (T=250) vs oracle 0.600;而均值通道固定程序功效几乎为零。 - 功效缺口随 T 从 250 增加到 500 缩小(Figure 3),符合 Theorem 3。 - 该例想说明什么:验证 Theorem 2 的 FWER 控制和 Theorem 3 的渐近效率;展示自适应分配对通道误设的鲁棒性,避免选择错误通道带来的极低功效。

🔎 结论是否比证明窄

是。 需要注意几点: 1. Theorem 1 的完备性依赖于确定类 D(Assumption 2),但 D 的具体成员未明确定义,作者仅举了金融中常用的 skewed scale-mixture 族作为例子,未给出充分必要条件。因此实际使用时,若真实条件分布不属于 D,完备性可能不成立。 2. 有限菜单的合理性:Remark 1 承认实际操作中只使用截断菜单(方差、尾部、三/四阶累积量),此时 Theorem 1 不再成立,只能检测分布差异的一部分。作者声称“finite-sample and asymptotic guarantees are stated relative to this operational null”,但 operational null 的含义仅仅是“所选通道不变”,而非真正的分布 Granger 非因果。这意味着论文的检验目标实际上比标题中“Distributional Granger Causality”要弱。 3. Theorem 3 的渐近效率:证明假设备择下非中心性差 \(\Delta>0\),且唯一最优通道存在。但现实中可能多个通道同时非零且非中心性接近,此时 gap 可忽略且分配效率难以达到 oracle。 4. Theorem 2 的有限样本有效性:证明依赖 p 值条件超均匀性,而 Theorem 5 给出的渐近版本(\(O_p(T^{-1/2})\))仅在大样本下近似成立。对有限 \(T\),作者未提供精确有限样本界,因此实际应用中小样本可能存在轻微偏差。 5. 模拟中的 naive 程序:作者将其描述为“naive”,但实际上是一种同时检验所有通道且不调整多重性的方法,其膨胀率与预期一致,但用户可能会问:为什么不直接使用 e.g. Holm 或 min-P 校正?论文未与此类更有效的多重比较方法比较,仅与 Bonferroni(太保守)和 naive 比较。


四、开放问题

  1. 有限样本下 p 值条件超均匀性的精确界:Theorem 5 给出 \(O_p(T^{-1/2})\),但能否得到有限样本界(如用混合条件下的 Berry-Esseen 常数)?这直接影响 Theorem 2 在较小 \(T\) 时的可靠性。(扎根于 Theorem 5 陈述及 Appendix OA.2 的渐近框架。)

  2. 确定类 D 的必要可验证条件:Assumption 2 要求条件分布属于一个由累积量和尾部分位唯一决定的族。但对使用者而言,如何检验该假设?能否基于数据构造一个有效性(如用密度估计判断族是否足够丰富)?或者是否存在一个更弱的充要条件,使得有限菜单仍能识别分布 Granger 非因果?(扎根于 Section 3.5 的讨论及 Remark 1 的承认。)

  3. 高阶计算复杂度:第五通道涉及条件累积量估计(尤其是 \(k_3, k_4\)),这在高维情况下可能涉及大量协方差/累积量运算。论文未讨论计算效率。研究者若利用其熟悉的 U-统计量/张量收缩技术,可能改进计算——例如将高阶累积量的估计转化为张量收缩,并用 treewidth 优化计算成本。(扎根于 Section 3.3 中 ϕ5 定义,但论文未涉计算。)

  4. 多时间序列(网络)扩展:论文 conclusion 提到“network-based versions...allocated jointly across channels and graph structures”。对高维系统,每个节点对都可能有无穷多通道,如何将自适应检验扩展到高维?这涉及 Poisson 或稀疏模式假设下的多重比较控制。(扎根于 Conclusion 第2段:“One direction is the development of network-based versions...”)

  5. 与统计-计算权衡的潜在联系:论文中的通道选择本质上是有限 arms 的试验问题,但若通道数目随维数爆炸(例如考虑无穷多个分位点),则变成连续臂问题。此时是否会出现信息-计算缺口(即统计上可检测但多项式时间算法无法达到最优功效)?论文未触及,但对有计算复杂性背景的研究者是一个自然衔接点。(扎根于 Section 2.3 的有限武器假设,但未讨论 K 大的情形。)


Maintained by 陈星宇 · Homepage · Source on GitHub

评论