Gaussian Process Differential Ensembles for Joint Inference on Curves, Derivatives, and Integrals¶

作者: Andreas Kryger Jensen, Adam Gorm Hoffmann
主题: 非参数 / 半参数
相关性: 7/10
链接: https://arxiv.org/abs/2606.23036

一、领域脉络与小综述¶

这个方向是什么¶

本文所属的子方向是函数型数据分析中的联合推断，核心科学问题是：当可观测的是一条曲线 \(f_0\)（称为锚点），但科学目标包含了该曲线的各阶导数、重积分、以及这些泛函的联合不确定性时，如何在贝叶斯框架下建立一个统一的、可计算的、具有校准不确定性的联合后验模型。该方向当前的成熟度处于“方法丰富但缺乏通用组织原则”的阶段——已有诸多技术（GP 导数、线性算子 GP、积分过程、SDE 平滑）各自解决一部分问题，但缺少一个统一框架去说明：“应该把似然附着在哪个组件上？积分常数是模型的合法组成部分还是后处理的麻烦？有限秩近似如何为导数目标而非仅锚点目标校准？”

发展脉络¶

奠基工作。① Kimeldorf and Wahba (1970) & Wahba (1978)：建立了贝叶斯估计与样条平滑的对应关系，引入内在高斯先验（intrinsic Gaussian prior），其多项式零空间与本文的积分常数自由度的数学结构一致。② Matheron (1973)：内在随机函数理论，同样涉及多项式零空间。这两条线为“积分常数导致有限维边界不确定性”提供了数学源流。③ Cramer and Leadbetter (1967)：平稳过程的均方可导性理论，为弱导数构造提供严格基础。

主要进展。④ Solak et al. (2002)：在 GP 回归中引入导数观测的协方差恒等式，开辟了“GP 导数模型”这一分支。⑤ Särkkä (2011) 和 Graepel (2003)：将线性算子（微分方程）作用于 GP，建立了算子约束下的预测框架。⑥ Holsclaw et al. (2013) 和 Cahill et al. (2015)：走反方向——对潜变率过程（导数）施加 GP 先验，再积分得到观测曲线（集成过程 / 集成 GP）。这为本文的“正指数（积分）分支”提供了代表性前驱。⑦ Ramsay et al. (2007) 的广义平滑（generalized smoothing）：用微分方程的 penalize 来同时估计函数及其导数，是经典函数型数据分析的做法。

当前 frontier。⑧ Solin and Särkkä (2020)：希尔伯特空间 GP 近似（HSGP），用拉普拉斯-狄利克雷特征函数展开近似平稳核，为大规模 GP 计算提供了领域标准。⑨ Riutort-Mayol et al. (2023)：将 HSGP 的实用校准规则引入概率编程，本文的 TARTARE 正是它的从单层 GP 扩展到微分集成的版本。⑩ Liu and Li (2026)：近期理论证明，plug-in（先拟合后求导）的 GP 导数推断有正面的渐进性质，但该理论适用于点估计后的 plug-in，不适用于本文追求的联合后验。

本文的位置：作者在引言中明确说，“本文的贡献不是发现了GP可以被微分或积分，而是以锚点为中心组织这些操作，显式传播跨层协方差，并让积分常数成为统计模型的一部分”。因此，这篇论文站在已有的 GP 导数 / 算子 / 积分 / HSGP 技术的交汇点上，提供了一个组织性框架 + 计算校准程序的统一方案。

子线索聚类¶

GP 导数与线性算子 GP：Solak et al. (2002), Särkkä (2011), Graepel (2003), Murray-Smith and Pearlmutter (2005), Lázaro-Gredilla and Figueiras-Vidal (2009)。这一脉专注于把 GP 与微分/积分算子结合，给出协方差恒等式，但不特别区分哪个分量是观察链接的锚点。
集成过程与潜变率模型：Holsclaw et al. (2013), Cahill et al. (2015), Yue et al. (2014), Zhang et al. (2024)。这一脉把潜变率（导数）当作原初对象，通过积分得到可观测曲线。它们在方向上与本文相反（本文是锚点朝下导数、朝上积分）。
函数型数据与平滑样条：Silverman (1985), Ramsay and Silverman (2005), Ramsay et al. (2007)。这一脉通过先平滑再导出的方式处理函数与导数，但不确定性处理通常靠渐近而非分层贝叶斯。

方向的核心问题¶

Q1：如何对函数及其泛函（导数、积分）进行具有校准不确定性的联合推断，而非先拟合后插值？
Q2：积分常数这个有限维自由度（整数自由度）应如何处理？它是否是统计模型的一部分，还是后处理时被忽略的 nuisance？
Q3：当使用有限秩近似（HSGP）时，如何确保对导数级数足够准确的逼近——因为导数放大高频，而锚点校准的基可能对导数“欠解析”？
Q4：后验轨迹（posterior draws）应直接来自联合状态，而非来自先分开推断、再计算的流程。

⚠️ 作者的 framing¶

作者把缺口 frame 为：

“虽然 GP 可以被微分或被积分是众所周知的，但现有方法没有： (1) 以锚点为组织中心； (2) 分开锚点引致的协方差与积分常数引出的有限维多项式协方差； (3) 显式地用 TARTARE 校准有限秩 Fitting 使导数目标不欠解析。”

被作者淡化或回避的竞争路线： - 平滑样条方法（Ramsay et al. 2007, Silverman 1985）：虽然样条的导数推断是成熟工具，但作者认为它们的不确定性取决于平滑参数和边条件编码，没有层级贝叶斯联合后验自然。作者在 1.1 节只说“其不确定性取决于拟合表示中如何编码平滑、导数惩罚和边界行为”，没有详细比较在哪些实际场景下联合 GP 优于样条。 - 基于 SDE 的平滑先验（Yue et al. 2014, Zhang et al. 2024）：这些模型把函数视为 SDE 的解，对数格点自适应和潜在方程结构有天然优势，但作者回避了与它们比较的细节。

明显该被引或该存在但没出现的引用： - 多维函数域的 GP 导数 / 梯度模型：本文只在 1D 域上发展了计算形式（引言反复强调“stationary one-dimensional anchor kernels”），但完全没有引用任何多维 GP 梯度 kriging 的工作（也许被作者视为未来工作，但在绪论中完全不提就是遗漏）。 - 关于更快替代算法的近期工作：例如随机傅里叶特征（Rahimi and Recht 2007）在 GP 近似中的广泛使用。作者只写了 HSGP 而没提 RFF/正交变换，HSGP 的优点（特征函数解析可微/可积）受益于 Dirichlet 边条件，但 RFF 不依赖边条件。

张力¶

未见明显对立引用。所有被引工作（Solak et al. 2002、Holsclaw et al. 2013、Solin & Särkkä 2020）在理论上互补而非冲突。

二、最核心、最简单的例子 / 数学问题¶

第一步：记号、模型、可观测数据（全部交代清楚）¶

符号（一网打尽）：

记号	含义	类型
\(t_0, t_1\)	函数定义域的下界和上界	固定实数，已知
\(r \in \mathbb{N}\)	微分集成阶数	模型的超参数
\(f_0\)	锚点高斯过程。似然直接连接的对象	Gaussian process
\(f_{-k} (k=1,...,r)\)	\(f_0\) 的 \(k\) 阶均方可导导数	明确来自 \(f_0\) 的微分变换
\(f_k (k=1,...,r)\)	\(f_0\) 的 \(k\) 阶重积分（从 \(t_0\) 开始）加上高斯积分常数	由 \(f_0\) + 独立高斯部分构成
\(\kappa = (\kappa_1, ..., \kappa_r)^\top\)	积分常数向量	Gaussian random vector
\(C_\theta\)	锚点核函数	bivariate kernel
\(S_\theta(\omega)\)	\(C_\theta\) 的谱密度（平稳假设）	函数
\(L\)	计算域的半宽度（\([t_0,t_1] \subseteq [-L,L]\)）	超参数（由校准选定）
\(K\)	保留的拉普拉斯–狄利克雷特征函数个数	超参数
\(\phi_{k,L}, \lambda_{k,L}\)	在 \([-L,L]\) 上 Dirichlet 边界条件下的特征函数和特征值	已知解析函数
\(Y_i, t_i, n\)	第 \(i\) 个观测：观测值（有噪），时间，样本量	可观测数据
\(\sigma^2\)	观测噪声方差	待估参数
\(\psi^{(p)}_k\)	特征函数 \(\phi_{k,L}\) 经过微分或积分算子 \(A^{(p)}\) 变换后的函数	由算子作用得到
\(\tilde{C}_{\theta, L, K}\)	HSGP 近似的协方差	近似量
\(M\)	TARTARE 的监控集，例如 \(M=\{-2, -1, 0, 1, 2\}\)	用户指定的集合

模型（数据生成机制）：

锚点 \(f_0 \sim GP(0, C_\theta)\)。
积分常数 \(\kappa \sim N(0, \Sigma_\kappa)\)，且独立于 \(f_0\)（本文主设定；在线附录有依赖版）。
从 \(f_0\) 和 \(\kappa\) 构造联合状态：
\[f_{-r} = D^r_t f_0, \quad ..., \quad f_0 \quad \text{(锚点)}, \quad f_k(t) = I^k_{t_0} f_0(t) + \sum_{j=1}^k \frac{(t-t_0)^{k-j}}{(k-j)!} \kappa_j, \quad k=1,...,r.\]
观测：\(Y_i = f_0(t_i) + \epsilon_i, \quad \epsilon_i \perp\!\!\perp N(0, \sigma^2)\)。

可观测数据： - 直接可观测：\(\{(Y_i, t_i)\}_{i=1}^n\) ——仅仅来自锚点 \(f_0\)。 - 想要但无法直接观测：\(f_{-r}, ..., f_{-1}, f_1, ..., f_r, \kappa\)（即整个微分状态）。 - 核心识别困境：数据不直接 tie out \(\kappa\)。积分常数的后验完全源于先验（若没有额外边界观测）——anchor-only observations do not identify independent integration constants。

第二步：最小内核¶

选取一个最简特例：\(r=1\)（一阶微分集成），即状态向量为

\[(f_{-1}(t), f_0(t), f_1(t)) .\]

- 二阶导数不存在，只有一个导数，一个积分。 - 可观测数据仍只来自锚点 \(Y_i = f_0(t_i) + \epsilon_i\)。 - 积分常数：\(\kappa_1 \sim N(0, \tau^2)\)，独立于 \(f_0\)。

在这个 r=1 情形下，本文的核心构造退化成什么？

Step A（很层面构造）：

\[f_{-1}(t) := D_t f_0(t) \quad (\text{弱均方可导}), \qquad f_1(t) := \int_{t_0}^t f_0(u)du + \kappa_1 .\]

这个联合状态 \((f_{-1}, f_0, f_1)\) 是高斯过程（定理1）。

Step B（可观测数据角色）：似然只含 \(f_0\)。因此在对 \(f_0\) 进行后验更新时，由于 \(f_{-1}\) 和 \(f_1\) 的协方差是由 \(C_\theta\) 的算子块诱导的，所以 数据间接更新了整个状态——但只有 \(f_{-1}\) 的更新涉及 \(C_\theta\) 的交叉块提供的信息，而 \(f_1\) 中积分常数 \(\kappa_1\) 的更新完全由先验决定（因为积分常数的多项式部分是独立的，且不与 \(f_0\) 交叉）。

最小数学困难（就是这篇论文核心要解决的）：

已知有观测 \(Y\|f_0\)，要得到联合后验 \(p(f_{-1}, f_0, f_1, \kappa_1 \ |\ Y)\)。困难在于：当使用有限秩HSGP近似（\(K\) 个特征函数）计算 \(C_\theta\) 的算子块时，必须确保从 \(C_\theta\) 求导出来的 \(f_{-1}\) 的后验是准确的——而 HSGP 基是为 \(f_0\) 的协方差设计的，精度 \(K\) 显著小于用于导数的 \(K\) 要求。因此需要 TARTARE 来感知目标级数（导数），调大 \(K\) 和 \(L\)，使导数后验不欠解析。

综上，这个最小内核揭示了全文最硬的结构性冲突： - 锚点观察可更新锚点及所有算子块； - 但导数对高频敏感（需要高 \(K\)），积分常数完全靠已知有限维多项式协方差（无近似误差）； - 所以整个方法的技术难点实则落在：保证导数块的HSGP近似误差可控（定理2），并在实践中用 TARTARE 诊断加补救。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在仅观测锚点函数 \(f_0\) 时，如何联合推断该函数及其均方可导导数、重积分（含积分常数）构成的高斯后验状态。
核心工具/方法：① 定义锚点高斯微分集成——一种高斯状态的弱构造（定理1）；② 使用变换的希尔伯特空间 GP 近似（HSGP on Laplacian–Dirichlet 基）来实现任意阶的导数/积分块，积分常数的协方差精确保留（Proposition 2）；③ 提出 TARTARE 目标感知校准程序，确保有限秩 HSGP 逼近对导数目标不欠解析。
主要结论：① 定理1 给出联合高斯状态；② 定理2 给出导数协方差块的谱逼近界（误差 \(\propto 1/L + \text{谱尾}\)）；③ 命题3 证明固定超参数下有限格点后验收敛；④ 模拟和摩托車事故应用显示，锚点级校准的 HSGP 导数覆盖率严重不足，而 TARTARE 的导数感知校准显著改善导数后验收敛。

关键设定与假设¶

设定：\([t_0, t_1] \subset \mathbb{R}\)，1 维函数域。锚点 \(f_0\) 为 GP。积分常数 \(\kappa\) 独立于 \(f_0\)（主设定；在线附录有依赖版）。HSGP 近似在计算域 \([-L, L]\) 上使用 Dirichlet 边界。

关键假设：

假设	内容	统计含义	与已有文献对比
Assumption 1	\(\mu \in C^r, C_\theta \in C^{r,r}\)	确保 \(f_0\) 到 \(r\) 阶的均方可导。条件保证弱导数存在	比 Solak et al. (2002) 的常规假设更强（要求到 \(r\) 阶），但这是构造多阶导数/积分的必需品
Assumption 2	\(\kappa \perp\!\!\!\perp f_0\)	积分常数独立于锚点，简化协方差公式	这是本文独特区分。对比 Lange-Hegemann (2021) 用硬线性约束编码边界，本文选择显式随机常数的独立设定
Assumption 3	存在 \(C^r\) 版本	额外的路径正则性，确保弱构造可以升级为逐路径微分链	许多 GP 理论论文不要求此假设，只操作弱意义；本文加了才走命题1
Assumption 4	加权谱密度均匀有界、可导、可积	傅里叶级数界方法的标准假设	针对导数块比 Solin & Särkkä (2020) 的原始假设更强（加权谱尾控制）

主要结果¶

定理1（弱高斯构造）。

陈述：构造了 \((f_{-r}, ..., f_r)\) 的联合高斯分布，给出均值函数和协方差函数（分裂为锚点诱导块和积分常数多项式块）。
直觉：当 \(\kappa\) 与 \(f_0\) 独立时，整个联合状态是高斯过程。积分常数只贡献一个 \(\Sigma_\kappa\) 乘以多项式的协方差。
必要条件：Assumption 1 + Assumption 2。
解决的技术难点：证明正指数部分亦可保持平方可积和高斯性，尤其是积分路径的 \(L^2\) 极限处理。

定理2（导数协方差块的谱逼近界）。

陈述：对于任意固定的 \((a,b) \in \mathbb{N}_0^2\)，若 Assumption 4 成立，则
\[\sup_{[t_0,t_1]^2} |D_1^a D_2^b C_\theta(s,t) - D_1^a D_2^b \tilde{C}_{\theta,L,K}(s,t)| \le \frac{E_{a,b}}{L} + \frac{1}{\pi} \int_{\pi K/(2L)}^{\infty} \omega^{a+b} S_\theta(\omega) d\omega.\]
直觉：误差分为两项：（i）反射项 \(O(1/L)\)（来自 Dirichlet 边界的固定交界影响）；（ii）加权谱尾（截断频率以上的质量）。
必要条件：\(K/L \to \infty\) 才保证一致收敛（熬到谱尾无穷小）。
解决的技术难点：作者用双边傅里叶级数技巧和 Riemann sum bound——反射项被吸纳进 \(1/L\) 项，而非独立于基数目。这比 Solin & Särkkä (2020) 的原始界（anchor 级）更细致，因为导数权重将谱尾放大。

命题3（固定超参数下的有限格点后验收敛）。

陈述：当有限秩协方差块收敛到真协方差块时，对任意固定有限网格 \(G\)，条件后验均值和方差收敛。
直觉：这只是多元高斯条件分布的连续性。
必要性：此命题只保证固定超参数的 convergence，不保证超参数积分后的收敛。
解决的“难题”：作者需要确认（在固定超参下）使用 TARTARE 校准的近似不会阻止后验收敛到精确目标，此处给出了明确判定。

仿真 & 实例结果（见下面的“真实例子”部分，但在“主要结果”层归纳两个关键量化结论）： 1. 锚点级 HSGP 的 \(f_{-2}\) 覆盖率（在 SE kernel 下 = 91.5%，在 Mat7/2 下极低“non-coverage”≥10% points below nominal），而 T-D2 覆盖率升高到名义水平（≈94-95%）。 2. 积分常数不确定性主导正指数方差：仿真（边界常数灵敏度）发现，独立先验下积分常数贡献 I1 方差的 98%、I2 方差的 99%。

证明路线与技术技巧¶

整体路线（对定理1 - 定理2 - 命题3）：

Step 1（弱构造）：对锚点 \(f_0\) 使用均方可导理论。定义导数过程的均方极限。对正指数用 Cauchy 公式 + 高斯变量 \(\kappa\)。
Step 2（协方差块）：证明协方差分裂为“锚点诱导”部分和“积分常数多项式”部分。关键是证明算子交换性（\(A^{(p)}\) 与 covariance 交换后得恒等式）。
Step 3（谱逼近）：对 HSGP，用傅里叶级数展开和 Riemann sum 界。先将导数块写成傅里叶积分，再分解为“主项 + 反射项”。主项用有限 \(K\) 截断后的 Riemann sum bound，反射项用有界 Dirichlet 边界引致 \(\cos(\omega(s+t))\) 项的配对交替 bound（收敛到 \(O(1/L)\)）。
Step 4（后验收敛）：固定超参下，HSGP 近似协方差 + 均值一致收敛 ⇒ 条件后验在固定有限格点上收敛。

关键跳跃点： - 正指数部分的高斯性保持：证明正指数 \(f_p(t)\) 仍是高斯——积分作为一个 bounded linear functional in \(L^2\) 嵌入高斯性，且泊松型多项式项保持高斯性。这是最容易略过的细节，但确实是定理1的关键一步。 - 正指数部分的导数链的 \(L^2\) 意义：证明 \(D_t f_p = f_{p-1}\) 在均方意义下成立，从 \(f_{p-1}\)的均方连续和 Jensen's inequality 出发（见证明的补充材料）。 - 谱逼近界中对反射项的处理：作者巧用 Dirichlet 边界得到 \((-1)^k\) 项，然后用加法交换成配对交替和，积化为绝对误差 bound \(O(1/L)\) 和一个常数，而不依赖于 \(K\)。这种“量带事实证明谱尾仅来自主项”的技巧是优美的。

技术技巧点名： - 傅里叶级数 + Riemann sum 界：用于定理2的主项误差 bound。 - 配对交替求和 bound：处理反射项 \(B^{[a,b]}_{L,K}\)，将 \(K\) 个项配对求差，用连续 Lebesgue 导数 bound。 - \(L^2\) 极限的高斯性保持（Cramér–Wold）：证明正指数和负指数的高斯极限。 - 加权谱密度（\(\omega^{a+b} S_\theta\)）的界：将导数块的谱值加权纳入假设4。 - Matheron's rule（文中未显式命名，但在边际化实现中用到了等效方法从 \(\beta|\vartheta\) 取样）：在 Stan 实现中，从联合高斯条件后验取样的方法。

真实例子与应用¶

数据：著名的摩托车事故数据（mcycle data），含 133 次头部加速度测量（单位：g），覆盖碰撞后 0-60 ms。观测点为时间（ms）和加速度（g）。

方法使用方式： - 以头加速度为锚点 \(f_0\) 构建二阶微分集成（\(r=2\)）：状态为 (snap \(f_{-2}\), jerk \(f_{-1}\), acceleration \(f_0\), velocity \(f_1\), position \(f_2\))。积分常数 \(\kappa_1\)（初始速度）和 \(\kappa_2\)（初始位置）设定为正态先验（\(\kappa_1 \sim N(8 m/s, 2.5^2)\)，\(\kappa_2 \sim N(0, 0.05^2)\)）。 - 采用 Matérn 7/2 锚点核 + HSGP 近似，通过 TARTARE 校准 \(M=\{-2\}\)（snap 级），得到 \(K=181, L=39.31 ms\)。 - 此外对log 标准差也使用一阶微分集成，logσ(t) 为锚点，其导数 \(h_{-1}\)，累积 log σ 为 \(h_1\) + 积分常数（锚定在 \(t_0\) 处的噪声量级）。 - 后验采样后，在预测网格上计算短视界反弹功能量：基于当前（snap, jerk, acceleration, velocity）的五阶泰勒展开，问未来 5ms 内是否有速度反转点，以及经历位移多长。

量化结果：

后验反弹概率 \(p_{\text{turn}}(t)\) 峰值为 0.612（约在 20.1ms）。在此时间点，条件反弹位移的中位数为 11.8 cm，中心95%区间 (0.7cm, 23.2cm)；10cm 阈值概率为 0.383。
作者指出，这并非一个关于平滑加速度曲线的特征，而是依赖整个联合状态的功能量（snap → jerk → acceleration → velocity → position）。

例子想说明什么： - 证明该框架能够“后验完整采样耦合状态”，而不是先平滑再推导。 - 说明导数/积分区间的联合不确定性传播——尤其是积分常数（初始速度/初始位移）在撞击事件中成为关键边界信息。 - 用 TARTARE 证示了即使是非常高阶的导数（snap，二阶导数的导数）仍能在有限 HSGP 表示下不欠解析。

🔎 结论是否比证明窄¶

有几个地方值得留意：

定理2的谱尾积分界：作者在证明中明确强调“该 bound 是建立在固定超参数和锚点核为平稳的假设上”。因此对于非平稳核或超参数后验积分后的情形，该界不是一个紧的后验误差定理。论文在讨论（Section 5）明确写道：”本文不建立一个通用的有限K,L 后验误差定理，仅为固定超参数的收敛“。
TARTARE 的收敛验证性质：命题3证明的是“固定有限格点 \(G\) 和固定超参下的后验收敛”。TARTARE 做的是有限格点上的校准 + 贝叶斯后验稳定性检查。作者没有声称（也不能 claim）这是一个通用的有限秩后验误差定理，而称为“heuristic but necessary computational safeguard”。所以结论（TARTARE 改善导数后验收敛）是在给定仿真试验设计下验证的，并非普遍定理。
定理1的弱构造自带：积分常数的存在将“积分边值不确定性”显式化。但作者在后没证明后验能否一致或最优地估计这些积分常数，这是当然的——因为积分常数如果不通过边界观察，就不被数据更新。但这容易被泛化为“算法能有效推断边界常数”。

四、开放问题（扎根具体语句）¶

能否建立有限 K, L 的后验误差定理（带超参数集成）？
扎根：Section 5 “Future work should sharpen finite-basis posterior error theory, especially with inferred hyperparameters and nonlinear state functionals.” —— 本文仅有固定超参数的收敛性，超参数空间的后验误差没有界。这是值得做的技术问题（对您 moderately_familiar 的 semiparametric theory 和 HOIF）。
如何扩展到多维函数域（多变量 GP 的梯度/积分）？
扎根：Section 5 “Extending anchored differential ensembles to multidimensional and spatio-temporal domains would require operator-specific eigensystems and calibration rules…” —— 这是开放问题，但显然需要新低秩特征基理论。对您 very_familiar 的 high-dimensional asymptotics 和 inverse problems 是可得用的。
能否从后验中自适应选择 监控集 M，而不依赖预计算查表？
扎根：Section 5 “Adaptive or joint calibration criteria could choose monitored targets from the posterior questions actually reported.” —— 即 TARTARE 目前需要用户在拟合前指定 M；能否从后验实际关心的功能量（如求拐点）自动选择 M。
该框架能否嵌入半参数效率理论的框架，在存在高阶 nuisance 参数时推导联合推断的效率界？
扎根：论文末较短提“Broader comparisons with spline derivatives … general linear-operator GP models”。但更深入的问题是：给定 GP 微分集成做后验推断，对某种目标（如极值位置、积分区域面积）的半参数效率界是什么？这是将非参数贝叶斯与效率理论结合的开放方向。对您 moderately_familiar 的 semiparametric theory 可能正是一兴趣点。

Maintained by 陈星宇 · Homepage · Source on GitHub