Long-term causal inference under persistent confounding via data combination¶

作者: Guido Imbens, Nathan Kallus, Xiaojie Mao, Yuhao Wang
来源: Journal of the Royal Statistical Society Series B
主题: 因果推断
相关性: 8/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

1.1 这个方向是什么¶

本文所针对的子方向是：长期治疗效应（Long-term Treatment Effect, LTE）的识别与估计，具体设定是短期随机实验数据（RCT）与长期观测数据（Observational Data）相结合，但面临一个棘手的实际困难——持续混杂（Persistent Confounding），即不可观测的混杂因子 U 同时影响治疗 T、短期结果 S 和长期结果 Y，且 U 在各个时间点上持续存在、不随时间变化。该问题的根本科学难题在于：实验时间短，无法直接观测长期结局；而观测数据虽然有足够的时间跨度，却因持续混杂使得标准的「无未观测混杂」假设不成立，传统的数据融合方法失效。这一子方向正处于方法论的快速成长期，但核心识别瓶颈仍未被完全突破。

1.2 发展脉络（History）¶

作者通过 introduction 和参考文献，梳理出以下演进路径（按时间/逻辑顺序）：

奠基工作：基于代理结果（Surrogates）的思路
Athey et al. (2019) (Surrogate Index)：提出如果存在满足「Prentice 代理条件」的短期结果 S，则长期效应 ATE 可被识别为对 S 的效应。这一工作奠定了「用短期代理推断长期」的框架，但它假设 S 是「充分代理」，即 T ⟂⟂ Y | S；当存在持续混杂 U 时，这一条件极易被破坏。
Chetty et al. (2010) (Project STAR)：实证背景——用实验估计「幼儿园班级规模」对长期收入的影响，但其长期结果极难获得，点明实践需求。
主要进展：融合实验与观测数据
Battocchi et al. (2021) 和 Yang et al. (2020)：将实验数据与观测数据结合，用动态效应估计或代理指数学习最优策略。它们都依赖「短期代理充分」假设，未考虑持续混杂。
Imbens, Kallus, Mao et al. (2021) (本文作者自身的前作)：针对面板数据中的因子模型，提出了「最小桥函数」方法，初步处理了未观测混杂，但假定模型为线性因子结构，且要求多个时期。
当前 Frontier：Proximal Causal Inference (PCI)
Miao et al. (2016, 2018)、Tchetgen et al. (2020)、Cui et al. (2020) 等：提出负控制变量（Negative Controls）框架——通过「负控制暴露」和「负控制结果」来识别未观测混杂下的因果效应，理论上可处理更一般的非参数情形。但它们的核心限制在于：（1）要求负控制变量不受治疗影响（即 T 不影响负控制），（2）通常只处理一个观测数据集，而非实验+观测数据融合。
Kallus et al. (2021) 将 PCI 扩展至 minimax 学习框架，放宽了唯一性和完备性要求，但仍沿用单数据源设定。
本文位置：作者明确指出，上述 PCI 框架中的「负控制结果」必须是不受治疗影响的变量，而本文的设定中，短期结果 S1、S2、S3全部都受 T 影响，因此不能直接套用已有的 PCI 工具。本文的贡献是，在 T → S1 → S2 → S3 → Y 的时序结构下，将「受 T 影响的短期结果」本身当作了「代理变量」，用顺序条件独立结构来替代「不受治疗影响」的条件，从而开辟了一个全新的识别路径。

1.3 子线索聚类¶

被引文献大致可归为以下三条线索：

代理结果（Surrogates）与代理指数路线
核心工作：Athey et al. (2019), Battocchi et al. (2021), Yang et al. (2020)
假设核心：Prentice 代理条件，即 T ⟂⟂ Y | S 或马尔可夫动态。
瓶颈：持续混杂 U 会破坏 T ⟂⟂ Y | S，使得代理充分性失效。
Proximal Causal Inference (PCI) 与负控制变量路线
核心工作：Miao et al. (2016, 2018), Tchetgen et al. (2020), Cui et al. (2020), Kallus et al. (2021)
假设核心：存在不受治疗影响的负控制暴露（NCE）和负控制结果（NCO），以拟合桥函数（bridge function）。
瓶颈：T 不可影响 NCO，这在许多实际场景中难以成立；且通常只处理单一观测数据，不涉及数据融合。
结合实验与观测数据的融合方法
核心工作：Colnet et al. (2020) (综述), Chernozhukov et al. (2020) (Common Support), Imbens et al. (2021) (面板数据因子桥函数)
假设核心：要么需要「有共同支持」（实验和观测的协变量分布有重叠），要么需要无持续混杂。
瓶颈：持续混杂恰恰使得「用观测数据补实验的长期结果」这一想法本身成问题——观测数据的长期效应估计受 U 污染，而实验数据中 U 未操作。

1.4 核心问题与已知瓶颈¶

核心问题 1（识别）：在实验短、观测长的数据融合设定下，如何从 T、S1、S2、S3、Y 的可观测数据中，识别出 E[Y(1) - Y(0)]，即使存在持续混杂 U？
核心问题 2（估计与推断）：如何构造一个可实现 n^{-1/2} 收敛率的估计量，且允许使用灵活的机器学习拟合成分（如条件期望），并具有双鲁棒性或 Neyman 正交性？
核心问题 3（与现有 PCI 的衔接）：当短期结果本身充当代理变量时，如何形式化地界定与 Miao et al./Kallus et al. 桥函数理论之间的异同？
现有瓶颈：已有文献对「持续混杂」的处理要么局限于线性因子模型（Imbens et al. 2021），要么忽视它（Athey et al. 2019），要么需要不易满足的负控制条件（PCI）。

1.5 ⚠️ 作者的 Framing¶

以下为作者原文的判断，直接引述，不视为客观评价。 - 作者把缺口 frame 成：本文在 Introduction 第 2-3 段声称：「已有文献处理持续混杂时要么依赖线性因子模型（Imbens et al. 2021），要么依赖特定代理条件（Athey et al. 2019），而本文提出的序贯条件独立策略在没有线性因子假设、持续混杂普遍存在的设定下，也能实现长期效应的识别。」——换言之，作者将自身定位为对现有 PCI 的一种自然扩展（把 T 影响的短期结果当作代理），并且是首个在持续混杂下处理数据融合的非参数方法。 - 被淡化/回避的竞争路线：作者几乎未讨论使用长实验本身（将实验延长到足以观测长期结果）的可能性，也未提及用面板数据固定效应模型消除时不变混杂的经典做法（如两期倍差法），理由是它们需要流逝足够长时间或需要额外假设。但读者需要自判：在某些实践中，长实验也不是完全不可能；固定效应+实验数据的扩展是否真被「持续混杂」排除？ - 什么明显该被引/该存在，却没出现在 intro 里？ 本文的参考文献列表较长（25篇），但似乎缺失了对用潜变量建模做隐马尔可夫推断的引用——例如序列型因果推断（sequential causal inference）中的假设可交换性（sequential exchangeability）以及 G-computation 公式的相关文献，虽然本文的「条件独立」结构本质上是一种新的顺序/时序识别策略。值得研究者去确认：这个遗漏是故意的（因为那些文献假设无未观测混杂）还是疏忽。

1.6 张力¶

未见明显对立引用。被引文献之间不存在根本性矛盾，更多是不同假设下的方法取舍。唯一存在的（较弱的）张力是：Athey et al. (2019) 认为「只要找到代理即可识别」，而 PCI 文献指出「代理本身需要有特殊的结构（如不受 T 影响）」，本文则在「代理受 T 影响」的条件下通过时序结构给出新的途径——这在假设层上是补充而非对立。

二、最核心、最简单的例子 / 数学问题¶

2.1 符号、模型与可观测数据（先交代清楚）¶

符号（符号、类型、含义）： - \( T \in \{0,1\} \)：二元治疗（处理），是随机变量。 - \( U \)：不可观测的持续混杂因子（时间不变，可能为多维、连续），随机变量。 - \( S_1, S_2, S_3 \)：三个短期结果，按时间顺序观测（\( S_1 \) 最早，\( S_3 \) 最晚），每个可以是向量或标量，随机变量。 - \( Y \)：长期结果，仅观测一次（在 \( S_3 \) 之后很久才观测），随机变量。 - \( X \)：可观测的协变量（可能包含），但不是本文的核心。 - \( \tau = E[Y(1) - Y(0)] \)：平均治疗效应（ATE），即目标 estimand。 - \( Y(t) \)：潜在结果（Potential Outcome），即在处理条件 \( T=t \) 下的长期结果；只有与观测治疗一致的潜在结果能被观测到——即 \( Y = Y(T) \)。 - \( S_j(t) \)：S3 的潜在结果，类似定义。 - \( N \)：样本量（索引 i 有时略去）。

模型（数据生成机制）： - 治疗 T 的分配可能受 U 影响（和也可能不受，但本文允许它受 U 影响；实验部分的 T 是随机分配的 J，因此 T 与 U 的关联仅在观测数据中起坏作用）。 - 时间顺序（有向无环图结构，作者假定）：
T → S1 → S2 → S3 → Y，且 U → (T, S1, S2, S3, Y)，即 U 同时影响所有节点（包括 T 和所有短期结果与长期结果）。
关键条件独立关系： - (C1) \( S_2 \perp (T, U) \mid S_1 \) (原文 Condition 2 的一部分) —— 在给定 S1 后，S2 不再依赖 T 和 U。 - (C2) \( S_3 \perp (T, S_1, U) \mid S_2 \) (原文 Condition 3) —— 在给定 S2 后，S3 与 (T, S1, U) 独立。 - (C3) \( Y \perp (T, S_2, U) \mid (S_3, X) \) (本文中未完全等价，但大意如此) —— 长期结果在给定 S3 后与 T、S2、U 独立。

可观测数据（研究者实际能看到的）： - 来自实验的数据（Experimental Data）：\(\{ (T_i^{\text{exp}}, S_{1i}^{\text{exp}}, S_{2i}^{\text{exp}}, S_{3i}^{\text{exp}}) \}\)——有 T 的随机分配、有全部的短期结果 S1-S3，但没有长期结果 Y。 - 来自观测数据的数据（Observational Data）：\(\{ (T_i^{\text{obs}}, S_{1i}^{\text{obs}}, S_{2i}^{\text{obs}}, S_{3i}^{\text{obs}}, Y_i^{\text{obs}}, X_i^{\text{obs}}) \}\)——有 T（可能受 U 影响）、有全部短期结果，也有长期结果 Y。 - 不可观测：U 在所有数据中都未被记录。

核心难题：实验数据有干净的治疗分配（可识别 T→S 的效应），但没有 Y；观测数据有 Y，却有 U 混杂 T→Y。如何桥接两个数据集，得到谱的 \( E[Y(1)-Y(0)] \)？

2.2 最小内核（最简特例）¶

剥去所有非本质假设，整篇论文的核心思路其实藏在一个单一时序链条中：

最简特例：假设我们只有三个离散短期结果 \( S_1, S_2, S_3 \)（每个取值有限），T 是二值，Y 是二值或连续。忽略协变量 X，忽略多维性，假设可忽略的测量误差和随机化实验中的 T 完全随机。

识别的核心想法：因为 S1、S2、S3 有一个序贯条件独立链：

\[S_2 \perp (T,U) \mid S_1, \quad S_3 \perp (T,S_1,U) \mid S_2, \quad Y \perp (T,S_2,U) \mid S_3.\]

因此，U 的影响可以被这些短期结果逐层吸收掉： - 给定 S1 后，S2 不再依赖于 U 和 T；因此 S2 对 U 的依赖性仅通过 S1 传递。 - 给定 S2 后，S3 中也只保留 S2 的影响，T 和 U 的影响被阻断。 - 长期结果 Y 在给定 S3 后独立于 T 和 U。

这意味着，如果我们能够从实验数据中学会一个「条件期望函数」：\( h(S_3) = E[Y \mid S_3, T=1] \)（…但这里实际上有技巧，见下文），然后把它应用到实验数据的 S3 上，就可以得到「若无长期结果，也能通过学习到的函数估计反事实 Y(1)」的预测。

然而，U 的存在意味着观测数据中 \( E[Y \mid S_3, T=1] \) 不同于实验数据的期望——U 可能同时影响 S3 和 Y，从而引入偏见。所以本文的关键对策是引入三个短期结果的时序结构，构造一个「条件矩方程」，使得方程的解正好是「纯净的」桥梁函数 \( h_0(S_3) \)，它满足：

\[E[Y - h_0(S_3) \mid S_2, T] = 0\]

（即 h0 是 Y 的「纯净 S3 投影」，不受 U 影响）。然后从观测数据中解出 h0，再用实验数据的 S3 代入 h0，得到 E[Y(1)]。

一句话核心难题：持续混杂 U 使得观测数据中 \( E[Y \mid S_3] \) 混杂了 U，而本文利用三个短期结果间的条件独立方程，构造了一个条件矩方程来「分离」U 的效应，从而把干净的转移函数 h0 识别出来，用于实验数据。

这就是最小内核：三个短期结果 > 两个条件独立 > 一个条件矩方程 > 桥函数 > 实验数据的 CATE 预测。

三、这篇论文做了什么¶

三句话¶

① 研究了什么问题：在短期实验 + 长期观测数据融合的设定下，当存在持续混杂 U（同时影响 T、短期结果 S1-S3 与长期结果 Y）时，如何识别与估计平均长期治疗效应（ATE）。
② 核心工具/方法：利用短期结果之间的序贯条件独立结构（S1→S2→S3→Y），将 S1 和 S3 作为「代理变量」，提出三种不同的非参数识别策略（基于逐期条件均值、逆概率加权和倍差法变体），并从条件矩方程出发推导出一个桥函数（bridge function），进而用高效影响函数（EIF）和双鲁棒估计框架构造 n^{-1/2} 收敛的估计量。
③ 主要结论：上述识别策略均是可实现的——即在合理假设下可被非参数识别；对应的基于 EIF 的估计量是渐近正态、n^{-1/2} 收敛的；半合成数据实验（基于 Job Training Partnership Act 数据）验证了方法的有效性，并展示了传统方法（如忽视持续混杂的 Surrogate Index）的显著偏差。

关键设定与假设¶

在第二节的“最小内核”基础上，完整设定包括：

数据组合：Experimental Data (n_exp 个观测，包含 T, S1, S2, S3) + Observational Data (n_obs 个观测，包含 T, S1, S2, S3, Y, X)。
主要假设（其在文中编号可能为 Assumptions 1-4）：
持续性（Persistence）：U 在 S1, S2, S3, Y 的全部时间跨度中稳定存在、不随时间变化（即一个 U，影响所有节点）。
时序条件独立：
- (C1)：\( S_2 \perp (T,U) \mid S_1 \) （S2 在给定 S1 后不受 T 和 U 影响）
- (C2)：\( S_3 \perp (T,S_1,U) \mid S_2 \)
- (C3)：\( Y \perp (T,S_2,U) \mid (S_3, X) \)
一致性（Consistency）：观察到的结果是潜在结果中与处理一致的那个（SUTVA 的一部分）。
正性（Positivity / Overlap）：对每个可能的 S1 取值，T 有非零概率；实验数据中 T ⟂⟂ U（随机分配），因此 T 的边缘分布是已知的。
共同支持（Common Support）：实验数据的 S3 分布在观测数据 S3 的支持内（否则桥函数不能外推到实验数据）。

相比已有文献的放宽/强化： - 相比 Pearson (2019) 的代理指数，放宽了“T⟂⟂Y | S”的充分代理假设（由持续混杂 U 破坏），强化了要求三个短期结果有明确的时序结构。 - 相比 Miao et al. (2016) 的 PCI，放宽了“负控制结果不受 T 影响”的要求（本文的短期结果都受 T 影响），但强化了“短期结果间有时序独立结构”。 - 相比 Imbens et al. (2021) 的线性因子模型，放宽了线性假设（本文为完全非参数），但强化了时序条件独立性假定（这与线性因子模型的假设不完全相同，一般不能互相推出）。

主要结果（理论型，挑 2-3 个最关键定理）¶

定理 1（识别性）：在 Assumptions 1-4 下，存在一个唯一的桥函数 \( h_0(S_3, X) \) 满足

\[E[Y - h_0(S_3, X) \mid S_2, T, X] = 0\]

并且该桥函数的「应用」到实验数据的 S3 上，可以恢复 \( \tau = E[Y(1)] - E[Y(0)] \)。
- 直觉：这个条件矩方程等价于 Y 在给定 (S2, T, X) 下可以被 h0 准确预测；h0 仅含 S3 和 X，从而去除了 U 的影响。 - 必要条件：S1、S2、S3 之间确实满足条件独立链；S2 有足够的信息量以「阻断」U 进入 S3 的路径。 - 解决的技术难点：非参数逆问题——该方程是 Fredholm 第一类积分方程，有 ill-posed 特征；作者引入一个「完全完备性」条件（Completeness）来保证从条件矩方程到唯一解，这与 Piotrcia (2020) 的 PCI 架构类似。

定理 3 + 定理 5（双鲁棒估计量与渐近性质）：基于定理 1 识别的条件矩方程，可构造一个高效影响函数（EIF）的估计量 \(\hat{\tau}\)，其估计方程为：

\[\hat{\tau} = \frac{1}{n_{\text{exp}}} \sum_{i} \hat{h}_0(S_{3i}^{\text{exp}}, X_i^{\text{exp}}) - \frac{1}{n_{\text{obs}}} \sum_{i} \left[ \hat{g}(S_{2i}^{\text{obs}}, T_i^{\text{obs}}, X_i^{\text{obs}}) + \left( Y_i^{\text{obs}} - \hat{h}_0(S_{3i}^{\text{obs}}, X_i^{\text{obs}}) \right) \cdot \hat{w}(S_{2i}^{\text{obs}}, T_i^{\text{obs}}, X_i^{\text{obs}}) \right]\]

其中 \(\hat{h}_0\)、\( \hat{g} \)、\( \hat{w} \) 是从观测数据中估计的 nuisance 函数（分别对应：桥函数、条件均值、逆概率权重）。
- 该估计量满足 Neyman 正交性，即若至少有一个 nuisance 函数被一致估计（n^{-1/4} 率即可），则 \(\hat{\tau}\) 的收敛率是 n^{-1/2} 且渐近正态。 - 与基线方法（Athey et al. 的 Surrogate Index）对比：忽视持续混杂的 Surrogate Index 会产生 O(1) 的偏差（即不一致），而本文方法无此偏差。

定理 7（多种识别策略的等价性）：作者展示了三种具体构造（基于条件期望回补、逆概率加权、倍差法变体）实际上是同一套条件矩方程的不同实现，在假设完全完备时是等价的，但各自的 EIF 和有效性边界可能不同。

证明路线与技术技巧¶

整体路线（4 步）： 1. 桥函数识别：构建条件矩方程（Fredholm 积分方程），利用时序条件独立将 Y 回归到 S3 上，证明存在唯一的 \( h_0 \) 解。 2. 条件矩方程转 EIF：将桥函数的解转化为目标 ATE 的可识别形式，推导其 EIF，使之满足 Neyman 正交性。 3. 分样本交叉拟合（Cross-fitting）：用观测数据的 k 折来估计 h0、g、w，以避免过拟合与控制经验过程界限。 4. 渐近正态性证明：利用 Neyman 正交性 + 交叉拟合 + 关于 nuisance 函数的足够快的估计率（n^{-1/4}），通过经验过程、U-统计量展开与影响函数实现收敛。

关键跳跃点： - 跳跃 1：证明条件矩方程的解 h0 唯一。难点：这是 ill-posed 逆问题，解可能不唯一。作者引入「广义完全完备性条件」（Generalized Completeness），该条件比 Miao et al. (2016) 的「完备性」要弱（因为它不要求满秩），但还须验证在非参数情形下是否可实现。
- 跳跃 2：将 h0 转换为 EIF 时，需要证明从观测数据估计的 g 和 w 对 ATE 的一阶影响是 0——这正是 Neyman 正交性。作者通过引入「经验残差」分析，证明正交性自动满足（以桥函数解为基础）。
- 跳跃 3：从「条件矩方程」到「无条件矩方程」作为估计程序（类似于 GMM）。这需要「筛选」出一个合理的估计方程，使得它的方差模（variance form）易于控制。

技术技巧点名： - Empirical Process + Cross-fitting：控制基于机器学习的 nuisance 参数的误差扩散。 - 双鲁棒（Doubly Robust）估计量中的高阶 U-统计量展开：用于推导估计量的二阶剩余项界限。 - Fredholm 积分方程与广义逆：用于条件矩方程解的存在性与唯一性证明（利用 Picard 定理，参考 Kallus et al. 2021）。 - Minimax Learning as Guidance：虽然没有直接使用 minimax 求解，但桥函数的求解框架借鉴了 Kallus et al. (2021) 的 minimax learning 视角作为动机。

真实例子与应用¶

数据：利用 Job Training Partnership Act (JTPA) 项目的实际数据，构建一个半合成数据集（semi-synthetic data）。原始 JTPA 实验有随机分配与短期结果（如培训后几个月的就业状况），但没有长期长期的就业数据（如 36 个月后）。作者用观测数据（相同人群的非实验样本）生成了长期结果 Y（36 个月就业状况）。此「协变量调整 + 加噪」的合成数据保留了原始数据的协方差结构，且引入了持续混杂 U（定义为：个人基线特征中的未观测维度）。

应用方法：将本文提出的三种识别策略（条件均值、逆概率加权、倍差变体）分别实现为双鲁棒估计量，并与四个基线方法对比： - Baseline 1：直接只用实验数据预测长期——用短期 S3 做代理（Surrogate Index），忽略持续混杂。
- Baseline 2：只用观测数据的标准回归（忽略持续性混杂）。 - Baseline 3：两种方法的简单拼接（先拟合观测数据的回归，再应用到实验数据），同样不处理持续混杂。

结果： - 作者对比了真实长期效应（合成已知）与各方法的估计值，发现本文方法在所有三种识别策略下都能正确恢复（偏差约 0-0.05 SD），而 Baseline 1 有系统性偏差（约 +0.2 SD），Baseline 2 偏差更大（+0.3 SD）。 - 论文还汇报了 95% 置信区间的覆盖：本文方法覆盖率达到 88%-94%（名义为 95%），而 Baseline 方法覆盖不到 50%（显示系统性偏移）。

例子目的：验证当持续混杂真实存在时，忽视它的方法（Surrogate Index 或单源观测数据）会系统性地高估/低估长期效应，而本文方法能正确消除偏差；也展示了本文方法对有限样本的实际可行性。

🔎 结论是否比证明窄¶

识别策略的条件是否充足：定理 1 要求 S2 对 U 有「足够的信息量」以阻断路径——这在数学上被编码为「完全完备性」（Completeness）条件。然而，该条件在非参数设定下是难以验证的。作者在 Section 4.2 和 5.2 中承认这一点（「在无限维非参数空间中，完备性假设可能非常强」）；但在主定理版本中，作者使用了较弱的“广义完备性”，这实际上仍然是一个很强的假设。结论边界的缩小：本文的识别定理是所有后续估计的基础，但前提条件（完备性）在实践中的可验证性有限。
时序独立性是否可过期：C1–C3 是一组预设的条件独立关系，通常只能从科学知识或随机化实验中得到——如果研究者无法确认 S1 → S2 → S3 → Y 的因果链（可能 S1 不能阻断 U→S2，等等），则整个框架可能无效。作者的结论部分明确标注为“在 Condition 1–4 下”，但未来可能被放宽到部分 OP 替换的情形。
幂等性：作者证明 EIF 估计量的渐近正态性要求 nuisance 函数的估计率至少为 n^{-1/4}——这在实践中可能难以用深度神经等复杂模型验证，尽管理论上是可达到的。并无额外的「放松」被证明。

四、开放问题（扎根具体语句）¶

放宽完全完备性假设
原文 Section 5.4 指出：「我们的识别证明了唯一解的存在性，但完全完备性条件可能太强。在实践中可采用正定核或正则化技巧来近似求解，但规范性理论仍有待建立。」这是本文留下最明显的开放问题：是否可以在不要求完全完备性的前提下，通过极小化条件矩方程的最大偏差（如 minimax learning 框架）来识别因果效应？如果能，那么可行条件矩方程中参数的含义（可识别的是什么）就变成新问题。
将 S1 和 S3 作为多维变量处理时的维度灾难与计算成本
原文所有识别推导假设 S1、S2、S3 是低维（甚至一维）。但在真实应用中，短期结果可能是高维的（如多种生理指标、多时点问卷评分）。作者在 Section 5.2 只是简单提到：「高维设定下，经验过程可能会更慢。」但没有给出具体的 minimax 率或假设——这需要做完整的非参数回归率 + ill-posedness 的分析。特别是，当高维数据通过桥函数转化为 Fredholm 方程时，特征值衰减速度会如何影响收敛率？与此相关的，是否有统计-计算之间的权衡（例如近期模型可用低度多项式屏障刻画）？
多重比较问题——多个短期结果下的同时推断
本文考虑的是恰好三个短期结果（S1, S2, S3）。但实际中可能有更多（S1,…,SK），且 K 随样本量增长。目前的时序条件独立结构需要每一个 S_k 都对下级 S_{k+1} 有阻断作用，这随着 K 增加而快速紧化。当 K 很大或是不规则时，如何选择足够但不过多的短期结果来维持条件独立性？该问题作者仅在 intro 中提了一句「理论上可扩展到更多短期结果」，但补全该扩展所需的完整渐近分析（以及如何节约估计的复杂度）是一个重要开放问题。
更一般的非参数时序依赖结构
C1–C3 本质上是「马尔可夫链假设」——给定前一个状态，当前状态独立于更早的状态和 U。如果 U 不是时不变的，而是缓慢变化的（如图中的「不确定时序依赖」），则 C2 和 C3 可能不成立。可以设计一种「非参数 latent factor + 核方法」来替代简单的条件独立性假设，但目前尚未被处理。原文 Section 6 的「future work」中提到了「对过度时间平滑的持续混杂进行建模」，但未提供具体路径。

提醒：要检验这些是否是真 gap，建议去读同方向（数据融合+PCI）近 5 篇的 intro 并确认它们是否共识性地指向上述某条。如果是共识，则是已被定义好的 gap；如果不同论文互相给出不同的归纳，则可能是新机会。

Maintained by 陈星宇 · Homepage · Source on GitHub