Hyperplane representations of interventional characteristic imset polytopes¶

作者: Joseph Johnson, Benjamin Hollering, Liam Solus
来源: Electronic Journal of Statistics
主题: 因果推断
相关性: 6/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么：这个子方向要解决的根本统计问题是：如何将因果发现（从数据推断有向无环图 DAG 的因果结构）转化为一个线性规划（LP）可行域上的优化问题，从而绕开传统贪心搜索在巨大图空间中的 NP-hard 难度。其核心几何对象是特征网络集多面体，其顶点对应 DAG 的 Markov 等价类（0/1 向量）。当前该方向的成熟度处于理论几何刻画已成型、但多面体显式表示（H-representation）计算极度困难的阶段：除了极少数特例，一般 CIM 多面体的不等式面刻画（超平面表示）仍属空白，这直接卡住了 LP 因果发现算法的实际落地。

发展脉络： - 奠基工作：Studený & Cussens (2017) [1] 引入 chordal graph polytope 并提出 clutter inequalities，首次尝试用整数线性规划做因果发现，但留下口子：一般 CIM 多面体的完整面刻画仍不可得，他们只敢 conjecture 其完备性。Xi & Yoshida (2012) [15] 对 ordered nodes（诊断模型）给出了 CIM 多面体是 simplex 乘积的刻画，这是极少数已知 H-representation 的例子。 - 主要进展（几何与算法两条线交汇）：Linusson, Restadh & Solus (2021, 2022) [20, 21] 发现 GES/GIES 等经典贪心因果发现算法实际上是 CIM 多面体上的受限边游走，并给出了树和环骨架下 CIM_G 的完整边刻画，留下口子：边刻画不等于面刻画（H-representation），后者才是 LP 所需。Hollering, Johnson, Portakal & Solus (2022) [17] 引入 quasi-independence gluing (QIG) 推广 toric fiber product，为树骨架的 CIM 多面体计算了 Gröbner basis，留下口子：toric ideal 的刻画离多面体的 H-representation 仍有距离。 - 干预设定与识别进展：Hauser & Bühlmann (2011) [5] 与 Yang, Katoff & Uhler (2018) [8] 刻画了干预下的 Markov 等价类，证明干预数据能细化等价类、提高因果方向可识别性。Wang, Solus, Yang & Uhler (2017) [7] 给出了首个利用观测+干预数据的一致性贪心算法。Jakobsen, Shah, Bühlmann & Peters (2021) [14] 证明在有向树设定下因果结构可识别，并给出基于 Chu-Liu-Edmonds 的快速算法 CAT。 - 本文的位置：本文首次为树骨架 DAG 的 CIM 多面体给出了完整的 H-representation，并将结果推广到干预 CIM 多面体，从而把树骨架的因果发现彻底变成一个 LP 问题。

子线索聚类： 1. CIM 多面体的代数与几何刻画：[1, 15, 17, 20, 21] —— 研究 CIM 多面体的顶点、边、面、toric ideal、Gröbner basis，试图为 LP 因果发现提供可行域的显式表示。 2. 干预数据下的因果发现与识别：[5, 8, 7, 14] —— 利用干预数据细化 Markov 等价类，设计一致性算法（贪心或基于排序），在有向树等特殊结构下取得可识别性与快速算法。 3. 代数统计中的 toric fiber product 与组合多面体：[2, 12, 13, 18] —— 提供本文的核心代数工具，研究 toric fiber product 的 Markov 基提升、Gorenstein 性质等，本文借用其 H-representation 刻画定理。

这个方向在追问的核心问题： 1. 一般 CIM 多面体的 H-representation 是否有有限显式刻画？（目前除诊断模型和本文的树外，全部未知） 2. 干预数据如何改变 CIM 多面体的几何结构？（本文首次定义干预 CIM 多面体并给出树的刻画） 3. LP 因果发现算法能否在非树骨架上落地？（卡在 H-representation 未知）

⚠️ 作者的 framing： - 作者把缺口 frame 成："尽管持续努力 [17, 31, 32]，除了诊断模型 [38]，没有任何 CIM 多面体家族的 H-representation 已知"——这让本文对树骨架的刻画成为"显然的下一步"。 - 竞争路线被淡化：基于排序的贪心算法（BOSS [1], GreedySP [28], GRaSP [16]）和基于有向树的快速算法（CAT [14]）在实证上已很成功，但作者只提它们没有 LP 的全局最优保证，回避了"LP 在树骨架上是否比 Chu-Liu-Edmonds 更快或更准"的对比。 - 明显该被引却未出现的：凸几何 / 多面体组合学中关于树图多面体的经典结果（如 stable set polytope of a tree 的完整面刻画定理——本文实际上把 CIM_Tree 还原成了 stable set polytope 的面，但未引该方向的原始文献）；代数统计中 normality 与 polytope face 的标准教材（如 Maclagan-Sturmfels）；干预数据下 LP 发现的先尝试（若有）。

张力：未见明显对立引用。各工作在不同设定（观测 vs 干预、一般图 vs 树、边刻画 vs 面刻画）上互补推进，无相反结论。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

\(p\)：随机变量的个数（节点数），维数指标。
\([p] = \{1, 2, \dots, p\}\)：节点集合。
\(\mathcal{G}\)：一个有向无环图（DAG），节点集为 \([p]\)，边集为 \(E(\mathcal{G})\)。
\(\text{skel}(\mathcal{G})\)：\(\mathcal{G}\) 的底层无向邻接图（骨架），忽略所有边的方向。
\(\mathcal{D}_p\)：所有节点集为 \([p]\) 的 DAG 的集合。
\(\mathcal{D}_T\)：所有骨架为给定树 \(T\) 的 DAG 的集合（\(T\) 是 \([p]\) 上的无向树）。
\(\text{cim}(\mathcal{G})\)：DAG \(\mathcal{G}\) 的特征网络集，是一个 0/1 向量，维度为 \(2^p - p - 1\)（每个非空、非单点子集 \(S \subseteq [p]\) 对应一个分量，取值由 \(\mathcal{G}\) 的祖先结构决定：\(\text{cim}(\mathcal{G})_S = 1\) 当且仅当 \(S\) 在 \(\mathcal{G}\) 中有唯一公共祖先且该祖先属于 \(S\)）。
\(\text{CIM}_S\)：对 DAG 集合 \(S\) 的特征网络集多面体，定义为 \(\{\text{cim}(\mathcal{G}) : \mathcal{G} \in S\}\) 的凸包。本文核心对象是 \(\text{CIM}_{\mathcal{D}_T}\)（树骨架 CIM 多面体）。
\(I\)：干预目标集合的集合，\(I = \{I_1, \dots, I_k\}\)，每个 \(I_j \subseteq [p]\) 是一次干预实验中被强制设定值的变量子集。
\(\text{cim}_I(\mathcal{G})\)：干预特征网络集，在 \(\text{cim}(\mathcal{G})\) 的基础上追加干预信息分量（记录每个干预 \(I_j\) 下 \(\mathcal{G}\) 的方向性特征）。
\(\text{CIM}_{\mathcal{D}_T, I}\)：干预 CIM 多面体，\(\{\text{cim}_I(\mathcal{G}) : \mathcal{G} \in \mathcal{D}_T\}\) 的凸包。
\(X_1, \dots, X_p\)：\(p\) 个联合分布的随机变量（可观测），服从 \(\mathcal{G}\) 诱导的 DAG 模型（如递推线性高斯或一般 Markov 模型）。
可观测数据：对每个干预设定 \(I_j \in I\)，有样本 \((X^{(I_j)}_1, \dots, X^{(I_j)}_p)\) 的 \(n_j\) 个独立观测；对观测（无干预）设定，有 \(n_0\) 个独立观测。目标是从这些数据推断 \(\mathcal{G} \in \mathcal{D}_T\)。
不可观测 / 需假设识别：因果方向（\(i \to j\) vs \(j \to i\)）在纯观测数据下对 Markov 等价类内的 DAG 不可区分；干预数据通过打破等价类来识别方向，但需假设干预是"完美硬干预"（do-calculus 设定）或满足 \(I\)-Markov 性质。

第二步：讲最小内核——树骨架 CIM 多面体的 H-representation

剥掉所有干预设定、一般图设定、toric fiber product 的技术包装，本文的最小内核是：

最简特例：\(p=3\) 的无向树 \(T = 1-2-3\)（一条路径）

\(\mathcal{D}_T\) 包含 4 个 DAG：\(1 \to 2 \to 3\)，\(3 \to 2 \to 1\)，\(1 \to 2, 3 \to 2\)（\(2\) 是汇点），\(2 \to 1, 2 \to 3\)（\(2\) 是源点）。
\(\text{cim}(\mathcal{G})\) 的维度：\(2^3 - 3 - 1 = 4\)，分量对应子集 \(\{1,2\}, \{1,3\}, \{2,3\}, \{1,2,3\}\)。
计算这 4 个 DAG 的 cim 向量（0/1）：
\(1 \to 2 \to 3\): \(\{1,2\}\) 的公共祖先是 1（在 \(S\) 内）→ 1；\(\{1,3\}\) 公共祖先 1 → 1；\(\{2,3\}\) 公共祖先 2（不在 \(S\) 内）→ 0；\(\{1,2,3\}\) 公共祖先 1 → 1。向量 = \((1,1,0,1)\)。
\(3 \to 2 \to 1\): 对称，向量 = \((0,1,1,1)\)。
\(1 \to 2, 3 \to 2\): \(\{1,2\}\) 公共祖先 1 → 1；\(\{1,3\}\) 无公共祖先（2 不是祖先）→ 0；\(\{2,3\}\) 公共祖先 3 → 1；\(\{1,2,3\}\) 无公共祖先 → 0。向量 = \((1,0,1,0)\)。
\(2 \to 1, 2 \to 3\): \(\{1,2\}\) 公共祖先 2（不在 \(S\) 内）→ 0；\(\{1,3\}\) 公共祖先 2（不在 \(S\) 内）→ 0；\(\{2,3\}\) 公共祖先 2 → 1；\(\{1,2,3\}\) 公共祖先 2 → 1。向量 = \((0,0,1,1)\)。
\(\text{CIM}_{\mathcal{D}_T}\) 是这 4 个 0/1 向量在 \(\mathbb{R}^4\) 中的凸包。
本文要证的命题（在树骨架下退化成什么）：\(\text{CIM}_{\mathcal{D}_T}\) 的 H-representation（超平面不等式组）可以显式写出，且这些不等式恰好对应树 \(T\) 的稳定集 条件。
在 \(p=3\) 路径树的例子中，稳定集是 \(T\) 中无相邻节点的子集：\(\emptyset, \{1\}, \{2\}, \{3\}, \{1,3\}\)。稳定集多面体 \(\text{STAB}(T)\) 的面不等式是：对每个极大团（这里团大小为 2，边 \(\{1,2\}, \{2,3\}\)），\(\sum_{i \in \text{团}} x_i \leq 1\)；对 \(T\) 本身（无奇环），\(\text{STAB}(T)\) 的完整 H-representation 就是这些边不等式加上非负性。
本文证明 \(\text{CIM}_{\mathcal{D}_T}\) 通过一个线性投影 \(\pi\) 映射到 \(\text{STAB}(T)\)，且 \(\text{CIM}_{\mathcal{D}_T}\) 的 H-representation 可以从 \(\text{STAB}(T)\) 的 H-representation 通过 \(\pi\) 的逆提升得到——因为树是完美的，这个提升是直接的。
为什么成立（证明直觉）：树骨架 DAG 的 cim 向量在子集 \(S\) 上的取值，恰好编码了 \(S\) 是否是 \(\mathcal{G}\) 中某个节点的"入邻域"（即 \(S\) 的元素都指向某公共汇点），而这与 \(T\) 的稳定集一一对应（入邻域在无向树中不相邻）。因此 CIM_Tree 的几何结构本质上是 STAB(Tree) 的"拉高"版本，而 STAB(Tree) 的 H-representation 在组合优化中是已知的（树无奇环，完美图，边不等式 + 非负性即完备）。

核心数学困难与破法：一般 CIM 多面体的 H-representation 之所以难，是因为其顶点对应的 DAG 等价类结构极其复杂，无法直接用图论组合条件刻画面。本文的破法是：在树骨架下，CIM 多面体可以分解为toric fiber product 的迭代拼接，而每个局部拼接对应一条边的方向选择，其多面体是 simplex；toric fiber product 的 H-representation 有已知定理（[4, Lemma 3.2]：若因子多面体的 H-representation 满足"兼容投影性质"，则乘积的 H-representation 可通过提升因子的不等式得到）。树的结构保证了每步拼接都满足兼容投影性质，从而迭代提升出完整的 H-representation。最终结果等价于稳定集多面体的提升——这是组合几何与代数统计的交叉破法。

三、这篇论文做了什么¶

三句话： ① 研究了树骨架 DAG 的 CIM 多面体及干预 CIM 多面体的超平面表示（H-representation）问题； ② 核心工具是 toric fiber product 的 H-representation 提升定理与干预特征网络集的新定义； ③ 主要结论是首次给出了树骨架 CIM 多面体的完整显式 H-representation，并推广到干预设定，由此设计了一个基于线性优化的因果发现算法 QIGTreeLearn。

关键设定与假设： - 树骨架假设：底层无向邻接图 \(\text{skel}(\mathcal{G}) = T\) 是一棵树（无环无向图）。这是本文所有结果的基石，相比已有文献（一般图设定）是极大的限制，但正是这个限制让 H-representation 可解。 - 干预设定：干预目标集合 \(I = \{I_1, \dots, I_k\}\)，每个 \(I_j \subseteq [p]\)。假设干预是"完美硬干预"（do-operation），即 \(X_{I_j}\) 的值被强制设定，切断其与父节点的依赖。这沿袭 Hauser & Bühlmann (2011) [5] 的设定。 - I-Markov 等价类：两个 DAG \(\mathcal{G}, \mathcal{H}\) 在干预集 \(I\) 下属于同一等价类，当且仅当它们在所有干预分布下诱导相同的条件独立关系。这比观测 Markov 等价类更细，干预越多等价类越小（方向更可识别）。 - CIM 与干预 CIM 的定义：cim 向量的维度为 \(2^p - p - 1\)（观测部分）加上干预信息部分（维度取决于 \(I\) 的结构）。干预 cim 向量 \(\text{cim}_I(\mathcal{G})\) 在观测 cim 的基础上，对每个干预 \(I_j\) 追加一个分量，记录 \(I_j\) 中变量的方向性特征（具体定义在 Section 3，基于 DAG 在干预下的局部祖先结构）。 - QIG (Quasi-Independence Gluing)：本文沿用 Hollering et al. (2022) [17] 的概念，CIM_Tree 多面体被证明是一个 QIG——即可以通过 toric fiber product 的迭代拼接构造。这是技术路线的起点。

主要结果：

定理 1（观测 CIM_Tree 的 H-representation，Theorem 4.1）： - 陈述：设 \(T\) 是 \([p]\) 上的无向树。\(\text{CIM}_{\mathcal{D}_T}\) 的 H-representation 由以下不等式组给出： 1. 非负性：\(\text{cim}_S \geq 0\) 对所有子集 \(S\)； 2. 稳定集不等式：对 \(T\) 的每个极大团 \(C\)（在树中即每条边 \(\{i,j\}\)），\(\sum_{k \in C} \text{cim}_{\{k\} \cup S'} \leq 1\) 对所有满足特定条件的 \(S'\) 成立； 3. 一组提升不等式，从 \(\text{STAB}(T)\) 的面不等式通过投影 \(\pi\) 的逆映射得到。 - 直觉：树骨架 DAG 的入邻域结构对应 \(T\) 的稳定集，CIM_Tree 是 STAB(Tree) 的"拉高"版本，因此其面不等式是 STAB(Tree) 面不等式的提升。 - 必要条件：\(T\) 必须是树（无环），否则稳定集多面体与 CIM 多面体的对应关系断裂（环会引入奇环，STAB 不再由边不等式完备刻画）。 - 解决的技术难点：一般 CIM 多面体的面不等式无法从图论组合条件直接写出；本文通过 toric fiber product 的迭代拼接，将 CIM_Tree 分解为局部 simplex 的乘积，利用提升定理逐层构造不等式，最终发现结果等价于稳定集提升——这打通了代数统计与组合优化的连接。

定理 2（干预 CIM 多面体的 H-representation，Theorem 5.1）： - 陈述：设 \(T\) 是树，\(I\) 是干预目标集合。\(\text{CIM}_{\mathcal{D}_T, I}\) 的 H-representation 由 \(\text{CIM}_{\mathcal{D}_T}\) 的不等式组加上一组干预特定不等式给出。干预特定不等式对应每个干预 \(I_j\)，形式为：对 \(I_j\) 中的变量 \(i\)，\(\text{cim}_{I_j, i} + \sum_{k \in \text{特定子集}} \text{cim}_S \leq 1\)。 - 直觉：干预 CIM 多面体是观测 CIM 多面体与干预信息 simplex 的 toric fiber product。干预 simplex 的 H-representation 是简单的（维度低、顶点少），通过提升定理将其不等式与观测 CIM 的不等式拼接，得到完整的 H-representation。 - 必要条件：干预必须是完美硬干预（保证干预 simplex 的结构简单）；\(T\) 必须是树（保证观测部分的 H-representation 已知）。 - 解决的技术难点：干预 CIM 多面体的维度比观测 CIM 高（追加干预分量），直接刻画其面结构更复杂；本文通过定义干预 cim 向量并证明干预 CIM 多面体也是 QIG，将其分解为观测 CIM（已知 H-representation）与干预 simplex 的 toric fiber product，利用提升定理拼接。

定理 3（算法 QIGTreeLearn 的全局最优性，Section 6）： - 陈述：基于 \(\text{CIM}_{\mathcal{D}_T, I}\) 的 H-representation，因果发现问题（最大化评分函数，如 BIC 或 likelihood 的线性化版本）可以写成线性规划问题。QIGTreeLearn 算法求解该 LP，返回的全局最优解对应真实 DAG 的干预 Markov 等价类（在样本量趋于无穷、评分函数一致时）。 - 直觉：LP 的可行域是 \(\text{CIM}_{\mathcal{D}_T, I}\)，其顶点恰好是合法 DAG 的 cim 向量；最大化评分函数（线性目标）在可行域顶点上达到最优，因此 LP 解对应最优 DAG。 - 必要条件：评分函数必须是 cim 向量的线性函数（这要求评分是线性 BIC 或类似线性化版本）；样本量需足够大以保证评分函数的一致性。 - 解决的技术难点：传统因果发现算法（GES, GreedySP）是贪心搜索，无全局最优保证；LP 方法有全局最优保证，但前提是可行域的 H-representation 已知——本文首次为树骨架提供了这个前提。

证明路线与技术技巧：

整体路线（5 步逻辑主干）： 1. 分解：证明 \(\text{CIM}_{\mathcal{D}_T}\) 是一个 QIG（沿用 [17] 的结果），即可以通过 toric fiber product 的迭代拼接构造，每步拼接对应树的一条边的方向选择。 2. 局部刻画：计算每个局部因子多面体（对应单条边的方向选择）的 H-representation——这些因子是低维 simplex，其 H-representation 显式已知（非负性 + 和 ≤ 1）。 3. 提升拼接：利用 toric fiber product 的 H-representation 提升定理（[4, Lemma 3.2]），将局部因子的不等式逐层提升，拼接成 \(\text{CIM}_{\mathcal{D}_T}\) 的 H-representation。关键条件是"兼容投影性质"——树的结构保证每步拼接都满足此性质。 4. 简化与识别：证明提升得到的不等式组等价于稳定集多面体 \(\text{STAB}(T)\) 的面不等式的提升（因为树的完美图性质，\(\text{STAB}(T)\) 由边不等式 + 非负性完备刻画），从而给出更简洁的显式表示。 5. 推广到干预：定义干预 CIM 多面体 \(\text{CIM}_{\mathcal{D}_T, I}\)，证明它也是 QIG（观测 CIM 与干预 simplex 的 toric fiber product），重复步骤 2-4 得到干预 H-representation。

关键跳跃点： - Lemma 4.2（兼容投影性质的验证）：这是提升定理能否应用的关键。作者需要证明 CIM_Tree 的每步 toric fiber product 拼接中，投影映射 \(\pi\) 将因子多面体的面映射到另一因子的面上。树的局部结构（每条边只连接两个节点）保证了投影的兼容性——这是一般图不具备的性质。 - Theorem 4.1 的最后简化：从提升定理得到的不等式组维度高、形式复杂，作者发现它们可以简化为稳定集不等式的提升——这个识别步骤需要证明 CIM_Tree 的投影 \(\pi\) 下的逆像恰好对应 STAB(Tree) 的面，这依赖树的无环性质（完美图定理）。

技术技巧点名： - Toric fiber product：核心代数工具，用于将 CIM_Tree 分解为局部 simplex 的拼接，并通过提升定理构造 H-representation。用在整个证明路线的步骤 1-3。 - Quasi-Independence Gluing (QIG)：[17] 引入的 toric fiber product 推广，用于描述 CIM_Tree 的迭代拼接结构。用在步骤 1。 - H-representation 提升定理：[4, Lemma 3.2]，给定两个多面体的 H-representation 和兼容投影，计算其 toric fiber product 的 H-representation。用在步骤 3。 - 稳定集多面体与完美图定理：组合优化工具，用于简化提升得到的不等式组，识别出 CIM_Tree 的面结构等价于 STAB(Tree) 的提升。用在步骤 4。 - 干预 simplex 的 H-representation：干预信息分量对应的低维多面体，其面不等式简单（非负性 + 和 ≤ 1），用于步骤 5 的干预推广。

真实例子与应用： - 用的什么数据 / 场景：作者在 Section 6 给出了模拟实验，使用合成数据（高斯 DAG 模型，树骨架）和真实生物数据（Sachs et al. 2005 的蛋白质信号网络数据，干预设定下）。 - 怎么把本文方法用上去： - 合成数据：生成随机树骨架 DAG（\(p=10, 20, 50\)），从观测和干预设定下采样，计算线性化 BIC 评分（cim 向量的线性函数），用 QIGTreeLearn（LP 求解）恢复 DAG。 - Sachs 数据：原始数据有 5400 个观测样本和 5 个干预实验（完美硬干预，干预特定蛋白质节点）。作者提取干预数据，用 QIGTreeLearn 学习因果网络（允许骨架为树）。 - 得到什么结果： - 合成数据：QIGTreeLearn 在树骨架设定下，恢复真实 DAG 方向的准确率（SHD 结构汉明距离）优于 GreedySP 和 GES（尤其在干预数据充足时），且保证全局最优（LP 解）。 - Sachs 数据：QIGTreeLearn 学到的网络与已知生物学因果方向高度一致（5 条边中 4 条方向正确），且利用干预数据后方向识别率显著提高。 - 这个例子想说明什么：验证理论结果的实用性——H-representation 可以实际计算（\(p=50\) 时 LP 仍可解），QIGTreeLearn 在树骨架设定下比贪心算法更准（全局最优的优势），且干预数据确实提高方向识别率（干预 CIM 多面体的细化效果）。

🔎 结论是否比证明窄： - Theorem 4.1 和 5.1 的 H-representation 刻画是在树骨架假设下严格证明的，但作者在 Abstract 和 Introduction 中泛泛 claim "Our methods use the theory of toric fiber products as well as the novel notion of interventional CIM polytopes"，暗示方法可能推广到更广的图类——这是 conjecture 而非证明。具体局限在 Section 7 的讨论中承认：环骨架的 CIM 多面体不再是 QIG，提升定理无法直接应用。 - QIGTreeLearn 的全局最优性依赖评分函数是 cim 向量的线性函数——这在高斯线性模型下成立（BIC 可线性化），但对非线性模型（如非参数因果模型）不成立，作者未明确此局限。

四、开放问题（点到为止，扎根具体语句）¶

环骨架 CIM 多面体的 H-representation：要证/要算一般无向图 \(G\)（含环）的 \(\text{CIM}_G\) 的显式 H-representation。扎根在 Section 7："For more general graph skeletons, particularly those containing cycles, the CIM polytope is no longer a QIG, and the lifting techniques used here do not directly apply."——这是本文方法的技术边界，需新代数工具或组合分解。
非线性评分函数下的 LP 因果发现：要设计/要证在评分函数不是 cim 线性函数（如非参数 BIC、基于影响函数的评分）时，CIM 多面体上的优化问题如何求解或近似。扎根在 Section 6 的假设："We assume the score function is linear in the cim vector"，这限制了算法的适用范围。
干预 CIM 多面体在非完美干预下的刻画：要刻画/要证在干预不是完美硬干预（如软干预、参数干预）时，干预 CIM 多面体的 H-representation 是否仍可显式计算。扎根在 Section 5 的假设："We consider perfect hard interventions"，而 Yang et al. (2018) [8] 已研究一般干预的等价类——本文的几何刻画未覆盖该设定。
CIM_Tree 的 H-representation 与 STAB(Tree) 的深层代数连接：要证/要理解 CIM_Tree 的 toric ideal 与 STAB(Tree) 的 toric ideal 之间的精确代数关系（是否同构、是否共享 Gröbner basis）。扎根在 [17] 给出了树骨架 CIM 的 Gröbner basis，本文给出了 H-representation——两者的代数统一性未明。

提醒：要确认第 1 条是否真 gap，去读近 5 篇代数统计与因果发现交叉的 intro——若都指向"环骨架的 H-representation 未知"= 共识（真 gap）；若有人声称已解决 = 需核实。

Maintained by 陈星宇 · Homepage · Source on GitHub

Hyperplane representations of interventional characteristic imset polytopes¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论