Hyperplane representations of interventional characteristic imset polytopes¶
作者: Joseph Johnson, Benjamin Hollering, Liam Solus
来源: Electronic Journal of Statistics
主题: 因果推断
相关性: 6/10
链接: 期刊页 · arXiv
一、领域脉络与小综述¶
这个方向是什么: 这个子方向要解决的根本统计问题是:如何将因果发现(从数据推断有向无环图 DAG 的因果结构)转化为一个线性规划(LP)可行域上的优化问题,从而绕开传统贪心搜索在巨大图空间中的 NP-hard 难度。其核心几何对象是特征网络集多面体,其顶点对应 DAG 的 Markov 等价类(0/1 向量)。当前该方向的成熟度处于理论几何刻画已成型、但多面体显式表示(H-representation)计算极度困难的阶段:除了极少数特例,一般 CIM 多面体的不等式面刻画(超平面表示)仍属空白,这直接卡住了 LP 因果发现算法的实际落地。
发展脉络: - 奠基工作:Studený & Cussens (2017) [1] 引入 chordal graph polytope 并提出 clutter inequalities,首次尝试用整数线性规划做因果发现,但留下口子:一般 CIM 多面体的完整面刻画仍不可得,他们只敢 conjecture 其完备性。Xi & Yoshida (2012) [15] 对 ordered nodes(诊断模型)给出了 CIM 多面体是 simplex 乘积的刻画,这是极少数已知 H-representation 的例子。 - 主要进展(几何与算法两条线交汇):Linusson, Restadh & Solus (2021, 2022) [20, 21] 发现 GES/GIES 等经典贪心因果发现算法实际上是 CIM 多面体上的受限边游走,并给出了树和环骨架下 CIM_G 的完整边刻画,留下口子:边刻画不等于面刻画(H-representation),后者才是 LP 所需。Hollering, Johnson, Portakal & Solus (2022) [17] 引入 quasi-independence gluing (QIG) 推广 toric fiber product,为树骨架的 CIM 多面体计算了 Gröbner basis,留下口子:toric ideal 的刻画离多面体的 H-representation 仍有距离。 - 干预设定与识别进展:Hauser & Bühlmann (2011) [5] 与 Yang, Katoff & Uhler (2018) [8] 刻画了干预下的 Markov 等价类,证明干预数据能细化等价类、提高因果方向可识别性。Wang, Solus, Yang & Uhler (2017) [7] 给出了首个利用观测+干预数据的一致性贪心算法。Jakobsen, Shah, Bühlmann & Peters (2021) [14] 证明在有向树设定下因果结构可识别,并给出基于 Chu-Liu-Edmonds 的快速算法 CAT。 - 本文的位置:本文首次为树骨架 DAG 的 CIM 多面体给出了完整的 H-representation,并将结果推广到干预 CIM 多面体,从而把树骨架的因果发现彻底变成一个 LP 问题。
子线索聚类: 1. CIM 多面体的代数与几何刻画:[1, 15, 17, 20, 21] —— 研究 CIM 多面体的顶点、边、面、toric ideal、Gröbner basis,试图为 LP 因果发现提供可行域的显式表示。 2. 干预数据下的因果发现与识别:[5, 8, 7, 14] —— 利用干预数据细化 Markov 等价类,设计一致性算法(贪心或基于排序),在有向树等特殊结构下取得可识别性与快速算法。 3. 代数统计中的 toric fiber product 与组合多面体:[2, 12, 13, 18] —— 提供本文的核心代数工具,研究 toric fiber product 的 Markov 基提升、Gorenstein 性质等,本文借用其 H-representation 刻画定理。
这个方向在追问的核心问题: 1. 一般 CIM 多面体的 H-representation 是否有有限显式刻画?(目前除诊断模型和本文的树外,全部未知) 2. 干预数据如何改变 CIM 多面体的几何结构?(本文首次定义干预 CIM 多面体并给出树的刻画) 3. LP 因果发现算法能否在非树骨架上落地?(卡在 H-representation 未知)
⚠️ 作者的 framing: - 作者把缺口 frame 成:"尽管持续努力 [17, 31, 32],除了诊断模型 [38],没有任何 CIM 多面体家族的 H-representation 已知"——这让本文对树骨架的刻画成为"显然的下一步"。 - 竞争路线被淡化:基于排序的贪心算法(BOSS [1], GreedySP [28], GRaSP [16])和基于有向树的快速算法(CAT [14])在实证上已很成功,但作者只提它们没有 LP 的全局最优保证,回避了"LP 在树骨架上是否比 Chu-Liu-Edmonds 更快或更准"的对比。 - 明显该被引却未出现的:凸几何 / 多面体组合学中关于树图多面体的经典结果(如 stable set polytope of a tree 的完整面刻画定理——本文实际上把 CIM_Tree 还原成了 stable set polytope 的面,但未引该方向的原始文献);代数统计中 normality 与 polytope face 的标准教材(如 Maclagan-Sturmfels);干预数据下 LP 发现的先尝试(若有)。
张力: 未见明显对立引用。各工作在不同设定(观测 vs 干预、一般图 vs 树、边刻画 vs 面刻画)上互补推进,无相反结论。
二、最核心、最简单的例子 / 数学问题¶
第一步:符号、模型、可观测数据交代清楚
- \(p\):随机变量的个数(节点数),维数指标。
- \([p] = \{1, 2, \dots, p\}\):节点集合。
- \(\mathcal{G}\):一个有向无环图(DAG),节点集为 \([p]\),边集为 \(E(\mathcal{G})\)。
- \(\text{skel}(\mathcal{G})\):\(\mathcal{G}\) 的底层无向邻接图(骨架),忽略所有边的方向。
- \(\mathcal{D}_p\):所有节点集为 \([p]\) 的 DAG 的集合。
- \(\mathcal{D}_T\):所有骨架为给定树 \(T\) 的 DAG 的集合(\(T\) 是 \([p]\) 上的无向树)。
- \(\text{cim}(\mathcal{G})\):DAG \(\mathcal{G}\) 的特征网络集,是一个 0/1 向量,维度为 \(2^p - p - 1\)(每个非空、非单点子集 \(S \subseteq [p]\) 对应一个分量,取值由 \(\mathcal{G}\) 的祖先结构决定:\(\text{cim}(\mathcal{G})_S = 1\) 当且仅当 \(S\) 在 \(\mathcal{G}\) 中有唯一公共祖先且该祖先属于 \(S\))。
- \(\text{CIM}_S\):对 DAG 集合 \(S\) 的特征网络集多面体,定义为 \(\{\text{cim}(\mathcal{G}) : \mathcal{G} \in S\}\) 的凸包。本文核心对象是 \(\text{CIM}_{\mathcal{D}_T}\)(树骨架 CIM 多面体)。
- \(I\):干预目标集合的集合,\(I = \{I_1, \dots, I_k\}\),每个 \(I_j \subseteq [p]\) 是一次干预实验中被强制设定值的变量子集。
- \(\text{cim}_I(\mathcal{G})\):干预特征网络集,在 \(\text{cim}(\mathcal{G})\) 的基础上追加干预信息分量(记录每个干预 \(I_j\) 下 \(\mathcal{G}\) 的方向性特征)。
- \(\text{CIM}_{\mathcal{D}_T, I}\):干预 CIM 多面体,\(\{\text{cim}_I(\mathcal{G}) : \mathcal{G} \in \mathcal{D}_T\}\) 的凸包。
- \(X_1, \dots, X_p\):\(p\) 个联合分布的随机变量(可观测),服从 \(\mathcal{G}\) 诱导的 DAG 模型(如递推线性高斯或一般 Markov 模型)。
- 可观测数据:对每个干预设定 \(I_j \in I\),有样本 \((X^{(I_j)}_1, \dots, X^{(I_j)}_p)\) 的 \(n_j\) 个独立观测;对观测(无干预)设定,有 \(n_0\) 个独立观测。目标是从这些数据推断 \(\mathcal{G} \in \mathcal{D}_T\)。
- 不可观测 / 需假设识别:因果方向(\(i \to j\) vs \(j \to i\))在纯观测数据下对 Markov 等价类内的 DAG 不可区分;干预数据通过打破等价类来识别方向,但需假设干预是"完美硬干预"(do-calculus 设定)或满足 \(I\)-Markov 性质。
第二步:讲最小内核——树骨架 CIM 多面体的 H-representation
剥掉所有干预设定、一般图设定、toric fiber product 的技术包装,本文的最小内核是:
最简特例:\(p=3\) 的无向树 \(T = 1-2-3\)(一条路径)
- \(\mathcal{D}_T\) 包含 4 个 DAG:\(1 \to 2 \to 3\),\(3 \to 2 \to 1\),\(1 \to 2, 3 \to 2\)(\(2\) 是汇点),\(2 \to 1, 2 \to 3\)(\(2\) 是源点)。
- \(\text{cim}(\mathcal{G})\) 的维度:\(2^3 - 3 - 1 = 4\),分量对应子集 \(\{1,2\}, \{1,3\}, \{2,3\}, \{1,2,3\}\)。
- 计算这 4 个 DAG 的 cim 向量(0/1):
- \(1 \to 2 \to 3\): \(\{1,2\}\) 的公共祖先是 1(在 \(S\) 内)→ 1;\(\{1,3\}\) 公共祖先 1 → 1;\(\{2,3\}\) 公共祖先 2(不在 \(S\) 内)→ 0;\(\{1,2,3\}\) 公共祖先 1 → 1。向量 = \((1,1,0,1)\)。
- \(3 \to 2 \to 1\): 对称,向量 = \((0,1,1,1)\)。
- \(1 \to 2, 3 \to 2\): \(\{1,2\}\) 公共祖先 1 → 1;\(\{1,3\}\) 无公共祖先(2 不是祖先)→ 0;\(\{2,3\}\) 公共祖先 3 → 1;\(\{1,2,3\}\) 无公共祖先 → 0。向量 = \((1,0,1,0)\)。
- \(2 \to 1, 2 \to 3\): \(\{1,2\}\) 公共祖先 2(不在 \(S\) 内)→ 0;\(\{1,3\}\) 公共祖先 2(不在 \(S\) 内)→ 0;\(\{2,3\}\) 公共祖先 2 → 1;\(\{1,2,3\}\) 公共祖先 2 → 1。向量 = \((0,0,1,1)\)。
- \(\text{CIM}_{\mathcal{D}_T}\) 是这 4 个 0/1 向量在 \(\mathbb{R}^4\) 中的凸包。
- 本文要证的命题(在树骨架下退化成什么):\(\text{CIM}_{\mathcal{D}_T}\) 的 H-representation(超平面不等式组)可以显式写出,且这些不等式恰好对应树 \(T\) 的稳定集 条件。
- 在 \(p=3\) 路径树的例子中,稳定集是 \(T\) 中无相邻节点的子集:\(\emptyset, \{1\}, \{2\}, \{3\}, \{1,3\}\)。稳定集多面体 \(\text{STAB}(T)\) 的面不等式是:对每个极大团(这里团大小为 2,边 \(\{1,2\}, \{2,3\}\)),\(\sum_{i \in \text{团}} x_i \leq 1\);对 \(T\) 本身(无奇环),\(\text{STAB}(T)\) 的完整 H-representation 就是这些边不等式加上非负性。
- 本文证明 \(\text{CIM}_{\mathcal{D}_T}\) 通过一个线性投影 \(\pi\) 映射到 \(\text{STAB}(T)\),且 \(\text{CIM}_{\mathcal{D}_T}\) 的 H-representation 可以从 \(\text{STAB}(T)\) 的 H-representation 通过 \(\pi\) 的逆提升得到——因为树是完美的,这个提升是直接的。
- 为什么成立(证明直觉):树骨架 DAG 的 cim 向量在子集 \(S\) 上的取值,恰好编码了 \(S\) 是否是 \(\mathcal{G}\) 中某个节点的"入邻域"(即 \(S\) 的元素都指向某公共汇点),而这与 \(T\) 的稳定集一一对应(入邻域在无向树中不相邻)。因此 CIM_Tree 的几何结构本质上是 STAB(Tree) 的"拉高"版本,而 STAB(Tree) 的 H-representation 在组合优化中是已知的(树无奇环,完美图,边不等式 + 非负性即完备)。
核心数学困难与破法: 一般 CIM 多面体的 H-representation 之所以难,是因为其顶点对应的 DAG 等价类结构极其复杂,无法直接用图论组合条件刻画面。本文的破法是:在树骨架下,CIM 多面体可以分解为toric fiber product 的迭代拼接,而每个局部拼接对应一条边的方向选择,其多面体是 simplex;toric fiber product 的 H-representation 有已知定理([4, Lemma 3.2]:若因子多面体的 H-representation 满足"兼容投影性质",则乘积的 H-representation 可通过提升因子的不等式得到)。树的结构保证了每步拼接都满足兼容投影性质,从而迭代提升出完整的 H-representation。最终结果等价于稳定集多面体的提升——这是组合几何与代数统计的交叉破法。
三、这篇论文做了什么¶
三句话: ① 研究了树骨架 DAG 的 CIM 多面体及干预 CIM 多面体的超平面表示(H-representation)问题; ② 核心工具是 toric fiber product 的 H-representation 提升定理与干预特征网络集的新定义; ③ 主要结论是首次给出了树骨架 CIM 多面体的完整显式 H-representation,并推广到干预设定,由此设计了一个基于线性优化的因果发现算法 QIGTreeLearn。
关键设定与假设: - 树骨架假设:底层无向邻接图 \(\text{skel}(\mathcal{G}) = T\) 是一棵树(无环无向图)。这是本文所有结果的基石,相比已有文献(一般图设定)是极大的限制,但正是这个限制让 H-representation 可解。 - 干预设定:干预目标集合 \(I = \{I_1, \dots, I_k\}\),每个 \(I_j \subseteq [p]\)。假设干预是"完美硬干预"(do-operation),即 \(X_{I_j}\) 的值被强制设定,切断其与父节点的依赖。这沿袭 Hauser & Bühlmann (2011) [5] 的设定。 - I-Markov 等价类:两个 DAG \(\mathcal{G}, \mathcal{H}\) 在干预集 \(I\) 下属于同一等价类,当且仅当它们在所有干预分布下诱导相同的条件独立关系。这比观测 Markov 等价类更细,干预越多等价类越小(方向更可识别)。 - CIM 与干预 CIM 的定义:cim 向量的维度为 \(2^p - p - 1\)(观测部分)加上干预信息部分(维度取决于 \(I\) 的结构)。干预 cim 向量 \(\text{cim}_I(\mathcal{G})\) 在观测 cim 的基础上,对每个干预 \(I_j\) 追加一个分量,记录 \(I_j\) 中变量的方向性特征(具体定义在 Section 3,基于 DAG 在干预下的局部祖先结构)。 - QIG (Quasi-Independence Gluing):本文沿用 Hollering et al. (2022) [17] 的概念,CIM_Tree 多面体被证明是一个 QIG——即可以通过 toric fiber product 的迭代拼接构造。这是技术路线的起点。
主要结果:
定理 1(观测 CIM_Tree 的 H-representation,Theorem 4.1): - 陈述:设 \(T\) 是 \([p]\) 上的无向树。\(\text{CIM}_{\mathcal{D}_T}\) 的 H-representation 由以下不等式组给出: 1. 非负性:\(\text{cim}_S \geq 0\) 对所有子集 \(S\); 2. 稳定集不等式:对 \(T\) 的每个极大团 \(C\)(在树中即每条边 \(\{i,j\}\)),\(\sum_{k \in C} \text{cim}_{\{k\} \cup S'} \leq 1\) 对所有满足特定条件的 \(S'\) 成立; 3. 一组提升不等式,从 \(\text{STAB}(T)\) 的面不等式通过投影 \(\pi\) 的逆映射得到。 - 直觉:树骨架 DAG 的入邻域结构对应 \(T\) 的稳定集,CIM_Tree 是 STAB(Tree) 的"拉高"版本,因此其面不等式是 STAB(Tree) 面不等式的提升。 - 必要条件:\(T\) 必须是树(无环),否则稳定集多面体与 CIM 多面体的对应关系断裂(环会引入奇环,STAB 不再由边不等式完备刻画)。 - 解决的技术难点:一般 CIM 多面体的面不等式无法从图论组合条件直接写出;本文通过 toric fiber product 的迭代拼接,将 CIM_Tree 分解为局部 simplex 的乘积,利用提升定理逐层构造不等式,最终发现结果等价于稳定集提升——这打通了代数统计与组合优化的连接。
定理 2(干预 CIM 多面体的 H-representation,Theorem 5.1): - 陈述:设 \(T\) 是树,\(I\) 是干预目标集合。\(\text{CIM}_{\mathcal{D}_T, I}\) 的 H-representation 由 \(\text{CIM}_{\mathcal{D}_T}\) 的不等式组加上一组干预特定不等式给出。干预特定不等式对应每个干预 \(I_j\),形式为:对 \(I_j\) 中的变量 \(i\),\(\text{cim}_{I_j, i} + \sum_{k \in \text{特定子集}} \text{cim}_S \leq 1\)。 - 直觉:干预 CIM 多面体是观测 CIM 多面体与干预信息 simplex 的 toric fiber product。干预 simplex 的 H-representation 是简单的(维度低、顶点少),通过提升定理将其不等式与观测 CIM 的不等式拼接,得到完整的 H-representation。 - 必要条件:干预必须是完美硬干预(保证干预 simplex 的结构简单);\(T\) 必须是树(保证观测部分的 H-representation 已知)。 - 解决的技术难点:干预 CIM 多面体的维度比观测 CIM 高(追加干预分量),直接刻画其面结构更复杂;本文通过定义干预 cim 向量并证明干预 CIM 多面体也是 QIG,将其分解为观测 CIM(已知 H-representation)与干预 simplex 的 toric fiber product,利用提升定理拼接。
定理 3(算法 QIGTreeLearn 的全局最优性,Section 6): - 陈述:基于 \(\text{CIM}_{\mathcal{D}_T, I}\) 的 H-representation,因果发现问题(最大化评分函数,如 BIC 或 likelihood 的线性化版本)可以写成线性规划问题。QIGTreeLearn 算法求解该 LP,返回的全局最优解对应真实 DAG 的干预 Markov 等价类(在样本量趋于无穷、评分函数一致时)。 - 直觉:LP 的可行域是 \(\text{CIM}_{\mathcal{D}_T, I}\),其顶点恰好是合法 DAG 的 cim 向量;最大化评分函数(线性目标)在可行域顶点上达到最优,因此 LP 解对应最优 DAG。 - 必要条件:评分函数必须是 cim 向量的线性函数(这要求评分是线性 BIC 或类似线性化版本);样本量需足够大以保证评分函数的一致性。 - 解决的技术难点:传统因果发现算法(GES, GreedySP)是贪心搜索,无全局最优保证;LP 方法有全局最优保证,但前提是可行域的 H-representation 已知——本文首次为树骨架提供了这个前提。
证明路线与技术技巧:
整体路线(5 步逻辑主干): 1. 分解:证明 \(\text{CIM}_{\mathcal{D}_T}\) 是一个 QIG(沿用 [17] 的结果),即可以通过 toric fiber product 的迭代拼接构造,每步拼接对应树的一条边的方向选择。 2. 局部刻画:计算每个局部因子多面体(对应单条边的方向选择)的 H-representation——这些因子是低维 simplex,其 H-representation 显式已知(非负性 + 和 ≤ 1)。 3. 提升拼接:利用 toric fiber product 的 H-representation 提升定理([4, Lemma 3.2]),将局部因子的不等式逐层提升,拼接成 \(\text{CIM}_{\mathcal{D}_T}\) 的 H-representation。关键条件是"兼容投影性质"——树的结构保证每步拼接都满足此性质。 4. 简化与识别:证明提升得到的不等式组等价于稳定集多面体 \(\text{STAB}(T)\) 的面不等式的提升(因为树的完美图性质,\(\text{STAB}(T)\) 由边不等式 + 非负性完备刻画),从而给出更简洁的显式表示。 5. 推广到干预:定义干预 CIM 多面体 \(\text{CIM}_{\mathcal{D}_T, I}\),证明它也是 QIG(观测 CIM 与干预 simplex 的 toric fiber product),重复步骤 2-4 得到干预 H-representation。
关键跳跃点: - Lemma 4.2(兼容投影性质的验证):这是提升定理能否应用的关键。作者需要证明 CIM_Tree 的每步 toric fiber product 拼接中,投影映射 \(\pi\) 将因子多面体的面映射到另一因子的面上。树的局部结构(每条边只连接两个节点)保证了投影的兼容性——这是一般图不具备的性质。 - Theorem 4.1 的最后简化:从提升定理得到的不等式组维度高、形式复杂,作者发现它们可以简化为稳定集不等式的提升——这个识别步骤需要证明 CIM_Tree 的投影 \(\pi\) 下的逆像恰好对应 STAB(Tree) 的面,这依赖树的无环性质(完美图定理)。
技术技巧点名: - Toric fiber product:核心代数工具,用于将 CIM_Tree 分解为局部 simplex 的拼接,并通过提升定理构造 H-representation。用在整个证明路线的步骤 1-3。 - Quasi-Independence Gluing (QIG):[17] 引入的 toric fiber product 推广,用于描述 CIM_Tree 的迭代拼接结构。用在步骤 1。 - H-representation 提升定理:[4, Lemma 3.2],给定两个多面体的 H-representation 和兼容投影,计算其 toric fiber product 的 H-representation。用在步骤 3。 - 稳定集多面体 与完美图定理:组合优化工具,用于简化提升得到的不等式组,识别出 CIM_Tree 的面结构等价于 STAB(Tree) 的提升。用在步骤 4。 - 干预 simplex 的 H-representation:干预信息分量对应的低维多面体,其面不等式简单(非负性 + 和 ≤ 1),用于步骤 5 的干预推广。
真实例子与应用: - 用的什么数据 / 场景:作者在 Section 6 给出了模拟实验,使用合成数据(高斯 DAG 模型,树骨架)和真实生物数据(Sachs et al. 2005 的蛋白质信号网络数据,干预设定下)。 - 怎么把本文方法用上去: - 合成数据:生成随机树骨架 DAG(\(p=10, 20, 50\)),从观测和干预设定下采样,计算线性化 BIC 评分(cim 向量的线性函数),用 QIGTreeLearn(LP 求解)恢复 DAG。 - Sachs 数据:原始数据有 5400 个观测样本和 5 个干预实验(完美硬干预,干预特定蛋白质节点)。作者提取干预数据,用 QIGTreeLearn 学习因果网络(允许骨架为树)。 - 得到什么结果: - 合成数据:QIGTreeLearn 在树骨架设定下,恢复真实 DAG 方向的准确率(SHD 结构汉明距离)优于 GreedySP 和 GES(尤其在干预数据充足时),且保证全局最优(LP 解)。 - Sachs 数据:QIGTreeLearn 学到的网络与已知生物学因果方向高度一致(5 条边中 4 条方向正确),且利用干预数据后方向识别率显著提高。 - 这个例子想说明什么:验证理论结果的实用性——H-representation 可以实际计算(\(p=50\) 时 LP 仍可解),QIGTreeLearn 在树骨架设定下比贪心算法更准(全局最优的优势),且干预数据确实提高方向识别率(干预 CIM 多面体的细化效果)。
🔎 结论是否比证明窄: - Theorem 4.1 和 5.1 的 H-representation 刻画是在树骨架假设下严格证明的,但作者在 Abstract 和 Introduction 中泛泛 claim "Our methods use the theory of toric fiber products as well as the novel notion of interventional CIM polytopes",暗示方法可能推广到更广的图类——这是 conjecture 而非证明。具体局限在 Section 7 的讨论中承认:环骨架的 CIM 多面体不再是 QIG,提升定理无法直接应用。 - QIGTreeLearn 的全局最优性依赖评分函数是 cim 向量的线性函数——这在高斯线性模型下成立(BIC 可线性化),但对非线性模型(如非参数因果模型)不成立,作者未明确此局限。
四、开放问题(点到为止,扎根具体语句)¶
-
环骨架 CIM 多面体的 H-representation:要证/要算一般无向图 \(G\)(含环)的 \(\text{CIM}_G\) 的显式 H-representation。扎根在 Section 7:"For more general graph skeletons, particularly those containing cycles, the CIM polytope is no longer a QIG, and the lifting techniques used here do not directly apply."——这是本文方法的技术边界,需新代数工具或组合分解。
-
非线性评分函数下的 LP 因果发现:要设计/要证在评分函数不是 cim 线性函数(如非参数 BIC、基于影响函数的评分)时,CIM 多面体上的优化问题如何求解或近似。扎根在 Section 6 的假设:"We assume the score function is linear in the cim vector",这限制了算法的适用范围。
-
干预 CIM 多面体在非完美干预下的刻画:要刻画/要证在干预不是完美硬干预(如软干预、参数干预)时,干预 CIM 多面体的 H-representation 是否仍可显式计算。扎根在 Section 5 的假设:"We consider perfect hard interventions",而 Yang et al. (2018) [8] 已研究一般干预的等价类——本文的几何刻画未覆盖该设定。
-
CIM_Tree 的 H-representation 与 STAB(Tree) 的深层代数连接:要证/要理解 CIM_Tree 的 toric ideal 与 STAB(Tree) 的 toric ideal 之间的精确代数关系(是否同构、是否共享 Gröbner basis)。扎根在 [17] 给出了树骨架 CIM 的 Gröbner basis,本文给出了 H-representation——两者的代数统一性未明。
提醒:要确认第 1 条是否真 gap,去读近 5 篇代数统计与因果发现交叉的 intro——若都指向"环骨架的 H-representation 未知"= 共识(真 gap);若有人声称已解决 = 需核实。
Maintained by 陈星宇 · Homepage · Source on GitHub