Faithlessness in Gaussian graphical models¶
作者: Mathias Drton, Leonard Henckel, Benjamin Hollering, Pratik Misra
来源: Bernoulli
主题: 因果推断
相关性: 8/10
链接: 期刊页 · arXiv
一、领域脉络与小综述¶
这个方向是什么: 条件独立(Conditional Independence, CI)蕴含问题研究的是:若一个概率分布服从一组有限的 CI 关系,这是否逻辑上必然蕴含另一个 CI 关系也成立?在因果推断与图模型中,CI 关系是识别因果效应、构建图结构的基石。然而,一般的 CI 蕴含问题已被证明不存在有限的公理完备刻画(Sullivant 2007),这使得在有限样本下依赖 CI 检验进行因果发现(如 PC 算法)的理论保证变得极为脆弱。当前子方向的成熟度处于“经典不可能性结果已确立,但针对带图结构约束的特例与近似蕴含的代数/几何刻画刚刚起步”的阶段。
发展脉络: - 奠基工作:Geiger & Pearl (1988/2013) 证明了在 DAG 模型中,d-separation 提供了多项式时间内的 sound and complete 推理机制,即由 DAG 结构推导的 CI 蕴含完全等价于半图公理的推导。这确立了“图论表征 = 精确蕴含”的经典范式。 - 不可能性结果:Sullivant (2007) 证明了对于一般的 Gaussian CI 关系,不存在有限的公理列表能完备刻画所有蕴含,这封死了“寻找通用有限公理系统”的路线。 - 代数/几何进路:Draisma, Sullivant, Talaska (2008/2012) 引入 trek separation 与 trek rule,将 Gaussian 图模型中协方差矩阵子行列式为 0(即 CI 关系)的问题转化为图上的路径分离准则,并给出了非零子行列式的无消去展开公式。Boege et al. (2017) 引入 Gaussoid 概念,将 CI 关系编码为对称矩阵的几乎主子式(almost-principal minors)的二次关系,从代数几何角度统一了 CI 的组合结构。 - 因果发现中的 Faithfulness 瓶颈:Uhler et al. (2012) 从几何与组合角度研究了 Strong Faithfulness 条件,证明了不满足 Strong Faithfulness 的分布集合的 Lebesgue 测度可以惊人地大,这直接质疑了 PC 算法等基于偏相关检验的因果发现算法的均匀一致性。Zhang & Spirtes (2002) 提出了 Strong Faithfulness 的推广以保证均匀一致性,但未给出图论诊断。 - 近似蕴含的萌芽:Kenig & Suciu (2018) 在数据库与概率语境下定义了近似蕴含(approximate implication),用信息论度量 CI 的满足度,证明了某些蕴含可以松弛为线性不等式,但指出一般情形下近似蕴含不成立。Kenig (2021) 进一步证明,在 DAG 模型中,d-separation 是推断近似 CI 的 sound and complete 系统,为本文奠定了直接基础。 - 本文的位置:本文填补了“DAG + 1 条额外 CI”这一特例下精确蕴含的代数/图论刻画空白,并将 Kenig 的近似蕴含思路与 Uhler 的 Strong Faithfulness 瓶颈结合,给出了偏相关系数近似蕴含的图论解。
子线索聚类: 1. CI 蕴含的公理与逻辑进路:研究 CI 关系在一般概率分布或特定分布族下的逻辑蕴含结构。核心工作包括半图公理、Sullivant 的不可能性定理、Gaussoid 公理。这一簇在寻找组合/逻辑的完备刻画。 2. Gaussian 图模型的代数几何进路:将 CI 关系视为多项式方程(行列式=0),利用 trek rule、Gaussoid、Lagrangian Grassmannian 等代数几何工具研究协方差矩阵的半代数结构。这一簇在寻找“多项式理想包含 = CI 蕴含”的等价条件。 3. 因果发现中的 Faithfulness 与统计保证进路:研究 Faithfulness 假设的几何测度、Strong Faithfulness 的违反概率,以及因果发现算法的均匀一致性。这一簇在量化“图论结构 → 有限样本误差传播”的瓶颈。 4. 近似蕴含与信息论进路:研究当 CI 关系仅近似成立时,蕴含是否仍近似成立。这一簇在建立“误差放大”的界与图论条件。
这个方向在追问的核心问题: 1. 在何种带结构约束的特例下,CI 蕴含问题存在有限的图论完备刻画?(一般情形已不可能,但 DAG+额外 CI 是否可行?) 2. 当 CI 关系仅近似成立(偏相关系数微小但不为零)时,蕴含的 CI 关系是否也近似成立?误差如何放大? 3. Strong Faithfulness 假设的违反与图结构有何关联?能否用图论条件诊断哪些图更容易导致因果发现算法失败? 4. 如何将代数几何的精确蕴含结果(多项式理想包含)松弛为统计可用的近似蕴含结果(偏相关系数的界)?
⚠️ 作者的 framing: - 作者将缺口 frame 为:一般 CI 蕴含无有限刻画(Sullivant 2007),但因果发现实践中遇到的是“DAG 推导的 CI + 1 条额外 CI”这一极常见特例,且 Strong Faithfulness 的违反(Uhler et al. 2012)迫切需要近似蕴含的图论解。这使得本文的“代数刻画 + 近似蕴含”成为因果发现理论的自然下一步。 - 被淡化或回避的竞争路线:作者未讨论非 Gaussian 分布(如离散、半参数)下的近似蕴含,也未涉及基于信息论度量(互信息而非偏相关)的近似蕴含(Kenig & Suciu 2018 用的是信息论,本文严格限制在 Gaussian 偏相关)。此外,作者未引用基于 M-分离或最大祖先图(MAG)的 CI 蕴含工作(如 van der Zander et al. 2018),这些工作处理了潜在变量,而本文假设无潜在变量。 - 明显该被引却未出现的:处理潜在变量或一般图模型(如 MAG, CPDAG)下的 CI 蕴含与调整集的工作(如 Perković et al. 2018, van der Zander et al. 2018),以及半参数模型下的效率界与调整集最优性(如 Witte et al. 2020, Runge 2021)。这些工作与本文的“CI 蕴含用于最优调整集选择”直接相关,但作者仅引用了线性模型下的调整集工作。这提示研究者:本文结果向潜在变量图或半参数模型的推广可能是一个真 gap。
张力: - Kenig & Suciu (2018) 证明了在一般概率分布下,近似蕴含不必然成立(即使精确蕴含成立);但 Kenig (2021) 证明了在 DAG 模型下,d-separation 是近似蕴含的 sound and complete 系统。本文进一步在“DAG + 1 条额外 CI”下给出了偏相关近似蕴含的图论解。这里存在一个微妙的张力:d-separation 的近似蕴含保证(Kenig 2021)是否覆盖了“额外 CI 近似成立”的情形?本文隐含地指出,d-separation 仅处理 DAG 推导的 CI,而额外 CI 的近似蕴含需要新的图论条件(λ-faithfulness)。未见其他明显对立引用。
二、最核心、最简单的例子 / 数学问题¶
第一步:符号、模型、可观测数据交代清楚
- \(G\):有向无环图(DAG),节点集 \(V = \{1, \dots, p\}\),边集 \(E\)。
- \(X = (X_1, \dots, X_p)\):服从 Gaussian 分布的随机向量,\(X \sim N(0, \Sigma)\),\(\Sigma\) 为正定协方差矩阵。
- \(\mathcal{I}(G)\):由 DAG \(G\) 通过 d-separation 推导出的所有 CI 关系集合。即 \(\mathcal{I}(G) = \{A \perp\!\!\!\perp B \mid C : A, B, C \subset V, A \text{ d-sep } B \mid C \text{ in } G\}\)。
- \(\sigma_{ab \mid C}\):偏相关系数,表示在给定 \(C\) 下 \(X_a\) 与 \(X_b\) 的相关系数。在 Gaussian 模型中,\(A \perp\!\!\!\perp B \mid C \iff \sigma_{ab \mid C} = 0\)。
- \(\omega\):一条额外的 CI 关系,不在 \(\mathcal{I}(G)\) 中,形式为 \(i \perp\!\!\!\perp j \mid L\),其中 \(i, j \in V, L \subset V \setminus \{i, j\}\)。
- \(\psi\):目标 CI 关系,形式为 \(k \perp\!\!\!\perp l \mid M\)。
- \(\Sigma(G, \omega)\):满足 DAG \(G\) 推导的所有 CI(即 \(\Sigma \in M(G)\))且满足额外 CI \(\omega\)(即 \(\sigma_{ij \mid L} = 0\))的协方差矩阵集合。这是一个半代数集。
- \(\lambda\):近似蕴含的阈值参数,\(\lambda \in (0, 1)\)。
- \(\lambda\)-faithlessness:对于 CI 关系 \(A \perp\!\!\!\perp B \mid C\),若 \(|\sigma_{ab \mid C}| \leq \lambda\),则称该关系是 \(\lambda\)-faithless 的(即近似成立但不精确成立)。
- 可观测数据:研究者实际能观测到的是 \(X\) 的 \(n\) 个独立样本 \(X^{(1)}, \dots, X^{(n)}\),由此可估计偏相关系数 \(\hat{\sigma}_{ab \mid C}\)。潜在不可观测的是真实的 \(\Sigma\) 及其是否精确满足 \(\omega\) 或 \(\psi\)。
模型:数据生成机制为 \(X = B X + \varepsilon\),其中 \(B\) 是与 \(G\) 的邻接矩阵对应的权重矩阵(\(B_{uv} \neq 0 \iff u \to v \in E\)),\(\varepsilon \sim N(0, D)\),\(D\) 为对角阵。由此 \(\Sigma = (I - B)^{-1} D (I - B)^{-T}\)。要估的对象是:在 \(\Sigma \in \Sigma(G, \omega)\) 下,\(\psi\) 是否必然成立(精确蕴含),或在 \(|\sigma_{ij \mid L}| \leq \lambda\) 下,\(|\sigma_{kl \mid M}|\) 是否必然受界(近似蕴含)。
第二步:最小内核——支撑整篇论文的最简特例
整篇论文的证明本质上是 “ trek rule + 几乎主子式行列式 = 0 的代数蕴含” 这一特例的推广。最简特例是:\(p=3\) 的 DAG \(G: 1 \to 2 \to 3\),额外 CI \(\omega: 1 \perp\!\!\!\perp 3 \mid 2\),目标 CI \(\psi: 1 \perp\!\!\!\perp 3\)。
- 在特例下,要证的命题退化成什么:
- 精确蕴含:若 \(\Sigma \in M(G)\) 且 \(\sigma_{13 \mid 2} = 0\),是否必然 \(\sigma_{13} = 0\)?
-
近似蕴含:若 \(|\sigma_{13 \mid 2}| \leq \lambda\),是否必然 \(|\sigma_{13}| \leq f(\lambda)\)(\(f\) 为某函数)?
-
证明怎么走、为什么成立:
- 精确蕴含:由 trek rule,\(\sigma_{13} = \sigma_{12} \sigma_{23} / \sigma_{22} + \text{treks not through 2}\)。但在 DAG \(1 \to 2 \to 3\) 中,从 1 到 3 的 trek 只有 \(1 \to 2 \to 3\)(因为无其他路径或共同祖先)。故 \(\sigma_{13} = \sigma_{12} \sigma_{23} / \sigma_{22}\)。又 \(\sigma_{13 \mid 2} = \sigma_{13} - \sigma_{12} \sigma_{23} / \sigma_{22} = 0\)。因此 \(\sigma_{13 \mid 2} = 0 \iff \sigma_{13} = 0\)。蕴含成立,且代数上表现为:\(\det(\Sigma_{\{1,3\},\{1,3\}}) = \sigma_{11}\sigma_{33} - \sigma_{13}^2\),而 \(\sigma_{13 \mid 2} = 0\) 对应的几乎主子式 \(\det(\Sigma_{\{1,3\},\{1,3\} \setminus \{2\}}) = 0\),这直接蕴含 \(\sigma_{13} = 0\)(因为 \(\sigma_{11}, \sigma_{33} > 0\))。
- 近似蕴含:\(|\sigma_{13 \mid 2}| \leq \lambda\) 意味着 \(|\sigma_{13} - \sigma_{12} \sigma_{23} / \sigma_{22}| \leq \lambda\)。由于 \(\sigma_{13} = \sigma_{12} \sigma_{23} / \sigma_{22}\),这直接给出 \(|\sigma_{13}| \leq \lambda\)。近似蕴含成立,且误差无放大。
-
为什么成立的关键:在 \(1 \to 2 \to 3\) 中,从 1 到 3 的 trek 唯一,且该 trek 恰好是计算偏相关时消去的部分。这导致偏相关系数 \(\sigma_{13 \mid 2}\) 与总相关系数 \(\sigma_{13}\) 在代数上等价(仅差一个正因子)。论文的一般情形只是这个“唯一 trek 被偏相关消去”的加壳:当图更复杂时,需要 trek separation 准则来判定哪些 trek 被消去、哪些残留,从而决定偏相关系数的多项式结构。
-
核心数学困难:当图有多个 trek 且偏相关消去的 trek 集合与总相关的 trek 集合不同时,\(\sigma_{kl \mid M}\) 的多项式表达中会残留未被消去的 trek 项。此时 \(\sigma_{ij \mid L} = 0\)(或 \(\leq \lambda\))是否能蕴含 \(\sigma_{kl \mid M} = 0\)(或 \(\leq f(\lambda)\)),取决于残留项是否可被 \(\sigma_{ij \mid L}\) 的多项式因子控制。本文的关键想法是用 “ trek separation 与几乎主子式行列式的代数包含关系” 来判定残留项是否可消,从而给出图论条件。
三、这篇论文做了什么¶
三句话: ①研究了在 Gaussian DAG 模型中,由 DAG 推导的 CI 关系加上一条额外 CI 关系,何时蕴含另一条 CI 关系(精确与近似蕴含)。 ②核心工具是代数几何(多项式理想包含)与 trek rule(协方差矩阵的路径分解),将 CI 蕴含转化为图论准则。 ③主要结论是给出了“DAG + 1-CI”精确蕴含的完备图论刻画,以及偏相关系数近似蕴含(\(\lambda\)-faithlessness)的图论解,直接量化了 Strong Faithfulness 失败的图论结构。
关键设定与假设: - 设定:Gaussian DAG 模型 \(M(G)\),额外 CI \(\omega: i \perp\!\!\!\perp j \mid L\),目标 CI \(\psi: k \perp\!\!\!\perp l \mid M\)。研究 \(\Sigma(G, \omega) \implies \psi\) 是否成立。 - 假设 1:Gaussian 分布。统计含义:CI 关系等价于偏相关系数为 0,且协方差矩阵属于正定锥的半代数子集。相比已有文献(Kenig 2021 用信息论,允许一般分布),本文严格限制在 Gaussian,从而利用代数几何。 - 假设 2:无潜在变量(DAG 而非 MAG/CPDAG)。统计含义:所有变量可观测,d-separation 完全刻画 CI。相比 Uhler et al. (2012) 也假设 DAG,但 Kenig (2021) 暗含可推广到 MAG,本文未推广。 - 假设 3:仅 1 条额外 CI。统计含义:\(\Sigma(G, \omega)\) 是 \(M(G)\) 与一个超曲面 \(\{\sigma_{ij \mid L} = 0\}\) 的交集,代数结构简单。相比 Sullivant (2007) 的一般多 CI 蕴含(无有限刻画),本文利用“仅 1 条额外 CI”避免了不可能性结果。 - 定义:\(\lambda\)-faithlessness。\(|\sigma_{ab \mid C}| \leq \lambda\)。统计含义:偏相关系数微小但不为零,对应有限样本下 CI 检验的 Type II error 区域。相比 Strong Faithfulness(要求所有非 d-sep 的偏相关 \(> \lambda\)),本文研究的是特定 CI 的 \(\lambda\)-faithlessness 如何传播。
主要结果:
- Theorem 3.3(精确蕴含的代数刻画):
- 陈述:\(\Sigma(G, \omega) \implies \psi\) 成立,当且仅当多项式理想 \(I(\omega)\) 包含几乎主子式行列式 \(\det(\Sigma_{\{k,l\},\{k,l\} \setminus M})\)。即 \(\det(\Sigma_{\{k,l\},\{k,l\} \setminus M}) \in I(\omega)\),其中 \(I(\omega)\) 是由 \(\det(\Sigma_{\{i,j\},\{i,j\} \setminus L})\) 在 trek rule 参数化下生成的多项式理想。
- 直觉:CI 蕴含 \(\iff\) 目标 CI 的代数表达(行列式)可被额外 CI 的代数表达(行列式)的因子消去。这直接将逻辑蕴含转化为代数包含。
- 必要条件:Gaussian 分布 + DAG 结构 + trek rule 参数化。
-
解决的技术难点:绕过 Sullivant (2007) 的不可能性结果,利用“仅 1 条额外 CI”使得理想 \(I(\omega)\) 是主理想,从而包含关系可判定。
-
Theorem 4.5(精确蕴含的图论刻画):
- 陈述:\(\Sigma(G, \omega) \implies \psi\) 成立,当且仅当图 \(G\) 满足一个纯图论准则(基于 trek separation 与路径消去)。具体地,若从 \(k\) 到 \(l\) 的所有 trek 都被 \(\omega\) 的 trek separation 准则“覆盖”(即每条 trek 都经过 \(\omega\) 的分离集或可被消去),则蕴含成立。
- 直觉:代数包含 \(\iff\) 图上所有路径都被额外 CI 的分离集阻断。这是 d-separation 在“DAG + 1-CI”下的推广。
-
解决的技术难点:将代数理想的包含关系翻译为图论路径的覆盖关系,利用 Draisma et al. (2012) 的 trek rule 展开公式,证明行列式的非零项恰好对应未被覆盖的 trek。
-
Theorem 5.8(近似蕴含的图论解):
- 陈述:若 \(|\sigma_{ij \mid L}| \leq \lambda\),且图 \(G\) 满足某图论条件(\(\lambda\)-faithfulness 条件),则 \(|\sigma_{kl \mid M}| \leq c \lambda\)(\(c\) 为常数,取决于图结构)。反之,若图论条件不满足,则存在 \(\Sigma\) 使得 \(|\sigma_{ij \mid L}| \leq \lambda\) 但 \(|\sigma_{kl \mid M}|\) 任意大。
- 直觉:近似蕴含成立 \(\iff\) 目标偏相关系数的 trek 展开中,所有残留项都可被 \(\sigma_{ij \mid L}\) 的 trek 项控制(乘以常数)。若残留项有独立于 \(\sigma_{ij \mid L}\) 的 trek,则误差可无限放大。
- 解决的技术难点:将代数包含松弛为不等式包含,利用 trek rule 展开的逐项控制,证明常数 \(c\) 仅取决于图的拓扑(路径长度、分支数),不取决于参数值。
证明路线与技术技巧:
- 整体路线:
- 参数化:用 trek rule 将 \(\Sigma\) 的元素表示为路径权重乘积之和(\(\sigma_{uv} = \sum_{\text{treks } u \leftrightarrow v} \prod \text{edge weights}\))。
- 代数化:将 CI 关系 \(\omega\) 和 \(\psi\) 表示为几乎主子式行列式 \(\det(\Sigma_{S, S \setminus T}) = 0\)。
- 理想包含:证明 \(\Sigma(G, \omega) \implies \psi \iff \det(\Sigma_{\{k,l\},\{k,l\} \setminus M}) \in I(\omega)\),利用主理想的性质判定包含。
- 图论翻译:利用 trek rule 展开 \(\det(\Sigma_{\{k,l\},\{k,l\} \setminus M})\),证明每一项对应一条 trek,包含关系 \(\iff\) 每条 trek 被额外 CI 的分离集覆盖。
-
近似松弛:将行列式展开的逐项控制转化为不等式 \(|\det(\ldots)| \leq c |\det(\ldots)|\),利用图的拓扑界控制常数 \(c\)。
-
关键跳跃点:
- Lemma 4.3:证明 trek rule 展开的无消去性(cancellation-free),即行列式展开的每一项对应唯一一条 trek 且无符号消去。这是将代数包含翻译为图论覆盖的关键,因为若存在符号消去,则代数包含不对应路径覆盖。
-
Lemma 5.5:证明近似蕴含的常数 \(c\) 仅取决于图拓扑。难点在于 trek 展开的项数可能随图复杂度指数增长,但作者利用 trek 的结构(每条 trek 的权重乘积可被偏相关系数的乘积控制),将指数增长压缩为多项式界。
-
技术技巧点名:
- Trek rule / Trek separation(Draisma et al. 2008/2012):将协方差矩阵的行列式表示为路径权重的乘积之和,并给出行列式为 0 的图论分离准则。用在第 2-4 步,起“代数-图论翻译”作用。
- 几乎主子式行列式(Almost-principal minors):将偏相关系数 \(\sigma_{ab \mid C} = 0\) 表示为 \(\det(\Sigma_{\{a,b\},\{a,b\} \setminus C}) = 0\)。用在第 2 步,起“CI 代数化”作用。
- 主理想包含判定(Principal ideal containment):利用 \(I(\omega)\) 是由单个行列式生成的主理想,判定包含只需检验生成元是否整除目标行列式。用在第 3 步,起“绕过不可能性结果”作用。
- 无消去展开(Cancellation-free expansion):利用 Gaussian DAG 的 trek rule 展开无符号消去(所有项为正或同号),保证代数包含等价于逐项覆盖。用在第 4 步,起“代数-图论等价”作用。
- 逐项不等式控制(Term-wise inequality control):将行列式的绝对值界分解为每条 trek 权重的界,利用图的拓扑(路径长度)控制乘积。用在第 5 步,起“近似蕴含常数界”作用。
真实例子与应用: 本文为纯理论论文,无真实数据例子或模拟实验。但作者在 Section 5.2 给出了一个具体图例来说明近似蕴含的图论条件: - 图例:DAG \(G: 1 \to 2 \to 3, 1 \to 3\)(即 \(1 \to 2 \to 3\) 加上直接边 \(1 \to 3\))。额外 CI \(\omega: 1 \perp\!\!\!\perp 3 \mid 2\),目标 CI \(\psi: 1 \perp\!\!\!\perp 3\)。 - 应用:在此图中,\(\sigma_{13 \mid 2} = 0\) 蕴含 \(\sigma_{13} = 0\)(精确蕴含成立,因为 trek \(1 \to 3\) 被偏相关消去)。但近似蕴含:\(|\sigma_{13 \mid 2}| \leq \lambda\) 是否蕴含 \(|\sigma_{13}| \leq c\lambda\)?作者指出,若边 \(1 \to 3\) 的权重 \(b_{31}\) 很大,则 \(|\sigma_{13}|\) 可远大于 \(\lambda\),因为 \(\sigma_{13} = b_{31} \sigma_{11} + b_{21} b_{32} \sigma_{11}\),而 \(\sigma_{13 \mid 2} = b_{31} \sigma_{11}\),故 \(|\sigma_{13}| = |\sigma_{13 \mid 2}| + |b_{21} b_{32} \sigma_{11}|\)。当 \(b_{21} b_{32}\) 大时,误差放大。这说明近似蕴含需要额外图论条件(如残留 trek 的权重可被控制),直接量化了 Strong Faithfulness 在此图上的脆弱性。
🔎 结论是否比证明窄: - Theorem 5.8 的近似蕴含结论要求图满足“\(\lambda\)-faithfulness 条件”,但作者在 Section 5.1 仅证明了该条件的充分性,未证明必要性(仅证明了反例:条件不满足时近似蕴含不成立)。这留下一个 gap:\(\lambda\)-faithfulness 条件是否是最紧的图论条件?作者在结论中 conjecture 它是必要的,但未严格证明。 - 作者 claim 近似蕴含结果可推广到“DAG + 多条额外 CI”,但证明仅处理了 1 条额外 CI。多 CI 的代数结构不再是主理想,包含判定可能极复杂,此 claim 未被证明。
四、开放问题(点到为止,扎根具体语句)¶
-
\(\lambda\)-faithfulness 图论条件的必要性证明:Theorem 5.8 证明了图论条件的充分性,并给出反例说明条件不满足时近似蕴含不成立。但必要性(即条件是最紧的)未证明。扎根在 Section 5.1 的陈述:“We show that if the graphical condition is not satisfied, then there exists a covariance matrix such that the approximate implication fails”,但未证明“所有满足近似蕴含的图都满足该条件”。
-
向潜在变量图(MAG/CPDAG)的推广:本文假设无潜在变量(DAG),但因果发现实践中常有潜在变量。d-separation 在 MAG 中有对应(m-separation),trek rule 是否可推广到 MAG?扎根在作者未引用 van der Zander et al. (2018) 或 Perković et al. (2018) 的 MAG 调整集工作,且 Section 6 仅提到“future work includes extending to other graphical models”。
-
多额外 CI 的近似蕴含:作者 claim 可推广到多额外 CI,但证明仅处理 1 条(主理想)。多 CI 的代数结构复杂,近似蕴含的常数界如何依赖图结构?扎根在 Section 6:“Our results can potentially be extended to the case of multiple additional CI statements”。
-
有限样本下偏相关检验误差与 \(\lambda\)-faithfulness 的联系:本文的 \(\lambda\)-faithfulness 是纯理论阈值,未联系有限样本下偏相关估计的误差分布。如何将 \(\lambda\) 与样本量 \(n\)、维度 \(p\) 联系,推导因果发现算法的 Type I/II error 界?扎根在 Uhler et al. (2012) 的 Strong Faithfulness 测度界与本文的图论条件,但本文未涉及有限样本。要确认此 gap 是否真 gap,去读近期 5 祠因果发现算法的 uniform consistency 文献(如 Zhang & Spirtes 2002 的后续)。
Maintained by 陈星宇 · Homepage · Source on GitHub