Parameter identification in linear non-Gaussian causal models under general confounding¶

作者: Daniele Tramontano, Mathias Drton, Jalal Etesami
来源: Annals of Statistics
主题: 因果推断
相关性: 9/10
链接: https://doi.org/10.1214/25-aos2597

核心问题与动机¶

本文研究线性非高斯因果模型在存在潜变量时的参数识别问题。重要性在于：潜变量混淆是因果推断中的核心难题，而LiNGAM类模型利用非高斯性提供了超越传统基于条件独立性（如PC算法）的识别能力。已有方法的不足：现有基于超定独立成分分析的方法，均严格要求观测变量对潜变量的依赖是线性的，这在实际中过于受限。

主要贡献¶

放宽潜变量混淆假设：允许观测变量受到潜变量的任意非线性混淆，突破了传统线性潜变量框架的局限。
图判据：提出了判定直接因果效应（线性系数）是否具备一般可识别性的充要图条件。
多项式时间算法：给出了该图判据的算法实现，其运行时间关于观测变量数呈多项式级复杂度。
估计与拓展：基于识别结果提出了估计启发式算法，并将理论推广至包含反馈环的有向循环图模型。

方法框架¶

模型设定：$X_j = \sum_{i \in \text{pa}(j)} \beta_{ij} X_i + f_j(U) + \epsilon_j$，其中 $\beta_{ij}$ 为目标因果效应，$\epsilon_j$ 为非高斯噪声，$U$ 为潜变量，$f_j(\cdot)$ 为任意非线性函数（关键突破点）。
关键假设：
非高斯性：外生误差项非高斯（LiNGAM核心假设）。
无环性：基础结果要求DAG结构（后续拓展至循环）。
一般非线性混淆：$f_j(U)$ 形式任意，不再限定为线性映射。
方法步骤：1) 依据观测变量的DAG结构构建图判据；2) 运用多项式时间算法检验图判据的充要条件；3) 若满足，则直接因果效应具备一般可识别性，可进行后续估计。

主要理论结果¶

核心定理：提出的图判据是直接因果效应（线性系数）具备一般可识别性的充分且必要条件。此处的“一般可识别性”指在参数空间中除零测集外处处可识别。
计算复杂度：验证该图判据的算法复杂度为观测变量个数的多项式级别，具备计算可行性。

实验 / 数值仿真¶

摘要仅提及基于识别结果提出了估计启发式算法，未提供具体仿真或实验的定量对比细节。

与研究者兴趣的关联¶

因果推断（识别与潜变量）：直接关联因果推断中的参数识别问题，特别是处理复杂潜变量混淆的非参数方法。
可借鉴思路：将潜变量的影响从“线性参数化”放松为“任意非线性函数”（类似Proximal CI中处理未测量混淆的灵活性思想），结合非高斯性实现识别；这种在宽松混淆结构下寻找图论充要条件的思路，对研究半参数/非参数因果模型的识别域极具启发。

局限性与开放问题¶

估计理论缺失：目前仅提供了估计的启发式算法，缺乏对估计量的渐近分布、半参数效率界或收敛速率的严格数理统计刻画（这是后续可深耕的理论方向）。
一般可识别性 vs 严格可识别：结论建立在“一般可识别性”（除零测集外）之上，在特定参数配置下仍可能不可识别，敏感性分析是一个开放问题。
非线性混淆的检验：模型假设存在非线性混淆，如何从数据中检验该假设的合理性尚未讨论。

Maintained by 陈星宇 · Homepage · Source on GitHub