Apportioning Causal Responsibility of Two Risk Factors for an Adverse Outcome via Counterfactual Attribution¶
作者: Shanshan Luo, Yafang Deng, Qingyuan Zhao, Zhi Geng
主题: 因果推断
相关性: 8/10
链接: https://arxiv.org/abs/2606.18459
一、领域脉络与小综述¶
这个方向是什么¶
这篇论文处理的根本问题是“已发生结果的因果归因”(Causes of Effects),与传统的“原因的效果”(Effects of Causes)形成对照。传统因果推断(如平均处理效应ATE、条件平均处理效应CATE)是前瞻性的:给定处理,估计其对结果的平均影响。而本文的问题是回顾性的:给定一个已经发生的不良结果(如肺癌),以及两个已知存在的二元风险因素(如吸烟和石棉暴露),如何定量地分配每个因素对这个 已实现 的结果所应承担的因果责任。这个问题的核心统计困难在于,它需要关于“如果这些风险因素不存在(或部分不存在),该结果的潜在状态”的反事实推理,而这些潜在状态永远无法被同时观测。
这个子方向的成熟度相对较低且高度非参数化。它不寻求估计平均因果效应,而是试图分解一个单一事件(或一个亚群中已发生的事件)的责任归属。其识别主要依赖于对潜在结果类型的结构假设(如单调性),而不依赖参数模型。
发展脉络(History)¶
引文(与作者自己的判断)串起了一条清晰的线:
-
奠基工作(单原因设定):
- Pearl (2000) 与 Dawid (2000) 是本方向的基石。Pearl 提出了 概率必要性 (Probability of Necessity, PN),用于量化单个暴露是结果必要的概率。作者引用时指出,PN是“对法律中‘若非则非’(but-for)标准的统计形式化”(Wright, 1985)。Dawid (2000) 则提出了一个不使用反事实的因果推断框架,但同样关注单个原因导致结果的概率。
- Tian and Pearl (2000) 在单调性假设下给出了PN的识别公式与界限,这是后续工作的核心技术之一。
- 遗留口子:所有这些工作都完全局限于单原因场景。当存在两个同时、交互的风险因素时,分别计算每个因素的PN会得到一个“总必要性份额”,总和远超过100%,无法进行合理的责任分配。
-
主要进展(多原因设定的尝试):
- Lu et al. (2023) 和 Luo et al. (2026) 是最接近的直接相关工作。作者指出,这些工作“聚焦于量化在结果发生后,多个原因的后验总效应,而非在它们之间分配责任”。这意味着它们关注的是“这些原因整体上有多大责任”,而不是“每个原因具体承担多少”。这为本文留下了核心定位——从“总效应”到“责任分配”。
-
当前 Frontier 与作者自身的定位:
- 本文明确将自己定位在 “两原因、非参数、回顾性责任分配” 的框架。它利用了一个经典但被忽视的概率分布参数——Darroch and Borkent (1994) 对两个二元暴露因素协同作用(synergism)和交互作用的研究。作者引用该文指出,在单调性假设下,潜在结果的联合概率
pr(Y_01 = 1, Y_10 = 1)是不可识别的,但有一个已知的可行区间[ν_l, ν_u]。本文的核心技巧在于证明,在某些特定的“责任分配规则”下,尽管潜在类型概率不可识别,但加权后的平均因果责任在这个不可识别参数ν附近保持恒定(或具有sharp bounds)。 - 作者也引用了 Balke and Pearl (1994) 和 Ben-Michael et al. (2024),这些工作提供了更一般的部分识别方法论,暗示了放松单调性假设的未来方向。
- 本文明确将自己定位在 “两原因、非参数、回顾性责任分配” 的框架。它利用了一个经典但被忽视的概率分布参数——Darroch and Borkent (1994) 对两个二元暴露因素协同作用(synergism)和交互作用的研究。作者引用该文指出,在单调性假设下,潜在结果的联合概率
子线索聚类¶
被引文献可以分成三簇:
- 单原因归因与概率必要性:Pearl (2000), Dawid (2000), Tian and Pearl (2000), Dawid and Musio (2022),Dawid et al. (2014)。 这一簇提供了基础概念(PN)和单原因下的识别方法。
- 多原因的总效应与潜在结果类型:Lu et al. (2023), Luo et al. (2026), Luo et al. (2025), Darroch and Borkent (1994)。 这一簇研究了多因素共同作用时的总体因果作用,并界定了潜在类型的分布。
- 部分识别与无假设方法:Balke and Pearl (1994), Ben-Michael et al. (2024), Gabriel et al. (2024)。 这一簇提供了更一般的识别框架,是本文处理非平衡规则(导致部分识别)时的技术渊源。
这个方向在追问的核心问题¶
- Q1:如何定义“因果责任”这样一个概念,使其在数学上可操作且在不同领域(法律、医学、经济学)中具有合理的解释?
- Q2:在纯观测数据下,给定结果发生后,是否存在对每个原因责任的无偏估计(点识别)?需要哪些额外假设(如单调性)?
- Q3:当点识别失败时(例如,责任分配规则具有结构性“不平衡”),我们能得到多紧的界限?这些界限是否足够窄以产生实质性结论?
- Q4:如何处理超过两个原因、或多值结果的情况?
⚠️ 作者的 Framing¶
作者如何frame缺口:作者将缺口描述为“多原因情况下的责任分配问题”,而非简单的“总效应”问题。他们巧妙地将自己的核心贡献定义为:给定一个责任分配规则,即使潜在类型概率不可识别,某些规则下的加权平均也是可识别的;而其他规则下的界限则受控于唯一不可识别参数 ν 的区间 [ν_l, ν_u]。这使本文成为一个“显然的下一步”——补上了从“概率必要性”到“责任分配”的逻辑链条。
竞争路径被淡化或回避:作者几乎没有讨论基于结果的后验概率(posterior probability)进行归因的贝叶斯方法。他们主要谈论的是“平均因果责任”,这是一种基于人群潜在类型分布频率的频繁学派思想。这避免了复杂的先验设定,但也回避了“个体化”归因问题。
什么明显该被引/该存在、却没出现在 intro 里:这篇论文的框架与 Principal Stratification (主分层,Frangakis and Rubin, 2002) 高度相似。(Y_00, Y_01, Y_10, Y_11) 的16种组合本质上就是主分层中的16个“基本层”(principal strata)。作者没有使用这个术语。对一位熟悉主层分析的读者来说,这可能是一个需要自己判断的“连接点”——是否将本文的工作看作是主层分析的一个特例,还是认为它有本质不同。
张力¶
未见明显对立引用。Pearl 和 Dawid 阵营之间的争论(反事实 vs. 非反事实)在此处(已发生结果的归因)似乎得到了调和,因为本文同时引用了两人并使用了反事实框架。Darroch and Borkent (1994) 的工作是纯描述性的,没有涉及归因,而本文将其嫁接过来,这本身是一个有趣的创新,但不存在矛盾。
二、最核心、最简单的例子 / 数学问题¶
第一步:把符号、模型、可观测数据交代清楚¶
-
符号:
Z, M ∈ {0,1}: 两个二元风险因素(例如,Z=1吸烟,M=1石棉暴露)。Y ∈ {0,1}: 二元不良结果(例如,Y=1患肺癌)。C: 观测到的协变量(文章中在技术处理上被条件化并抑制,即所有概率理解为条件于C后的结果)。Y_zm: 潜在结果。在给定Z=z且M=m的干预下,个体将出现的潜在结果。例如,Y_11表示一个人同时吸烟和接触石棉时,是否患肺癌的潜在结果。这是一个潜在/不可观测的量。T = (Y_00, Y_01, Y_10, Y_11) ∈ {0,1}^4: 因果类型 (Causal Type)。这是一个四元组,完全描述了一个个体对所有可能的(Z, M)组合的反应。这是一个潜在/不可观测的向量。E_zm = (Z=z, M=m, Y=1): 观测到的证据。即研究者观察到某个个体暴露于特定风险因素组合(Z=z, M=m)并且结果发生(Y=1)这一事件。这是可观测的。ξ_zm = pr(Y=1 | Z=z, M=m): 条件发病率。在给定风险因素暴露下,群体中结果发生的条件概率。这是可观测的(或其估计量是可观测的)。文章假设有两种典型情况:双暴露E_11 (4个ξ值) 或单暴露E_10 (需ξ_00, ξ_10) 等。π(t) = pr(T = t): 因果类型t的边际概率。它是对整体人口中四种潜在反应模式的概率描述。不可直接识别。π(t | E_zm) = pr(T = t | Z=z, M=m, Y=1): 给定观测证据E_zm后,个体属于因果类型t的后验概率。这是归因计算的核心,但部分不可识别。R_j(t | E_zm): 类型特异性责任 (Type-Specific Responsibility)。对于给定的因果类型t和观测证据E_zm,分配给因素j(j = Z, M, 或0表示背景因素)的规范性责任份额。这是一个研究者需指定的规则,不是数据本身提供的。R_j(E_zm): 平均因果责任 (Average Causal Responsibility)。R_j(t | E_zm)在π(t | E_zm)分布下的期望。这是本文要识别的参数。
-
模型:
- 数据生成机制: 两个二元风险因素Z和M被随机(或近似随机,在无混杂假设下)分配到个体。个体有一个固有的、不可观测的反应函数
T = (Y_00, Y_01, Y_10, Y_11)。总的来说,对给定个体,观测结果Y = Y_zm(一致性假设)。整个模型是一个完全非参数模型,没有任何对π(t)或Y_zm间关系的函数形式假设。
- 数据生成机制: 两个二元风险因素Z和M被随机(或近似随机,在无混杂假设下)分配到个体。个体有一个固有的、不可观测的反应函数
-
可观测数据:
- 能够观测到什么:研究者能观测到每个个体的
(Z, M, Y),或更特指地,能估算出条件发病率(ξ_00, ξ_10, ξ_01, ξ_11)。这些就是文章所需的全部“数据”。 - 想要但观测不到的(潜在):
- 反事实结果: 对任何一个个体,我们只能观察到
(Z,M,Y)对应的那个潜在结果,其他三个Y_zm结果是观测不到的。 - 因果类型: 我们永远无法直接知道一个个体属于哪个
T。我们只能根据其观测到的证据E_zm推断其可能属于哪些类型。 - 联合概率: 概率π(t) 及其后验π(t|E_zm),以及Darroch和Borkent提出的联合概率
ν = pr(Y_01=1, Y_10=1),是永远无法从边际ξ_zm中完全恢复的。
- 反事实结果: 对任何一个个体,我们只能观察到
- 能够观测到什么:研究者能观测到每个个体的
第二步:讲最小内核¶
本文的最小的、支撑整个论文的核心思想是:在单调性假设下,唯一阻挡识别 R_j(E_11) 的参数是 ν,但如果我们选择的 R_j(t|E_11) 规则符合某种“结构性平衡”,加权平均 R_j(E_11) 在 ν 的变化下保持不变。
最简特例:
假设一个极简情况,我们只看双暴露证据 E_11,以及最简单的“活性因果”(Active-only, Assumption 3)责任分配规则(对照Table 2)。
在这个规则下:
- 类型0001(协同型/synergistic): R_Z=50%, R_M=50%
- 类型0011(吸烟单独/smoking-only): R_Z=100%, R_M=0%
- 类型0101(石棉单独/asbestos-only): R_Z=0%, R_M=100%
- 类型0111(平行型/parallel): R_Z=50%, R_M=50%
- 类型1111(注定型/doomed): R_Z=0%, R_M=0%
现在,根据观测数据,已知 π(1111|E_11) = ξ_00/ξ_11(注定型的后验概率是可直接得出的,因为只有该类型的人在全面暴露下也会发病,且其发生的概率就是背景风险率)。
对于其他类型,其概率由式(3)给出,并依赖于未知参数ν。
π(0001|E_11) = (ξ_11 - ξ_10 - ξ_01 + ν) / ξ_11
π(0011|E_11) = (ξ_10 - ν) / ξ_11
π(0101|E_11) = (ξ_01 - ν) / ξ_11
π(0111|E_11) = (ν - ξ_00) / ξ_11
现在,我们计算R_Z(E_11) = Σ R_Z(t|E_11) * π(t|E_11)。
代入各π(t|E_11)和R_Z值,我们得到一个线性表达式,其中ν出现了。但是,仔细观察各项:
R_Z(E_11) = [0 * (ν-ξ_00) + 0.5 * (ξ_11 - ξ_10 - ξ_01 + ν) + 1 * (ξ_10 - ν) + 0 * (ξ_01 - ν) + 0 * ξ_00]/ξ_11
让我们化简分子:
= 0.5 * (ξ_11 - ξ_10 - ξ_01 + ν) + (ξ_10 - ν)
= 0.5ξ_11 - 0.5ξ_10 - 0.5ξ_01 + 0.5ν + ξ_10 - ν
= 0.5ξ_11 + 0.5ξ_10 - 0.5ξ_01 - 0.5ν
啊!这不完全抵消!但再仔细检查(对照Theorem 1的公式 (ξ_11 + ξ_10 - ξ_01 - ξ_00) / (2ξ_11)),我们的式子中还有一项-0.5ν,而Theorem 1中是 -0.5ξ_00。
让我意识到:上面的计算中,R_Z(t|E_11) 的取法并没有让所有ν都抵消掉! 这是因为我在计算中将R_Z分配给 π(0011|E_11) 项时使用了 1,而分配给 π(0111|E_11) 项时使用了 0.5,但实际在Active-only规则里(对照Table 2),R_Z在 π(0111|E_11) 下是 1(因为平行型下吸烟单独也足以导致结果,所以吸烟负全责?不,这是作者的设定,让我们严格按照Table 2:并行型下,R_Z=50%, R_M=50%。所以在并行型下,虽然吸烟足以致病,但作者选择将责任平分。这一设定是规范性的,不是数据告诉我们的,而是作者规定的。这非常关键)。
正确计算(对照Table 2,E_11栏):
R_Z(0011) = 1, R_Z(0101) = 0, R_Z(0001) = 0.5, R_Z(0111) = 0.5, R_Z(1111) = 0.25(?)
再对照 Table 2: 双暴露E_11栏下,并行型(0111)的R_Z也是0.5。重新核实。对,并行型是50-50。
所以公式变为:
R_Z(E_11) 分子 = 1*(ξ_10 - ν) + 0*(ξ_01 - ν) + 0.5*(ξ_11 - ξ_10 - ξ_01 + ν) + 0.5*(ν - ξ_00)
= ξ_10 - ν + 0.5ξ_11 - 0.5ξ_10 - 0.5ξ_01 + 0.5ν + 0.5ν - 0.5ξ_00
= -0.5ξ_00 + 0.5ξ_10 - 0.5ξ_01 + 0.5ξ_11 + (-ν + 0.5ν + 0.5ν)
= -0.5ξ_00 + 0.5ξ_10 - 0.5ξ_01 + 0.5ξ_11 + 0ν
完美!ν 项消失了! 分子不依赖ν。
R_Z(E_11) = (0.5ξ_11 + 0.5ξ_10 - 0.5ξ_01 - 0.5ξ_00) / ξ_11 = (ξ_11 + ξ_10 - ξ_01 - ξ_00) / (2ξ_11)
这正是Theorem 1的结果。
最小内核总结:在最简单的情况(双暴露E_11,单调性,活性因果责任规则)下,虽然给定E_11后各潜在类型(synergistic, smoking-only, asbestos-only, parallel, doomed)的概率π(t|E_11) 随着未知参数 ν 变化,但当我们采用作者指定的“公平”分配规则(活性因子平分责任,非活性因子零责任),并将责任权重分配给不同潜在类型时,责任期望中的ν系数恰好和为零。因此,尽管我们对各型的概率分布一无所知,但我们能精确知道责任分配的平均值。这个平均值的公式可以仅用四个可观测的发病率ξ_zm完全表达出来。
三、这篇论文做了什么¶
三句话¶
- 本文研究了一个两原因、二值结果的“已发生结果的因果归因”问题,旨在定量地将一对风险因素(如吸烟和石棉)对已经观察到的不良结果(如肺癌)的因果责任进行分配。
- 核心工具是潜在结果类型(Principal Strata)框架,引入类型特异性责任 (Type-Specific Responsibility) 作为规范性输入,并将平均因果责任定义为该责任在后验潜在类型分布上的期望。
- 主要结论是:在无混杂和单调性假设下,若选择的类型特异性责任规则满足作者提出的结构性平衡条件 (Structural Balance Condition, Assumption 4),平均因果责任是非参数点识别的;否则得到sharp bounds,其宽度与控制不平衡的系数
β_j相关。
关键设定与假设¶
- Assumption 1 (No Confounding / 无混杂):
(Z, M) ⊥ (Y_00, Y_01, Y_10, Y_11). 即风险因素Z和M的取值与个体的所有潜在结果独立。等价于随机化实验。作者后续提到可用条件协变量C放松。这继承了标准因果推断的基础假设。 - Assumption 2 (Monotonicity / 单调性):
Y_00 ≤ Y_01 ≤ Y_11且Y_00 ≤ Y_10 ≤ Y_11。即风险因素的存在只能增加(不能减少)结果发生的概率。这排除了任何保护性效应。这比“标准单调性”(即每个因素单独对结果单调)更强(它限制了交互方式)。它使得潜在类型从16种缩减到6种(忽略免疫型)。这是作者分析可行性的核心。相比已有文献,作者明确指出其在法律和流行病学中的自然性(Lash et al., 2020; VanderWeele and Knol, 2014)。 - Assumption 3 (Active-only Rule / 活性因果规则): 对给定的E_zm,类型特异性责任的分配仅根据哪个因素在因果上是激活的(active):唯一激活的承担100%,两个都激活承担50%,都不激活承担0%。(Specified in Table 2)。这是一个规范性假设,是分析的出发点。
- Assumption 4 (Balanced Responsibility / 平衡责任): 类型特异性责任满足结构平衡条件:在E_11中,交互类型(0001和0111)的责任之和 = 独立类型(0011和0101)的责任之和;对单暴露E_10(或E_01),R_Z(或R_M)在0011和0111(或0101和0111)上相等。这是比Assumption 3更弱的约束。它允许不对称分配,但要求总和相等。作者创造性地提出了这个条件,是本文理论的核心。
主要结果¶
本文主要有三个核心定理和一个实证例子。
-
Theorem 1 (Point Identification under Monotonicity and Active-only Rule): 在Assumptions 1, 2, 3下,平均因果责任R_j(E_zm)被非参数点识别。公式为(4)。技术突破:它证明了一个看似不可能的识别是可能的。必要条件:单调性+特定的责任规则(活性因果) + ν自动消去。口子:规则是完美对称的(Active-only)。
-
Theorem 2 (Point Identification under Structural Balance): 在Assumptions 1, 2, 4下,平均因果责任R_j(E_zm)被非参数点识别。公式是Theorem 1的推广(如5式)。它更一般:只需要责任在一个“求和”量上均衡,而不需要单个类型上严格按活性分配。技术难点:证明如何从“活性因果规则”的推演推广到一般平衡规则。作者给出的公式是显式的,通过代入责任值即可。
-
Theorem 3 (Sharp Bounds with Arbitrary Type-Specific Responsibilities): 在Assumptions 1, 2下(无需平衡),R_j(E_zm)的sharp bounds是线性函数
α_j(E_zm) + β_j(E_zm) * [ν_l, ν_u],其中ν_l, ν_u是(2)中给出的界限。它覆盖了所有情况。当β=0时退化到点识别(Theorem 2)。自然界缺失了什么:它表明界限的宽度完全由β_j(E_zm)(一个关于责任分配的简单函数)控制,而不是由更复杂的未知量控制。这个系数是一个“imbalance coefficient”,值是(R_j(0001) - R_j(0011) - R_j(0101) + R_j(0111)) / ξ_11。界限的解析形式简单强大。
证明路线与技术技巧(理论型必写)¶
整体路线 (以E_11为例):
1. 定义与表示:将平均因果责任 R_j(E_11) 定义为类型特异性责任 R_j(t|E_11) 与后验类型概率 π(t|E_11) 的乘积和 (2.3节)。
2. 概率界限 (Darroch & Borkent 1994 的借用):在单调性假设下,后验类型概率 π(t|E_11) 是观测概率 ξ_zm 和一个未知联合概率 ν 的函数(见式3),且 ν 限于区间 [ν_l, ν_u] 内 (式2)。这是导致不可识别性的唯一“自由参数”。
3. 代入与化简:将表示式(3)代入(1)中的求和。结果是 R_j(E_11) = α + β * ν,其中α和β是 R_j(t|E_11) 和 ξ_zm 的代数组合。
4. 识别/界限的两种情形:
- 如果 β = 0(即Assumption 4 成立):R_j(E_11) 对 ν 不变 → 点识别。
- 如果 β ≠ 0: R_j(E_11) 是 ν 的线性函数,所以其范围就是 α + β * [ν_l, ν_u]。由于ν的界限是已知的,R_j的界限也是已知的,且是sharp的(因为ν取遍区间内的任意值,R_j取遍该区间端点,所以界限是sharp的)。
5. 单暴露情况类似:使用同样的线性代入和化简逻辑,得出单暴露的公式。
关键跳跃点:
- ν 的抵消:这是最大的跳跃。作者认识到,虽然概率不可识别,但加权和 R_j 只是 ν 的线性函数。关键在于理解,线性函数的系数β 可以由于责任分配规则R_j的对称性而为零。
- 从ν到R_j界限的跳跃:认识到ν的界限 [ν_l, ν_u] 可以等价映射到 R_j 的界限。这在数学上是平凡的(线性函数的像区间),但在统计学上很重要——它表明即使没有点识别,我们仍然可以给出有效且sharp的区间估计。
技术技巧点名:
- 潜在结果类型框架:系统地对 (Y_00, Y_01, Y_10, Y_11) 的所有组合进行枚举和分类(synergistic, smoking-only, asbestos-only, parallel, doomed)。这是定性建模的核心技巧。
- Darroch & Borkent (1994) 的界限:直接使用经典的界限结果来量化不可识别性的范围。这是应用老技巧的典范。
- 低维参数化:将16个潜在类型(在单调性下减为6个)的后验概率参数化为一个单一未知参数ν。这是简化分析的精妙之举。
- 线性化解消:将目标函数R_j写成关于ν的线性函数,β系数是简单责任分配的差分。本质是线性代数技巧。
真实例子与应用¶
论文使用了两个真实/合成例子(Sections 5.1 & 5.2)。
例子1: 真实流行病学数据 (VanderWeele & Knol, 2014; Hilt et al., 1986) - 数据/场景: 一组关于吸烟和石棉暴露导致肺癌的经典四格数据 (ξ_00=0.12%, ξ_10=0.95%, ξ_01=0.67%, ξ_11=4.51%)。这被用作代表性的协同型场景(dominant synergistic type)。 - 方法应用: 对四个不同的责任规则(Active-only, Balanced, Smoking-oriented, Workplace-oriented)计算R_j(E_zm)。 - 结果: 在Active-only规则下,吸烟承担51.77%,石棉承担45.57%,背景仅占2.66%;在Balanced规则下,背景责任升至37.38%。在非平衡的规则下(如Smoking-oriented),论文展示了sharp bounds [61.15%, 62.37%],宽度仅1.22%,明确识别了主导因素。 - 说明目标: 验证理论结果在实际数据中的可计算性,证明即使点识别失败(在某些非平衡规则下),sharp bounds也极其狭窄,足以给出确定的结论(如吸烟承担主要责任)。突出了方法的实用价值。
例子2: 合成数据(主导石棉风险) - 数据/场景: 将例子1中的ξ_01从0.67%提高至4.00%,模拟了石棉主导的情况(dominant asbestos-only type)。 - 方法应用: 使用同样的四个规则。 - 结果: 在Active-only下,石棉占比飙升至82.48%,吸烟降至14.86%。Smoking-oriented规则下的bound [32.33%, 33.46%] 都低于50%,直接排除了吸烟作为主要原因。 - 说明目标: 证明框架能适应不同的潜在发病机制,并且即使在不对称规则下,界限也能可靠地指向主要因素。验证了理论的鲁棒性。
🔎 结论是否比证明窄¶
一个潜在的窄化:论文的所有结论都依赖于单调性假设。没有这个假设,潜在类型数量增加(特别是出现“免疫型”以外的其他类型如讨好型 Y_01 = 1, Y_00 = 0),且 ν 的界限不再适用,整个识别框架可能完全失效。作者在Discussion(第6节)中明确承认了这一点:“Under weaker monotonicity assumptions, our identification results no longer apply directly”。论文的贡献完全框定在单调性有效的情景内,并未声明对非单调性的推广。
四、开放问题¶
-
放松单调性假设:作者坦言(第6节):“在较弱的单调性假设下,我们的识别结果不再直接适用”。一个具体的问题是:当允许风险因素具有保护效应(非单调)时,如何定义“因果责任”?如何建立相应的点识别或sharp bounds框架(扎根于Balke & Pearl (1994) 的工作)?
-
扩展到K>2个原因:作者指出(第6节):“将结果推广到三个或更多原因仍具挑战性,因为因果类型和单调性配置的数量会急剧增长”。一个可行的课题是:通过图模型或代数组合方法,找到多原因情况下的可识别条件或计算sharp bounds的通用算法(扎根于Lu et al. (2023) 和 Luo et al. (2025) 提到的方向)。
-
责任分配规则的“最优化”或“学习”:作者在第4节中举了多个责任分配规则的例子,并强调了规则选择需要领域知识。一个更深入的理论问题是:在给定的统计或法律目标下(如最小化某个宽泛的误差度量,或最大化香农信息的后验预测),是否存在一个“最优”的类型特异性责任规则?这也许可以形式化为一个决策理论问题,并需探讨其与Section 4.2中平衡条件的联系。
Maintained by 陈星宇 · Homepage · Source on GitHub