Bias-Reduced GEE via Adjusted Estimating Equations, with Odds-Ratio Extensions¶

作者: Anestis Touloumis
主题: 非参数 / 半参数
相关性: 6/10
链接: https://arxiv.org/abs/2606.16043

一、领域脉络与小综述¶

这个方向是什么¶

广义估计方程（GEE，Liang & Zeger, 1986）是分析纵向数据或聚类数据的标准方法，它通过指定边际均值和低维的工作关联结构来估计回归参数，且在正确指定边际均值模型下，即使工作关联结构错设，仍能得到一致的、渐近正态的估计。然而，当独立聚类数 \(N\) 较小或中等时，回归估计量可能出现严重偏倚，影响Wald型推断（Paul & Zhang, 2014; Mondol & Rahman, 2019; Geroldinger et al., 2022; Gosho et al., 2023）。该子方向致力于降低GEE在有限样本下的偏倚，主要通过两类路线：一是对估计方程直接施加调整（bias-reduced estimating equations），二是对已有估计量作一步偏倚校正（bias correction）。目前这一子方向相对成熟，但仍有若干被忽视的缺口——特别是工作协方差对均值参数的依赖问题，以及对二元响应中odds-ratio参数化的处理。

发展脉络（history）¶

奠基工作：似然框架下的偏倚校正
Cox & Snell (1968) 最早给出了极大似然估计量的一般偏倚展开，Cordeiro & McCullagh (1991) 将其推广到广义线性模型（GLM），Firth (1993) 则通过修正得分函数实现偏倚减少（消除 \(O(N^{-1})\) 偏倚）。这些工作在似然框架下为后文奠定了基础。
GEE的偏倚校正：直接移植似然方法
Paul & Zhang (2014) 借鉴Firth (1993)的思想，将GEE估计量视为 \(M\)-估计量，推导了偏倚减少（bias-reduced）和偏倚校正（bias-corrected）的GEE估计量。Lunardon & Scharfstein (2017) 指出他们的构造依赖关联结构的正确设定，进而给出了一个一步偏倚校正量，该校正量在错设时仍有效。然而作者注意到（Introduction 第2段）：“A further limitation, not previously noted, is that treating the working covariance matrices as fixed with respect to the marginal means introduces an additional problem even under correct specification of the association structure.” 即 Paul & Zhang (2014) 将工作协方差矩阵视为与均值参数无关，这在方差依赖于均值（如二项、泊松）时会导致一阶偏倚减少失效。
当前 frontier：统一 \(M\)-估计框架与 odds-ratio 参数化
Kosmidis & Lunardon (2024) 发展了一般的经验性偏倚减少调整方法（empirical bias-reducing adjustments to estimating functions），为本文提供了理论工具。本文在此基础上，将GEE嵌入聚类数据 \(M\)-估计框架，显式推导了理想调整目标，并构造了稳健、朴素、经验三类调整向量。同时，对于二元响应，首次将偏倚减少框架扩展到 pairwise odds-ratio 参数化（Lipsitz et al., 1991; Carey et al., 1993），这一参数化避免了相关系数参数化的可行性约束（Prentice, 1988; Chaganty & Joe, 2004, 2006），在小样本下更为稳定。

子线索聚类¶

这些被引文献大致落在以下三个子线索上： - 似然框架的偏倚校正（Cox & Snell, 1968; Cordeiro & McCullagh, 1991; Firth, 1993; Cordeiro & Klein, 1994）：发展了一套成熟的方法，但限于似然方程。 - GEE的偏倚减少/校正（Paul & Zhang, 2014; Lunardon & Scharfstein, 2017; Mondol & Rahman, 2019; Geroldinger et al., 2022; Gosho et al., 2023）：直接针对GEE，但要么忽略了工作协方差对均值的依赖，要么仅适用于相关系数参数化。 - odds-ratio 参数化与关联建模（Lipsitz et al., 1991; Carey et al., 1993; Prentice, 1988; Chaganty & Joe, 2004, 2006; Touloumis et al., 2013; Touloumis, 2026）：提供一个不受边际均值约束的关联参数化，但此前未有偏倚减少方法。

该方向在追问的核心问题¶

如何将似然框架下的偏倚减少技术（Firth, 1993）扩展到 \(M\)-估计（GEE），并处理工作协方差对均值的依赖？
在错设工作关联结构时，偏倚减少能否仍保持？需要什么条件？
对于二元响应，odds-ratio 参数化是否能在偏倚减少框架下实现，且对比相关系数参数化有何优势？
当普通GEE解不存在时（如分离问题），如何保证偏倚减少估计量的存在性？

当前主流方法：Paul & Zhang (2014) 的偏倚减少估计量和 Lunardon & Scharfstein (2017) 的稳健一步校正。已知瓶颈：Paul & Zhang (2014) 忽略了均值-方差依赖，导致对二项/泊松等响应一阶偏倚校正失败；所有现有方法仅适用于相关系数参数化，而此参数化在小样本下常导致工作相关矩阵非正定。

⚠️ 作者的 framing（需明确标注为作者说法）¶

作者将缺口 frame 如下：“All existing bias-correction and bias-reduction methods have focused on correlation-coefficient parameterizations of the association” 以及 “treating the working covariance matrices as fixed with respect to the marginal means introduces an additional problem”。由此，本文的贡献成为“显然的下一步”：统一三个调整向量，且首次扩展到 odds-ratio 参数化。竞争路线被淡化的：作者没有讨论基于 bootstrap 或 jackknife 的偏倚校正方案（这种方案不依赖 \(M\)-估计展开，但计算成本高），也没有讨论完全贝叶斯路线。明显该被引或该存在、却未出现在intro中：有关 GEE 的有限样本性质的理论文章（如更精细的 Edgeworth 展开）未被引用；此外，与 penalized GEE（如 Touloumis 2026）的衔接虽然在文中提到，但未在 intro 中突出该路线作为竞争或补充。

张力¶

未见明显对立引用。但存在一个微妙张力：Paul & Zhang (2014) 和 Lunardon & Scharfstein (2017) 对工作协方差假设的处理不同——前者默认协方差固定，后者允许协方差依赖于均值但只考虑了相关系数参数化。本文批评前者并推广后者，但没有直接比较两种假设下的有限样本性能（仅在模拟中包含了一部分对比，且 NBR 包含了 ΛN2 项，而 PZ 的估计量是 λN2=0 的特例，模拟中未单独运行 PZ 的结果，而是说“The naive estimators of Paul and Zhang are omitted since they correspond to the special case ΛN2 = 0p of our naive adjustment”）。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

符号及定义
\(i=1,\dots,N\)：独立聚类（subject）下标。
\(j=1,\dots,n_i\)：每个聚类内的观测时刻。
\(\mathbf{Y}_i = (Y_{i1},\dots,Y_{in_i})^\top\)：第 \(i\) 个聚类的响应向量。
\(\mathbf{X}_i\)：\(n_i \times p\) 协变量矩阵。
\(\mu_{ij} = E(Y_{ij} \mid \mathbf{x}_{ij})\)，\(\boldsymbol{\mu}_i = (\mu_{i1},\dots,\mu_{in_i})^\top\)。
边际回归模型：\(g(\mu_{ij}) = \eta_{ij} = \mathbf{x}_{ij}^\top \boldsymbol{\beta}\)，\(g(\cdot)\) 为已知链接函数，\(\boldsymbol{\beta} \in \mathbb{R}^p\) 为感兴趣的回归参数。
\(\text{Var}(Y_{ij}) = \phi h(\mu_{ij})\)：方差函数 \(h(\cdot)\) 已知，\(\phi\) 为离散参数。
\(\mathbf{A}_i = \text{diag}\{h(\mu_{ij})\}\)，工作相关矩阵 \(\mathbf{R}_i(\alpha)\) 依赖于参数向量 \(\alpha\)。
工作协方差矩阵 \(\mathbf{V}_i = \phi \mathbf{A}_i^{1/2} \mathbf{R}_i(\alpha) \mathbf{A}_i^{1/2}\)（相关系数参数化）或由 odds-ratio 导出（见后）。
残差向量 \(\mathbf{S}_i = \mathbf{Y}_i - \boldsymbol{\mu}_i\)。
\(\mathbf{D}_i = \boldsymbol{\Delta}_i \mathbf{X}_i\)，其中 \(\boldsymbol{\Delta}_i = \text{diag}\{\partial \mu_{ij}/\partial \eta_{ij}\}\)。
GEE 估计量 \(\hat{\boldsymbol{\beta}}_G\) 求解 \(\mathbf{U}_G = \sum_i \mathbf{D}_i^\top \mathbf{V}_i^{-1} \mathbf{S}_i = \mathbf{0}_p\)。
渐近线性化中出现的矩阵：\(\boldsymbol{\Sigma}_0 = \sum_i \mathbf{D}_i^\top \mathbf{V}_i^{-1} \mathbf{D}_i\)，\(\boldsymbol{\Sigma}_1 = \sum_i E(\mathbf{U}_i \mathbf{U}_i^\top)\)。
渐近方差：\(\boldsymbol{\Sigma}_G = \boldsymbol{\Sigma}_0^{-1} \boldsymbol{\Sigma}_1 \boldsymbol{\Sigma}_0^{-1}\)。
调整向量：\(\boldsymbol{\Lambda}_{\text{BR}}\) 加到估计方程中，得到 \(\mathbf{U}_{\text{BR}} = \mathbf{U}_G + \boldsymbol{\Lambda}_{\text{BR}} = \mathbf{0}_p\)。
模型与可观测数据
模型假设：边际均值由广义线性模型决定；工作关联结构（\(\mathbf{R}_i(\alpha)\) 或 odds-ratio）是用户指定的低维近似；协变量视为固定（或条件于 \(\mathbf{X}_i\) 处理）。可观测数据：对每个聚类，有 \((\mathbf{Y}_i, \mathbf{X}_i)\)；\(\alpha\) 和 \(\phi\) 未知，通常通过矩估计（Liang & Zeger, 1986）得到 \(\sqrt{N}\)-一致的估计。
潜在/未观测量：真实协方差矩阵 \(\text{cov}(\mathbf{Y}_i)\) 未知，需要被近似或假设。

第二步：最小内核——当 GEE 恰好为无偏时的特例（展示调整的微妙性）¶

考虑最简特例：
- 响应为正态分布：\(Y_{ij} \sim N(\mu_{ij}, \sigma^2)\)，独立同方差（\(\phi = \sigma^2\)，\(h(\mu)=1\)）；
- 身份链接 \(g(\mu) = \mu\)，因此 \(\mathbf{D}_i = \mathbf{X}_i\)；
- 工作独立：\(\mathbf{R}_i(\alpha) = \mathbf{I}_{n_i}\)，所以 \(\mathbf{V}_i = \sigma^2 \mathbf{I}_{n_i}\)；
- \(\sigma^2\) 已知（为简化）。
此时 GEE 方程退化为一组普通最小二乘方程：\(\sum_i \mathbf{X}_i^\top (\mathbf{Y}_i - \mathbf{X}_i \boldsymbol{\beta}) = \mathbf{0}\)，其解 \(\hat{\boldsymbol{\beta}}_G\) 正是 MLE，无偏（\(E(\hat{\boldsymbol{\beta}}_G - \boldsymbol{\beta}) = \mathbf{0}\)）。

在这个特例下，理想的目标调整 \(\boldsymbol{\Lambda}^G\) 应为零（因为 \(E(\hat{\boldsymbol{\beta}}_G - \boldsymbol{\beta}) = 0\) 意味着无偏，无需校正）。现在检查三种构造：

稳健调整 \(\boldsymbol{\Lambda}^R\)：替换 \(\text{cov}(\mathbf{Y}_i)\) 为 \(\mathbf{S}_i \mathbf{S}_i^\top\)。因为 \(\boldsymbol{\Lambda}^G\) 恒为零，且 \(E(\mathbf{S}_i \mathbf{S}_i^\top) = \sigma^2 \mathbf{I}\)，期望下 \(\boldsymbol{\Lambda}^R\) 也为零，故 RBR 恰好给出无偏估计（延续 GEE 性质）。
朴素调整 \(\boldsymbol{\Lambda}^N\)：若进一步假设 \(\mathbf{V}_i = \text{cov}(\mathbf{Y}_i)\)（此处成立），则 \(\boldsymbol{\Lambda}^N\) 也为零，NBR 也无偏。
经验调整 \(\boldsymbol{\Lambda}^E\)：由式 (10) 给出。它基于样本值 \(j, d, e, u\)，是随机量；即使目标为零，其样本实现一般不恒为零。因此 EBR 解 \(\hat{\boldsymbol{\beta}}_{\text{EBR}}\) 一般不等于普通 GEE 解，引入额外变异性（Web Appendix D.1 明确指出了这一点：“the empirical adjustment \(\Lambda_E\) does not identically vanish”）。

这个特例说明了什么？
（1）当 GEE 本身无偏时，一个好的偏倚减少策略应保留这一性质（调整应为零）。
（2）RBR 和 NBR 因基于期望替代，在“无偏目标”下自动归零；而 EBR 因直接使用样本矩，即使期望为零，也造成有限样本额外误差。
（3）这解释了为什么作者推荐 RBR 为默认、EBR 为 fallback 的建议。
（4）更一般地，该特例展现了“理想调整” \(\boldsymbol{\Lambda}^G\) 的构造逻辑：从 \(M\)-估计的偏倚展开出发得到目标，再设计近似满足无偏性条件 (5)：\(E(\boldsymbol{\Lambda}^{\text{BR}}) = \boldsymbol{\Lambda}^G + O(N^{-1/2})\)。

三、这篇论文做了什么¶

三句话¶

① 本文将 GEE 估计量视为聚类数据 \(M\)-估计量，推导了消除一阶偏倚的调整估计方程，并构造了三类可实现的偏倚减少估计量（RBR、NBR、EBR）及对应的一步偏倚校正版本，统一并扩展了 Paul & Zhang (2014) 和 Lunardon & Scharfstein (2017) 的工作。
② 核心工具是 Kosmidis & Lunardon (2024) 的 RBM 恒等式，通过显式计算 GEE 得分函数的一阶和二阶导数的期望，导出理想调整 \(\boldsymbol{\Lambda}^G\)，然后分别通过稳健（用残差外积替代协方差）、朴素（假设工作协方差正确）、经验（用样本导数组装）三种近似构造可计算的调整向量。
③ 主要结论：在标准正则条件下，所有六种估计量与普通 GEE 具有相同渐近分布；模拟表明，在 \(N\) 小到中等时，RBR 显著降低偏倚，同时维持相近效率，且覆盖概率接近名义水平；在二元响应中，odds-ratio 参数化的调整估计量首次被提出并在真实数据中展示了比相关系数参数化更稳定的性能。

关键设定与假设¶

正则条件：引用 Liang & Zeger (1986) Theorem 2 的条件（bounded cluster sizes, correct marginal mean, 适当矩条件）以及 Kosmidis & Lunardon (2024) 的 \(M\)-估计正则条件（包括得分与协方差矩阵的非奇异极限）。
模型：边际回归模型正确指定。工作关联结构（\(\mathbf{R}_i(\alpha)\) 或 odds-ratio）可错设。
对调整向量的假设：\(\boldsymbol{\Lambda}_{\text{BR}}\) 及其关于 \((\boldsymbol{\beta}, \alpha, \phi)\) 的导数为 \(O_p(1)\)，且满足 \(E(\boldsymbol{\Lambda}_{\text{BR}}) = \boldsymbol{\Lambda}^G + O(N^{-1/2})\)（条件 (5)）。
与已有工作的比较：本文的“稳健”调整量 \(\boldsymbol{\Lambda}^R\) 对应 Lunardon & Scharfstein (2017) 的估计量（在相关系数参数化下）；“朴素”调整量 \(\boldsymbol{\Lambda}^N\) 若舍去 \(\boldsymbol{\Lambda}_{N2}\) 则恢复 Paul & Zhang (2014) 的偏倚减少量。这表明本文统一了它们，并且首次明确指出了 \(\boldsymbol{\Lambda}_{N2}\) 项的重要性：当方差依赖于均值时，忽略此项会导致一阶偏倚校正失败。

主要结果¶

结果 1（理想的偏倚目标）：
在假设 \(\alpha, \phi\) 已知的条件下，GEE 估计量的偏倚为 \(E(\hat{\boldsymbol{\beta}}_G - \boldsymbol{\beta}) = \boldsymbol{\Sigma}_0^{-1} \boldsymbol{\Lambda}^G + O(N^{-3/2})\)，其中 \(\boldsymbol{\Lambda}^G\) 由式 (3) 给出，依赖于 \(\{\text{cov}(\mathbf{Y}_i)\}\)。
直觉：这是 \(M\)-估计标准偏倚展开的聚类数据版本；\(\boldsymbol{\Lambda}^G\) 涉及 \(\mathbf{U}_i\) 的一、二阶导数的期望。

结果 2（稳健、朴素、经验三个调整向量）： - 稳健调整 \(\boldsymbol{\Lambda}^R\)：将 \(\text{cov}(\mathbf{Y}_i)\) 换成 \(\mathbf{S}_i \mathbf{S}_i^\top\)，满足 \(E(\boldsymbol{\Lambda}^R) = \boldsymbol{\Lambda}^G\)（精确），因此条件 (5) 成立，无需正确指定关联结构。 - 朴素调整 \(\boldsymbol{\Lambda}^N\)：假设 \(\mathbf{V}_i = \text{cov}(\mathbf{Y}_i)\)，简化计算，仅当关联结构正确或满足条件 (9) 时才保证一阶偏倚减少。 - 经验调整 \(\boldsymbol{\Lambda}^E\)：直接使用样本导数 \(j, d, e, u\)，满足条件 (5)，但有限样本变异性较 RBR 大（如二节特例所示）。

结果 3（渐近等价性）：
在标准正则条件下，\(\hat{\boldsymbol{\beta}}_{\text{RBR}}, \hat{\boldsymbol{\beta}}_{\text{NBR}}, \hat{\boldsymbol{\beta}}_{\text{EBR}}\) 及其一步校正版本 \(\hat{\boldsymbol{\beta}}_{\text{RBC}}, \hat{\boldsymbol{\beta}}_{\text{NBC}}, \hat{\boldsymbol{\beta}}_{\text{EBC}}\) 都与普通 GEE 同渐近分布：\(\sqrt{N}(\hat{\boldsymbol{\beta}} - \boldsymbol{\beta}) \xrightarrow{d} N(\mathbf{0}, \lim N \boldsymbol{\Sigma}_G)\)。证明思路在 Web Appendix E 中给出：通过 Taylor 展开和 \(\mathbf{U}_\Lambda = \mathbf{U}_G + O_p(1)\) 以及 \(\mathbf{U}_G\) 的 CLT。

结果 4（Odds-ratio 参数化扩展）：
基于 Lipsitz et al. (1991) 和 Carey et al. (1993) 的 odds-ratio 参数化，重新推导了 \(\boldsymbol{\Lambda}^{OR}_{G1}, \boldsymbol{\Lambda}^{OR}_{G2}\)（Web Appendix C），构建了对应的 RBR/NBR/EBR 估计量。这是该参数化下首次偏倚减少方法。

模拟核心结论（详见正文 Tables 1-2 及 Web Tables 1-2）： - 对于二元响应（probit 模型，\(N=20,35,50,100,500\)），RBR 一致地减少偏倚（特别对时间变化协变量 \(\beta_2\)），同时维持接近 1 的 RE（相对效率指标）和接近名义的覆盖率（95%），收敛比例近百 (100%)。 - 在随机缺失（MCAR）情况下，RBR 保持稳健，而 EBR 在 \(N=20\) 时收敛率降至 ~93%（独立）和 ~92%（可交换），且 ESE 显著增大（SRE 低至 0.37）。 - 对于 Poisson 响应（对数线性模型），GEE 自身偏倚已很小，偏倚减少带来的改善不明显；但在小样本（\(N=20\)）下，AR(1)工作相关结构引起约 91% 的收敛比例，所有方法受影响相似。

真实例子：肩痛临床试验（Lumley, 1996）。41 位病人，二元疼痛评分，拟合 logistic 边际模型，使用 odds-ratio 参数化与无结构工作 OR 结构。结果（Table 3）：RBR 与 RBC 的点估计与标准误较 GEE 略有下降，但推断结论一致（治疗有效、最后一天有效、年龄边缘显著、性别不显著）。使用相关系数参数化时出现非收敛和非正定工作相关矩阵，印证了 odds-ratio 参数化的优势。

证明路线与技术技巧¶

整体路线（针对偏倚调整的推导）： 1. 写出 GEE 得分函数 \(\mathbf{U}_G(\boldsymbol{\beta}) = \sum_i \mathbf{D}_i^\top \mathbf{V}_i^{-1} \mathbf{S}_i\)。 2. 应用 \(M\)-估计的 RBM 恒等式（Kosmidis & Lunardon, 2024 公式 (6)）：
\(\boldsymbol{\Lambda}^G = -(\mathbf{I}_p \otimes \mathbf{1}_p^\top) [(\mathbf{1}_p \otimes \{\mathbf{E}(j)\}^{-1}) \circ \mathbf{E}(d) + \frac12 (\mathbf{1}_p \otimes \{\mathbf{E}(j)\}^{-1} \mathbf{E}(e) \{\mathbf{E}(j)\}^{- \top}) \circ \mathbf{E}(u)] \mathbf{1}_p\)，
其中 \(j = D\mathbf{U}_G(\boldsymbol{\beta})\)，\(d = \sum_i \text{vec}([D\mathbf{U}_i]^\top) \mathbf{U}_i^\top\)，\(e = \sum_i \mathbf{U}_i \mathbf{U}_i^\top\)，\(u = Dj(\boldsymbol{\beta})\)。 3. 计算这些量的期望：
- \(E(j) = -\boldsymbol{\Sigma}_0\)（利用 \(E(\mathbf{E}_i) = -\mathbf{V}_i^{-1}\)，见 Web Appendix B.5）。
- \(E(e) = \boldsymbol{\Sigma}_1\)。
- \(E(d)\) 和 \(E(u)\) 的计算需要 \(\mathbf{E}_i = [D\mathbf{U}_i(\boldsymbol{\mu}_i)]^\top\) 及其导数的期望，涉及复杂矩阵导数（利用窄导数定义、Kronecker 积与 vec 算子、Kni 矩阵）。最终得到式 (3) 的 \(\boldsymbol{\Lambda}^G\)。 4. 构造三个可计算的调整，使得 \(E(\boldsymbol{\Lambda}^{\text{BR}}) = \boldsymbol{\Lambda}^G + O(N^{-1/2})\)：
- 稳健：直接用 \(\mathbf{S}_i \mathbf{S}_i^\top\) 替换 \(\text{cov}(\mathbf{Y}_i)\)，期望精确等于 \(\boldsymbol{\Lambda}^G\)。
- 朴素：假设 \(\mathbf{V}_i = \text{cov}(\mathbf{Y}_i)\)，代入简化得 \(\boldsymbol{\Lambda}^N\)，其期望只在正确设定时等于 \(\boldsymbol{\Lambda}^G\)。
- 经验：将 \(j, d, e, u\) 中的导数用样本值代替而不取期望，直接作为调整。

关键跳跃点： - 计算 \(\mathbf{E}_i\) 和 \(D\mathbf{E}_i^\top\)：这是最吃力的部分。\(\mathbf{E}_i\) 涉及 \(D\mathbf{V}_i^{-1}(\boldsymbol{\mu}_i)\)，需要分相关系数参数化和 odds-ratio 参数化两种情形分别推导（Web Appendix B.1–B.4）。Odds-ratio 参数化下的 \(D\mathbf{V}_i^{-1}(\boldsymbol{\mu}_i)\) 更复杂，涉及 \(\partial \mu_{ijj'}/\partial \mu_{ij}\) 的显式公式（Web Appendix B.2）。
- 验证条件 (5)：对稳健调整，由于 \(E(\mathbf{S}_i \mathbf{S}_i^\top) = \text{cov}(\mathbf{Y}_i)\)，\(E(\boldsymbol{\Lambda}^R) = \boldsymbol{\Lambda}^G\) 精确成立，无需额外条件。对朴素调整，需要 \(\boldsymbol{\Lambda}^G - \boldsymbol{\Lambda}^N = O(N^{-1/2})\)，这在关联错设下一般不保证，但给出一个反例（Web Appendix D.2）说明有时可能成立。

技术技巧点名： - 窄矩阵导数（Magnus, 2010）用于处理 \(\partial \text{vec}(\mathbf{A})/\partial \mathbf{b}^\top\)。
- Kronecker 积与 vec 算子：反复使用 \(\text{vec}(\mathbf{ABC}) = (\mathbf{C}^\top \otimes \mathbf{A}) \text{vec}(\mathbf{B})\)。
- Kni 矩阵：\(n_i^2 \times n_i\) 矩阵，用于表达 \(\text{vec}(\mathbf{A}_i) = \mathbf{K}_{n_i} \text{diag}(\mathbf{A}_i)\) 之类的操作。
- M-估计的 RBM（Rao-Blackwellized moment）恒等式：Kosmidis & Lunardon (2024) 的核心公式，将偏倚与得分的一二阶矩联系起来。
- \(\sqrt{N}\)-一致的矩估计（\(\hat{\alpha}, \hat{\phi}\)）：标准渐近理论中，参数估计对 \(\sqrt{N}(\hat{\boldsymbol{\beta}} - \boldsymbol{\beta})\) 的渐近分布贡献 \(o_p(1)\)。

真实例子与应用（已包含在第三节末尾）¶

🔎 结论是否比证明窄¶

是。例如： - 对朴素调整 NBR，作者证明在条件 (9) 成立时才有一阶偏倚减少，但该条件“cannot be verified in practice without knowledge of the true association structure”（Web Appendix D.2 结尾）。因此 NBR 的偏倚减少性质在实际中无保证，论文的模拟却显示 NBR 在某些设定下表现良好（如 Table 1 中 exchangeable 结构下对 \(\beta_2\) 的偏倚小于 RBR）。这暗示可能存在未严格证明的模式。 - 对经验调整 EBR，作者在 Web Appendix D.1 给出了其引起额外变异性的反例，但仍声称 EBR 满足条件 (5) 从而有渐近无偏性。但有限样本下其偏倚减少程度明显劣于 RBR（如 Table 2 中 MCAR 下 \(N=20\) 时 EBR 的 ESE 膨胀、SRE 极低）。最后推荐 EBR 为 fallback，这一推荐并非由定理严格支持，而是基于模拟观察和特例的启发。 - Odds-ratio 参数化下的偏倚减少理论完全平行于相关系数情形，但模拟中未直接对比两种参数化在相同数据生成机制下的偏倚减少幅度——因为数据生成基于相关系数（latent correlation matrix），非 odds-ratio 参数化。所以无法直接评估 odds-ratio 参数化下的偏倚减少是否优于相关系数参数化（后者已有 Lumley 数据例子显示数值问题）。

四、开放问题¶

模型选择准则的调整
作者提到调整估计方程推动了相关模型选择准则（QIC, QICu, CIC）的重新审视（Summary 第2段）。具体地，这些准则的推导基于未调整的估计方程，调整后版本需重新推导。扎根于原文：“adjusted estimating equations motivate a reexamination of model-selection and goodness-of-fit criteria for correlated data”。这是一个纯粹的推导问题，不需要新的模拟或渐近理论，适合研究者目前 moderately familiar 的 M-估计理论。
扩展到有序/多分类响应
作者指出，扩展到有序或名义多项响应需要处理局部 odds-ratio 参数化下调整项导数的闭式表达，这可能具有挑战性（Summary 第2段）。扎根于原文：“extending the framework to ordinal and nominal multinomial responses would broaden applicability, though the derivatives required for the adjustment terms may be challenging to obtain in closed form when association is parameterized through local odds ratios”。研究者若熟悉 Touloumis et al. (2013) 的多分类 GEE，可与本文的偏倚调整结合。
偏倚减少与惩罚 GEE 的结合
作者指出理想调整依赖于真实协方差（未知），而惩罚 GEE 仅依赖于模型协方差 \(\boldsymbol{\Sigma}_0\)，两者“reconciling … without sacrificing the finiteness guarantees of the penalized framework remains a worthwhile direction”。扎根于原文：“The main obstacle is that the ideal bias-reduction adjustment depends on the true covariance matrices of the responses … whereas the PGEE penalty depends only on the model-based covariance matrix Σ0 and its derivatives”。这一问题需要同时处理调整与惩罚，可能有统计-计算权衡的意味，但更偏向于方法设计。

Maintained by 陈星宇 · Homepage · Source on GitHub