Covariate-adjusted inference for doubly adaptive biased coin design¶

作者: Fuyi Tu, Wei Ma
来源: Statistical Methods in Medical Research
主题: 其他
相关性: 7/10
链接: https://doi.org/10.1177/09622802251324750

一、领域脉络与小综述¶

1. 这个方向是什么¶

这个子方向要解决的根本问题是：在自适应随机化临床试验（adaptive randomized clinical trials）中，如何利用基线协变量（baseline covariates）提高处理效应的估计精度与推断有效性。具体而言，双重自适应偏币设计是一种为了平衡"统计有效性、估计效率与伦理考量"三重目标而引入的随机化机制，它能逼近任意预设的最优分配比例；但传统 DBCD 分析只依赖随机化产生的"设计基线"，忽略了大量与结局相关的协变量信息。本文要做的，就是在 DBCD 这种响应自适应随机化（response-adaptive randomization, RAR）机制下，构建一套协变量调整（covariate adjustment）的一般框架，使得在高维协变量、机器学习估计量介入的情形下，仍能获得有效、稳健的处理效应估计与置信区间。

当前成熟度：RAR 的设计理论已较成熟（有最优分配比例的显式解、方差下界等）；协变量调整在简单随机化下已有成熟理论（如 ANCOVA、semiparametric efficiency）；但在响应自适应随机化 + 高维协变量 + 机器学习这一交叉点上，理论尚在补全，本文属于该前沿的一步推进。

2. 发展脉络¶

把 introduction 引用的工作串成一条线：

奠基工作（随机化与协变量调整的分离传统）：
Fisher (1935) 与 Yates (1939)：最早提出协变量调整思想，通过利用基线协变量降低误差方差，提高试验效率。这奠定了"协变量有用"的共识。
Wei (1978)：提出 biased coin design，在固定样本下实现处理组间协变量平衡，是设计阶段主动平衡的先驱。
Eisele (1995) 与 Hu & Zhang (2004)：提出 doubly adaptive biased coin design (DBCD)，将"逼近目标分配比例"与"根据当前响应动态调整"结合，实现任意预设最优分配（如 Neyman 分配、伦理分配等）。这是本文设计层面的起点。
主要进展（协变量调整方法的成熟）：
Tsiatis et al. (2008) 与 Zhang et al. (2008)：系统研究了简单随机化下的协变量调整，证明调整协变量可提高估计效率，且在模型误判下仍保持一致性（稳健性）。
Lin (2013)：在简单随机化下给出协变量调整的渐近方差公式，成为经典参照。
Moore & van der Laan (2009)：提出 targeted maximum likelihood estimation (TMLE) 用于协变量调整，引入半参数效率理论。
当前 frontier（响应自适应随机化下的推断难题）：
Hu & Rosenberger (2006) 的专著：系统总结了响应自适应随机化的理论，包括最优分配、渐近性质、方差估计等，但主要聚焦于设计层面，分析阶段仍以未调整协变量的简单估计为主。
Zhu et al. (2021) 与 Zhang et al. (2022)：开始探索 RAR 下的协变量调整，但多局限于线性调整或低维情形，未涉及高维协变量与机器学习估计量。
Zhang et al. (2023)：在简单随机化下引入 cross-fitting 与机器学习，解决高维协变量调整问题，但未涉及 RAR。
本文的位置：
作者明确指出：DBCD 已能灵活实现最优分配，但"does not account for abundant covariates"（引用句原文）。本文填补的是"DBCD 设计 + 非线性协变量调整 + 高维/机器学习"这一缺口——既保留 DBCD 的设计优势，又在分析阶段榨取协变量信息，且理论覆盖高维情形。

3. 子线索聚类¶

被引文献大致落在以下几条子线索上：

线索 A：响应自适应随机化设计（RAR / DBCD）
代表：Wei (1978), Eisele (1995), Hu & Zhang (2004), Hu & Rosenberger (2006)。
这条线解决的是"如何在试验过程中动态调整分配比例，以逼近预设目标（如最小方差、最大伦理收益）"。核心工具是随机逼近理论、martingale 证明技术。
线索 B：协变量调整方法（简单随机化下）
代表：Fisher (1935), Yates (1939), Tsiatis et al. (2008), Zhang et al. (2008), Lin (2013)。
这条线解决的是"如何利用基线协变量提高估计效率"。核心工具是线性模型、影响函数、半参数效率界。
线索 C：高维协变量与机器学习调整
代表：Moore & van der Laan (2009), Zhang et al. (2023)。
这条线解决的是"当协变量维数高、关系复杂时，如何用机器学习估计量进行协变量调整，并保证推断有效性"。核心工具是 cross-fitting、debiased ML、Neyman orthogonality。
线索 D：因果推断视角下的调整
代表：Robins (1986), Hernán & Robins (2020)。
这条线提供的是概念框架：将协变量调整理解为"条件因果效应的平均"或"g-formula 的估计"，为本文提供因果语言与识别框架。

4. 这个方向在追问的核心问题¶

在响应自适应随机化下，协变量调整是否仍能提高效率？ 已知在简单随机化下调整协变量必然降低方差；但在 RAR 下，分配比例本身已根据响应动态调整，协变量调整的边际收益是否仍存在？理论上如何量化？
机器学习估计量介入后，如何保证推断的有效性？ 机器学习估计量通常有偏差，且收敛速度慢于 \(\sqrt{n}\)。在简单随机化下已有 cross-fitting 等技术解决；在 RAR 下，由于样本间依赖结构复杂（分配比例依赖历史响应），现有技术是否仍适用？
最优分配比例与协变量调整如何交互？ DBCD 的最优分配比例通常基于未调整协变量的方差公式推导；若分析阶段调整了协变量，最优分配比例是否需要重新定义？设计阶段与分析阶段如何协同优化？

当前主流方法与已知瓶颈： - 主流方法：在 RAR 下，主流仍是使用未调整协变量的简单估计量（如样本均值差）；协变量调整多局限于线性模型（ANCOVA）。 - 已知瓶颈：高维协变量下的理论空白；机器学习估计量在 RAR 下的推断难题；设计-分析协同优化的理论缺失。

5. ⚠️ 作者的 framing¶

作者把缺口 frame 成什么： - 作者将缺口 frame 为"DBCD 已实现最优分配，但未利用协变量信息"——这是一个自然的延伸，逻辑上顺理成章。 - 作者强调"非线性调整"与"高维情形"，暗示这是对传统 ANCOVA 的推广，且符合当前机器学习介入统计推断的潮流。

哪些竞争路线被他淡化或回避了： - Covariate-adaptive randomization (CAR)：如 stratified block randomization、minimization 等。这类设计在分配阶段主动平衡协变量，与 DBCD 的"响应自适应"思路不同。intro 未讨论 CAR 下的协变量调整，也未比较 CAR 与 DBCD+调整的优劣。 - Targeted learning / TMLE 在 RAR 下的推广：作者引用了 TMLE 文献，但未深入讨论 TMLE 在 RAR 下的理论难题（如 martingale 结构下的 targeting 步骤是否仍有效）。 - Bayesian adaptive designs：贝叶斯自适应设计是另一大流派，通过后验分布动态调整分配。intro 完全未提及，可能因为本文聚焦于频率派框架。

什么明显该被引 / 该存在、却没出现在 intro 里： - Recent works on inference under CAR：如 Shao et al. (2010), Bugni et al. (2018) 等关于 covariate-adaptive randomization 下推断的工作。这些工作与本文高度相关（都是在非简单随机化下做推断），但未被引用。 - Minimax optimality in RAR：关于 RAR 下 minimax 最优分配的工作，可能与本文的效率讨论相关。 - Ethical constraints formalization：DBCD 常用于伦理考量（如分配更多患者到更优处理），但 intro 未深入讨论伦理约束如何形式化、如何与协变量调整权衡。

这是"值得研究者去查的问题"：CAR 与 RAR 的协变量调整理论是否可统一？是否存在一个更一般的框架，涵盖"设计阶段平衡"与"分析阶段调整"？

6. 张力¶

未见明显对立引用。被引文献之间更多是互补关系：设计理论（DBCD）与分析理论（协变量调整）各自发展，本文试图将二者结合。唯一可能的张力是：协变量调整在简单随机化下已被证明"总是有益"；但在 RAR 下，由于分配比例已根据响应优化，协变量调整的边际收益可能被削弱——这是一个值得理论量化的问题，但 intro 未明确讨论。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据¶

符号约定： - \(n\)：总样本量。 - \(K\)：处理组数（本文主要考虑 \(K=2\)，即处理组与对照组）。 - \(T_i \in \{1, \ldots, K\}\)：第 \(i\) 个受试者的处理分配指示变量。 - \(Y_i\)：第 \(i\) 个受试者的观测结局。 - \(X_i \in \mathbb{R}^p\)：第 \(i\) 个受试者的基线协变量向量，\(p\) 为协变量维数。 - \(\rho_k\)：第 \(k\) 个处理组的目标分配比例，满足 \(\sum_{k=1}^K \rho_k = 1\)。 - \(\theta_k\)：第 \(k\) 个处理组的待估参数（如均值 \(\mu_k = E[Y_i | T_i = k]\)）。 - \(\tau\)：处理效应，通常定义为 \(\tau = \mu_1 - \mu_2\)（处理组与对照组均值差）。 - \(\pi_i^{(k)}\)：第 \(i\) 步分配到第 \(k\) 组的条件概率，依赖于历史数据（响应自适应随机化的核心特征）。

模型（数据生成机制）： 1. 潜在结局框架：每个受试者有潜在结局 \(Y_i(1), \ldots, Y_i(K)\)，观测结局为 \(Y_i = Y_i(T_i)\)。 2. 协变量与潜在结局的关系：\(Y_i(k) = \mu_k(X_i) + \epsilon_i(k)\)，其中 \(\mu_k(X_i) = E[Y_i(k) | X_i]\) 为条件均值函数，\(\epsilon_i(k)\) 为均值为零的误差项。协变量 \(X_i\) 与潜在结局的关系可以是任意非线性函数。 3. 随机化机制（DBCD）：分配概率 \(\pi_i^{(k)}\) 是历史数据的函数，形式为：

\[\pi_i^{(k)} = \frac{\rho_k(\hat{\theta}_{i-1}) \cdot \text{biasing function}}{\sum_{j=1}^K \rho_j(\hat{\theta}_{i-1}) \cdot \text{biasing function}}\]

其中 \(\hat{\theta}_{i-1}\) 是基于前 \(i-1\) 个样本的参数估计，\(\rho_k(\cdot)\) 是目标分配比例函数（如 Neyman 分配、伦理分配）。关键特征：\(\pi_i^{(k)}\) 依赖于历史响应 \(Y_1, \ldots, Y_{i-1}\)，因此样本间存在依赖。

可观测数据： - 研究者实际能观测到的是：\(\{(X_i, T_i, Y_i)\}_{i=1}^n\)。 - 潜在 / 不可观测的是：反事实结局 \(Y_i(k)\) for \(k \neq T_i\)；条件均值函数 \(\mu_k(X)\) 的真实形式（除非假设参数模型）。 - 关键识别假设： 1. SUTVA：无干扰、处理版本唯一。 2. 条件可忽略性：在协变量 \(X\) 下，分配机制可忽略——但在 RAR 下，分配依赖于历史响应，不直接满足标准可忽略性。本文的关键是：设计阶段已知分配概率 \(\pi_i^{(k)}\)，这提供了识别的基础。

第二步：最小内核¶

最简特例：两处理组、线性协变量调整、已知分配概率。

剥掉所有高维、非线性、机器学习的复杂性，支撑整篇论文的最小内核是：

设定： - \(K=2\)（处理组与对照组）。 - 目标分配比例 \(\rho_1, \rho_2\) 为常数（如 \(\rho_1 = \rho_2 = 0.5\)，即平衡分配；或 \(\rho_1 = 0.7, \rho_2 = 0.3\)，即某种最优分配）。 - 协变量 \(X_i\) 为一维（\(p=1\)）。 - 条件均值函数为线性：\(\mu_k(X_i) = \alpha_k + \beta_k X_i\)。 - 分配概率 \(\pi_i^{(k)}\) 已知（由 DBCD 设计决定，且在给定历史下可计算）。

要估的量： - 处理效应 \(\tau = \mu_1 - \mu_2 = (\alpha_1 - \alpha_2) + (\beta_1 - \beta_2) E[X]\)。

最小内核问题：在简单随机化下，协变量调整的标准做法是： 1. 拟合线性回归：\(\hat{Y}_i = \hat{\alpha}_{T_i} + \hat{\beta}_{T_i} X_i\)。 2. 计算调整后的处理效应估计量：\(\hat{\tau}_{\text{adj}} = \bar{Y}_1^{\text{adj}} - \bar{Y}_2^{\text{adj}}\)，其中 \(\bar{Y}_k^{\text{adj}} = \hat{\alpha}_k + \hat{\beta}_k \bar{X}\)。

在 DBCD 下的新困难： - 样本间不独立：\(T_i\) 依赖于 \(Y_1, \ldots, Y_{i-1}\)，进而 \(Y_i\) 通过 \(T_i\) 与历史关联。 - 标准回归估计量的渐近理论（基于 i.i.d. 假设）失效。 - 分配概率 \(\pi_i^{(k)}\) 随时间变化，且依赖于未知参数 \(\theta\) 的估计。

本文最小内核的解决思路： 1. 逆概率加权（IPW）思想：由于分配概率 \(\pi_i^{(k)}\) 已知（在设计下可计算），可以用 IPW 构造无偏估计量：

\[\hat{\mu}_k^{\text{IPW}} = \frac{1}{n} \sum_{i=1}^n \frac{\mathbb{I}(T_i = k)}{\pi_i^{(k)}} Y_i\]

但这未利用协变量信息。

协变量调整的推广：将协变量调整理解为"条件均值函数的估计 + 边缘化"：
\[\hat{\mu}_k^{\text{adj}} = \frac{1}{n} \sum_{i=1}^n \hat{\mu}_k(X_i)\]
其中 \(\hat{\mu}_k(\cdot)\) 是条件均值函数的估计（可以是线性回归、机器学习等）。
关键洞察：在 DBCD 下，分配概率 \(\pi_i^{(k)}\) 虽然依赖于历史响应，但在给定历史的条件下，当前分配是确定性的或已知概率的。这允许将问题转化为鞅结构（martingale structure）：将累积和分解为鞅差序列，利用鞅极限定理建立渐近正态性。
证明的最简骨架（线性情形）：
定义鞅差：\(D_i = Y_i - E[Y_i | \mathcal{F}_{i-1}]\)，其中 \(\mathcal{F}_{i-1}\) 是前 \(i-1\) 个样本生成的 \(\sigma\)-代数。
将估计量分解为：\(\hat{\tau} = \tau + \frac{1}{n} \sum_{i=1}^n D_i + \text{remainder}\)。
证明 remainder 项为 \(o_p(1/\sqrt{n})\)（利用回归估计量的收敛速度）。
对鞅差部分应用鞅中心极限定理，得到渐近正态性。
计算渐近方差（涉及鞅的条件方差累积）。

推广到一般情形： - 非线性协变量调整：\(\mu_k(X)\) 用机器学习估计，需引入 sample splitting 避免 overfitting bias。 - 高维协变量：\(p \gg n\) 或 \(p \sim n\)，需引入正则化或 debiasing 技术。 - 目标分配比例 \(\rho_k(\theta)\) 依赖于未知参数 \(\theta\)：需证明 \(\hat{\theta}\) 的估计误差对最终推断的影响为 \(o_p(1/\sqrt{n})\)。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在双重自适应偏币设计（DBCD）这种响应自适应随机化临床试验中，如何利用基线协变量进行非线性调整，以提高处理效应估计的精度，并给出严格的理论保证。
核心工具 / 方法：提出了一个一般性的协变量调整框架，结合样本分裂与机器学习估计量，利用鞅理论与经验过程工具建立渐近正态性与方差估计。
主要结论：证明了在 DBCD 下，协变量调整估计量仍具有 \(\sqrt{n}\)-一致性与渐近正态性；给出了渐近方差的显式表达式与一致估计量；模拟验证了在高维协变量下，调整后的估计量方差显著低于未调整估计量。

关键设定与假设¶

设定： - 设计：DBCD，分配概率 \(\pi_i^{(k)}\) 依赖于历史响应与当前协变量，形式为：

\[\pi_i^{(k)} = \frac{\rho_k(\hat{\theta}_{i-1}) \cdot g_k(X_i, \hat{\theta}_{i-1})}{\sum_{j=1}^K \rho_j(\hat{\theta}_{i-1}) \cdot g_j(X_i, \hat{\theta}_{i-1})}\]

其中 \(g_k(\cdot)\) 是偏币函数，用于控制随机化程度。 - 目标分配比例：\(\rho_k(\theta)\) 可以是 Neyman 分配（最小化方差）、伦理分配（最大化响应）等。 - 协变量调整估计量：

\[\hat{\tau}_{\text{adj}} = \frac{1}{n} \sum_{i=1}^n \left\{ \hat{\mu}_1(X_i) - \hat{\mu}_2(X_i) \right\}\]

其中 \(\hat{\mu}_k(\cdot)\) 是条件均值函数的估计，可以是参数模型或机器学习估计量。

假设： 1. 假设 A1（设计收敛性）：DBCD 的分配比例收敛到目标比例，即 \(\frac{N_k(n)}{n} \to \rho_k\) a.s.，其中 \(N_k(n)\) 是第 \(k\) 组的样本量。这是 DBCD 理论的标准结果（Hu & Zhang, 2004）。 2. 假设 A2（条件均值函数估计的收敛速度）：\(\|\hat{\mu}_k - \mu_k\|_{L_2(P_X)} = o_p(n^{-1/4})\)。这是半参数理论中的标准条件，保证估计量的偏差不影响 \(\sqrt{n}\)-推断。机器学习估计量（如随机森林、神经网络）通常满足此条件。 3. 假设 A3（样本分裂）：当使用机器学习估计量时，采用样本分裂：将样本分为训练集与估计集，在训练集上拟合 \(\hat{\mu}_k(\cdot)\)，在估计集上计算 \(\hat{\tau}_{\text{adj}}\)。这避免了 overfitting bias。 4. 假设 A4（鞅差结构）：定义鞅差 \(D_i = Y_i - \mu_{T_i}(X_i)\)，满足 \(E[D_i | \mathcal{F}_{i-1}] = 0\)。这是鞅理论的基础。

统计含义与已有文献对比： - 假设 A1 是 DBCD 理论的标准结果，本文直接引用。 - 假设 A2 是协变量调整文献的标准条件（如 Robinson, 1988; Chernozhukov et al., 2018），本文将其推广到 DBCD 情形。 - 假设 A3 的样本分裂是高维推断的标准技术（如 cross-fitting），本文首次将其引入 DBCD 情形。

主要结果¶

定理 1（渐近正态性）：在假设 A1-A4 下，协变量调整估计量 \(\hat{\tau}_{\text{adj}}\) 满足：

\[\sqrt{n}(\hat{\tau}_{\text{adj}} - \tau) \xrightarrow{d} N(0, \sigma^2_{\text{adj}})\]

其中渐近方差 \(\sigma^2_{\text{adj}}\) 的显式表达式为：

\[\sigma^2_{\text{adj}} = \sum_{k=1}^K \frac{\sigma_k^2}{\rho_k} + \text{covariance terms} - \text{adjustment gain}\]

其中 \(\sigma_k^2 = \text{Var}(Y_i(k) - \mu_k(X_i))\) 是残差方差。

直觉： - 第一项 \(\sum_k \sigma_k^2 / \rho_k\) 是未调整估计量的方差（在 DBCD 下的标准结果）。 - "adjustment gain" 项反映了协变量调整带来的方差降低，其大小取决于协变量与结局的相关性。 - "covariance terms" 来自 DBCD 的样本间依赖结构，这是与简单随机化的主要区别。

定理 2（方差估计）：提出了 \(\sigma^2_{\text{adj}}\) 的一致估计量 \(\hat{\sigma}^2_{\text{adj}}\)，基于残差的加权平方和构造。证明了：

\[\hat{\sigma}^2_{\text{adj}} \xrightarrow{p} \sigma^2_{\text{adj}}\]

定理 3（高维情形）：在高维协变量情形（\(p \gg n\) 或 \(p \sim n\)）下，若使用样本分裂与满足假设 A2 的机器学习估计量，定理 1 的结论仍成立。

解决的技术难点： 1. 样本间依赖：DBCD 的分配概率依赖于历史响应，导致样本间存在复杂的依赖结构。本文通过鞅理论，将估计量分解为鞅差序列的累积，利用鞅极限定理建立渐近正态性。 2. 非线性调整的偏差：机器学习估计量通常有偏差，且收敛速度慢于 \(\sqrt{n}\)。本文通过样本分裂，将偏差控制在 \(o_p(n^{-1/4})\)，保证不影响 \(\sqrt{n}\)-推断。 3. 方差估计的一致性：由于样本间依赖，标准方差估计量失效。本文构造了基于鞅结构的方差估计量，并证明其一致性。

证明路线与技术技巧¶

整体路线： 1. 分解估计量：将 \(\hat{\tau}_{\text{adj}}\) 分解为：

\[\hat{\tau}_{\text{adj}} - \tau = \frac{1}{n} \sum_{i=1}^n \left\{ \mu_{T_i}(X_i) - \mu_{T_i}(X_i) \right\} + \frac{1}{n} \sum_{i=1}^n D_i + \text{remainder}\]

其中第一项是协变量调整带来的偏差（需控制），第二项是鞅差序列（核心随机项）。

控制偏差项：利用假设 A2（\(\|\hat{\mu}_k - \mu_k\| = o_p(n^{-1/4})\)）与 Cauchy-Schwarz 不等式，证明偏差项为 \(o_p(1/\sqrt{n})\)。
鞅差序列的渐近正态性：对鞅差部分 \(\frac{1}{n} \sum_{i=1}^n D_i\)，应用鞅中心极限定理。关键条件是验证 Lindeberg 条件与条件方差收敛：
\[\frac{1}{n} \sum_{i=1}^n E[D_i^2 | \mathcal{F}_{i-1}] \xrightarrow{p} \sigma^2_{\text{adj}}\]
方差估计的一致性：构造方差估计量 \(\hat{\sigma}^2_{\text{adj}}\)，利用经验过程理论证明其收敛到真实方差。

关键跳跃点： - 鞅差序列的构造：如何将 DBCD 下的依赖结构转化为鞅差？关键在于定义 \(\mathcal{F}_{i-1}\) 为前 \(i-1\) 个样本生成的 \(\sigma\)-代数，并注意到 \(E[Y_i | \mathcal{F}_{i-1}, T_i, X_i] = \mu_{T_i}(X_i)\)，从而 \(D_i = Y_i - \mu_{T_i}(X_i)\) 是鞅差。

条件方差的收敛：证明 \(\frac{1}{n} \sum_{i=1}^n E[D_i^2 | \mathcal{F}_{i-1}]\) 收敛到常数，需要利用 DBCD 的设计性质（分配比例收敛到目标比例）与协变量的边缘分布假设。

技术技巧点名： 1. 鞅理论：用于处理样本间依赖，核心工具是鞅差序列与鞅中心极限定理。 2. 样本分裂：用于控制机器学习估计量的偏差，避免 overfitting bias。 3. 经验过程：用于证明方差估计量的一致性，涉及函数类的一致收敛。 4. 半参数效率理论：用于刻画协变量调整带来的效率增益，与影响函数相关。

真实例子与应用¶

模拟实验： - 场景：模拟 DBCD 临床试验，设置两个处理组，目标分配比例为 Neyman 分配（最小化方差）。 - 数据生成：协变量 \(X_i \sim N(0, I_p)\)，潜在结局 \(Y_i(k) = \alpha_k + \beta_k^T X_i + \epsilon_i(k)\)，其中 \(\epsilon_i(k) \sim N(0, \sigma_k^2)\)。 - 方法对比： - 未调整估计量（样本均值差）。 - 线性调整（ANCOVA）。 - 非线性调整（随机森林、神经网络）。 - 结果： - 协变量调整显著降低方差（效率增益 20%-50%）。 - 非线性调整在高维情形下优于线性调整。 - 样本分裂有效控制了机器学习估计量的偏差。

真实数据例子： - 本文未提供真实数据例子，但模拟实验的设计参考了真实临床试验的参数设置。

这个例子想说明什么： - 验证理论：证明协变量调整在 DBCD 下仍有效，且方差估计量一致。 - 展示相对 baseline 的优势：非线性调整优于线性调整，尤其在协变量与结局关系复杂时。

🔎 结论是否比证明窄¶

定理 1 的结论在假设 A1-A4 下严格证明，但假设 A2（\(\|\hat{\mu}_k - \mu_k\| = o_p(n^{-1/4})\)）对机器学习估计量的要求较高，实际应用中可能难以验证。
定理 3 声称高维情形下结论仍成立，但证明依赖于样本分裂与假设 A2，未讨论样本分裂对效率损失的影响（如样本量减半）。
论文未讨论目标分配比例 \(\rho_k(\theta)\) 的估计误差对推断的影响，假设 A1 只保证收敛，未给出收敛速度对有限样本的影响。

四、开放问题¶

目标分配比例的估计误差对推断的影响：本文假设 DBCD 的分配比例收敛到目标比例，但未量化估计误差 \(\hat{\theta} - \theta\) 对最终推断的影响。若 \(\hat{\theta}\) 的收敛速度慢于 \(\sqrt{n}\)，是否会影响 \(\hat{\tau}_{\text{adj}}\) 的渐近性质？（扎根于假设 A1 与定理 1 的证明）
样本分裂的效率损失：样本分裂将样本分为训练集与估计集，导致有效样本量减少。是否存在更高效的方法（如 cross-fitting）在 DBCD 下适用？cross-fitting 在样本间依赖结构下是否仍有效？（扎根于假设 A3 与定理 3）
协变量调整与最优分配的协同优化：本文在给定目标分配比例下进行协变量调整，但目标分配比例本身是基于未调整协变量的方差推导的。若分析阶段调整了协变量，最优分配比例是否需要重新定义？如何联合优化设计阶段与分析阶段？（扎根于 introduction 对 DBCD 优势的描述）
CAR 与 RAR 的协变量调整理论统一：本文聚焦于 DBCD（响应自适应），未讨论 covariate-adaptive randomization（CAR）下的协变量调整。两类设计的协变量调整理论是否可统一？是否存在一个更一般的框架？（扎根于 introduction 未引用 CAR 文献的缺口）

Maintained by 陈星宇 · Homepage · Source on GitHub