Typical Healthcare Pathways as a Basis for Admixture Modeling of Patient Trajectories¶

作者: Maryam Farhadizadeh, Carola S. Heinzel, August Sigle, Harald Binder, Frederik Wenz et al.
主题: 流行病学
相关性: 6/10
链接: https://arxiv.org/abs/2606.14587

一、领域脉络与小综述（从 introduction + 参考文献 + 已检索摘要构建）¶

这个方向是什么¶

本方向聚焦于从电子健康档案（EHRs）的患者轨迹数据中提取可解释的、稳定的群体级治疗路径，并用于表征患者个体异质性。其根本统计/科学问题是：在个体轨迹高度异质、存在分支/并发/不同记录精度的真实世界医疗数据中，如何平衡三个目标——(1) 降低高维事件日志的维度、(2) 保留时间与结构进展、(3) 维持对临床可解释性的输出。当前成熟度：方法可用，但缺乏被广泛认可的、集成“结构重建+概率建模+个体异质性捕捉”的统一框架。

发展脉络（history）¶

从引言引用的工作可梳理出一条清晰的脉络：

奠基工作（过程挖掘，约2010-2015）：
van der Aalst (2011) [6]：《Process Mining》专著，首次将流程发现方法用于临床事件日志，推断有向过程模型。留下了“在细粒度数据中，患者级变异性过大，难以作为紧凑可解释的群体级汇总”的口子（原文：“These models provide detailed descriptions…but in fine-grained clinical data, they often retain substantial patient-level variability, which can make them difficult to use as compact and interpretable cohort-level summaries”）。
主要进展（序列挖掘、主题建模与聚类方法，约2015-2020）：
Perer, Wang & Hu (2015) [9]：频繁序列挖掘提取复发子序列，但“这些子序列通常是独立辨识的，因此并不提供一个完整的整体进展模型”。
Blei, Ng & Jordan (2003) [10]：LDA被引入医疗轨迹，将事件视为词、患者段视为文档，推断潜在主题（治疗模式）。“Topic modeling techniques…replace sparse, high-dimensional event representations…preserving clinically meaningful semantic structure”——但“primarily operate at the level of events or days and often treat structural progression across complete trajectories implicitly”。
Najjar et al. (2018) [17]：用HMM混合模型对患者序列建模，先聚类后拟合，但“structural progression patterns remain distributed across clusters or embedded within fitted models”。
当前前沿（预测性ML与表示学习，约2018-2024）：
Xiao, Choi & Sun (2018) [4]：系统性回顾深度学习方法（RNN、注意力）在EHR预测中的应用，“their primary objective is usually prediction or latent representation learning rather than explicit construction of interpretable models of care progression”——留下了“可解释路径结构”的缺口。
Muyama, Neuraz & Coulet (2024) [21]：机器学习方法发现临床路径的系统性综述，指出“多数方法侧重预测而非构建进展模型”。
本文位置：作者将以上工作按“结构重建（过程挖掘）→ 概率抽象（主题建模）→ 聚类与HMM → 预测性ML”串成一条线，然后点出共同的局限性：“The explicit integration of cohort-level pathway structure with probabilistic modeling of individual trajectories therefore remains insufficiently developed”。本文提出的是将群体级典型路径辨识与个体级混合建模显式分离的三步框架。

子线索聚类¶

这些被引文献大致落在以下3-4条子线索上：

线索A：结构重建方法（过程挖掘、流程发现）—— van der Aalst (2011) [6], Rosa et al. (2022) [5], Rismanchian et al. (2023) [7], Quintano Neira et al. (2019) [8]。共同特征：以有向图/模型描述护理流程，保留详细时序与并发结构，但输出复杂、对异质性敏感。本文的“典型路径算法”属于这一条的变体，但加入了可控的简化步骤（重要性评分+折叠+剪枝）以避免复杂性爆炸。
线索B：概率抽象方法（主题建模/LDA与变体）—— Blei, Ng & Jordan (2003) [10], Huang et al. (2018) [11], Huang et al. (2019) [12], Chiudinelli et al. (2020) [13], Xu et al. (2016) [14], Li et al. (2024) [15]。共同特征：事件→词、患者段→文档，推断潜在治疗主题。本文的“admixture模型”在结构上可视为一种基于路径的LDA变体——不同的是，主题（路径）已被前一步固定为具体的马尔可夫链，而非从数据中自由学出。
线索C：聚类与轨迹分组方法—— Najjar et al. (2018) [17], MacQueen (1967) [18], Levenshtein (1966) [19], Funkner, Yakovlev & Kovalchuk (2017) [20]。共同特征：先分组（k-means、HMM混合模型），再提取各组模板。本文的Step 3（在admixture空间中聚类）属于此线索的延伸。
线索D：预测性ML方法—— Xiao, Choi & Sun (2018) [4], Muyama, Neuraz & Coulet (2024) [21], Lin et al. (2021) [22], Ye et al. (2020) [23], Muyama, Neuraz & Coulet (2024) [24]。共同特征：以预测或表示学习为目标，不追求显式路径模型。本文明确将其视为“无法直接用于结构建模”的对照。

这个方向在追问的核心问题（2-4个）¶

Q1（结构性）：如何从高度异质的个体轨迹中提取群体级的“典型”路径，从而提供一个紧凑但临床可解释的护理流程图？当前主流方法（过程挖掘）保留的变异性过大，难以直接作为群体级汇总。
Q2（概率化）：如何在已知群体级路径结构的前提下，将个体轨迹表示为一组固定成分的概率混合，而非单一类型，从而保留中间/混合模式？当前方法（主题建模）对整体时间进展的捕捉是隐式的。
Q3（稳定性与可推广性）：辨识出的路径结构在不同训练样本上是否稳定？患者层混合权重是否具有可复现的对比能力？这是一个应用层面的核心问题，但现有文献很少系统考察。
Q4（解释与行动）：如何将这些路径表示转化为可操作的分组、基准测试或质量改进指标？本文将其定位为“retrospective exploratory analysis”，不涉及前瞻性决策。

⚠️ 作者的 framing（必须明确标注成“这是作者的说法”）¶

作者把缺口 frame 成：“The explicit integration of cohort-level pathway structure with probabilistic modeling of individual trajectories...remains insufficiently developed”（Introduction末段）。这是作者的说法：他们认为现有工作要么只能重建群体级结构（但太复杂），要么只能做概率抽象（但对进展建模是隐式的），要么只能聚类（但缺乏统一概率表示）。本文的“三步框架”被包装成弥补这一缺口的显然下一步。

被淡化/回避的竞争路线： - 基于深度学习的可解释序列模型（如注意力权重图）：作者只在引言末尾提了一句“primary objective is prediction...rather than explicit construction of interpretable models”，但未深入讨论如Temporal Fusion Transformers或Attention-based CNNs能否直接输出可解释路径图。这些模型也能产出“路径图”形式的注意力模式，但被作者一笔带过。 - 潜在状态空间模型（如HMM的不同结构变体）：作者只引了Najjar et al. 2018，但未讨论更复杂的结构化HMM（如基于图结构的HMM）能否直接完成“路径辨识+混合建模”两步合一的框架。 - 多模态EHR方法：本文只用了ICD-10和OPS代码，未引入文本笔记、实验室检验或影像学特征，也未讨论是否需要处理这些信息来源。

什么明显该被引/该存在、却没出现在intro里？ - 与生存分析/竞争风险模型的交叉：医疗轨迹本质上是一个多状态竞争风险过程，但全文未引用任何生存分析/多状态建模（multi-state models）的经典文献（如Andersen & Keiding 2002, Putter et al. 2007）。多状态模型也能提供结构化的进展路径刻画，且同样可以处理异质性，但本文并未讨论其作为替代方法的优劣势。 - 与因果推断中“treatment pathway”概念的交集：诸如“inverse probability weighting for time-varying treatments”、“g-computation公式”等因果推断方法在处理序贯决策路径时已有成熟应用，但本文未涉及。 - 行为序列建模中的“admixture”原作：Pritchard et al. 2000 [26] 是种群遗传学的奠基工作（STRUCTURE软件），本文将其作为admixture模型源头引用。但在EHR领域，LDA与admixture模型的核心差异（主题隐含 vs 路径显式固定、状态空间同构 vs 异质等）并未被充分讨论。

张力¶

未见明显对立引用：被引工作之间不存在在略不同条件下得出相反结论的情况。但可以注意一个隐含张力：过程挖掘派强调保留所有变异（包括罕见分支），而主题建模/聚类派则倾向于抽象与压缩。本文实际上站在后者一边，但未与前者正面争论。

二、最核心、最简单的例子 / 数学问题（先把符号/模型/可观测数据交代清楚）¶

第一步：把符号、模型、可观测数据交代清楚¶

符号¶

状态（state）：每个临床事件（ICD-10诊断、OPS操作、Discharge）被映射到一个整数。论文中总共用了167个状态标签（state 0 = admission diagnosis “C61”；state 166 = Discharge）。这是可观测的离散状态空间。
患者轨迹（patient trajectory）：\(S_i = (s_{i1}, s_{i2}, \dots, s_{iT_i})\)，其中\(s_{it}\)是患者\(i\)的第\(t\)个事件块（由一个时间戳下的多个code组成一个集合状态）。\(T_i\)是轨迹长度。这是可观测的随机向量。
事件块（event block / care stage）：一个时间戳上所有code的集合，表示为状态节点\(N_i = (s_i, c_i, I_i)\)，其中\(s_i\)是code集合，\(c_i\)是经过该节点的患者数，\(I_i\)是患者标识符。这是建模中的内部构造。
典型路径（typical pathway）：从简化路径图中提取的、从root到terminal的序列，记为\(k=1,\dots,K\)（论文中\(K=3\)）。这是被估计的群体级结构，不是自然可观测的。
路径特异性马尔可夫链（pathway-specific Markov chain）：对每个典型路径\(k\)，定义状态转移矩阵\(P_k \in [0,1]^{167 \times 167}\)，\(P_k(i,j)\)是从状态\(i\)到\(j\)的转移概率，估计自训练集中属于该路径的过渡频次。这是用于建模的参数。
混合权重（admixture weights）：对患者\(i\)，\(\mathbf{q}_i = (q_{i1}, \dots, q_{iK})\)，\(q_{ik} \ge 0\)，\(\sum_k q_{ik} = 1\)。这是要估计的个体级参数（每个患者一个\(K\)维单纯形点）。
假设：\(S_i\)的观测似然假定为一阶马尔可夫混合模型：
\[\log p(S_i | \mathbf{q}_i) = \sum_{t=1}^{T_i-1} \log\left( \sum_{k=1}^K q_{ik} P_k( s_{it}, s_{i,t+1} ) \right)\]
可观测数据是\(S_i\)，不可观测的是\(\mathbf{q}_i\)与潜在的路径分配\(z_{it}\)（每个转移被哪个路径解释）。
可观测数据 vs 不可观测：
可观测：\(S_i\)（状态序列）、患者标识符、时间戳、节点计数\(c_i\)。
不可观测/仅靠假设识别：\(\mathbf{q}_i\)（混合权重）、路径分配\(z_{it}\)、路径特异性转移矩阵\(P_k\)（由训练数据间接通过简化路径图估计，但图本身也是构造出来的）。

模型（数据生成机制）¶

论文没有假设一个显式数据生成模型来描述真实医疗轨迹。相反，它使用一个两步式的描述性-概率性混合模型：

群体级描述性步骤：从训练集患者轨迹中，用基于规则（importance threshold + pruning）构造一个简化前缀树，从中提取\(K\)条典型路径，并计算每条路径的转移矩阵\(P_k\)。这个步骤不是生成式的——没有假设这些路径是如何“产生”患者轨迹的。
个体级概率步骤：对测试集患者\(i\)，固定\(P_k\)，用EM或SLSQP估计\(\mathbf{q}_i\)，最大化条件对数似然。这假设给定\(\mathbf{q}_i\)和\(P_k\)，轨迹\(S_i\)是独立同分布（路径混合）的。

重要区分：本文的核心是一个似然函数，而非一个有生成假设的全概率模型。\(P_k\)从训练数据通过构造（非随机）获得，因而本文不是通常意义上的“latent variable model with fitted components”。

可观测数据是什么¶

患者集合：\(n_{\text{train}} = 796\)，\(n_{\text{test}} = 199\)（80/20分割）。
训练集：用于构造简化路径图（图3右）。输出：三条路径、每条路径的转移矩阵、重要性阈值参数\(\tau=15\)与剪枝参数\(\alpha=5, \beta=0.1\)。
测试集：用于固定\(P_k\)、估计\(\mathbf{q}_i\)，\(K=3\)。
最终表示：每个患者被映射到\(K-1\)维单纯形上的一个点（\(\mathbf{q}_i\)）。

第二步：讲最小内核¶

本文的方法在数学上并非“一般情形”向“特殊例子”推广，而是一个如何将离散状态序列嵌入到一组固定马尔可夫链的凸包中的问题。以下是去掉“真实数据细节”后的最小版本：

最简特例（首选）：假设只有2条典型路径（\(K=2\)），且每条路径只有2个状态\(\{a, e\}\)（admission与discharge）。那么路径1的转移矩阵为\(P_1\)，路径2的为\(P_2\)。每个患者\(i\)的轨迹\(S_i = (a, e)\)（即是从a直接跳到e的一个双状态序列）。

在这种最简单的情况下： - 观测到的转移（a→e）只有一次。似然函数简化为：

\[\log p(S_i | \mathbf{q}_i) = \log\left( q_{i1} P_1(a,e) + q_{i2} P_2(a,e) \right)\]

由于\(q_{i1}+q_{i2}=1\)，且\(q_{i1} \in [0,1]\)，此时估计\(\mathbf{q}_i\)只需要极大化一个单变量凹函数。

如果\(P_1(a,e) \approx 0.9\)（典型路径fast discharge）、\(P_2(a,e) \approx 0.1\)（典型路径slow discharge），那么观察到直接discharge就对应较大的\(q_{i1}\)。这实际上就是在一个线性混合模型下，观测到的转移概率对路径比例进行贝叶斯式后验平均。
进一步最小化：如果去掉所有数据噪声、随机扰动，只保留上述框架，那本质上就是在一个严格可辨识的线性模型下估计混合权重。但本文引入了真实数据的复杂性：多个状态、多个过渡、路径的分支与重叠——使得单纯形上的\(\mathbf{q}_i\)不能直接可由一个过渡推断。

这个最简例子揭示了核心思路：论文不是在做无监督的聚类或主题发现，而是在一个预先固定好的参照系统（路径转移矩阵）中，估计每个个体在该参照系下的坐标。

三、这篇论文做了什么（本次重心，务必讲透）¶

三句话¶

研究了什么问题：如何从高度异质的真实世界医疗轨迹（EHRs）中，提取一个稳定、可解释的群体级典型路径图，并用它作为“脚手架”来估计患者的路径混合比例，从而支持子组发现。
核心工具/方法：基于规则的前缀树简化算法（重要性评分+垂直/水平折叠+剪枝+后向合并） + 由简化路径导出的马尔可夫链 + 群体遗传学中admixture模型（STRUCTURE风格）的似然函数（EM或SLSQP优化）。
主要结论：在前列腺癌根治术患者数据（n=995, 6,904个事件）上，算法一致性恢复了3条典型路径；患者级混合权重在不同训练-测试分割下稳定；admixture空间中的聚类产生了可临床解释的子组（更详细的院内诊断 vs 外部转诊 vs 混合型/复杂轨迹）。模拟显示，算法在结构混合程度增加时定性退化但不会崩溃。

关键设定与假设¶

（在第二节最小记号的基础上补充）

记号补全（重要）：每条典型路径\(k\)是一个确定的状态序列，但用于构造转移矩阵\(P_k\)时，只使用了训练集中沿着该路径的轨迹的观察。\(P_k(i,j)\)是按过渡次数简单估计的，未使用贝叶斯平滑（例如，对于未观察到的过渡，概率直接赋0）。
假设列表：
1. 离散一阶马尔可夫假设（在路径级）：患者轨迹中的当前状态决定下一状态的分布，不依赖于更长的历史。这虽然在真实医疗数据中不完全成立（例如术后并发症风险依赖于多步之前的程序），但本文认为“simplified pathway representation is intended to capture dominant structural transitions, for which a first-order model provides a parsimonious and stable approximation”。
2. 路径独立性假设（在混合模型中）：给定\(\mathbf{q}_i\)和所有\(P_k\)，\(S_i\)的似然是各过渡的条件对数似然之和，其中每个过渡的贡献是所有路径的加权平均。这意味着不存在路径间相互作用——例如，一个过渡不能同时被两个路径解释得更好（只能通过权重调和）。
3. 训练-测试分离：群体级路径图完全由训练数据构造，测试数据不参与任何结构辨识。这是为了防止信息泄漏，但同时意味着测试数据的结构特征必须完全由训练数据的模板来解释——如果某个患者在测试集中呈现出训练集从未见过的转移模式，该模式将被分配到已有路径的加权混合中（可能会产生不合理的高模糊权重）。
4. 可复现性：作者假设在不同训练子集上构造出的路径图在结构上基本一致（图S2验证了这一点）。但这是一个经验性假设，未给出理论保证。
5. 阈值假设：重要性阈值\(\tau\)、绝对与相对剪枝阈值\(\alpha,\beta\)被当作用户指定的参数。作者观察到改变它们主要影响图的细粒度而非主干结构，但未给出系统性的最优选择准则。
相比已有文献的强化与放宽：
- 强化：与LDA相反，本文规定了路径结构显式已知且固定，而不是从数据中学出潜在主题。这保证了可解释性和稳定性，但限制了表达能力（无法学到训练集中未出现的路径模式）。
- 放宽：相比过程挖掘（产生详细有向图），本文允许大量的“非重要”状态被折叠/剪枝，使得主干更清晰，但以一个可控的信息损失为代价（只有29.8%的原始轨迹完整保留）。

主要结果¶

A. 真实数据应用（前列腺癌队列）¶

结果	数值/描述
辨识路径数	\(K=3\)（路径1: 诊断→活检→手术→出院; 路径2: 类似但额外中间级; 路径3: 出院后再次入院的路径）
路径稳定性	跨3个随机80/20分割，相同路径结构恢复（图S2）
测试集患者分布	约50%患者由路径1主导，约25%由路径2主导，25%由路径3主导（图4）
内部聚类有效性	Silhouette (EM) = 0.70 ± 0.03; (SLSQP) = 0.75 ± 0.02; Davies-Bouldin (SLSQP) = 0.37 ± 0.04
优化器对比	SLSQP一致优于EM（更高似然、更好聚类分离）

B. 模拟研究（文献S7）¶

生成设置：\(N=400\)，3条基干路径，共享起点与终点，内部不同。Dirichlet先验\(\alpha \in \{0.8, 1.0, 1.2\}\)，switch概率\(p_{\text{switch}} \in \{0.10, 0.22, 0.35\}\)，引入真实噪音（状态跳过/重复/插入）。
主要量化结果（表S2）：
低混合：MAE=0.234，相关性=0.834，ARI=0.940，Silhouette=0.923
中混合：MAE=0.257，相关性=0.785，ARI=0.774，Silhouette=0.897
高混合：MAE=0.242，相关性=0.754，ARI=0.717，Silhouette=0.876
结论：随着结构混合程度增加，恢复质量单点下降但未崩溃。在高混合条件下，ARI仍在0.717，表明即使大量路径间切换，主干恢复仍合理。

证明路线与技术技巧（本文虽是方法论+应用型，但“证明”只出现在模拟和稳定性检查中；以下以算法逻辑代替证明路线）¶

整体路线（算法逻辑的3-5步主干）¶

前缀树构建：将每个患者轨迹以“事件块”序列形式依次插入树，共享前缀的患者合并。
重要性打分+简化：
对每个节点\(N_i\)，计算\(p_i = c_i / \sum_{j \in C_i} c_j\)（在同个care stage内的比例）。然后\(\text{Imp}(N_i) = \min(p_i, 1-p_i) \times \sum_{j \in C_i} c_j\)。
关键直觉：当一个节点\(N_i\)的比例接近0.5时，它是最“信息区分性”的——它把队列分成两个大小相似的子群；比值接近0或1的节点则贡献小（要么太稀有，要么几乎是所有患者都会经历）。
重要性阈值\(\tau\)决定保留哪些节点。
折叠：
垂直折叠：相同care stage上共享重要process的节点合并。
水平折叠：相邻非重要节点压缩为一个复合节点（同时包裹状态集合）。
后向合并：从终端节点向上递归，再次应用垂直合并条件。
剪枝：移除无法达到绝对/相对支持阈值的节点（\(\alpha=5\), \(\beta=0.1\)）。
路径提取+马尔可夫链+混合推断：从简化图中枚举3条路径，估计转移矩阵，固定后，对测试集患者用EM/SLSQP估计\(\mathbf{q}_i\)。

关键跳跃点（最吃功夫的引理/步骤）¶

重要性函数的定义（公式3）是本文被引工作[1,3,5]中没有出现的创新点。核心：它把“分裂能力”显式编码进重要性，使得一个在中间比例出现的节点，即使绝对计数不大，仍能获得高重要性。这使得罕见但具有区分性的处理步骤（如某些诊断程序只出现在1/3的患者中）在剪枝后仍可能保留。
竖直折叠的条件：要求非空共享子集\(X\)中所有procedure的Imp(P_k)都≥τ。这个条件是强加的——这意味着如果两个节点共享的procedure虽然重要但一个重要procedure不在共同子集中，则不合并。这保证了折叠只发生在有确凿“重要”共同点时，而非胡乱统一。
水平折叠：做的是将多个连续重要节点的“间隙”合并为一个复合节点。这里隐含着一阶马尔可夫假设的局部有效性假设：连续非重要节点之间的转移信息不重要，可以被压缩。
后向合并：之所以需要后向合并，是因为前方垂直合并可能不能传播到更早的care stage——例如，后继节点的合并可能会改变父节点的语义，但前向算法不会回溯。这是一个设计上必要的回溯步骤。

技术技巧点名¶

重要/过程重要性：基于relative frequency + min(pi,1-pi) 的启发式方法，而非信息增益或基尼系数（树模型常用），也未提及统计显著性检验。
前缀树（Prefix tree / Trie）：标准的数据结构，用于压缩共享前驱的轨迹。
混合似然优化：EM vs SLSQP——这是经典的非凸优化问题（约束级单纯形），本文未提供收敛保证。
交叉验证-like稳定性检查：用多个随机80/20分割来检验路径图的可重现性，相当于完全省略了模型选择（K选择）——K被固定为3，来自路径图结构（与路径的拓扑数目相对应）。本文未讨论K的选择（如gap统计量或BIC），但这是一个操作上的重要缺失。

真实例子与应用¶

数据：University Medical Center Freiburg泌尿科从2015-2020年的前列腺癌根治术患者（n=995）。数据字段：ICD-10诊断（4 distinct codes），OPS操作（162 codes），Discharge。总事件6,904。事件映射为167个状态，其中0=C61（入院诊断），166=Discharge。
怎么用：
构造训练集（80%患者），运行算法得到3条路径（图3右）。
从每条路径导出一个马尔可夫链\(P_k\)，固定。
对测试集（20%患者），用EM/SLSQP估计每个患者的\(\mathbf{q}_i\)。
在\(\mathbf{q}_i\)空间中用k-means（K=3）聚类分组。
得到什么结果：
三条路径被解释为：“入院诊断→融合活检→手术→出院”（路径1）、“入院诊断→手术→更多中间步骤→出院”（路径2）、“入院诊断→出院→再次入院→重新处理→再次出院”（路径3）。
聚类分析揭示了三个临床可解释的亚组：组1（院内诊疗方案完整、包括活检）；组2（外部转诊、更直接进入手术）；组3（混合/复杂病程，需要再入院）。
这些组在admixture空间中分离良好（Silhouette 0.70-0.75）。
这个例子想说明什么：
验证算法在真实复杂数据上能够恢复合理的、稳定的结构。
展示框架的输出（混合权重+群结构）相对于原始轨迹更加可解释和可比。
说明从群体路径到个体表示的过程是稳定且对训练-测试分割不敏感的。

🔎 结论是否比证明窄¶

Yes。作者在摘要和结论中声称“produced a stable and interpretable typical healthcare pathway”和“supported the identification of patient subgroups with distinct care progression patterns”。但实际上：
稳定性只通过图S2（3次分割）和一次模拟（不同混合水平）验证，从未给出任何统计学上的可靠性界限（至少需要多个分割的分布、非参数重抽样等）。
K=3的选择是基于简化图的定向分析结果，但作者从未检验其他K的合理性（例如，K=2时是否仍然稳定？K=4时是否产生过拟合？）。结论中直接用了K=3作为事实。
“典型路径”概念的严格数学定义在文章里没有出现。全文使用的是“cohort-level progression patterns identified from multiple patient trajectories”——这一定义是完全操作性的：典型路径=从简化算法中输出的前\(K\)个最频繁路径。没有理论刻画“典型”意味着什么（例如，它们是否最大化似然？是否覆盖了某种积分的概率质量？）。
关于临床解释的声称：作者说“the three identified clusters reflected distinct and clinically interpretable care trajectory patterns”（第5节）。但这些都是事后解释，没有任何前瞻性验证或与金标准的对比。

四、开放问题（点到为止，扎根具体语句）¶

K的选择问题：本文固定的\(K=3\)在简化路径图中被观察为三个不同的顶端分支。但作者未讨论如果简化图只有2条分支，或者如果减少了更多节点导致分支合并，应如何处理K。可扎根于第4.2节最后一句：“Three pathway-specific Markov models were derived from the typical pathways identified in the simplified graph.”——这里K不是一个被选择的模型复杂度，而是被直观等同为“简化图中看到的路数”。这是否总会是好的近似？不确定。
稳定性缺乏理论界：虽然经验上观察到跨分割稳定性（图S2），但从未给出严格的界限：路径结构是否在任何训练集上的变化下都能保持\(< \epsilon\)的差异？是否有反例？可扎根于第5节：“Across multiple random train–test splits, the same typical pathway structures...were consistently recovered.”——这是实证观察，非理论结论。
一阶马尔可夫假设的有效性：该假设是本文建模的基础，但作者自己也承认“real-world healthcare trajectories may exhibit longer-range dependencies”。如果允许二阶或高阶依赖，当前的混合似然公式会变成\(\sum_{t=2}^{T_i-1} \log(\sum_k q_{ik} P_k(s_{i,t-1}, s_{it}, s_{i,t+1}))\)，这将使优化变得更复杂。可扎根于第3.2.1节：“Although real-world healthcare trajectories may exhibit longer-range dependencies...”——作者用“parsimonious and stable approximation”来辩解，但未检验这个近似在多严重时会失效。
无新统计理论贡献：本文未提出新的估计量一致性或渐近分布结果。全部 inference 来自数值优化（EM/SLSQP），且使用截断的过渡矩阵（未观察到的转移被赋0）。这使得不能做任何关于\(\mathbf{q}_i\)的下界/置信区间。可扎根于第3.2节：“transition probabilities are estimated as \(P_k(i,j) = n_k(i,j) / \sum_{j'} n_k(i,j')\)”——所有未观察到过渡被赋0，而不是使用拉普拉斯平滑或贝叶斯后验。
可转移性问题：本文路径图和admixture分析完全依赖于同一个医院/同一种手术类型的数据。在跨机构或跨疾病的应用中，路径结构可能完全改变（例如，与不同的编码系统、不同的转诊习惯相关当前的路径图可能完全不适用）。可扎根于第5节：“its generalizability across institutions, patient populations, and coding practices remains to be evaluated”。这是一个重要的可推广性缺口。

Maintained by 陈星宇 · Homepage · Source on GitHub