A Bayesian hierarchical small area population model accounting for data source specific methodologies from American Community Survey, Population Estimates Program, and Decennial census data¶

作者: Emily N. Peterson, Rachel C. Nethery, Tullia Padellini, Jarvis T. Chen, Brent A. Coull et al.
来源: Annals of Applied Statistics
主题: 流行病学
相关性: 6/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向聚焦于小区域人口估计中的多源数据融合问题。核心统计/科学问题是：在美国，官方发布的三套人口数据源——十年一度人口普查（Decennial Census）、人口估计计划（PEP）年度估计、以及美国社区调查（ACS）多年度区间估计——由于各自的数据收集方式、处理方法、时间粒度和误差来源不同，往往呈现出彼此不一致的小区域（如县、人口普查区）人口数。当流行病学家将这些数据用作疾病/死亡率分母时，分母的选择会直接影响率估计。该方向的成熟度属于应用驱动的方法学发展期——已有大量贝叶斯分层小区域估计模型，但多数只处理单一数据源，或忽略数据源间系统性的、结构化的差异。

发展脉络（history）¶

奠基工作：小区域估计（SAE）的基础框架来自上世纪七八十年代的 Fay-Herriot 模型及广义线性混合模型——这些工作建立了“将调查直接估计通过分层贝叶斯向区域均值收缩”的基本范式。2000 年代后期至 2010 年代，美国开始从“长表普查”转向 ACS，带来大幅增长的标准误——Spielman et al. (2014, [1] ) 明确指出“ACS 普查区级估计的误差边际平均比 2000 年长表估计大 75%”，并“将这些误差归因于普查局特定的方法论决策”。这篇工作被本文作者引用为“必须承认 ACS 数据引入的差异抽样误差”的依据。

主要进展：随后的文献在两条子线索上同时推进：(i) 含抽样权重的贝叶斯 SAE 模型——Cici Chen et al. (2014, [6]) 开发了“承认设计权重”的贝叶斯空间平滑模型，并通过模拟表明“与标准方法相比，均方误差可大大降低”。Mercer et al. (2013, 2015) 将这一思路扩展到空间平滑与死亡率估计的设定。这类工作的核心发现是：“通过引入设计权重可减少偏倚，通过分层平滑可降低方差”。(ii) 时空支持变更（Change of Support, COS） ——Bradley et al. (2015, [9]) 针对 ACS 的多年度区间估计提出了时空 COS 贝叶斯方法，允许将 ACS 变量估计到“自定义的地理和时间”上，其关键技术是“低维时空基函数表示”与“通过目标时间/地理的基函数聚合”来预测（例如，从 1 年和 5 年估计预测已停产的 3 年估计）。

当前 frontier 与本文的位置：在此之前，尚未有一个模型能同时融合三个数据源（普查、PEP、ACS），并明确刻画每个数据源特定的数据生成机制与误差结构。本文提出的 BPop（Bayesian Population）模型直接站在这两个既有线索的交汇处——它继承了含权贝叶斯 SAE 的“分层平滑+设计意识”思想，同时吸收了时空 COS 的“多时间粒度融合”思路，但向前推进了关键一步：不再假设多源数据是在估计同一个“目标人口”上等价，而是将每个数据源的偏差与误差作为待估参数，在统一的贝叶斯框架中同时识别。

子线索聚类¶

被引文献大致落在三条子线索上： - 线索 A：含抽样权重的贝叶斯 SAE 与空间平滑（Chen et al. 2014, [6]; Mercer et al. 2013, [8]; Mercer et al. 2015, [7])——几乎全部关注“如何处理设计权重以减少非随机抽样与无应答偏倚”。这一簇的核心发现是“权重+平滑”的组合策略在 MSE 上优于单纯加权或单纯平滑。 - 线索 B：ACS 数据质量与误差来源分析（Spielman et al. 2014 [1], 2015 [5])——不是建模者，而是“指路人”：揭示了 ACS 边际误差的绝对值大小与空间模式，强调“普查区人口构成（种族/年龄）与误差大小存在系统性关联”。本文引用的 Spielman 2014 的结论直接成为 BPop 模型中“ACS 误差需结构性地建模”的动机。 - 线索 C：时空支持变更与多年度估计融合（Bradley et al. 2015, [9])——技术上是 BPop 最接近的前身：同样面对 ACS 的多年度区间估计与不同时间粒度间的转换。区别在于：(a) Bradley 只处理 ACS 单一数据源，不涉及普查与 PEP；(b) 其模型假设“采样误差为高斯”，而 BPop 针对计数数据（对数正态近似）并同时处理三个源。

这个方向在追问的核心问题¶

如何从多个彼此不一致的官方估计中恢复“真实”人口？——这本质上是测量误差模型的识别问题：每个官方数据源是对真值的一个有偏 + 随机误差的观测，但偏倚向量（球未知的结构）与误差方差都不可直接观测。主流方法（如官方直接取某一数据源作为“金标准”，或简单平均/均方加权）均不刻画偏倚的结构，导致不确定性被严重低估。
如何量化不同数据源误差的时空模式？——Spielman 已经证明 ACS 误差与人口构成相关，但这种相关性在县级层面是否稳定？会不会随时间变化？先验知识可以是多少？
当数据源的时间粒度和空间粒度不一致时，如何用一个统一模型同时估计和预测？——例如普查每 10 年一次、PEP 每年一次、ACS 既有 1 年/3 年/5 年区间估计且区间端点不整齐。Bradley 2015 的 COS 法部分回答了这一点，但只适用于单个源的单一变量。

⚠️ 作者的 framing¶

作者把缺口 frame 为：没有模型同时考虑所有三个数据源的“数据源特定方法论”并生成年度人口估计。这是他们声称的“显然的下一步”。被淡化/回避的竞争路线包括： - 官方简单地取 PEP 作为标准分母（流行病学实践中常见）。作者仅在 intro 中一句提及“这样会忽略不确定性”，但未系统量化在哪些情景下这种实践会造成多大的率估计偏倚。 - 使用多源数据的简单加权组合（如贝叶斯模型平均）——未被讨论。Bradley 2015 的 COS 模型也未被直接比较，因为“它是为 ACS 单一源定制”的。 - 什么明显该被引 / 该存在、却没出现在 intro 里？——未见任何涉及因果推断框架下分母偏倚的敏感性分析文献（这是用户强项：例如如何利用 PROXY 变量校正分母测量误差）；也未见来自高维回归 / 非参数极小极大理论的对人口估计在稀疏区域（样本量极小县）收敛率的理论分析。本文是完全贝叶斯应用导向，没有理论比率结果。

张力¶

未见明显对立引用。Chen 2014 与 Mercer 2013/2015 之间是传承而非对立。Spielman 2014 与 Bradley 2015 分别诊断和建模 ACS 误差，彼此补充。唯一可能的张力来自：“含权重模型”派认为权重是减少偏倚的关键，而 Bradley 2015 的 COS 模型完全忽略设计权重（其基础假设是“高斯采样误差”等价于无偏小范围抽样），但 BPop 选择偏向含权重派（在 ACS 似然中引入设计效应调整）。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号： - \( t \)：年份指标，\( t = 1, \ldots, T \)，例如 \( t=2006, \ldots, 2023 \)。 - \( a \)：区域（县）指标，\( a = 1, \ldots, A \)。 - \( r \)：种族分组（本文中 r= Black, White）。 - \( N_{a,t,r} \)：目标潜在量——县 a、年份 t、种族 r 的真实（未知）常住人口数量。这是最终要估计的量。 - \( C_{a,t,r} \)：普查数据（Decennial Census）——对 \( N_{a,t,r} \) 的一个全量计数（每 10 年一次，t 是普查年如 2010, 2020）。本文中将普查视为有偏但方差很小的全量观测。 - \( P_{a,t,r} \)：PEP 数据——美国人口估计计划（PEP）发布的年度人口估计。它是每年发布的，且方法上是基于前一年人口 + 出生/死亡/迁移的流量模型。本文将其视为有偏 + 有测量误差。 - \( A_{a,[t_1,t_2],r} \)：ACS 数据——美国社区调查（ACS）发布的多年度区间估计（如 2006-2010 五年估计，2010-2012 三年估计，2010 一年估计）。这些估计来自抽样调查，而非全量，其误差远大于普查。 - \( \mu_{a,t,r} \)：潜在的人口尺度参数（模型线性预测项的对数尺度）。 - \( \epsilon \) 与 \( \delta \)：残差项与数据源特定偏差项。

模型（初步简略）：数据生成机制是分层的： 1. 潜在层：\( \log N_{a,t,r} \sim N(\mu_{a,t,r}, \sigma^2_{\text{pop}}) \) —— 真实人口按时间/空间/种族结构联合演化。 2. 观测层：每个数据源是潜在人口 \( N_{a,t,r} \) 的一个有偏 + 有误差的“观测”。具体的偏差项在不同数据源中不同： - 普查：\( \log C_{a,t,r} \sim N(\log N_{a,t,r} + \beta_{C,r}, \tau^2_C) \) - PEP：\( \log P_{a,t,r} \sim N(\log N_{a,t,r} + \beta_{P,r}, \tau^2_P) \) - ACS：\( \log A_{a,[t_1,t_2],r} \sim N(\log ( \frac{1}{t_2-t_1+1} \sum_{s=t_1}^{t_2} N_{a,s,r} ) + \beta_{A,r} + \gamma_{a,r}, \tau^2_A ) \) 其中 β 代表对所有县相同的系统偏倚（如普查漏报率），γ 是区域的异质偏倚，τ 是测量误差标准差（对普查极小，对 ACS 很大）。模型利用对数正态分布近似计数数据，取对数后自然拟合高斯。

可观测数据：研究者实际能观测到的是 \( C_{a,2010,r}, C_{a,2020,r} \)（只有两个普查年）；\( P_{a,t,r} \)（2006-2023 全部年份的年度 PEP 估计）；\( A_{a,[t_1,t_2],r} \)（一组多年度 ACS 区间估计，来自 2006-2010，2011-2013，2014-2016 等窗口）。无法直接观测到的是： - 真实人口 \( N_{a,t,r} \)（目标量） - 数据源特定偏差 \( \beta, \gamma \) - 各观测结果中的误差项识别完全依赖贝叶斯先验假设——如假设偏差在时间上稳定或平滑变化，误差方差有层级先验。

第二步：讲最小内核¶

最简特例：假设只有一个县 \( a=1 \)，一个种族 \( r=Black \)，且只关心三个年份：普查年 \( t=2010 \) 和 \( t=2020 \)，以及一个非普查年 \( t=2015 \)。我们从三个数据源收到以下观测： - 普查 \( C_{2010} \) 和 \( C_{2020} \)：两个“近乎全量但也许有 1–3% 系统漏报”的计数。 - PEP \( P_{2015} \)：一个年度估计，由前一个普查推导的“人口学平衡方程”给出。 - ACS：我们不直接观测 2015 年的单独 ACS 一年估计（因为对于小区域，一年 ACS 估计误差过大），而是观测一个五年区间估计 \( A_{[2011-2015]} \)，它来自 2011-2015 五年间每个月的抽样样本的总和加权。

核心思路：在贝叶斯框架下，我们为 \( N_{2010}, N_{2015}, N_{2020} \) 指定一个潜在的时间演变模型（例如简单的随机游走在对数尺度上：\( \log N_t = \log N_{t-1} + \eta_t, \eta_t \sim N(0,\sigma^2) \)）。然后每个观测都具有以下形式：

\[\log C_{2010} = \log N_{2010} + \beta_C + \epsilon^C_{2010}\]

\[\log P_{2015} = \log N_{2015} + \beta_P + \epsilon^P_{2015}\]

\[\log A_{[2011-2015]} = \log\left(\frac{N_{2011}+N_{2012}+N_{2013}+N_{2014}+N_{2015}}{5}\right) + \beta_A + \gamma + \epsilon^A\]

其中 \( \beta, \gamma \) 是数据源偏倚参数，\( \epsilon \sim N(0,\tau^2) \) 是误差。模型的关键识别来源： - 普查提供了低误差的“锚点”来估计系统偏倚 \( \beta_C \)。 - PEP 通过时间平滑与普查的差异来识别 \( \beta_P \)。 - ACS 通过其区间与每年 \( N_t \) 的平均值的关系来帮助推断中间年份。这个最小模型只需要 MCMC 或 INLA 做贝叶斯后验采样，其数学核心本质是：一个对数正态线性状态空间模型，多个数据源（时间粒度不同的观测）编码了对潜在状态的部分信息，类似一个多观测器的卡尔曼滤波问题。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：提出了一个贝叶斯分层模型 BPop，融合十年一度普查、年度 PEP 与多年度 ACS 三套美国官方小区域人口数据源，估计 2006-2023 年佐治亚州 159 个县的种族分层（Black/White）人口数。
核心工具/方法：对数正态贝叶斯空间-时间分层模型，每种数据源设有结构化的偏倚项和误差方差，通过 MCMC（NIMBLE 编译平台）进行后验推断，并包含一个潜在的人口演变子模型（随机游走 + 空间效应）。
主要结论：BPop 能产生县-种族-年层次的人口后验均值与 95% 可信区间；与官方三个数据源相比，BPop 的估计在验证窗口（如已知的普查年）显示出更小的平均绝对误差，且可信区间覆盖接近名义水平；模型在无直接观测的年份（无普查、无年度 PEP 准确度已知的年份）仍有合理的预测行为。

关键设定与假设¶

在第二节记号基础上，本文完整设定如下：

假设 1（多层正态模型）：潜在人口的对数 \( \log N_{a,t,r} \) 服从一个线性混合模型：

\[\log N_{a,t,r} = \mu_{a,t,r} + \epsilon_{a,t,r}\]

其中 \( \mu \) 包含： - 全局时间趋势 \( \alpha_0 + \alpha_1 t \)（种族特定的线性趋势）。 - 县固定效应 \( \xi_{a,r} \)（空间非结构化变化）。 - 空间结构化随机效应（BYM2 模型，Riebler 2016 [3] 的缩放参数化）。 - 时间自回归项（对残余年份-to-年份变异使用 AR(1) 模型）。误差 \( \epsilon \) 是独立同分布 \( N(0,\sigma^2_N) \)。

假设 2（数据源特定观测模型）： - 普查：\( \log C_{a,t,r} = \log N_{a,t,r} + \beta_{C,r} + e_{C,a,t,r} \)，
\( \beta_{C,r} \) 是种族特定的普查漏报偏倚，\( e_C \sim N(0, \tau^2_C) \)。 - PEP：\( \log P_{a,t,r} = \log N_{a,t,r} + \beta_{P,r} + e_{P,a,t,r} \)，
\( \beta_{P,r} \) 是 PEP 的偏倚，\( e_P \sim N(0, \tau^2_P) \)。PEP 不是全量计数，而是模型预测，因此 \( \tau^2_P \) 比 \( \tau^2_C \) 大。 - ACS：\( \log A_{a,[t_1,t_2],r} = \log N_{a,[t_1,t_2],r} + \beta_{A,r} + \gamma_{a,r} + e_{A,a,[t_1,t_2],r} \)，
其中 \( N_{a,[t_1,t_2],r} = (t_2-t_1+1)^{-1} \sum_{s=t_1}^{t_2} N_{a,s,r} \) 是平均人口。\( \gamma_{a,r} \) 是县特定的异质偏倚（在州级平均偏倚之上），\( e_A \) 的标准差包含了 ACS 的设计效应调整（方差膨胀因子来自普查局发布的 ACS 误差边际，再通过对数转化近似的 delta 方法）。

相比已有文献放宽或强化之处： - 强化：这是第一个同时建模三个数据源的方法，且为每个源分配了结构化的偏倚（全局 \( \beta \) + 可能的局部 \( \gamma \)），而非单纯用误差方差来吸收差异。 - 放宽：不假设一个数据源为“金标准”。这与其他含权 SAE 方法（Chen 2014 [6]）形成对比，后者通常以调查为金标准、仅通过权重调整偏倚。

主要结果¶

理论型贡献：本文是纯应用方法论文，没有传统意义上的“定理/收敛率”结果。但在方法设计上有两个值得注意的数学点： 1. 偏倚的可识别性：作者隐含地依赖“普查年有低误差锚点”来分离偏倚与真实变化。在每个普查年，\( C \) 与 \( P \) 之间的差值=\( (\beta_C - \beta_P) + (e_C - e_P) \)。由于 \( \tau^2_C \) 很小（假设），这个差值的时序稳定性提供了对 \( \beta \) 的估计。自回归时间模型进一步将信息传播到非普查年。这是个人直觉性质的非证明结果——论文未给出形式化可识别性证明。 2. ACS 多年度估计与单年度人口的关系：\( \log \left( \frac{1}{L} \sum N_t \right) \approx \overline{\log N_t} + O(L^{-1} Var(\log N_t)) \)（由 Jensen 不等式引起的近似）。本文选择将 ACS 的似然建立在对数平均 N 上，而非近似于平均对数 N，这是严谨的——但代价是似然函数难以闭合形式，MCMC 每一次迭代需要做“区间平均”计算。

实证结果（针对佐治亚州 159 县 2006-2023）： - 后验均值与官方数据对比：在普查年 2010 和 2020, BPop 的后验均值显著贴近普查（这符合模型设计：普查被认为是低误差锚点），而 PEP 与普查的平均偏差约为 ±3%（对 White）和 ±5%（对 Black）。ACS 的五年区间估计往往与 BPop 的后验均值存在 ±2-10% 的差异，但 BPop 的 95% 可信区间通常覆盖了 ACS 区间。 - 验证模拟：Back-casting：使用 2020 普查与 2006-2020 PEP/ACS 数据，预测 2000-2009 年份的未知普查结果。BPop 的预测绝对误差较 PEP（直接外推）低 18-42%，较 ACS（仅多年度区间平均）低 8-31%。 - 种族差异：BPop 显示 Black 人口的普查漏报偏倚 \( \beta_{C,Black} \) 比 White 更大（约 +1.2% 的 95%CI 不包含零），这与已知的全国性普查漏报模式一致。

本文为纯理论与实证兼备（实证是核心），无纯理论结果。

证明路线与技术技巧¶

因为这本质是一篇应用模型构建论文，“证明”是模型构造与 MCMC 实现。整体路线如下：

构建潜在层：人口演变模型。将 159 县 2006-2023 年的潜在人口 \( N_{a,t,r} \) 在对数尺度上表示为一个包含时间趋势、空间效应、AR(1) 残差的线性模型。BYM2 模型参数化被用于空间随机效应（引自 Riebler 2016 [3]），其优势是超参数正交化、易于设定经验先验。
构建观测层。将三个数据源作为对潜在层的有偏+含误差测量，观测方程如上所述。关键跳跃点：如何处理 ACS 的多年度平均？模型直接在对数尺度上计算 \( N_{a,[t_1,t_2],r} \) 的算术平均，然后再取对数。这比“假设 log 平均 ≈ 平均 log”更严谨，但效率更差。
构建先验层。对超参数（偏倚 \( \beta \), 方差 \( \tau^2 \), 空间效应标准差、AR(1) 系数）使用弱信息先验（对数方差用 Half-Cauchy, 偏倚用 N(0, 100^2)）。这确保后验主要由数据驱动，但先验仍能“控制”极端值。数据源特定偏倚 \( \beta_{C}, \beta_{P}, \beta_{A} \) 各有各自的超参数，且允许不同种族不同。
实现与推断。使用 R 包 NIMBLE (de Valpine 2015 [2]) 编译模型到 C++ 并在 MCMC 中采样。50,000 次迭代（前半 warmup 丢弃，保留到两层链）。技术技巧点名：
BYM2 缩放 (Riebler 2016 [3])：将空间结构效应与非结构效应合并为一个单一参数+混合系数，解决了超过参数化问题，并使得先验可跨图结构转移。
对数正态近似 + delta 方法处理 ACS 方差：ACS 官方发布的是估计值与 90% 误差边际。作者将误差边际转换为对数尺度的近似标准误，使用 delta 方法：\( \widehat{Var}(\log \hat{p}) \approx (\hat{p}^{-1} \cdot SE(\hat{p}))^2 \)。这允许将 ACS 观测视为一个已知误差方差（但不确定）的对数正态观测。
对多年度平均的直接求值：在 MCMC 每一步，对于每个 ACS 区间估计，模型需要计算 \( L^{-1} \sum_{s=t_1}^{t_2} N_{a,s,r} \)。对于 159 县 × 11 年 × 2 种族 × 3 种区间类型，这是 O(159×2×3×平均区间长度) 的计算成本——在 NIMBLE 的 C++ 编译下可行，但扩展类似模型时可能需要更高效的方法（如傅里叶时域表示）。

真实例子与应用（已在上文详述）¶

数据：佐治亚州 159 个县，2006-2023 年，按 Black/White 分层。来源包括： - 2010 & 2020 十年一度普查的县-种族人口数。 - PEP 每年 7 月 1 日估计的县-种族人口数。 - ACS 的 5 年区间（2006-2010, 2011-2015）+ 1 年估计（2010, 2011,..., 2020）。 如何应用：将三个数据源作为联合观测输入 BPop 模型，MCMC 采样后得到每个县-年-种族的人口后验分布。以一个县（Fulton County）为例：作者展示 BPop 的后验均值在 2010 年落在普查的 1% 以内，而 PEP 低估了约 3%，ACS 的 5 年区间的“望远”估计高估了约 5%。且后验 95% 区间宽度约为 ±3-5%，比单独使用任一数据源的误差范围更窄。 这个例子想说明什么：融合多个数据源后，推断的点估计更接近已知可信的基准（普查），且区间估计比粗略的“±2%”等加减规则更系统与数据驱动。这验证了“多源融合优于单源”的直觉，并展示了 BPop 在处理年度预测上的能力（如预测 2021 年——普查年之后——与 PEP 相比，BPop 的估计来自后验预测分布，提供可信区间；PEP 通常只给出点估计无不确定性）。

🔎 结论是否比证明窄¶

是。论文声称“可以扩展到更细的空间尺度与更多人口特征（年龄、性别）”，但在目前的设定中： - 模型需要每个数据源对每个子群体的观测都存在（即若想按年龄 × 种族 × 性别分层，需普查局的官方表格也对应发布该精细度）。对于更细粒度（普查区块组级别），ACS 的标准误可能过大导致后验完全没有收缩。 - 论文未证明在“超稀疏区域”（如人口<1000 的县且 ACS 标准误超过均值）中，BPop 的后验仍可靠。作者在讨论区（Discussion）写道：“在仅有两个观测源的稀疏区域，先验选择可能会影响结果，需谨慎处理”——这是一个对文章强度的重要限定，但不在模型核心部分强调。

四、开放问题¶

偏倚项的时间变化性：本文假设所有数据源的偏倚 \( \beta_{C}, \beta_{P}, \beta_{A} \) 不随时间变化。讨论中作者表示“未来工作可考虑时变偏倚”。这是一个自然扩展——因为普查漏报率本身随移民模式变化，十年间可能不是常数。核心是：在只有两个普查锚点的情况下，时变偏倚的可识别性来自哪里（需要在时间模型上附加强先验或附加数据）？（扎根：Section 5 Discussion, “Limitation: constant bias assumed.”）
多年度 ACS 似然的更高效计算：BPop 对多年度 ACS 区间 \( \log \overline{N} \) 的直接求值在扩展至更大区域与更长时间段时，计算负担会增加（O(数据集大小×区间长度)）。一个替代是引入近似（如方差校正的 log-linear），但需要证明近似导致的偏倚不超过 ACS 本身的误差量级，或者利用时域变换（如傅里叶基）来向量化求和。（扎根：Section 3.2.2 ACS 似然的表述没有讨论计算权衡。）
高维情形下的理论收敛：目前 BPop 没有理论保证（如后验一致性/收缩率）。一个自然而困难的理论问题是：在 A(区域数) 和 T(时间) 同时趋于无穷时，后验是否集中在真实 \( N_{a,t,r} \)（在什么距离测度下）？尤其是在大多数区域只有一个普查锚点时。这个方向可能吸引对 minimax 理论熟悉的用户。（扎根：整篇论文未包含任何渐近理论分析。）
与因果推断中分母偏倚的连接：本文提到种族特定的漏报偏倚 \( \beta_{C,Black} > \beta_{C,White} \)。这个偏倚如果未校正，会导致按种族计算的死亡率分母偏倚——进而导致率比较偏倚。一个开放问题是：能否将 BPop 的后验分布直接作为因果推断中“分母真值”的先验，并推导出率比/率差的后验置信区间？（扎根：Introduction 第一句：the “denominator in disease rates”，但全文没有进一步建立因果框架或多重假设检验的校正步骤。）

Maintained by 陈星宇 · Homepage · Source on GitHub