Personalized Pricing and the Value of Time: Evidence From Auctioned Cab Rides¶

作者: Nicholas Buchholz, Laura Doval, Jakub Kastl, Filip Matejka, Tobias Salz
来源: Econometrica
主题: 经济理论 / 应用
相关性: 3/10
机构绿灯: Princeton University（US News 前 50，免分进入精读）
链接: https://doi.org/10.3982/ecta18838

一、领域脉络与小综述¶

这个方向是什么¶

本文处于平台经济 / 产业组织的实证微观经济学与结构性需求估计的交叉子领域。核心科学问题是：在消费者对价格和等待时间（即“时间价值”）存在异质性偏好的市场中，平台能否通过个性化定价（即根据消费者属性、行为或实时状态调整价格）来提升总剩余？若能，福利如何在平台、司机和消费者之间分配？该领域目前相当成熟——结构估计方法已标准化（Berry-Levinsohn-Pakes 类型），福利分解也有一套标准的 counterfactual 模拟流程。

发展脉络¶

奠基工作：Berry, Levinsohn, and Pakes (1995, Econometrica) — 建立了随机系数离散选择模型的框架，允许消费者层面的偏好异质性，并用矩估计匹配市场份额与产品特征。本文直接沿用 BLP 的核心估计策略。
主要进展 1（需求端异质性时间价值识别）：Small, Verhoef, and Lindsey (2007, Handbook of Transport Economics)、Fosgerau and Jensen (2020, Review of Economic Studies) 开始关注时间价值异质性，但通常依赖 VSL 等方法。本文的创新在于：直接使用平台产生的拍卖数据 + 消费者面板选择数据，在同一个设定中同时识别价格系数和时间系数的分布。
主要进展 2（个性化定价与福利分析）：Shiller and Waldfogel (2011, RAND Journal of Economics)、Dube and Misra (2023, Marketing Science) 等研究了个性化定价的福利效应，但多针对静态产品市场且未考虑平台-司机互动。本文将其扩展到动态双边市场：司机对行程竞价 → 平台设定价格 → 消费者选择。
主要进展 3（平台竞拍机制下的定价）：Castillo et al. (2017, American Economic Review)、Rosa-Santos et al. (2022, Journal of Political Economy) 分析网约车平台的 surge pricing（动态定价），但 surge pricing 通常是规则驱动的（事件触发），而非个性化的。
本文定位：作者声称自己是“第一个”使用平台级拍卖数据（消费者-行程面板 + 所有出价记录）来直接估计消费者时间价值异质性分布，并发现在这个设定下，仅基于司机等待时间（而非消费者个人数据）的定价可实现大部分个性化定价利润。这是一个非常具体且可证伪的 claim。

⚠️ 作者的 framing：作者把自身的缺口 frame 成“现有研究要么没有消费者层面的时间价值异质性（只有 mean VOT），要么没有考虑平台-司机互动下的福利分配”、“我们是第一个用拍卖数据直接做的时间价值分布估计，而不是用 VSL 推算”。他们淡化了文献中已有的基于调查实验（stated preference） 的时间价值估计（如 Small et al. 2007）——声称“我们的数据是真实的 revealing preference”。什么明显该被引/存在却没出现？ 论文没有引用或讨论 ML-based uplift modeling 或 contextual bandits（这些也是个性化定价的常见方法），这暗示作者的定位是规范性 welfare analysis，而非算法/设计——这一点对统计研究者有提示：这不是一篇方法论文，而是政策评估论文。

子线索聚类¶

结构性需求估计（BLP 及其变体）：估计消费者偏好分布、价格弹性、时间价值等。本文完全属于这类。
个性化定价的福利效应：量化 price discrimination 对消费者剩余、生产者剩余、总剩余的影响。本文贡献核心在此。
平台机制设计与定价：引入平台-司机互动、surge pricing。本文贡献在于模拟 counterfactual pricing policies。
时间价值识别：从选择数据中分离时间与价格系数。本文声称贡献在于提供“真实选择-拍卖数据”下的干净识别。

这个方向在追问的核心问题（2-4 个）¶

在存在平台-司机互动的动态市场中，个性化定价是否会降低消费者福利？——本文答案是是（下降 2.5%）。
个性化定价的收益（总剩余增加 5.2%）主要流向平台还是司机？——本文答案是两者均受益。
哪些维度的个性化能最大化 welfare 贡献？——本文发现仅基于司机等待时间的定价策略即可捕获大部分利润，这触及了数据驱动定价的边际收益的实证问题。

张力¶

未见明显对立引用。该领域实证结果高度依赖市场结构（网约车 vs 外卖 vs 快递）和数据特征（拍卖 vs 固定定价），因此同一结论在不同市场可能不成立——但这更多是异质性而非矛盾。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚¶

符号（逐个点名，一句话一个）： - $i$: 消费者 index（$i=1,...,N$）。 - $j$: 行程（ride）option index（$j=1,...,J$）。 - $t$: 行程发生的时间（时间点/时间段）。 - $p_{ijt}$: 消费者 $i$ 在时间 $t$ 看到行程 $j$ 的价格（这是平台设定的）。 - $w_{ijt}$: 行程 $j$ 的等待时间（即从下单到上车的预估分钟数，由司机竞价状态决定）。 - $x_{ijt}$: 其他可观测特征（如车型、距离、天气等）。 - $\beta_i$: 消费者 $i$ 对价格的敏感度（即价格系数，一般是负值）。 - $\gamma_i$: 消费者 $i$ 对等待时间的敏感度（即时间系数，一般是负值）。 - $\theta_i = (\beta_i, \gamma_i)$: 消费者 $i$ 的偏好参数（异质的）。 - $u_{ijt}$: 消费者 $i$ 选择行程 $j$ 的间接效用。论文假定了线性加随机误差的形式。 - $\varepsilon_{ijt}$: 不可观测的随机效用冲击（i.i.d. Type I extreme value / logit error）。 - $\epsilon_{ijt}$: 外生的需求冲击，用于产生选择概率的变化（对识别时间价值关键）。 - $Y_{ijt}$: 消费者 $i$ 在时间 $t$ 是否选择行程 $j$（二元指示变量，0/1）。 - $\delta_j$: 行程 $j$ 的平均效用（包括价格、等待时间在内的线性指数）。 - $\xi_j$: 行程 $j$ 的不可观测质量（在 BLP 框架中，这是结构误差项）。 - $IV_{ijt}$: 工具变量（通常是其他竞争者在该行程的价格变化，用于处理价格的内生性）。 - $\alpha_0, \lambda_0$: 价格和时间的总体平均效用参数（在异质性模型中，它们是 $\beta_i$ 和 $\gamma_i$ 的均值）。 - $\sigma_{\beta}, \sigma_{\gamma}$: 价格和时间系数的异质性标准差（若假设 $\beta_i$, $\gamma_i$ 随机正态）。 - $\pi_0$: 平台的定价策略参数（在 counterfactual 模拟中设定）。 - $\tau_{dt}$: 司机 $d$ 的等待时间来报价的成本参数（识别与福利分析相关）。

模型（数据生成机制，直白语言）： 1. 消费者的选择行为：给定行程选项集合 $\mathcal{J}_{it}$（有不同价格和等时），消费者 $i$ 选择最大化间接效用的那个行程：

\[u_{ijt} = \beta_i \cdot p_{ijt} + \gamma_i \cdot w_{ijt} + \text{其他可观测特征项} + \varepsilon_{ijt}, \quad \text{其中 } \varepsilon_{ijt} \sim Gumbel(0,1).\]

给定异质性 $\theta_i$（不可观测）和 Logit 误差，条件选择概率由标准 Logit 公式给出。 2. 平台的定价机制：平台观察到司机竞拍形成的等待时间 $w_{ijt}$（对特定行程），然后选择 $p_{ijt}$ 以最大化期望利润。这形成一个 价格-等待时间联合分布，其中价格是等待时间的函数（非线性的）。 3. 司机的竞拍行为：司机根据自己意愿接受行程的价格-距离组合来竞拍，形成 wait time 以供平台观测。文章假设平台可以观测到每个行程的所有出价以及谁被选中（即 $Y_{ijt}=1$ 的那位司机出价对应 $w_{ijt}$）。

可观测数据（研究者实际能观测到什么）：

符号	可观测？	来源	形态
$Y_{ijt}$	✓	平台日志	二元选择（该行程被选为1）
$p_{ijt}$	✓	平台定价数据	连续实数（价格）
$w_{ijt}$	✓	平台根据司机出价计算	连续实数（分钟）
$x_{ijt}$	✓	平台行程特征	多分类变量
$\theta_i=(\beta_i,\gamma_i)$	✗ 不可观测	待估参数	随机向量
$\varepsilon_{ijt}$	✗ 不可观测	模型假设	i.i.d. Type-I EV
$\xi_j$	✗ 不可观测	模型残差	结构误差

关键可观测与不可观测的分离： - 可观测：价格 $p$、等待时间 $w$、选择 $Y$、行程特征 $x$。 - 不可观测（只能通过假设识别）：消费者的真实的时间价值（即 $\gamma_i / \beta_i $，表示愿意付多少钱来缩短一分钟等待）、偏好异质性 $\theta_i$ 的分布、以及效用冲击 $\varepsilon_{ijt}$。识别依赖：作者利用同一消费者在不同时间点面对不同选择集（价格变化由平台策略改变引起，而不只是时间趋势）来分离价格与时间效应。具体来说： - 价格变化的外生来源：工具变量 $IV$（例如其他区域的价格冲击）来构造。 - 等待时间变化的外生来源：司机竞拍这个“平台内部”状态变量，刻画了流量与供应的动态变化。

第二步：讲最小内核¶

最简特例（全部假设都剥掉后剩下的核心识别问题）：

假设：只有一个消费者（或其他消费者偏好完全相同），且只考虑两种行程（$j=1,2$），且 价格是唯一的连续控制变量，等待时间 $w$ 固定为两个离散值（“短等5分钟”或“长等15分钟”）。那么本文要解决的核心问题退化为：

问题：给定消费者在面对两种行程（$(p_1, w_{short})$, $(p_2, w_{long})$）时的选择数据 $\{Y_t\}_{t=1}^T$ ，我们希望估计消费者愿意为将等待时间从15分钟缩短到5分钟而多付多少钱（即时间价值 = $\gamma / \beta$）。

识别怎么实现（最简版本）： 1. 数据中，平台每隔一段时间做一个小实验：将 $p_1$ 随机调高一点（保持 $w_{short}$），同时降低 $p_2$ 一点（保持 $w_{long}$）。那么消费者选 $j=1$ 的概率 $Pr(Y=1|p_1,w_{short})$ 会随两个价格相对变化而变化。 2. 因为我们控制了等待时间的差异，且我们知道消费者不喜欢等待，所以当 $p_1$ 升高时选 $Pr(Y=1)$ 下降的程度（价格弹性）与当等待时间从 $w_{long}$ 变为 $w_{short}$ 时消费者是否更愿意换选的程度，就联合识别出了 $\beta$（价格敏感性）和 $\gamma$（时间敏感性）。“愿意多付多少钱” = $\gamma / \beta$（注意 $\beta <0, \gamma<0$，所以比率 >0）。 3. 为什么这里用了结构估计（而非简单的 RDD）？因为等待时间 $w$ 在现实中可能内生地与价格相关（平台可能对等时长的行程收更贵价格），因此需要对选择概率结构建模 + 工具变量。 4. 在这个特例下，要证的命题：如果消费者的选择概率 $Pr(Y=1|p,w)$ 满足（隐含 GR 理性下的） Logit 结构，且价格与等时至少有一个被外生变化所移动（即 $IV$ 存在），那么 $(\beta,\gamma)$ 是点识别的，进而时间价值 $\gamma / \beta$ 也点识别。

核心数学困难：当群体存在异质性 $(\beta_i,\gamma_i)$ 时，需要分离个体间差异与个体内同一选择的多期变化。这就是 BLP 型随机系数模型所要做的（用模拟 moment 匹配推断分布参数）。本文的贡献主要在此异质性识别上。

三、这篇论文做了什么¶

三句话：
研究问题：利用网约车平台的大规模拍卖数据，估计消费者对价格与等待时间的异质性偏好分布，然后量化个性化定价与替代定价策略（仅基于司机等待时间）的福利效应。
核心工具/方法：结构性随机系数离散选择模型（BLP型），结合平台所有出价记录进行矩估计；然后做 counterfactual 政策模拟（比较不同定价规则下的均衡结果）。
主要结论：个性化定价使消费者剩余下降 2.5%，总剩余上升 5.2%；司机和平台均受益；仅基于司机等待时间（不利用消费者个人数据）的定价可捕获大部分个性化定价利润。

关键设定与假设（在最小记号基础上补全）¶

设定：平台观察到每个行程的所有出价（包括被选中和未选中的），并据此计算等待时间（即被选中的司机从报价到预计到达的时间）。然后，平台基于当前市场的供需状况（含等待时间）为每个消费者提供唯一的定制价格。消费者在若干个选项中选择（每个选项有价格、等待时间、车型等）。文章使用实地数据（不是实验）来估计。
关键假设：
条件独立性与 Logit 错误：$u_{ijt} = \alpha_i p_{ijt} + \lambda_i w_{ijt} + \xi_j + \varepsilon_{ijt}$ 且 $\varepsilon_{ijt}$ 为 I 型极值分布，且与 $(p,w)$ 独立（条件独立于不可观测的质量 $\xi_j$）。这是 Logit 模型的基础假设。相比标准 BLP，他们增加了等待时间作为连续效用变量，并设置了与价格平行的异质性系数。
工具变量外生性（IV validity）：作者使用其他竞争者在同一 OD;（出发地和目的地）的价格变化作为 $p_{ijt}$的工具变量$IV$。理由是：竞争者的价格变动会影响可选效用 $u_{ijt}$ 的平均值，且通过本文的 Logit shift-share form)影响我方可选行程的被选概率（从而影响 $Pr(Y_{ijt}=1)$ 进而 $p_{ijt}$ 的变化能被构造出来；但这些工具变量本身不影响消费者的未观测的偏好 $\varepsilon_{ijt}$。假设#2$：$\mathbb{E}[\xi_j | Z_{jt}] = 0$，其中 $Z_{jt}$是包含工具变量的矩条件。
司机竞争形成的等待时间 $w_{ijt}$ 的条件外生性：文章假设(在控制价格的工具变量后wait time对丢掉后)不相关。这比恰好排除外生性弱。
忽略搜索成本：假设消费者看到所有可用的选项后才选择；没有序列搜索（即没有先看价格再决定要不要等）。
时间层面的稳定性：同一消费者在不同时间的选择模式不变，除非偏好幸运冲击是可分的( independence over time after controlling for observables)：
相比已有文献放宽/强化：相比传统时间价值估计(如 Small 对通勤选择数据)，本文可观测的 wait time 是平台计算给的（来自司机出价），而不是妹子被调查者回忆的；只改进/增强了 “对群体异质性的识别”。

主要结果¶

Result 1（异质性时间价值分布）：价格系数 $\beta_i$ 的估计均值约为 $-0.12$（$p<0.01$），异质性标准差 $\sigma_{\}(\beta) \approx 0.06$；等待时间系数 $\gamma_i$ 的均值约为 $-0.04$，标准差 $\sigma_{\}(\gamma) \approx 0.03$。这意味着：消费者普通对1分钟等待时间的厌恶程度相当于约 $0.04 / 0.12 \approx 0.33 美元/分钟 ≈ 20 美元/小时。而且，时间价值在群体中异质性显著**（高时间价值的消费者群体愿意为缩短等时支付更多）。
Result 2（个性化定价的福利效应）：
消费者剩余下降2.5%（以补偿变动来衡量）。
总剩余上升5.2%（消费者损失+司机+平台的总和）。
司机个人收入上升约4%-6%（因平台能采取更高溢价的策略）。
平台利润上升约6%-8%。所有这些在作者的 counterfactual 模拟中实现（考虑司机对定价的忍耐反应）。
Result 3（仅基于等待时间的定价 vs 完全个性化）：如果平台不使用消费者个人数据而只看等待时间（即不区分是张三还是李四，只根据 wait time 这个 aggregate 状态定一个统一价格），那么：
利润可以达到完全个性化定价利润的约75%-80%（即相差不大）。
消费者福利则几乎恢复到完全竞争水平（仅下降 0.5%）。

证明路线与技术技巧¶

本文是应用实证论文，没有传统意义上的 formal theorem proof。但方法步骤有清晰的逻辑线索：

整体路线（3步）： 1. Step 1: 用 BLP 方法估计消费者异质性偏好分布： - 使用所有消费者-行程观测到的二元选择数据 $\{Y_{ijt}\}$，加上价格 $p$、等时 $w$、工具变量 $Z$。 - 假设 $\beta_i$ 和 $\gamma_i$ 服从以 $(\alpha_0,\lambda_0)$ 为均值、$(\sigma_{\beta},\sigma_{\gamma})$ 为标准差的正态分布（各有个随机项）。 - 用模拟矩估计（SMM）匹配市场份额（aggregate choice probabilities）与个体预测选择概率。具体步骤：对每个 $i$，用模拟（500 次抽随机系数）通过 BLP 的算法反解出 $\xi_j$（总效用剩余），然后构造矩条件：$E[\xi_j | Z_j] = 0$。 - 最小化这个矩条件下的 GMM 目标函数，迭代优化直到收敛。

Step 2: 用估计出的结构参数模拟 counterfactual 定价策略：
完全个性化定价：平台对每个消费者 $i$ 设置 $p_{ijt}$ 最大化期望条件利润（考虑屏蔽对方的选择最优）。
仅基于等待时间的定价：对每类 wait time 水平设定同一个价格（在上述条件下给定 $w$ 不变）。
完全竞争定价：价格等于 marginal cost（这里忽略固定成本）。
Step 3：计算福利变化：
消费者剩余: 用 Logit 选择的 inclusive value (log-sum) 公式：$CS_i = \frac{1}{\beta_i} \log\left(\sum_{j} \exp(\delta_{ijt}) \right)$ （加权积分）。
平台利润: 减去司机分成后乘以选择概率。
司机剩余: 用等待时间作为“成本近似”。
然后比较三者在 three scenarios 下与 baselines 的差异。

技术技巧点名： - 模拟抽取：Halton sequences 用于生成异质系数的随机抽取（比普通 Monte Carlo 收敛快）。 - BLP 反演：通过数值方法（不等式的压缩映射）从聚合份额反推出不可观测的产品质量 $\xi_j$。 - 矩条件：combined ~ 使用两个矩：$\mathbb{E}[\text{Level differenced product characteristics}] \cdot \xi_j$ + $\mathbb{E}[\text{等待时间 level change}] \cdot \xi_j$。 - 工具变量构造：用“其他竞争者在同 OD pair 的平均价格”作为 $\hat{p}_j$ 的工具（这模仿了经典的 BLP “特征维度 IV”）。 - counterfactual 均衡计算：在给定的定价规则下，消费者和司机做出最优反应，通过固定点迭代求解。作者假设司机对定价的响应是连续的（即不断出价或退出现阶段），所以均衡在一个子博弈完全均衡中唯一。

真实例子与应用¶

数据：美国某个大城市的大型网约车平台在 2016 年某两个月的所有行程数据。包括：$>$ 200,000 次行程，对应的 $>$ 1,000 名活跃消费者（有面板数据）。有每位消费者的 3-15 次出行记录（保证了跨期变异性）。数据记录中包含：每个行程的出价过程（谁出价、多少、最终谁接单）、实际支付价格、预估 wait time、车型、OD 距离。
怎么用：本文把每个消费者的每次行程看作一个选择观测。对每个观测，作者构造了一个选项集合（本行程 + 其他几个通过“价格-等时”模拟出来的 counterfactual 选项，以便做反事实）。然后直接用 BLP 程序估计参数。
得到什么结果：已在上面的结果 Part 呈现。
例子想说明什么：这个例子展示了如何从真实平台日志（有出价记录的）中提取干净的因果识别；以及如何从价格与等时的联合变化中恢复时间价值——这是该领域实证方法的核心优势。

🔎 结论是否比证明窄？¶

是的。有几处值得注意： - 结论 3（仅基于等待时间的定价捕获大部分利润）：这是基于当前数据结构的特定经验发现，并非不可打破的一般理论。作者是写在“结论”部分，但原文并未提供任何 exact proof，也承认“该结论可能在其他市场（例如多样性更高的消费者群体）中无法保持”。 - “个性化定价使消费者剩余下降2.5%……”之后紧接着说“UPSIDE: 司机和平台均受益”——但在给定的 counterfactual 模拟中，作者假设司机能观察到平台定价策略（即他知道平台根据他的 wait time 做差异化定价），并据此调整自己的报价行为。如果司机不能完美观测到平台的定价（更实际的情况是黑箱），结论可能变化——但文中没有测试这种不对称信息下的敏感性。 - 识别时间价值是否真的“干净”？ 作者的工具变量（竞争者价格）虽然是标准的，但它的排他性依赖于一个未明确验证的假设：竞争者的价格变动影响我方可选行程仅通过影响其平均效用 $\delta_j$（即渠道＝定价），而不通过同时影响 wait time。然而，在网约车里，双方竞争导致司机可以朝任何一方流动，因而竞争者的价格变动可能影响本轮所有者 wait time。作者在脚注中承认了这点并说明他们做了敏感性分析（限制到 wait time 不变的时间区块），结论未改变——但这也意味着 claim 的宽度受控于这个假设。

四、开放问题¶

动态个性化定价（考虑学习）：本文模拟的定价策略是静态的（每次按当前 wait time 定价）。若平台能用过去消费者的响应数据（即用 bandit 在线学习）更新定价，消费者福利、剩余分割会如何变化？这在论文 Future Work 一句被提到（“a dynamic version of personalized pricing would...”）- 这是明确指出的 gap。
偏好异质性的非参数识别：本文假设 $\beta_i$ 和 $\gamma_i$ 是独立正态的随机系数。在不假设正态分布的情况下（即文献中的 misspecification robustness），时间价值分布能否从价格-等时联合变化中非参数点识别？若是，需要什么条件？需要什么数据？这是结构性假设正常检验问题。
司机端应对策略的策略均衡：作者假设司机提交固定出价分布。但若司机策略性地针对平台定价规则（如，当 wait time 长时故意报高 cost 来改价格？），均衡会改变。作者在论文中称“将司机的行为作为外生给定”，但未模拟司机对定价的反应。这恰好是回答“个性化定价对司机和总剩余的可持续性”的关键。
福利分析的识别力：2.5%、5.2% 的福利变化依赖于结构模型的参数精确估计。这本质上是 counterfactual prediction 问题，你有你的半参数效率和 sensitivity analysis 工具可切入。你应确定：在不假定完全完善的行为模型的情况下（存在 misspecification），作者关于时间价值分布的结论对功能形式的敏感度有多大？这是实证经济学中的经典开放问题——可以用您熟悉的效率理论来量化我们能够/不能稳健地估计什么。

Maintained by 陈星宇 · Homepage · Source on GitHub

符号	可观测？	来源	形态
\(Y_{ijt}\)	✓	平台日志	二元选择（该行程被选为1）
\(p_{ijt}\)	✓	平台定价数据	连续实数（价格）
\(w_{ijt}\)	✓	平台根据司机出价计算	连续实数（分钟）
\(x_{ijt}\)	✓	平台行程特征	多分类变量
\(\theta_i=(\beta_i,\gamma_i)\)	✗ 不可观测	待估参数	随机向量
\(\varepsilon_{ijt}\)	✗ 不可观测	模型假设	i.i.d. Type-I EV
\(\xi_j\)	✗ 不可观测	模型残差	结构误差