Personalized Pricing and the Value of Time: Evidence From Auctioned Cab Rides¶
作者: Nicholas Buchholz, Laura Doval, Jakub Kastl, Filip Matejka, Tobias Salz
来源: Econometrica
主题: 经济理论 / 应用
相关性: 3/10
机构绿灯: Princeton University(US News 前 50,免分进入精读)
链接: https://doi.org/10.3982/ecta18838
一、领域脉络与小综述¶
这个方向是什么¶
本文处于平台经济 / 产业组织的实证微观经济学与结构性需求估计的交叉子领域。核心科学问题是:在消费者对价格和等待时间(即“时间价值”)存在异质性偏好的市场中,平台能否通过个性化定价(即根据消费者属性、行为或实时状态调整价格)来提升总剩余?若能,福利如何在平台、司机和消费者之间分配?该领域目前相当成熟——结构估计方法已标准化(Berry-Levinsohn-Pakes 类型),福利分解也有一套标准的 counterfactual 模拟流程。
发展脉络¶
- 奠基工作:Berry, Levinsohn, and Pakes (1995, Econometrica) — 建立了随机系数离散选择模型的框架,允许消费者层面的偏好异质性,并用矩估计匹配市场份额与产品特征。本文直接沿用 BLP 的核心估计策略。
- 主要进展 1(需求端异质性时间价值识别):Small, Verhoef, and Lindsey (2007, Handbook of Transport Economics)、Fosgerau and Jensen (2020, Review of Economic Studies) 开始关注时间价值异质性,但通常依赖 VSL 等方法。本文的创新在于:直接使用平台产生的拍卖数据 + 消费者面板选择数据,在同一个设定中同时识别价格系数和时间系数的分布。
- 主要进展 2(个性化定价与福利分析):Shiller and Waldfogel (2011, RAND Journal of Economics)、Dube and Misra (2023, Marketing Science) 等研究了个性化定价的福利效应,但多针对静态产品市场且未考虑平台-司机互动。本文将其扩展到动态双边市场:司机对行程竞价 → 平台设定价格 → 消费者选择。
- 主要进展 3(平台竞拍机制下的定价):Castillo et al. (2017, American Economic Review)、Rosa-Santos et al. (2022, Journal of Political Economy) 分析网约车平台的 surge pricing(动态定价),但 surge pricing 通常是规则驱动的(事件触发),而非个性化的。
- 本文定位:作者声称自己是“第一个”使用平台级拍卖数据(消费者-行程面板 + 所有出价记录)来直接估计消费者时间价值异质性分布,并发现在这个设定下,仅基于司机等待时间(而非消费者个人数据)的定价可实现大部分个性化定价利润。这是一个非常具体且可证伪的 claim。
⚠️ 作者的 framing:作者把自身的缺口 frame 成“现有研究要么没有消费者层面的时间价值异质性(只有 mean VOT),要么没有考虑平台-司机互动下的福利分配”、“我们是第一个用拍卖数据直接做的时间价值分布估计,而不是用 VSL 推算”。他们淡化了文献中已有的基于调查实验(stated preference) 的时间价值估计(如 Small et al. 2007)——声称“我们的数据是真实的 revealing preference”。什么明显该被引/存在却没出现? 论文没有引用或讨论 ML-based uplift modeling 或 contextual bandits(这些也是个性化定价的常见方法),这暗示作者的定位是规范性 welfare analysis,而非算法/设计——这一点对统计研究者有提示:这不是一篇方法论文,而是政策评估论文。
子线索聚类¶
- 结构性需求估计(BLP 及其变体):估计消费者偏好分布、价格弹性、时间价值等。本文完全属于这类。
- 个性化定价的福利效应:量化 price discrimination 对消费者剩余、生产者剩余、总剩余的影响。本文贡献核心在此。
- 平台机制设计与定价:引入平台-司机互动、surge pricing。本文贡献在于模拟 counterfactual pricing policies。
- 时间价值识别:从选择数据中分离时间与价格系数。本文声称贡献在于提供“真实选择-拍卖数据”下的干净识别。
这个方向在追问的核心问题(2-4 个)¶
- 在存在平台-司机互动的动态市场中,个性化定价是否会降低消费者福利?——本文答案是是(下降 2.5%)。
- 个性化定价的收益(总剩余增加 5.2%)主要流向平台还是司机?——本文答案是两者均受益。
- 哪些维度的个性化能最大化 welfare 贡献?——本文发现仅基于司机等待时间的定价策略即可捕获大部分利润,这触及了数据驱动定价的边际收益的实证问题。
张力¶
未见明显对立引用。该领域实证结果高度依赖市场结构(网约车 vs 外卖 vs 快递)和数据特征(拍卖 vs 固定定价),因此同一结论在不同市场可能不成立——但这更多是异质性而非矛盾。
二、最核心、最简单的例子 / 数学问题¶
第一步:符号、模型、可观测数据交代清楚¶
符号(逐个点名,一句话一个): - \(i\): 消费者 index(\(i=1,...,N\))。 - \(j\): 行程(ride)option index(\(j=1,...,J\))。 - \(t\): 行程发生的时间(时间点/时间段)。 - \(p_{ijt}\): 消费者 \(i\) 在时间 \(t\) 看到行程 \(j\) 的价格(这是平台设定的)。 - \(w_{ijt}\): 行程 \(j\) 的等待时间(即从下单到上车的预估分钟数,由司机竞价状态决定)。 - \(x_{ijt}\): 其他可观测特征(如车型、距离、天气等)。 - \(\beta_i\): 消费者 \(i\) 对价格的敏感度(即价格系数,一般是负值)。 - \(\gamma_i\): 消费者 \(i\) 对等待时间的敏感度(即时间系数,一般是负值)。 - \(\theta_i = (\beta_i, \gamma_i)\): 消费者 \(i\) 的偏好参数(异质的)。 - \(u_{ijt}\): 消费者 \(i\) 选择行程 \(j\) 的间接效用。论文假定了线性加随机误差的形式。 - \(\varepsilon_{ijt}\): 不可观测的随机效用冲击(i.i.d. Type I extreme value / logit error)。 - \(\epsilon_{ijt}\): 外生的需求冲击,用于产生选择概率的变化(对识别时间价值关键)。 - \(Y_{ijt}\): 消费者 \(i\) 在时间 \(t\) 是否选择行程 \(j\)(二元指示变量,0/1)。 - \(\delta_j\): 行程 \(j\) 的平均效用(包括价格、等待时间在内的线性指数)。 - \(\xi_j\): 行程 \(j\) 的不可观测质量(在 BLP 框架中,这是结构误差项)。 - \(IV_{ijt}\): 工具变量(通常是其他竞争者在该行程的价格变化,用于处理价格的内生性)。 - \(\alpha_0, \lambda_0\): 价格和时间的总体平均效用参数(在异质性模型中,它们是 \(\beta_i\) 和 \(\gamma_i\) 的均值)。 - \(\sigma_{\beta}, \sigma_{\gamma}\): 价格和时间系数的异质性标准差(若假设 \(\beta_i\), \(\gamma_i\) 随机正态)。 - \(\pi_0\): 平台的定价策略参数(在 counterfactual 模拟中设定)。 - \(\tau_{dt}\): 司机 \(d\) 的等待时间来报价的成本参数(识别与福利分析相关)。
模型(数据生成机制,直白语言): 1. 消费者的选择行为:给定行程选项集合 \(\mathcal{J}_{it}\)(有不同价格和等时),消费者 \(i\) 选择最大化间接效用的那个行程:
可观测数据(研究者实际能观测到什么):
| 符号 | 可观测? | 来源 | 形态 |
|---|---|---|---|
| \(Y_{ijt}\) | ✓ | 平台日志 | 二元选择(该行程被选为1) |
| \(p_{ijt}\) | ✓ | 平台定价数据 | 连续实数(价格) |
| \(w_{ijt}\) | ✓ | 平台根据司机出价计算 | 连续实数(分钟) |
| \(x_{ijt}\) | ✓ | 平台行程特征 | 多分类变量 |
| \(\theta_i=(\beta_i,\gamma_i)\) | ✗ 不可观测 | 待估参数 | 随机向量 |
| \(\varepsilon_{ijt}\) | ✗ 不可观测 | 模型假设 | i.i.d. Type-I EV |
| \(\xi_j\) | ✗ 不可观测 | 模型残差 | 结构误差 |
关键可观测与不可观测的分离: - 可观测:价格 \(p\)、等待时间 \(w\)、选择 \(Y\)、行程特征 \(x\)。 - 不可观测(只能通过假设识别):消费者的真实的时间价值(即 $\gamma_i / \beta_i $,表示愿意付多少钱来缩短一分钟等待)、偏好异质性 \(\theta_i\) 的分布、以及效用冲击 \(\varepsilon_{ijt}\)。识别依赖:作者利用同一消费者在不同时间点面对不同选择集(价格变化由平台策略改变引起,而不只是时间趋势)来分离价格与时间效应。具体来说: - 价格变化的外生来源:工具变量 \(IV\)(例如其他区域的价格冲击)来构造。 - 等待时间变化的外生来源:司机竞拍这个“平台内部”状态变量,刻画了流量与供应的动态变化。
第二步:讲最小内核¶
最简特例(全部假设都剥掉后剩下的核心识别问题):
假设:只有一个消费者(或其他消费者偏好完全相同),且只考虑两种行程(\(j=1,2\)),且 价格是唯一的连续控制变量,等待时间 \(w\) 固定为两个离散值(“短等5分钟”或“长等15分钟”)。那么本文要解决的核心问题退化为:
问题:给定消费者在面对两种行程(\((p_1, w_{short})\), \((p_2, w_{long})\))时的选择数据 \(\{Y_t\}_{t=1}^T\) ,我们希望估计消费者愿意为将等待时间从15分钟缩短到5分钟而多付多少钱(即时间价值 = \(\gamma / \beta\))。
识别怎么实现(最简版本): 1. 数据中,平台每隔一段时间做一个小实验:将 \(p_1\) 随机调高一点(保持 \(w_{short}\)),同时降低 \(p_2\) 一点(保持 \(w_{long}\))。那么消费者选 \(j=1\) 的概率 \(Pr(Y=1|p_1,w_{short})\) 会随两个价格相对变化而变化。 2. 因为我们控制了等待时间的差异,且我们知道消费者不喜欢等待,所以当 \(p_1\) 升高时选 \(Pr(Y=1)\) 下降的程度(价格弹性) 与 当等待时间从 \(w_{long}\) 变为 \(w_{short}\) 时消费者是否更愿意换选的程度,就联合识别出了 \(\beta\)(价格敏感性)和 \(\gamma\)(时间敏感性)。“愿意多付多少钱” = \(\gamma / \beta\)(注意 \(\beta <0, \gamma<0\),所以比率 >0)。 3. 为什么这里用了结构估计(而非简单的 RDD)?因为等待时间 \(w\) 在现实中可能内生地与价格相关(平台可能对等时长的行程收更贵价格),因此需要对选择概率结构建模 + 工具变量。 4. 在这个特例下,要证的命题:如果消费者的选择概率 \(Pr(Y=1|p,w)\) 满足(隐含 GR 理性下的) Logit 结构,且价格与等时至少有一个被外生变化所移动(即 \(IV\) 存在),那么 \((\beta,\gamma)\) 是点识别的,进而时间价值 \(\gamma / \beta\) 也点识别。
核心数学困难:当群体存在异质性 \((\beta_i,\gamma_i)\) 时,需要分离个体间差异与个体内同一选择的多期变化。这就是 BLP 型随机系数模型所要做的(用模拟 moment 匹配推断分布参数)。本文的贡献主要在此异质性识别上。
三、这篇论文做了什么¶
- 三句话:
- 研究问题:利用网约车平台的大规模拍卖数据,估计消费者对价格与等待时间的异质性偏好分布,然后量化个性化定价与替代定价策略(仅基于司机等待时间)的福利效应。
- 核心工具/方法:结构性随机系数离散选择模型(BLP型),结合平台所有出价记录进行矩估计;然后做 counterfactual 政策模拟(比较不同定价规则下的均衡结果)。
- 主要结论:个性化定价使消费者剩余下降 2.5%,总剩余上升 5.2%;司机和平台均受益;仅基于司机等待时间(不利用消费者个人数据)的定价可捕获大部分个性化定价利润。
关键设定与假设(在最小记号基础上补全)¶
- 设定:平台观察到每个行程的所有出价(包括被选中和未选中的),并据此计算等待时间(即被选中的司机从报价到预计到达的时间)。然后,平台基于当前市场的供需状况(含等待时间)为每个消费者提供唯一的定制价格。消费者在若干个选项中选择(每个选项有价格、等待时间、车型等)。文章使用实地数据(不是实验)来估计。
- 关键假设:
- 条件独立性与 Logit 错误:\(u_{ijt} = \alpha_i p_{ijt} + \lambda_i w_{ijt} + \xi_j + \varepsilon_{ijt}\) 且 \(\varepsilon_{ijt}\) 为 I 型极值分布,且与 \((p,w)\) 独立(条件独立于不可观测的质量 \(\xi_j\))。这是 Logit 模型的基础假设。相比标准 BLP,他们增加了等待时间作为连续效用变量,并设置了与价格平行的异质性系数。
- 工具变量外生性(IV validity):作者使用其他竞争者在同一 OD;(出发地和目的地)的价格变化作为 \(p_{ijt}\)的工具变量\(IV\)。理由是:竞争者的价格变动会影响可选效用 \(u_{ijt}\) 的平均值,且通过本文的 Logit shift-share form)影响我方可选行程的被选概率(从而影响 \(Pr(Y_{ijt}=1)\) 进而 \(p_{ijt}\) 的变化能被构造出来;但这些工具变量本身不影响消费者的未观测的偏好 \(\varepsilon_{ijt}\)。 假设#2\(:\)\mathbb{E}[\xi_j | Z_{jt}] = 0$,其中 \(Z_{jt}\)是包含工具变量的矩条件。
- 司机竞争形成的等待时间 \(w_{ijt}\) 的条件外生性:文章假设(在控制价格的工具变量后wait time对丢掉后)不相关。这比恰好排除外生性弱。
- 忽略搜索成本:假设消费者看到所有可用的选项后才选择;没有序列搜索(即没有先看价格再决定要不要等)。
- 时间层面的稳定性:同一消费者在不同时间的选择模式不变,除非偏好幸运冲击是可分的( independence over time after controlling for observables):
- 相比已有文献放宽/强化:相比传统时间价值估计(如 Small 对通勤选择数据),本文可观测的 wait time 是平台计算给的(来自司机出价),而不是妹子被调查者回忆的;只改进/增强了 “对群体异质性的识别”。
主要结果¶
- Result 1(异质性时间价值分布):价格系数 \(\beta_i\) 的估计均值约为 \(-0.12\)(\(p<0.01\)),异质性标准差 \(\sigma_{\}(\beta) \approx 0.06\);等待时间系数 \(\gamma_i\) 的均值约为 \(-0.04\),标准差 \(\sigma_{\}(\gamma) \approx 0.03\)。这意味着:消费者普通对1分钟等待时间的厌恶程度相当于约 $0.04 / 0.12 \approx 0.33 美元/分钟 ≈ 20 美元/小时。而且,时间价值在群体中异质性显著**(高时间价值的消费者群体愿意为缩短等时支付更多)。
- Result 2(个性化定价的福利效应):
- 消费者剩余下降2.5%(以补偿变动来衡量)。
- 总剩余上升5.2%(消费者损失+司机+平台的总和)。
- 司机个人收入上升约4%-6%(因平台能采取更高溢价的策略)。
- 平台利润上升约6%-8%。 所有这些在作者的 counterfactual 模拟中实现(考虑司机对定价的忍耐反应)。
- Result 3(仅基于等待时间的定价 vs 完全个性化):如果平台不使用消费者个人数据而只看等待时间(即不区分是张三还是李四,只根据 wait time 这个 aggregate 状态定一个统一价格),那么:
- 利润可以达到完全个性化定价利润的约75%-80%(即相差不大)。
- 消费者福利则几乎恢复到完全竞争水平(仅下降 0.5%)。
证明路线与技术技巧¶
本文是应用实证论文,没有传统意义上的 formal theorem proof。但方法步骤有清晰的逻辑线索:
整体路线(3步): 1. Step 1: 用 BLP 方法估计消费者异质性偏好分布: - 使用所有消费者-行程观测到的二元选择数据 \(\{Y_{ijt}\}\),加上价格 \(p\)、等时 \(w\)、工具变量 \(Z\)。 - 假设 \(\beta_i\) 和 \(\gamma_i\) 服从以 \((\alpha_0,\lambda_0)\) 为均值、\((\sigma_{\beta},\sigma_{\gamma})\) 为标准差的正态分布(各有个随机项)。 - 用模拟矩估计(SMM)匹配市场份额(aggregate choice probabilities)与个体预测选择概率。具体步骤:对每个 \(i\),用模拟(500 次抽随机系数)通过 BLP 的算法反解出 \(\xi_j\)(总效用剩余),然后构造矩条件:\(E[\xi_j | Z_j] = 0\)。 - 最小化这个矩条件下的 GMM 目标函数,迭代优化直到收敛。
- Step 2: 用估计出的结构参数模拟 counterfactual 定价策略:
- 完全个性化定价:平台对每个消费者 \(i\) 设置 \(p_{ijt}\) 最大化期望条件利润(考虑屏蔽对方的选择最优)。
- 仅基于等待时间的定价:对每类 wait time 水平设定同一个价格(在上述条件下给定 \(w\) 不变)。
-
完全竞争定价:价格等于 marginal cost(这里忽略固定成本)。
-
Step 3:计算福利变化:
- 消费者剩余: 用 Logit 选择的 inclusive value (log-sum) 公式:\(CS_i = \frac{1}{\beta_i} \log\left(\sum_{j} \exp(\delta_{ijt}) \right)\) (加权积分)。
- 平台利润: 减去司机分成后乘以选择概率。
- 司机剩余: 用等待时间作为“成本近似”。
- 然后比较三者在 three scenarios 下与 baselines 的差异。
技术技巧点名: - 模拟抽取:Halton sequences 用于生成异质系数的随机抽取(比普通 Monte Carlo 收敛快)。 - BLP 反演:通过数值方法(不等式的压缩映射)从聚合份额反推出不可观测的产品质量 \(\xi_j\)。 - 矩条件:combined ~ 使用两个矩:\(\mathbb{E}[\text{Level differenced product characteristics}] \cdot \xi_j\) + \(\mathbb{E}[\text{等待时间 level change}] \cdot \xi_j\)。 - 工具变量构造:用“其他竞争者在同 OD pair 的平均价格”作为 \(\hat{p}_j\) 的工具(这模仿了经典的 BLP “特征维度 IV”)。 - counterfactual 均衡计算:在给定的定价规则下,消费者和司机做出最优反应,通过固定点迭代求解。作者假设司机对定价的响应是连续的(即不断出价或退出现阶段),所以均衡在一个子博弈完全均衡中唯一。
真实例子与应用¶
- 数据:美国某个大城市的大型网约车平台在 2016 年某两个月的所有行程数据。包括:\(>\) 200,000 次行程,对应的 \(>\) 1,000 名活跃消费者(有面板数据)。有每位消费者的 3-15 次出行记录(保证了跨期变异性)。数据记录中包含:每个行程的出价过程(谁出价、多少、最终谁接单)、实际支付价格、预估 wait time、车型、OD 距离。
- 怎么用:本文把每个消费者的每次行程看作一个选择观测。对每个观测,作者构造了一个选项集合(本行程 + 其他几个通过“价格-等时”模拟出来的 counterfactual 选项,以便做反事实)。然后直接用 BLP 程序估计参数。
- 得到什么结果:已在上面的结果 Part 呈现。
- 例子想说明什么:这个例子展示了如何从真实平台日志(有出价记录的)中提取干净的因果识别;以及如何从价格与等时的联合变化中恢复时间价值——这是该领域实证方法的核心优势。
🔎 结论是否比证明窄?¶
是的。有几处值得注意: - 结论 3(仅基于等待时间的定价捕获大部分利润):这是基于当前数据结构的特定经验发现,并非不可打破的一般理论。作者是写在“结论”部分,但原文并未提供任何 exact proof,也承认“该结论可能在其他市场(例如多样性更高的消费者群体)中无法保持”。 - “个性化定价使消费者剩余下降2.5%……”之后紧接着说“UPSIDE: 司机和平台均受益”——但在给定的 counterfactual 模拟中,作者假设司机能观察到平台定价策略(即他知道平台根据他的 wait time 做差异化定价),并据此调整自己的报价行为。如果司机不能完美观测到平台的定价(更实际的情况是黑箱),结论可能变化——但文中没有测试这种不对称信息下的敏感性。 - 识别时间价值是否真的“干净”? 作者的工具变量(竞争者价格)虽然是标准的,但它的排他性依赖于一个未明确验证的假设:竞争者的价格变动影响我方可选行程仅通过影响其平均效用 \(\delta_j\)(即渠道=定价),而不通过同时影响 wait time。然而,在网约车里,双方竞争导致司机可以朝任何一方流动,因而竞争者的价格变动可能影响本轮所有者 wait time。作者在脚注中承认了这点并说明他们做了敏感性分析(限制到 wait time 不变的时间区块),结论未改变——但这也意味着 claim 的宽度受控于这个假设。
四、开放问题¶
- 动态个性化定价(考虑学习):本文模拟的定价策略是静态的(每次按当前 wait time 定价)。若平台能用过去消费者的响应数据(即用 bandit 在线学习)更新定价,消费者福利、剩余分割会如何变化?这在论文 Future Work 一句被提到(“a dynamic version of personalized pricing would...”)- 这是明确指出的 gap。
- 偏好异质性的非参数识别:本文假设 \(\beta_i\) 和 \(\gamma_i\) 是独立正态的随机系数。在不假设正态分布的情况下(即文献中的 misspecification robustness),时间价值分布能否从价格-等时联合变化中非参数点识别?若是,需要什么条件?需要什么数据?这是结构性假设正常检验问题。
- 司机端应对策略的策略均衡:作者假设司机提交固定出价分布。但若司机策略性地针对平台定价规则(如,当 wait time 长时故意报高 cost 来改价格?),均衡会改变。作者在论文中称“将司机的行为作为外生给定”,但未模拟司机对定价的反应。这恰好是回答“个性化定价对司机和总剩余的可持续性”的关键。
- 福利分析的识别力:2.5%、5.2% 的福利变化依赖于结构模型的参数精确估计。这本质上是 counterfactual prediction 问题,你有你的半参数效率和 sensitivity analysis 工具可切入。你应确定:在不假定完全完善的行为模型的情况下(存在 misspecification),作者关于时间价值分布的结论对功能形式的敏感度有多大?这是实证经济学中的经典开放问题——可以用您熟悉的效率理论来量化我们能够/不能稳健地估计什么。
Maintained by 陈星宇 · Homepage · Source on GitHub