盈余管理实践 · 第 0

前言:同一份 Compustat 面板的十种刀法

这本书的写作思路是:选定一份具体的数据集,把所有相关的盈余管理度量方法都在它身上跑一遍,让读者亲手看到每一种方法在同一个问题上能给出什么答案、各自的假设和局限在哪里。

本书用的数据是 Compustat North America Annual Fundamentals,时间跨度 1991 至 2023 年,剔除金融业与公用事业后约 18 至 22 万个 firm-year 观测。Compustat 是会计实证研究事实上的基准数据源,几乎所有英文盈余管理论文都基于它。本书把这套数据从清洗到模型估计的完整流水线写出来,让读者可以按章节顺序在自己的环境里复现。

读者画像是会计、审计、财务方向的在读研究生与青年研究者,能用 R 或 Python,看过几篇用了 Jones 模型或 Roychowdhury 真实活动 EM 的论文,但没有亲手跑过完整的方法对比。本书不打算把 Dechow、Ge 与 Schrand 在 2010 年的盈余质量综述重述一遍,更不打算把每一种方法都讲到学术教科书的精度。它的野心比较有限:让读者跑通一项 Compustat 级别的 DA 度量、看懂行业-年份回归的输出、知道每一种方法背后的会计与统计假设是什么、知道在常见样本期下哪些雷区会让结论失稳。读完之后愿意去翻原始论文作为参考、愿意去看 wrds Python 包与 RPostgres 文档把更复杂的取数任务深入处理,这本书的任务就完成了。

每章对应一种方法,从 1985 年最早的 Healy 模型一路推进到 2010 年代 Dechow et al. F-Score 与现代 ML 残差。代码以 R 为主、Python 为辅,关键章节两套代码并列给出。所有正文里出现的数字均来自真实代码运行输出,不手算、不估算。

—— 晨瀚宇,2026 年