Field Notes · 田野笔记

这本书的写作思路是：选定一份具体的数据集，把所有相关的盈余管理度量方法都在它身上跑一遍，让读者亲手看到每一种方法在同一个问题上能给出什么答案、各自的假设和局限在哪里。

本书用的数据是 Compustat North America Annual Fundamentals，时间跨度 1991 至 2023 年，剔除金融业与公用事业后约 18 至 22 万个 firm-year 观测。Compustat 是会计实证研究事实上的基准数据源，几乎所有英文盈余管理论文都基于它。本书把这套数据从清洗到模型估计的完整流水线写出来，让读者可以按章节顺序在自己的环境里复现。

读者画像是会计、审计、财务方向的在读研究生与青年研究者，能用 R 或 Python，看过几篇用了 Jones 模型或 Roychowdhury 真实活动 EM 的论文，但没有亲手跑过完整的方法对比。本书不打算把 Dechow、Ge 与 Schrand 在 2010 年的盈余质量综述重述一遍，更不打算把每一种方法都讲到学术教科书的精度。它的野心比较有限：让读者跑通一项 Compustat 级别的 DA 度量、看懂行业-年份回归的输出、知道每一种方法背后的会计与统计假设是什么、知道在常见样本期下哪些雷区会让结论失稳。读完之后愿意去翻原始论文作为参考、愿意去看 wrds Python 包与 RPostgres 文档把更复杂的取数任务深入处理，这本书的任务就完成了。

每章对应一种方法，从 1985 年最早的 Healy 模型一路推进到 2010 年代 Dechow et al. F-Score 与现代 ML 残差。代码以 R 为主、Python 为辅，关键章节两套代码并列给出。所有正文里出现的数字均来自真实代码运行输出，不手算、不估算。

—— 晨瀚宇，2026 年