Field Notes · 田野笔记

第 1 章 ITS 把整个语料合并处理，没有区分体裁。但苏轼的多种体裁——给皇帝的奏议、行政内制外制、私人书信尺牍、正式散文记序跋、铭文碑铭赞颂、诗、词、笔记——语言风格各不相同。奏议里有官式套语 "臣闻 / 切详 / 伏望"，诗里有抒情语汇 "归 / 闲 / 老"，行政公文里有 "速行 / 毋得"。如果 pre-period 与 post-period 的体裁分布失衡，跨时段的人格分差异就部分由体裁本身解释，不是苏轼真的变了。

本章正面处理这个问题，给出体裁画像表与体裁固定效应回归结果。由于 is_ghostwriting 标注待后续 iteration 完成，代笔诊断本章只给方法学讨论，不给具体数字。

10 体裁的人格画像差异

8 维度按体裁的均值表

表 5·1　8 维度在 10 种体裁上的平均分（每千字频率）

体裁	n	D1	D2	D3	D4	D5	D6	D7	D8
诗	2045	0.27	1.94	0.35	0.30	5.15	10.87	9.35	7.92
尺牍	1896	0.06	5.01	0.51	0.11	8.99	8.05	6.13	6.48
其他	1372	0.13	2.52	0.30	0.13	9.98	9.77	4.58	9.64
词	352	0.36	2.34	0.23	1.63	5.01	11.89	7.96	5.44
奏议	343	0.63	3.29	0.23	0.01	5.25	5.39	3.72	8.67
论策	111	0.39	2.78	0.10	0.16	16.10	4.46	2.95	8.08
碑铭	108	0.13	0.96	0.14	0.06	5.92	6.52	4.62	7.74
记	62	0.23	1.73	0.41	0.12	12.81	7.51	4.93	7.67
祭文	62	0.19	1.69	0.42	0.22	4.06	14.19	5.29	10.67
赋	24	0.24	2.15	0.07	0.07	7.16	7.79	4.78	6.14

加粗为该维度的最大值。

每个维度的极值体裁与语言学解释

把这张表的极值排一下。

D1 政治姿态最高在奏议（0.63），最低在尺牍（0.06），跨度 0.57。奏议是写给皇帝的报告，讥讽 / 讪 / 圣德 / 圣朝等政治词必然高密度；尺牍是私人书信，这些词几乎不用。

D2 自我修正最高在尺牍（5.01），最低在碑铭（0.96），跨度 4.06。尺牍里苏轼会向友人坦承悔 / 愧 / 误 / 过，这条信号在私人书信里最强；碑铭是公开纪念文体，自我反思几乎完全缺席。

D4 处变能力最高在词（1.63），最低在奏议（0.01），跨度 1.62。词的随遇 / 自适 / 闲适是词体本身的语汇集合（尤其密州出猎后的词作）；奏议是严肃政治文书，不会用这种闲适语汇。

D5 决断力最高在论策（16.10），最低在祭文（4.06），跨度 12.04。论策是辩论体，速行 / 毋得 / 须 / 决 / 宜 / 以为等决断词密集；祭文是悼亡文，决断动词被悲伤动词替代。

D6 情感深度最高在祭文（14.19），最低在论策（4.46），跨度 9.73。祭文的哀 / 悲 / 苦 / 忧 / 泣 / 涕 / 恸 / 忆 / 思 / 念是体裁固有信号。

D7 隐逸倾向最高在诗（9.35），最低在论策（2.95），跨度 6.40。诗的归 / 闲 / 老 / 病是抒情诗高频词；论策不会用这些词。

D8 三教融合最高在祭文（10.67），最低在词（5.44），跨度 5.23。祭文用仁 / 义 / 礼 / 禅 / 佛 / 空 / 道 / 玄论生死归宿，三教词集中；词更多写情景，三教词相对少。

体裁混淆对 ITS 推断的威胁

pre/post 体裁失衡的机制

回到第 1 章：1079 ITS 估出 D2 自我修正 $t = 1.82$ 。但 pre-period（1056–1078）主要是奏议与一部分诗（因为这阶段苏轼在朝任职或地方任职，写的多是奏议与寄赠诗）；post-period（1080–1101）体裁混杂，包含黄州尺牍激增、惠州海南诗、晚年笔记。体裁切换是 pre/post 的混杂因素。

尺牍在体裁画像表中 D2 = 5.01，是所有体裁的最大值；而奏议 D2 仅 3.29，诗 D2 仅 1.94。如果 post-period 比 pre-period 多了大量尺牍，单从体裁分布失衡就能解释 D2 上升，不需要任何真实的人格变化。第 1 章 ITS 看到的 +3.71 level shift 可能只是体裁混淆的副产品。

扣除体裁混淆：双 FE 回归

定义体裁与时段双 FE 回归

def:genre-fe

y_i = \alpha_{g(i)} + \beta \cdot \text{post}_i + \varepsilon_i

其中 $y_i$ 是篇目 $i$ 的某维度评分， $g(i)$ 是体裁， $\alpha_g$ 是体裁 fixed effect（用 $G-1$ 个 dummy 表示）， $\text{post}_i = 1$ 当 $i$ 写于 $\geq 1080$ 。体裁 FE $\alpha_g$ 吸收体裁本身的语气差异， $\beta$ 估的就是扣除体裁混淆之后的 1079 后跳跃。

扣除体裁混淆后的 1079 净效应

表 5·2　8 维度在 naive 回归与体裁 FE 回归下的 post 系数

维度	naive $\beta_{\text{post}}$	FE $\beta_{\text{post}}$	FE − naive
D1 政治姿态	−0.489	−0.486	+0.003
D2 自我修正	+0.111	+0.076	−0.036
D3 实践导向	−0.079	−0.055	+0.024
D4 处变能力	−0.025	−0.008	+0.017
D5 决断力	−1.143	−1.153	−0.010
D6 情感深度	−1.722	−1.505	+0.217
D7 隐逸倾向	−0.317	−0.058	+0.259
D8 三教融合	+2.636	+2.581	−0.055

结果解读

8 维度中，大多数维度 FE 与 naive 几乎相等（差 $|0.06|$ 以内），说明体裁混淆对这些维度的影响轻微，ITS 在第 1 章给出的结论稳健。

唯一显著的例外是 D7 隐逸倾向：naive −0.317 在 FE 下变为 −0.058，差 +0.259，体裁解释了原效应的 82%。这条结果有 strong implication：第 1 章 ITS 显示 D7 隐逸在 1079 后的 level shift 为 −2.77（ $t = -0.44$ ，不显著），但这条 "1080 后隐逸下降" 的方向本身就是体裁混淆造成的——post-period 的诗（D7 = 9.35）/ 尺牍（D7 = 6.13）/ 笔记大量进入，这些体裁的 D7 baseline 不同。扣除体裁后，D7 的 net post 跳跃几乎为零（−0.058）。

D6 情感深度也有 13% 被体裁解释（naive −1.72 → FE −1.51），但效应方向稳定。

D8 三教融合几乎不受体裁影响（naive +2.64 → FE +2.58，差 −0.06）。这条结果强化第 4 章合成控制的结论：D8 在 1080 后的 +5.86 偏离是真实的，不是体裁混淆假象。

D7 隐逸倾向的体裁混淆诊断

D7 是第 1 章 ITS 与第 3 章断点检测都没看到效应、第 4 章合成控制偏离仅 +0.37 也无效应的维度。三方法一致的负面结论现在加上第 5 章体裁 FE 的诊断：D7 在 naive 回归下显示的 −0.32 post 系数本身就是体裁假象，扣除后 −0.058 几乎为零。

这条四方法一致的负面结论意味着：1079 乌台诗案没有在 D7 隐逸维度上引发可检测的人格变化。传统苏轼研究中常被强调的 "黄州让苏轼归隐" 在数据上找不到支撑。

代笔诊断：剔除 821 篇内制外制前后的效应对比

本书的项目级 CLAUDE.md 约束 2 要求把 1086–1089 翰林学士期间起草的内制外制打 is_ghostwriting=true 标签。code/annotate_metadata.py 通过苏轼集 section 标签 "内制 / 外制" 识别出 821 篇代笔文档（内制 658 篇 + 外制 215 篇，合并《祭文一十四首》等子类），远超原先估计的 80 篇。

代笔篇目分布

821 篇代笔覆盖以下子类：内制诏敕 149 篇、内制口宣 250 篇、内制批答 57 篇、内制敕书 34 篇、内制祝文 33 篇、内制国书 18 篇、内制表本 16 篇、内制斋文 17 篇、内制祭文 14 篇、内制疏文 11 篇、内制朱表 3 篇、内制赦文 3 篇、内制导引歌辞 2 篇、内制其他 51 篇；外制制敕 215 篇。

这 821 篇虽然数量上占苏轼集 6,375 篇的 12.9%，但字数占比更高——这些诏书普遍偏长。全部集中在 1086–1089 苏轼任翰林学士的 4 年内，对 ITS 主分析的 post-period（1080–1101）字数贡献相当可观。

ITS 在 4 版本切片下的对比

code/rerun_with_filters.py 跑了 4 个版本的 ITS 对比：v1 baseline（含代笔，原版）、v2 排除代笔、v3 排除代笔 + 异体字归一化、v4 排除代笔 + 归一化 + 仅 self_expression 词。关键序列结果列在下表。

表 5·3　4 版本 ITS 在 7 个关键序列上的 $\beta_2$ level shift 与 $t$ 值

序列	v1 baseline	v2 排代笔	v3 + 归一化	v4 + 仅自抒词
D2 自我修正	+3.76（ $t = +2.02$ ）	+3.36（ $t = +1.84$ ）	+3.36（ $t = +1.84$ ）	+3.70（ $t = +2.02$ ）
D7 隐逸倾向	−3.87（ $t = -0.70$ ）	−3.42（ $t = -0.62$ ）	−3.42（ $t = -0.62$ ）	−2.98（ $t = -0.54$ ）
D8 三教融合	+1.86（ $t = +0.57$ ）	+1.92（ $t = +0.59$ ）	+1.92（ $t = +0.59$ ）	+1.08（ $t = +0.36$ ）
贬谪	+2.51（ $t = +2.63$ ）	+2.42（ $t = +2.50$ ）	+2.42（ $t = +2.50$ ）	+2.35（ $t = +2.41$ ）
黄州	+4.23（ $t = +3.65$ ）	+4.23（ $t = +3.66$ ）	+4.23（ $t = +3.66$ ）	+4.38（ $t = +3.72$ ）
佛家	+1.91（ $t = +0.91$ ）	+2.42（ $t = +1.08$ ）	+2.42（ $t = +1.08$ ）	+1.25（ $t = +0.78$ ）
归隐	+0.41（ $t = +0.09$ ）	+1.21（ $t = +0.26$ ）	+1.21（ $t = +0.26$ ）	+0.99（ $t = +0.21$ ）

注：v1 数字与第 1 章相近但不完全一致，源于聚合精度差异（本节用 annotated 版重算）。

结果解读

对比 v1 与 v2 给出代笔污染的具体度量。

D2 自我修正： $t$ 值从 +2.02 下降到 +1.84，下降 9%。代笔诏书里偶尔有 "悔 / 改 / 省" 等词（替皇帝下罪己诏或修正政策的标准语汇），这部分被错误归入苏轼的 self-reframing，剔除后 D2 效应轻微减弱，但方向稳健。

贬谪主题： $t$ 值从 +2.63 下降到 +2.50，下降 5%。代笔诏书也用 "谪 / 贬" 讨论被贬官员，但密度不高，影响有限。

黄州主题： $t$ 值从 +3.65 几乎不变到 +3.66。这一稳健符合预期——代笔诏书不会出现 "黄州 / 东坡 / 雪堂 / 临皋" 这些苏轼私人地标。这条 sanity check 通过，证实黄州主题在代笔污染下仍然是干净信号。

佛家主题： $t$ 值从 +0.91 上升到 +1.08。代笔诏书几乎不用佛家词汇（祝文与斋文除外，但量小），剔除代笔反而让佛家信号略显，因为分母变小。

D7 隐逸倾向在 4 个版本里都不显著，进一步确认第 5 章前节的结论：D7 在 1080 前后没有可检测的变化。

总体而言，代笔污染对方向没有反转，但对强度的影响在 5–10% 量级。第 1 章的 ITS 主要结论（D2 / 贬谪 / 黄州三个显著效应）在 v2 剔除代笔后依然成立，仅 $t$ 值略减。

异体字归一化与词应酬性的边际贡献

code/annotate_metadata.py 的异体字归一化命中 63 篇，占总篇 6,375 的约 1%。修正的字符包括：壊 → 坏 / 巳 → 已 / 嵗 → 岁 / 逰 → 游 / 髪 → 发 / 酧 → 酬 / 爲 → 为 / 於 → 于 / 與 → 与等。v2 与 v3 的 ITS 结果完全一致（差异 $< 0.01$ ），说明归一化在 ITS 主分析上的边际贡献接近零——这并不意味着归一化没价值，而是说明这 63 篇修正分散在各时段，没系统偏向 pre 或 post。

词应酬性标注把 352 首词分为五类：self_expression 175（49.7%）、social_courtesy 127（36.1%）、topic_painting 32（9.1%）、funereal 11（3.1%）、commemoration 7（2.0%）。v4 仅保留 self_expression 后，D2 自我修正 $t$ 值反弹回 +2.02（与 v1 相近），这一反弹的机制是：剔除 social_courtesy 应酬词后，词的 D2 噪声降低，信号纯度上升。

被验证的与被推翻的预期

剔除代笔之前，本章预期三条变化，后验情况如下。

预期 1：D1 政治姿态在剔除代笔后更显著。本节数据未给出 D1 对比（D1 在所有版本下 $t$ 都接近 0，不在关键序列里），但代笔诏书本身就是政治姿态信号源，剔除后 D1 的 post 跳跃应当减弱而不是增强。这条预期需要在后续 D1 专项分析中验证，不视为已证。

预期 2：D8 三教融合在剔除代笔后效应应当变化不大。实际数据： $t$ 从 +0.57 微涨到 +0.59，变化 $< 0.03$ ，预期得到验证。

预期 3：P4 元祐起复时段在散度分析中位置回移。本节未重跑散度分析，留作 chap02 后续 iteration。但 D2 自我修正与贬谪主题的 $t$ 值下降 5–9% 表明代笔确实在 P4 时段贡献了不该归入苏轼本人的语料。

本章知识地图

表 5·4　第 5 章核心概念与常见误解

核心概念	核心内容	常见误解	为什么错
体裁混淆	pre/post 体裁分布失衡造成假效应	以为 ITS 自动控制	ITS 默认所有体裁同质，实际不是
体裁 FE	把体裁作为固定效应吸收	以为可以替代切分子样本	FE 假设效应同质，但体裁 × treatment 可能交互
D7 隐逸 82% 体裁解释	naive −0.32 → FE −0.058	以为 "黄州归隐" 是真效应	实际是体裁分布失衡假象
D8 三教几乎不受体裁影响	naive +2.64 → FE +2.58	以为也是体裁假象	D8 真实效应大到突破体裁混淆
尺牍 D2 = 5.01 最高	自我反思集中在私人书信	以为人格分散在各体裁	私人书信是 D2 信号集中体裁，不是分散
代笔标签	`is_ghostwriting=true` 剔除内制外制	以为这部分也算苏轼	内容主导权在皇帝，非苏轼人格