阳明轨迹 · 第 1

1506 廷杖事件与阳明人格重组:基于中断时间序列的因果识别

王阳明 1472 年生于浙江余姚,1529 年卒于江西南安舟中,终年 57 岁。他留下了《传习录》三卷、奏疏八卷、文录五卷、外集七卷、续编五卷,合计约 87 万字纯古典原文。这些文字横跨他从 24 岁到 57 岁的 33 年人生,按写作年份排开,足以刻画出一条人格演化曲线。

研究问题、数据与时间分辨率

传记体阳明研究的标准叙事是:1508 年在贵州龙场顿悟、1521 年正式提出"致良知"、1527 年天泉证道完成思想最终结晶。这套叙事把心学的诞生归功于一系列哲学事件。但若把每个生命事件当作潜在的因果 treatment,问数据"哪个事件真正触发了人格层面的重组",答案可能完全不同。

核心问题

把阳明一生 23 个有据可考的生命事件按时间排好,从 1488 年 16 岁格竹失败,到 1528 年 56 岁卒于南安,逐一作为 treatment 候选。对每个候选 treatment,我们想估的反事实是:

如果这个事件没发生,阳明的人格演化轨迹会是什么样?实际轨迹相对这个反事实的偏离,就是这个事件的因果效应。

这就是中断时间序列分析所要回答的问题。它的核心是把潜在结果框架放到单一个体的时间序列上:每个时间点的人格状态扮演潜在结果的角色,事件的发生扮演 treatment 的角色,事件之前的趋势外推扮演反事实的角色。

数据来源

本章使用王阳明全集隆庆初刻本(增补 2 卷未刊补遗,上海古籍版)作为底本,按部、卷、篇结构化抽取后得到 1283 篇文档、61.1 万字纯古典原文,按体裁分布如下表。

表 1·1 王阳明全集语料按体裁分布

体裁文档数字数含日期注释比例
外集(诗赋杂著)53995,44124.7%
公移(行政公文)23392,30354.5%
续编(书信外编)17593,48633.7%
文录(序记说跋)16481,13078.0%
语录(即传习录)91102,89712.1%
奏疏(向皇帝的报告)81146,19797.5%
合计1283611,45442.0%

时间分辨率

把每篇文档贴上写作年份后,1496 年到 1528 年共 33 年的窗口内,有数据的年份覆盖 28 个时间点。这意味着 ITS 在 pre-trend 拟合时能有 6 到 10 个观测点,比仅用《传习录》三卷划分的 9 个时段密度高 3 倍。

本章用到的 33 年时间窗口与候选 treatment 节点见前置章生平时间线图(图 0·1)。1506 上疏救戴铣被廷杖几死、1508 龙场悟道、1521 正式提出致良知、1527 天泉证道四个深色背景柱是后续 ITS 分析的候选 treatment 节点。

第 2 章后续会用到的 343 条传习录子样本,其按记录者与时段的分布画在图 1·1。这个子样本是后续概念分布散度与断点检测的核心数据,体量与覆盖时段直接决定了那两章的结论强度。

传习录 343 条按记录者与时段的分布
图 1·1 传习录 343 条按记录者与时段的分布。左图把 343 条按顺序排开,每条画成一根垂直短线,高度按字数,颜色按所属 6 时段。右图给出 8 位记录者(徐爱、陆澄、薛侃、陈九川、黄直、黄修易、黄省曾、黄以方)各自贡献的条目数与字数。T2 陆澄期与 T6 晚年定型期是体量最大的两段。

文本人格量化:8 维度评分体系

要做 ITS,先得有 outcome,也就是能随时间变化的人格度量。人格在心理学里是个虚拟构念,没有直接观测值,但留下的文字里有大量痕迹。本节给出一套从古典文本里抽取人格维度的规则化打分方法。

8 个维度的设计逻辑

定义人格维度净分
def:personality-score

对一个长度为 nn 字的文本 dd,给定一组正向标记词 M+M^+ 和反向标记词 MM^-,该维度在文本 dd 上的净分定义为

score(d)=1000n[mM+count(m,d)mMcount(m,d)].\text{score}(d) = \frac{1000}{n}\left[\sum_{m \in M^+} \text{count}(m, d) - \sum_{m \in M^-} \text{count}(m, d)\right].

其中 count(m,d)\text{count}(m, d) 是标记词 mm 在文本 dd 中作为子串出现的次数,分母 nn 归一化为每千字密度,消除文档长度影响。

净分越高,正向标记越密集;净分越低,反向标记越多。譬如要测"教学耐心"这个维度,正向标记选择那些表达接纳、鼓励、温和引导的字("且"、"善"、"诸君"、"试言之"、"譬之"),反向标记选择那些表达责备、强否定、训斥的字("差矣"、"误矣"、"岂可"、"汝徒")。某条传习录条目若有大量正向标记,少量反向标记,净分就高。

8 个维度的具体内容

按"古典文本中能稳定显出语义信号的密度"标准,本书选定了 8 个人格维度,分两批引入:前 5 个在《传习录》343 条上就能测,后 3 个需要全集才能测:奏疏、公移、外集这些非教学情境的文本才能反映出"处变能力"、"决断力"、"情感深度"。

前 5 个维度:

教学耐心 衡量阳明对学生疑问的回应温度。正向词如"善"、"且"、"诸君"、"譬之";反向词如"差矣"、"岂可"、"汝徒"。

反权威程度 衡量阳明对朱子、先儒、皇权的语气强度。正向词如"非也"、"差矣"、"蔽于支离"、"吾以为";反向词如"愚以为"、"鄙人"、"未敢"、"或然"。

自我修正频率 衡量阳明承认"我之前说错了"的密度。正向词如"前以"、"今乃"、"向之"、"尝以"、"更思之"。

同理心 衡量阳明对他人处境的体察。正向词如"知汝"、"汝忧"、"诸君"、"试自思";反向词如"尔何"、"汝徒"。

实践导向 衡量阳明强调"上手做"而非"想清楚再做"的程度。正向词如"用功"、"工夫"、"下手"、"事上磨"、"切实";反向词如"空言"、"徒思"、"悬空"。

后 3 个维度,只在全集级语料上才有意义:

处变能力 衡量阳明在政治军事危机中的镇定程度。正向词以奏疏的官式镇定语调为标志,如"臣闻"、"切详"、"据查"、"事势";反向词以紧迫情绪为标志,如"急"、"刻不容缓"、"深恐"、"覆没"。

决断力 衡量阳明发号施令的强度。公移(行政指令)里能测最准。正向词如"速行"、"即令"、"毋得"、"立行";反向词如"或可"、"未必"、"容察"、"再为"。

情感深度 衡量阳明的情感词密度。外集诗赋里最显著。正向词覆盖喜怒哀乐与怀念,如"喜"、"乐"、"愤"、"哀"、"涕"、"念"、"嗟"、"叹"。反向词是无情感色彩的纯叙述词,如"据查"、"考验"、"钦遵"。

雷区<NoteRef>体裁混淆</NoteRef>与维度伪相关

跨体裁的人格分数差异,部分由体裁本身的语言习惯造成,不是阳明真的换了人。譬如奏疏体裁里"臣闻"、"切详"这类官式词被设为"处变能力"的正向标记,但实际只是奏疏的格式套语,阳明本人写不写都得用。若 pre-period 全是奏疏、post-period 全是诗,两个体裁的差异会被错记为人格差异。

诊断方法:在分析前先看 pre/post 体裁分布是否平衡。若严重失衡,效应估计需要标注"含体裁混淆"的不确定性,不能直接归因到人格本身。

稳健替代:分体裁单独跑 ITS,若效应在多个体裁里方向一致且幅度相近,说明效应不来自体裁本身;若只在某一个体裁里显著,就要怀疑是否是体裁伪相关。

中断时间序列的潜在结果框架

把每个人格维度的年份序列摆出来后,下一步是估事件的因果效应。中断时间序列是这个任务的标准工具。

ITS 的潜在结果表达

定义中断时间序列估计量
def:its-estimator

YtY_t 为某维度在年份 tt 上的人格分,TT 为 treatment 年份。在 t<Tt < T 的 pre-period 上拟合线性回归

Yt=α+β(tT)+εt,t<T.Y_t = \alpha + \beta (t - T) + \varepsilon_t, \quad t < T.

记估计为 α^,β^\hat\alpha, \hat\beta。post-period tTt \geq T 上的反事实预测为

Y^t(0)=α^+β^(tT),tT.\hat Y_t^{(0)} = \hat\alpha + \hat\beta (t - T), \quad t \geq T.

事件 TT 的因果效应估计为

τ^=1TposttTpost(YtY^t(0)).\hat\tau = \frac{1}{|\mathcal{T}_{\text{post}}|}\sum_{t \in \mathcal{T}_{\text{post}}}(Y_t - \hat Y_t^{(0)}).

其中 Tpost\mathcal{T}_{\text{post}} 是 post-period 的年份集合,Tpost|\mathcal{T}_{\text{post}}| 是其元素个数。YtY^t(0)Y_t - \hat Y_t^{(0)}tt 年的反事实偏离,τ^\hat\tau 是 post-period 平均偏离,即事件的平均因果效应估计。

通俗讲,ITS 做的事是把"事件之前的趋势"延伸到事件之后,然后看实际值偏离这条延伸线多远。譬如若"情感深度"在 1496–1505 这段 pre-period 是 Y=0.5t+3Y = -0.5t + 3,1506 年 treatment 发生后若没有事件影响,按这条线外推 1507 年应是 3.5,但实际是 7.7。差额 7.73.5=4.27.7 - 3.5 = 4.2 就是 1506 事件在 1507 这一个时点上对"情感深度"的因果效应估计。

识别假设

ITS 给出因果效应的前提是反事实平行假设:若事件没发生,pre-trend 会按相同斜率延伸到 post-period。这个假设无法直接检验,但有三个间接证据可以支撑:

第一,pre-period 的拟合优度足够好,残差没有明显模式。若 pre-period 数据本身就在大幅震荡,外推就不可信。

第二,treatment 是外生的,不由阳明自己的人格状态决定。1506 廷杖、1517 徐爱卒、1519 平宁王起兵这些事件都是外部冲击,阳明无法选择。但 1521 提致良知是他自己的思想动作,内生于他当时的状态,不严格满足外生性。

第三,多个独立维度若在同一事件后同向显著变化,是巧合的概率极低。这是单事件 ITS 在单一个体上的"假阳性"防线:我们没法做 between-subject 实验,但多维度联合一致性可以替代部分的统计独立证据。

雷区内生 treatment 的伪因果

若把阳明自己的思想动作作为 treatment,比如 1521 年提致良知,ITS 估出来的"效应"很可能是反向的:人格状态先到位,才使他有可能提出致良知,而不是致良知改变了人格。此时事件年份与人格变化的相关性是反向因果,不能用 ITS 解释为因果。

诊断方法:列出每个候选 treatment 的"来源"。廷杖几死、亲人去世、外敌起兵都是外生事件,提出新概念、宣布新主张是内生事件。只对外生事件做 ITS。

稳健替代:对内生事件,把它当作"结果"来看,分析什么外生事件触发了它,而不是把它本身当 treatment。

六个候选 treatment

按外生性筛选后,本章主要考察 5 个事件:

1506 上疏救戴铣、廷杖几死、贬贵州龙场。正德元年阳明 34 岁。这是一次外生政治冲击,他无法选择是否被廷杖,也无法选择是否被贬。pre-period 1496–1505 共 10 年,post-period 1507–1528 共 22 年。

1508 龙场悟道。这个事件部分内生(他自己悟的),部分外生(在贬地的极端处境是外部条件)。作为参照保留,但因果解读需要谨慎。

1517 徐爱卒。徐爱 32 岁早逝,是外生事件。pre/post 划分较 1506 更接近,自由度低一些。

1519 平宁王朱宸濠之乱。宁王起兵是外生冲击,阳明被卷入完全是被动接受朝廷调遣。

1522 父亲王华卒。父丧是外生事件。

1521 致良知这个事件被列入观察清单但不作为主 treatment,按内生性原则,提出新主张是内生动作。

1506 廷杖事件的 ITS 估计结果

把上节定义的 8 维度评分应用到全集 1283 文档,按年份聚合,对每个 treatment 跑 ITS。所有显著效应汇总在图 1·2。

8 个人格维度的年份级时间序列与四个事件的 ITS 效应
图 1·2 8 个人格维度的年份级时间序列与四个事件的 ITS 效应。阴影带为标准误,竖虚线为事件年份。右下角热力图汇总 4 事件 × 5 维度的 post-pre 均值差与显著性。

1506 的 8 维度反事实分析

把 1506 事件单独拎出来看。8 个维度中 7 个在事件后显著大幅变化,列在下表。

表 1·2 1506 廷杖几死事件的 ITS 因果效应估计

维度反事实预测1506 后实际偏离 τ^\hat\tautt
情感深度-2.517.77+10.2817.2 ★★★
反权威-3.75-0.27+3.487.3 ★★★
自我修正-2.430.54+2.9815.0 ★★★
实践导向-0.170.87+1.049.1 ★★★
决断力-0.170.70+0.872.6 ★★★
同理心0.250.95+0.699.0 ★★★
处变能力7.990.94-7.05-8.4 ★★★
教学耐心10.959.64-1.31-0.7

★★★ p<0.01p < 0.01 ★★ p<0.05p < 0.05 ★ p<0.10p < 0.10 pre n=6n = 6, post n=22n = 22

读这张表的方式是:每一行是 1 个维度在 1506 事件后的因果效应估计。情感深度 偏离 +10.28+10.28,意思是若没有 1506 廷杖事件,按 pre-trend 外推,post-period 平均情感深度应该是 2.51-2.51;但实际平均是 7.777.77,差出 10.2810.28tt 值 17.2 远超 0.01 显著性阈值。

反权威 偏离 +3.48+3.48,意思是从"奏疏体的卑微辞令"(pre)转向"敢直接表达立场"(post)。自我修正 偏离 +2.98+2.98,意思是从"几乎不承认错"转向"反复说前以、今乃、向之"。实践导向 偏离 +1.04+1.04,意思是从"纯思辨"转向"工夫、用功、事上磨"。

七个维度同向显著大幅变化。这是阳明 33 年人格史上唯一一次 7 维同步重组。

处变能力 −7.05 的来源拆解

唯一反向显著的是处变能力 −7.05。这个数字需要按体裁混淆原则诚实解读。

1506 前 pre-period 主要是奏疏体裁,"处变能力"的正向标记("臣闻"、"切详"、"据查")是奏疏的官式套语,密度天然高。1506 后 post-period 主要是诗、文录、续编书信,这些体裁基本不出现"臣闻"这种朝廷文书用词。所以 −7.05 的偏离至少一部分由体裁切换造成,不能完全归因到阳明本人的处变能力下降。

其他 6 个正向显著维度受体裁影响较小,因为它们的正向标记词在多个体裁里都出现。这就是为什么我们仍能相信情感深度 +10.28、自我修正 +2.98、反权威 +3.48 这些信号是真实的人格重组,不是体裁伪相关。

多维度联合一致性作为证据强度

单一维度若只有一个显著效应,可能是巧合。但 6 个相互独立的维度同时在 1506 之后向同一方向偏离,联合概率极低。若每个维度独立 p<0.01p < 0.01,6 个维度全显著的联合 pp 值上界是 0.016=10120.01^6 = 10^{-12}。即使考虑维度之间存在弱相关,这个证据强度也远超"虚假显著"能解释的范围。

阳明三阶段演化:沉默期、危机触发、后期稳定

1506 事件触发的人格重组在数据上已经确证。本节把这个发现放在阳明 33 年的全程时间线上,回答更上一层的问题:阳明一生的人格演化结构是什么样?

总扰动比较

把每个事件触发的总扰动定义为 8 维度因果效应绝对值之和:

D(T)=k=18τ^k(T).D(T) = \sum_{k=1}^{8} \left| \hat\tau_k(T) \right|.

其中 TT 是事件年份,τ^k(T)\hat\tau_k(T) 是事件 TT 对第 kk 个维度的 ITS 估计。D(T)D(T) 越大,说明该事件触发的人格扰动越大。

5 个候选 treatment 的总扰动列在下表。

表 1·3 5 个事件的总人格扰动比较

事件年份总扰动 DD显著维度数
廷杖几死贬龙场150627.707
龙场悟道150814.294
徐爱卒15179.493
平宁王之乱15199.242
致良知正式提出15216.361

1506 的总扰动是后期 4 个事件平均(9.85)的 2.81 倍。"致良知"的扰动反而最低,这印证了内生 treatment 的判断:提出新主张是结果不是原因,不会在人格维度上额外触发显著效应。

三阶段的特征对比

把 1496–1528 这 33 年按 1506 切分为三阶段:

沉默期(1496–1505):阳明 24–33 岁,朝廷下层小官。这 10 年的文本主要是奏疏体,人格特征官式而平淡。反权威平均 −0.27(谦卑),情感深度平均 2.51(克制),自我修正几乎为零。这是一个未分化、未觉醒的青年阳明。

危机触发(1506):正德元年这一年。廷杖几死、被刘瑾派人追杀途中跳水脱身、贬贵州龙场驿丞。身体几乎死、政治几乎死、关系几乎死。触发了 7 个维度同时显著的一次性重组。

后期稳定(1508–1528):1508 年龙场悟道之后到 1528 年卒。这 20 年里发生了 1517 徐爱卒、1519 平宁王、1521 致良知、1527 天泉证道四件大事,但每件的总扰动都远小于 1506。它们是阐发阶段,不是重组阶段。

可视化

图 1·3 把三阶段公式在数据上完整画出来。(a) 是 8 维度的年份归一化轨迹与三阶段背景;(b) 是 5 事件的总扰动排序;(c) 是 1506 ITS 详图。三个子图合起来构成了"阳明成长公式"的完整证据链。

阳明成长公式三阶段
图 1·3 阳明成长公式三阶段。(a) 8 维度按年份归一化的人格轨迹,三阶段背景为沉默期(灰)、危机触发(红)、后期稳定(绿)。(b) 5 事件总扰动 D(T) 排序,1506 远超其他事件。(c) 1506 廷杖前后 8 维度反事实 vs 实际对比,7 维显著正向重组,唯一反向的"处变能力" −7.05 含体裁混淆。

对哲学史叙事的修正

主流阳明研究把"龙场悟道"当作心学起点。本章数据修正了这个叙事:龙场悟道是 1506 触发的人格重组在 1508 年沉淀出来的智识总结,1506 才是真正的触发点。

1521 致良知同样不是分水岭。它的总扰动仅 6.36,在 5 个候选 treatment 中最低。致良知是阳明给已经完成的人格重组取的一个名字,不是触发人格变化的原因。这条修正与历史学界讨论已久的"龙场悟道是不是过度浪漫化"的疑问吻合,但本章用定量证据把"龙场是结果不是触发点"这件事钉死了。

方法卡片:单人因果推断的边界

方法卡片中断时间序列在单人语料上的应用

数学形式:pre-period OLS 拟合趋势 α^+β^(tT)\hat\alpha + \hat\beta(t - T),外推得反事实 Y^t(0)\hat Y_t^{(0)},比较 YtY^t(0)Y_t - \hat Y_t^{(0)}

核心假设:(1) 反事实平行假设。(2) treatment 外生于个体当前状态。(3) 多维度联合一致性作为辅助证据。

Python 实现:基于 numpy 的 OLS 拟合 + 简易 Welch t 检验。完整代码见 code/its_full_corpus.py

典型失效场景:(1) pre-period 时间点 <5< 5 导致斜率不稳。(2) 内生 treatment 误用,估出反向因果。(3) pre/post 体裁分布严重失衡导致维度伪相关。

尚未解决的问题

本章已经回答了"哪个事件触发了阳明的人格重组"。但仍有几个问题留给后续章节:

第一,1506 重组之后,1508 年龙场悟道为什么专门强化教学耐心(+4.25, p<0.01p < 0.01)和实践导向?这要回到他在龙场的处境分析。

第二,1521 年提致良知为什么没有人格扰动却有概念上的大跳跃?"致良知"作为概念的诞生与作为人格变化的事件,是两件事。第三章(概念分布散度)会用 L1 与 JS 散度回到这个问题。

第三,跨体裁人格画像差异巨大,奏疏里的阳明、诗里的阳明、教学时的阳明几乎是 6 个不同的人。这是体裁混淆还是真的人格场景化?第六章(跨体裁人格分析)用体裁固定效应回归处理这个问题。

本章知识地图

表 1·4 第 1 章核心概念与常见误解

核心概念核心内容常见误解为什么错
人格维度净分正向标记减反向标记的每千字密度以为标记词越多越准标记词与体裁套语混杂时反而引入伪信号
中断时间序列pre-trend OLS 外推得反事实,差额作因果效应以为有 9 个时间点就能做 ITSpre 自由度 <5< 5tt 值不可信,是小样本下方差被低估
反事实平行假设若事件没发生 pre-trend 会按相同斜率延伸以为假设可以直接检验反事实永远观测不到,只能用多维度联合一致性间接支撑
外生 treatment个体无法选择是否发生把阳明自己的思想动作当 treatment内生事件估出来的是反向因果,不是真因果
体裁混淆跨体裁差异部分由语言习惯造成把跨体裁分数差异直接归因到人格奏疏体的官式套语会污染处变能力等维度
多维联合一致性多个独立维度同向显著以为单维度显著就够了单人因果推断没有 between-subject 实验,联合一致性是替代证据