王阳明 1472 年生于浙江余姚,1529 年卒于江西南安舟中,终年 57 岁。他留下了《传习录》三卷、奏疏八卷、文录五卷、外集七卷、续编五卷,合计约 87 万字纯古典原文。这些文字横跨他从 24 岁到 57 岁的 33 年人生,按写作年份排开,足以刻画出一条人格演化曲线。
研究问题、数据与时间分辨率
传记体阳明研究的标准叙事是:1508 年在贵州龙场顿悟、1521 年正式提出"致良知"、1527 年天泉证道完成思想最终结晶。这套叙事把心学的诞生归功于一系列哲学事件。但若把每个生命事件当作潜在的因果 treatment,问数据"哪个事件真正触发了人格层面的重组",答案可能完全不同。
核心问题
把阳明一生 23 个有据可考的生命事件按时间排好,从 1488 年 16 岁格竹失败,到 1528 年 56 岁卒于南安,逐一作为 treatment 候选。对每个候选 treatment,我们想估的反事实是:
如果这个事件没发生,阳明的人格演化轨迹会是什么样?实际轨迹相对这个反事实的偏离,就是这个事件的因果效应。
这就是中断时间序列分析所要回答的问题。它的核心是把潜在结果框架放到单一个体的时间序列上:每个时间点的人格状态扮演潜在结果的角色,事件的发生扮演 treatment 的角色,事件之前的趋势外推扮演反事实的角色。
数据来源
本章使用王阳明全集隆庆初刻本(增补 2 卷未刊补遗,上海古籍版)作为底本,按部、卷、篇结构化抽取后得到 1283 篇文档、61.1 万字纯古典原文,按体裁分布如下表。
表 1·1 王阳明全集语料按体裁分布
| 体裁 | 文档数 | 字数 | 含日期注释比例 |
|---|---|---|---|
| 外集(诗赋杂著) | 539 | 95,441 | 24.7% |
| 公移(行政公文) | 233 | 92,303 | 54.5% |
| 续编(书信外编) | 175 | 93,486 | 33.7% |
| 文录(序记说跋) | 164 | 81,130 | 78.0% |
| 语录(即传习录) | 91 | 102,897 | 12.1% |
| 奏疏(向皇帝的报告) | 81 | 146,197 | 97.5% |
| 合计 | 1283 | 611,454 | 42.0% |
时间分辨率
把每篇文档贴上写作年份后,1496 年到 1528 年共 33 年的窗口内,有数据的年份覆盖 28 个时间点。这意味着 ITS 在 pre-trend 拟合时能有 6 到 10 个观测点,比仅用《传习录》三卷划分的 9 个时段密度高 3 倍。
本章用到的 33 年时间窗口与候选 treatment 节点见前置章生平时间线图(图 0·1)。1506 上疏救戴铣被廷杖几死、1508 龙场悟道、1521 正式提出致良知、1527 天泉证道四个深色背景柱是后续 ITS 分析的候选 treatment 节点。
第 2 章后续会用到的 343 条传习录子样本,其按记录者与时段的分布画在图 1·1。这个子样本是后续概念分布散度与断点检测的核心数据,体量与覆盖时段直接决定了那两章的结论强度。

文本人格量化:8 维度评分体系
要做 ITS,先得有 outcome,也就是能随时间变化的人格度量。人格在心理学里是个虚拟构念,没有直接观测值,但留下的文字里有大量痕迹。本节给出一套从古典文本里抽取人格维度的规则化打分方法。
8 个维度的设计逻辑
对一个长度为 字的文本 ,给定一组正向标记词 和反向标记词 ,该维度在文本 上的净分定义为
其中 是标记词 在文本 中作为子串出现的次数,分母 归一化为每千字密度,消除文档长度影响。
净分越高,正向标记越密集;净分越低,反向标记越多。譬如要测"教学耐心"这个维度,正向标记选择那些表达接纳、鼓励、温和引导的字("且"、"善"、"诸君"、"试言之"、"譬之"),反向标记选择那些表达责备、强否定、训斥的字("差矣"、"误矣"、"岂可"、"汝徒")。某条传习录条目若有大量正向标记,少量反向标记,净分就高。
8 个维度的具体内容
按"古典文本中能稳定显出语义信号的密度"标准,本书选定了 8 个人格维度,分两批引入:前 5 个在《传习录》343 条上就能测,后 3 个需要全集才能测:奏疏、公移、外集这些非教学情境的文本才能反映出"处变能力"、"决断力"、"情感深度"。
前 5 个维度:
教学耐心 衡量阳明对学生疑问的回应温度。正向词如"善"、"且"、"诸君"、"譬之";反向词如"差矣"、"岂可"、"汝徒"。
反权威程度 衡量阳明对朱子、先儒、皇权的语气强度。正向词如"非也"、"差矣"、"蔽于支离"、"吾以为";反向词如"愚以为"、"鄙人"、"未敢"、"或然"。
自我修正频率 衡量阳明承认"我之前说错了"的密度。正向词如"前以"、"今乃"、"向之"、"尝以"、"更思之"。
同理心 衡量阳明对他人处境的体察。正向词如"知汝"、"汝忧"、"诸君"、"试自思";反向词如"尔何"、"汝徒"。
实践导向 衡量阳明强调"上手做"而非"想清楚再做"的程度。正向词如"用功"、"工夫"、"下手"、"事上磨"、"切实";反向词如"空言"、"徒思"、"悬空"。
后 3 个维度,只在全集级语料上才有意义:
处变能力 衡量阳明在政治军事危机中的镇定程度。正向词以奏疏的官式镇定语调为标志,如"臣闻"、"切详"、"据查"、"事势";反向词以紧迫情绪为标志,如"急"、"刻不容缓"、"深恐"、"覆没"。
决断力 衡量阳明发号施令的强度。公移(行政指令)里能测最准。正向词如"速行"、"即令"、"毋得"、"立行";反向词如"或可"、"未必"、"容察"、"再为"。
情感深度 衡量阳明的情感词密度。外集诗赋里最显著。正向词覆盖喜怒哀乐与怀念,如"喜"、"乐"、"愤"、"哀"、"涕"、"念"、"嗟"、"叹"。反向词是无情感色彩的纯叙述词,如"据查"、"考验"、"钦遵"。
跨体裁的人格分数差异,部分由体裁本身的语言习惯造成,不是阳明真的换了人。譬如奏疏体裁里"臣闻"、"切详"这类官式词被设为"处变能力"的正向标记,但实际只是奏疏的格式套语,阳明本人写不写都得用。若 pre-period 全是奏疏、post-period 全是诗,两个体裁的差异会被错记为人格差异。
诊断方法:在分析前先看 pre/post 体裁分布是否平衡。若严重失衡,效应估计需要标注"含体裁混淆"的不确定性,不能直接归因到人格本身。
稳健替代:分体裁单独跑 ITS,若效应在多个体裁里方向一致且幅度相近,说明效应不来自体裁本身;若只在某一个体裁里显著,就要怀疑是否是体裁伪相关。
中断时间序列的潜在结果框架
把每个人格维度的年份序列摆出来后,下一步是估事件的因果效应。中断时间序列是这个任务的标准工具。
ITS 的潜在结果表达
设 为某维度在年份 上的人格分, 为 treatment 年份。在 的 pre-period 上拟合线性回归
记估计为 。post-period 上的反事实预测为
事件 的因果效应估计为
其中 是 post-period 的年份集合, 是其元素个数。 是 年的反事实偏离, 是 post-period 平均偏离,即事件的平均因果效应估计。
通俗讲,ITS 做的事是把"事件之前的趋势"延伸到事件之后,然后看实际值偏离这条延伸线多远。譬如若"情感深度"在 1496–1505 这段 pre-period 是 ,1506 年 treatment 发生后若没有事件影响,按这条线外推 1507 年应是 3.5,但实际是 7.7。差额 就是 1506 事件在 1507 这一个时点上对"情感深度"的因果效应估计。
识别假设
ITS 给出因果效应的前提是反事实平行假设:若事件没发生,pre-trend 会按相同斜率延伸到 post-period。这个假设无法直接检验,但有三个间接证据可以支撑:
第一,pre-period 的拟合优度足够好,残差没有明显模式。若 pre-period 数据本身就在大幅震荡,外推就不可信。
第二,treatment 是外生的,不由阳明自己的人格状态决定。1506 廷杖、1517 徐爱卒、1519 平宁王起兵这些事件都是外部冲击,阳明无法选择。但 1521 提致良知是他自己的思想动作,内生于他当时的状态,不严格满足外生性。
第三,多个独立维度若在同一事件后同向显著变化,是巧合的概率极低。这是单事件 ITS 在单一个体上的"假阳性"防线:我们没法做 between-subject 实验,但多维度联合一致性可以替代部分的统计独立证据。
若把阳明自己的思想动作作为 treatment,比如 1521 年提致良知,ITS 估出来的"效应"很可能是反向的:人格状态先到位,才使他有可能提出致良知,而不是致良知改变了人格。此时事件年份与人格变化的相关性是反向因果,不能用 ITS 解释为因果。
诊断方法:列出每个候选 treatment 的"来源"。廷杖几死、亲人去世、外敌起兵都是外生事件,提出新概念、宣布新主张是内生事件。只对外生事件做 ITS。
稳健替代:对内生事件,把它当作"结果"来看,分析什么外生事件触发了它,而不是把它本身当 treatment。
六个候选 treatment
按外生性筛选后,本章主要考察 5 个事件:
1506 上疏救戴铣、廷杖几死、贬贵州龙场。正德元年阳明 34 岁。这是一次外生政治冲击,他无法选择是否被廷杖,也无法选择是否被贬。pre-period 1496–1505 共 10 年,post-period 1507–1528 共 22 年。
1508 龙场悟道。这个事件部分内生(他自己悟的),部分外生(在贬地的极端处境是外部条件)。作为参照保留,但因果解读需要谨慎。
1517 徐爱卒。徐爱 32 岁早逝,是外生事件。pre/post 划分较 1506 更接近,自由度低一些。
1519 平宁王朱宸濠之乱。宁王起兵是外生冲击,阳明被卷入完全是被动接受朝廷调遣。
1522 父亲王华卒。父丧是外生事件。
1521 致良知这个事件被列入观察清单但不作为主 treatment,按内生性原则,提出新主张是内生动作。
1506 廷杖事件的 ITS 估计结果
把上节定义的 8 维度评分应用到全集 1283 文档,按年份聚合,对每个 treatment 跑 ITS。所有显著效应汇总在图 1·2。

1506 的 8 维度反事实分析
把 1506 事件单独拎出来看。8 个维度中 7 个在事件后显著大幅变化,列在下表。
表 1·2 1506 廷杖几死事件的 ITS 因果效应估计
| 维度 | 反事实预测 | 1506 后实际 | 偏离 | 值 |
|---|---|---|---|---|
| 情感深度 | -2.51 | 7.77 | +10.28 | 17.2 ★★★ |
| 反权威 | -3.75 | -0.27 | +3.48 | 7.3 ★★★ |
| 自我修正 | -2.43 | 0.54 | +2.98 | 15.0 ★★★ |
| 实践导向 | -0.17 | 0.87 | +1.04 | 9.1 ★★★ |
| 决断力 | -0.17 | 0.70 | +0.87 | 2.6 ★★★ |
| 同理心 | 0.25 | 0.95 | +0.69 | 9.0 ★★★ |
| 处变能力 | 7.99 | 0.94 | -7.05 | -8.4 ★★★ |
| 教学耐心 | 10.95 | 9.64 | -1.31 | -0.7 |
★★★ ★★ ★ pre , post 。
读这张表的方式是:每一行是 1 个维度在 1506 事件后的因果效应估计。情感深度 偏离 ,意思是若没有 1506 廷杖事件,按 pre-trend 外推,post-period 平均情感深度应该是 ;但实际平均是 ,差出 。 值 17.2 远超 0.01 显著性阈值。
反权威 偏离 ,意思是从"奏疏体的卑微辞令"(pre)转向"敢直接表达立场"(post)。自我修正 偏离 ,意思是从"几乎不承认错"转向"反复说前以、今乃、向之"。实践导向 偏离 ,意思是从"纯思辨"转向"工夫、用功、事上磨"。
七个维度同向显著大幅变化。这是阳明 33 年人格史上唯一一次 7 维同步重组。
处变能力 −7.05 的来源拆解
唯一反向显著的是处变能力 −7.05。这个数字需要按体裁混淆原则诚实解读。
1506 前 pre-period 主要是奏疏体裁,"处变能力"的正向标记("臣闻"、"切详"、"据查")是奏疏的官式套语,密度天然高。1506 后 post-period 主要是诗、文录、续编书信,这些体裁基本不出现"臣闻"这种朝廷文书用词。所以 −7.05 的偏离至少一部分由体裁切换造成,不能完全归因到阳明本人的处变能力下降。
其他 6 个正向显著维度受体裁影响较小,因为它们的正向标记词在多个体裁里都出现。这就是为什么我们仍能相信情感深度 +10.28、自我修正 +2.98、反权威 +3.48 这些信号是真实的人格重组,不是体裁伪相关。
多维度联合一致性作为证据强度
单一维度若只有一个显著效应,可能是巧合。但 6 个相互独立的维度同时在 1506 之后向同一方向偏离,联合概率极低。若每个维度独立 ,6 个维度全显著的联合 值上界是 。即使考虑维度之间存在弱相关,这个证据强度也远超"虚假显著"能解释的范围。
阳明三阶段演化:沉默期、危机触发、后期稳定
1506 事件触发的人格重组在数据上已经确证。本节把这个发现放在阳明 33 年的全程时间线上,回答更上一层的问题:阳明一生的人格演化结构是什么样?
总扰动比较
把每个事件触发的总扰动定义为 8 维度因果效应绝对值之和:
其中 是事件年份, 是事件 对第 个维度的 ITS 估计。 越大,说明该事件触发的人格扰动越大。
5 个候选 treatment 的总扰动列在下表。
表 1·3 5 个事件的总人格扰动比较
| 事件 | 年份 | 总扰动 | 显著维度数 |
|---|---|---|---|
| 廷杖几死贬龙场 | 1506 | 27.70 | 7 |
| 龙场悟道 | 1508 | 14.29 | 4 |
| 徐爱卒 | 1517 | 9.49 | 3 |
| 平宁王之乱 | 1519 | 9.24 | 2 |
| 致良知正式提出 | 1521 | 6.36 | 1 |
1506 的总扰动是后期 4 个事件平均(9.85)的 2.81 倍。"致良知"的扰动反而最低,这印证了内生 treatment 的判断:提出新主张是结果不是原因,不会在人格维度上额外触发显著效应。
三阶段的特征对比
把 1496–1528 这 33 年按 1506 切分为三阶段:
沉默期(1496–1505):阳明 24–33 岁,朝廷下层小官。这 10 年的文本主要是奏疏体,人格特征官式而平淡。反权威平均 −0.27(谦卑),情感深度平均 2.51(克制),自我修正几乎为零。这是一个未分化、未觉醒的青年阳明。
危机触发(1506):正德元年这一年。廷杖几死、被刘瑾派人追杀途中跳水脱身、贬贵州龙场驿丞。身体几乎死、政治几乎死、关系几乎死。触发了 7 个维度同时显著的一次性重组。
后期稳定(1508–1528):1508 年龙场悟道之后到 1528 年卒。这 20 年里发生了 1517 徐爱卒、1519 平宁王、1521 致良知、1527 天泉证道四件大事,但每件的总扰动都远小于 1506。它们是阐发阶段,不是重组阶段。
可视化
图 1·3 把三阶段公式在数据上完整画出来。(a) 是 8 维度的年份归一化轨迹与三阶段背景;(b) 是 5 事件的总扰动排序;(c) 是 1506 ITS 详图。三个子图合起来构成了"阳明成长公式"的完整证据链。

对哲学史叙事的修正
主流阳明研究把"龙场悟道"当作心学起点。本章数据修正了这个叙事:龙场悟道是 1506 触发的人格重组在 1508 年沉淀出来的智识总结,1506 才是真正的触发点。
1521 致良知同样不是分水岭。它的总扰动仅 6.36,在 5 个候选 treatment 中最低。致良知是阳明给已经完成的人格重组取的一个名字,不是触发人格变化的原因。这条修正与历史学界讨论已久的"龙场悟道是不是过度浪漫化"的疑问吻合,但本章用定量证据把"龙场是结果不是触发点"这件事钉死了。
方法卡片:单人因果推断的边界
数学形式:pre-period OLS 拟合趋势 ,外推得反事实 ,比较 。
核心假设:(1) 反事实平行假设。(2) treatment 外生于个体当前状态。(3) 多维度联合一致性作为辅助证据。
Python 实现:基于 numpy 的 OLS 拟合 + 简易 Welch t 检验。完整代码见 code/its_full_corpus.py。
典型失效场景:(1) pre-period 时间点 导致斜率不稳。(2) 内生 treatment 误用,估出反向因果。(3) pre/post 体裁分布严重失衡导致维度伪相关。
尚未解决的问题
本章已经回答了"哪个事件触发了阳明的人格重组"。但仍有几个问题留给后续章节:
第一,1506 重组之后,1508 年龙场悟道为什么专门强化教学耐心(+4.25, )和实践导向?这要回到他在龙场的处境分析。
第二,1521 年提致良知为什么没有人格扰动却有概念上的大跳跃?"致良知"作为概念的诞生与作为人格变化的事件,是两件事。第三章(概念分布散度)会用 L1 与 JS 散度回到这个问题。
第三,跨体裁人格画像差异巨大,奏疏里的阳明、诗里的阳明、教学时的阳明几乎是 6 个不同的人。这是体裁混淆还是真的人格场景化?第六章(跨体裁人格分析)用体裁固定效应回归处理这个问题。
本章知识地图
表 1·4 第 1 章核心概念与常见误解
| 核心概念 | 核心内容 | 常见误解 | 为什么错 |
|---|---|---|---|
| 人格维度净分 | 正向标记减反向标记的每千字密度 | 以为标记词越多越准 | 标记词与体裁套语混杂时反而引入伪信号 |
| 中断时间序列 | pre-trend OLS 外推得反事实,差额作因果效应 | 以为有 9 个时间点就能做 ITS | pre 自由度 时 值不可信,是小样本下方差被低估 |
| 反事实平行假设 | 若事件没发生 pre-trend 会按相同斜率延伸 | 以为假设可以直接检验 | 反事实永远观测不到,只能用多维度联合一致性间接支撑 |
| 外生 treatment | 个体无法选择是否发生 | 把阳明自己的思想动作当 treatment | 内生事件估出来的是反向因果,不是真因果 |
| 体裁混淆 | 跨体裁差异部分由语言习惯造成 | 把跨体裁分数差异直接归因到人格 | 奏疏体的官式套语会污染处变能力等维度 |
| 多维联合一致性 | 多个独立维度同向显著 | 以为单维度显著就够了 | 单人因果推断没有 between-subject 实验,联合一致性是替代证据 |