PRINCIPIA · PREFACE

前言:进入《几何原理》之前

目录
  1. 一、为什么从"公理"开始?
  2. 二、两千年的体检:从欧几里得到希尔伯特
  3. 三、公理不是"真理",而是"约定"
  4. 四、我们的选择:Birkhoff 四公理

在亮出"四条公理"之前,我们要先约定几件事:什么是公理、什么是定义,几何这门学问的"三层结构"是怎么搭起来的;以及这套规则是怎么从两千多年前的欧几里得,经过希尔伯特的修补,走到我们今天选用的 Birkhoff 体系。

一、为什么从"公理"开始?

你大概在初中数学课本上见过这样一句话:"两点确定一条直线"。课本接下去就用它推全等三角形、勾股定理,一路讲下去。

但只要你停下来认真追问,就会触及一个被反复跳过的问题——这一句"两点确定一条直线",它的依据是什么?凭什么不经证明,就被当作整套几何的起点?

而且追问可以一直往下走:什么是"点"?什么是"直线"?什么叫"确定"?凭什么是"两点",不是三点、四点? 你会发现,这句脱口而出的常识,每一个字其实都禁不起一问

你翻回前几页想找答案。课本会试着说点什么——画图、举例子、配上几句直观的描述。但你顺着每一句解释再往下追一步,最终都会撞上同一个词——"显然"

但是"显然"这两个字,恰恰是几何学最危险的陷阱。两千年来,人类在这个陷阱里摔过无数次跟头。我们这门《几何原理》要做的事,就是不接受任何"显然",把每一条定理都老老实实地从最底层的几句话推出来

那"最底层的几句话"——我们要从哪里开始?

让我们顺着定理往回追。试一试:

  • "勾股定理"可以用"三角形相似"证明;
  • "三角形相似"可以用"三角形全等"证明;
  • "三角形全等"又依赖"线段长度"、"角度大小"这些更基本的事实……

每一步往回走,前提都比结论更简单。这是一个逐级回溯的过程。

但是,这个回溯能无限进行下去吗?

不能。

如果"定理 A 要靠定理 B 证明","B 要靠 C 证明","C 要靠 D 证明"……一直追下去,要么有一天会绕回来撞上 A 自己(循环论证,等于什么都没证明),要么这条链就必须停在某个地方——停在一些我们不再去证明、而是直接当作出发点接受下来的句子上。

这些"再也无法向前推、必须当作出发点的句子",就叫做"公理" (axiom)。

这其实是一种非常普遍的思维方式,叫做第一性原理 (first principles)——任何复杂的真理,最终都要被还原到几条最基本的、无法再向前追问的起点。物理学家用它去找宇宙的基本规律,化学家用它去找最小的元素,而几何学,是人类最早把这种思想用到极致的领域。

但还有第二堵墙:词

公理只解决了一半的问题——"哪些命题不再证明"。但你回头看,刚才追问的不只是命题,还有

"什么是'点'?什么是'直线'?什么叫'确定'?"

词,也要追到底。

试着定义一个简单的概念——。日常语言里你也许会说"圆就是圆形的东西"——这是套娃。几何里我们给"圆"发一张精确的姓名牌:到一个固定点距离相等的所有点。这张姓名牌就像一道篱笆:差一根头发的距离,都被挡在外面。这就是定义——把一个概念从更基本的概念中"切"出来。

但是换一个词试试——

你怎么定义点?说它是"没有大小的东西"?那"大小"又是什么?说它是"两条线的交点"?那"线"又是什么?

往下追问总会撞到这堵墙——总要有几个最基础的词,无法再被定义,只能被"指出来"。几何里的"点"、"直线"、"平面",就是这种不定义项 (undefined terms)。它们不是被"定义"出来的,而是被"约定"下来的。

那么问题来了:如果"点"和"直线"没有定义,怎么保证你脑子里想的"点"和我脑子里想的"点"是一回事?

答案是——让公理来约定。我们不告诉你"点"是什么,但我们写下一条规则——"过任意两点存在唯一一条直线"。你可能仍然不知道"点"长什么样,但你知道:在我们这个游戏里,点是这样一种东西——随便挑两个,就能拉出唯一一条直线。慢慢地,公理一条一条加上来,"点"和"直线"的"性格"就被勾勒出来了。

公理不告诉你"点是什么",只告诉你"点能做什么"。但只要规则定得够细,"能做什么"反过来就把"是什么"框住了。

几何的三层结构

把上面两段拼到一起,整门几何的搭法其实长这样:

几何的三层结构:底层是公理与不定义项互相定义;中层是派生定义;顶层是所有定理

最关键的是底层那个双向箭头

  • 不定义项给公理提供"说话的对象"——没有"点""直线",公理就没有主语;
  • 公理给不定义项提供"全部的意义"——你不需要知道"点"长什么样,只要它满足公理列出的关系,它在这盘棋里就是"点"。

这个底层搭好之后,向上一层是定义——绝大多数你熟悉的几何概念(圆、三角形、中点、平行、全等、相似、角平分线、外心……)都是被严格定义出来的,而且必须用"不定义项 + 已定义过的概念"一层一层构造。再往上才是定理——从公理和定义出发推出来的所有结论。

换句话说:"定义"这件事并没有被放弃。只是当你追到最底,会发现总有几个词无法再用更简单的词去解释,那几个词就只能交给公理去刻画。

这一点很重要,因为它告诉我们一件事:几何不是在描述世界,而是在描述一个我们用语言精心搭建的"理想世界"。这个理想世界的居民——点、直线、圆、三角形——比现实世界的任何东西都要"干净":你画的圆总会有粗细、有抖动;几何里的"圆"则是一个绝对完美的轮廓,没有粗细,没有杂质。

棋子与规则

打个不太严谨的比方。假设你穿越到一个陌生的小岛,岛上的人正在玩一种你从没听过的桌游,叫做 "格灵棋"

棋盘是一张方格纸,岛民递给你一颗棋子,说:"来,这颗叫'灵'。"

你接过来问:"'灵'是什么?是兵?是马?是某种动物?"

岛民摇摇头:"你别管它'是什么',记住三条规则就行——

  • 每个回合,'灵'可以朝任意一个方向走一格;
  • '灵'不能走到另一颗'灵'已经站着的格子上;
  • 当两颗'灵'之间只有对方的一颗棋子时,可以吃掉这颗棋子。

照这三条玩,你就能下这盘棋了。"

奇妙的事情发生了:整局棋下完,你也没搞清楚"灵"到底"是什么"——它可以是一颗石头,可以是一只小鸟,可以只是一个抽象记号——但这完全不影响你下棋。因为决定"灵"在这盘棋里如何运作的,不是它的样子,而是规则告诉你它能做什么、不能做什么

几何就是这盘棋。"点""直线"是棋子,公理是它们的走法。我们不告诉你"点"是什么——你可以把它想成一颗豆子、一个针尖、一颗星星,都行。我们只写下几条规则,这些规则就是"点"和"直线"在这盘棋里的角色。

那"几条规则"具体是什么?人类是怎么找到它们的?让我们看看历史。

二、两千年的体检:从欧几里得到希尔伯特

把"几何"组织成"公理 → 定理 → 更多定理"这种结构,最早是古希腊人欧几里得 (Euclid) 干的。大约在公元前 300 年,他写下一本叫《几何原本 (Στοιχεῖα · Elements)》的书,从 23 条定义、5 条公设、5 条公理出发,推出了 465 条定理

这是人类历史上第一本用这种方式写的数学书,也是除《圣经》之外印刷量最大的西方书之一。两千年里,这本书是欧洲教育的标准教材,从牛顿到爱因斯坦都是读着它长大的。它教会人类的不只是几何,更是一种思维方式:任何复杂的真理,都可以被还原为几条简单的、不证自明的起点

但是欧几里得的工作并不完美。

一方面,他的"定义"里混了很多其实算不上定义的句子——比如"点是没有部分的",到底什么叫"没有部分"?这其实是在用一个更模糊的概念去解释一个本来就该当不定义项的词,等于把皮球往后踢。

另一方面——也是更要命的——他的论证里偷偷用了很多没有写在公理里的"显然"假设。比如他在《原本》第一个定理(用一条线段作等边三角形)的证明里,悄悄假设了两个圆会相交于一点;可是"两个圆是否一定相交"这件事,他的公理里根本没声明。两千多年里,无数读者读到这里也没察觉——因为图画上"显然"是相交的。

但是"显然"不是公理。这就是欧几里得给后人留下的最大功课。

时间快进到 1899 年。德国数学家 大卫·希尔伯特 (David Hilbert) 给《几何原本》做了一次彻底的"体检"。他写了一本叫《几何基础 (Grundlagen der Geometrie)》的书,把欧几里得遗漏的所有"显然"假设全部翻出来摆到台面上,重新整理成 20 条公理,分成五组:

  • 关联公理(8 条):点、线、面之间"在不在上面"的关系
  • 顺序公理(4 条):一个点"在另外两个点之间"是什么意思
  • 合同公理(5 条):两个图形"全等"是什么意思
  • 平行公理(1 条):欧几里得最有名的那条
  • 连续公理(2 条):直线上的点是"连续"的

希尔伯特最大的贡献,不是发现了什么新定理,而是把"几何"这门学问真正变成了一个纯逻辑游戏。他在书里说过一句惊世骇俗的话:

"我们应该可以把'点、直线、平面'换成'桌子、椅子、啤酒杯',所有的定理仍然成立。"

意思是:几何里的"点"是什么、"直线"长什么样,根本不重要;重要的只是它们之间满足的那些公理关系。这正是上一节那张三层结构图被推到了极致——几何不再依赖任何直观,只依赖逻辑

但是,希尔伯特摆平了"哪些公理需要写下来"之后,公理本身的地位反而开始变得可疑了。这是下一节我们要直面的问题。

三、公理不是"真理",而是"约定"

希尔伯特那句"桌子椅子啤酒杯",还藏着更深、也更让人不安的一层含义。

很多人以为"公理"就是"绝对正确的真理"——是上天写好、刻在石头上、所有人都必须接受的句子。

事实上不是。

公理只是数学家选择作为出发点的几句话。它们不是被证明的,但也不是被发现的——它们是被约定的。我们说:"好,让我们假设这几句话是对的,看看从它们出发能搭出怎样一座大厦。"——仅此而已。

听起来反直觉吧。"过两点存在唯一一条直线"这种事,难道不是"绝对正确"的吗?

让我们做一个小实验。在地球这颗球的表面上,"两点之间最短的路径"是什么?是直线段吗?

不是——是大圆弧(飞机的航线就是这么走的)。在球面上,你能拉出来的"最直"的线,其实是绕地球一圈的大圆。

那么问题来了:在球面上选两个点,过它们的大圆有几条?

一般情况下只有一条。但是如果你选的是"对径点"——比如北极和南极——过它们的大圆就有无穷多条:每一条经线都是! "两点确定唯一一条直线"在球面上失效了。

这件事被 19 世纪的几个数学家(Lobachevsky、Bolyai、Riemann)认真追问下去。他们问了一个被当时的人看作"疯狂"的问题:

如果换掉欧几里得的某条公理,还能不能搭出一套自洽、不矛盾的几何?

答案是:。换掉欧几里得的"平行公设"之后,他们搭出了一种全新的几何——非欧几何。这套几何里,欧几里得的"三角形内角和等于 180°"、"过直线外一点恰有一条平行线"这些被奉为"真理"长达两千年的句子,统统不再成立。但它从内部看完全自洽,没有一条定理打架。

更震撼的是后来的事情:1915 年,爱因斯坦提出广义相对论,发现我们这个宇宙的真实几何,恰恰是非欧的——光线在大质量天体附近会弯曲,时空本身是弯的。换句话说,欧几里得那些被颂扬了两千年的"自明真理",在描述真实宇宙时反而是错的

这件事彻底改变了数学家对公理的看法。

公理不再被理解为"宇宙真理",而是"游戏规则"

它们就像下棋前要约定的几条规则。规则没有"对错"——只有"我们今天选这一套来玩"或"我们今天选另一套来玩"。从一套规则能玩出一种棋,从另一套规则能玩出另一种棋。哪一种"更对"?这个问题本身没有意义。但是哪一种更适合当下要解决的问题?这是一个有意义的问题。

这给数学带来了惊人的自由。世界上不只有一种几何:欧几里得的平面世界、Riemann 的弯曲球面、Lobachevsky 的双曲空间……每一种都是一个自给自足的宇宙,每一种都遵循自己的逻辑,不分对错,只看你今天在哪个宇宙里讨论问题。

公理不是宇宙的真理,是人类思维的脚手架。

我们搭起它,是为了让真理有地方可以站。

四、我们的选择:Birkhoff 四公理

那我们这本《几何原理》选的公理,是"对的"吗?

不是。 它只是最适合用来描述你日常生活里那张笔直的纸、那块平整的桌面——也就是中学几何要研究的那个世界。如果有一天你抬头看星空,想理解光线如何在引力场里弯折,你就要换一套公理。这没有什么不好——这正是数学最迷人的地方

那这套"最适合中学几何"的公理,长什么样?

希尔伯特的 20 条公理虽然严谨,但是对中学生(以及教这门课的老师)来说,实在太多、也太琐碎了。光是"两个线段全等"这件事,他就要单独写 5 条公理来规定。

1932 年,美国数学家 G. D. Birkhoff 想了一个更聪明的办法。他注意到一件事:中学生其实早就会用"实数"了——会用尺子量长度,会用量角器量角度。既然实数这么熟悉,为什么不直接把"测量"作为基本概念呢?

于是 Birkhoff 把希尔伯特的 20 条公理压缩成了 4 条

公理 一句话
I · 尺子公理 直线上的点与实数一一对应,距离 = 两数之差的绝对值
II · 点线公理 过两个不同点存在唯一一条直线
III · 量角器公理 过一点的所有方向与角度(实数)一一对应
IV · 相似公理 (SAS) 两边成比例 + 夹角相等 ⇒ 三角形相似

简洁到震撼,对吧?四条公理,构成了我们能在中学几何里证明一切定理所需的全部原材料

尺子和量角器——这就是为什么我们把前两条叫"尺子公理"、第三条叫"量角器公理":它们就是把你手里那两件文具的能力,提炼成了数学语言。中学的几何课从一开始就在用尺子量长度、用量角器量角度,Birkhoff 只是把这件你早就会做的事,正式写进了游戏规则里

顺便说一句:量角器面板上印着的"360"本身也是一个约定——公理 III 只声明"方向与实数一一对应",并没有规定满圆必须是 360。这个数字是古巴比伦人留下来的:他们用六十进制计数,又把一年近似成 360 天,"满圆 360 度"于是沿用至今。数学家做微积分时则改用弧度(满圆 2π2\pi),因为那样 sinx\sin x 求导才不会冒出多余的因子。这正好呼应上一节——约定不止在"选哪几条公理"那一层,连公理内部用什么单位,也是一层约定。

这也是为什么我们这门《几何原理》选择 Birkhoff 而不是 Hilbert:它在严谨性和直观性之间找到了最好的平衡,特别适合从初中知识水平起步、又想真正理解"为什么"的人

接下来你会读到什么

接下来你会看到的四章,每一章对应一条公理。每条公理我们都会做三件事:

  1. 把公理小心地陈述清楚——一个字一个字地解释它在说什么;
  2. 解释它在防止什么——如果没有这条公理,会出什么乱子;
  3. 指出它解锁了什么——后续哪些定理是从它"长出来"的。

四条公理读完,你就持有了一切初中几何定理的"出生证明"。再回头看那些你早就会用的定理——勾股、相似、圆周角、四点共圆——你会清楚地看到它们每一个都是从这四句话里生长出来的逻辑大树。

你不会再被"显然"打发,也不会再为"为什么这一步可以这样"而困惑。

现在,篱笆已经插好,规则已经写下。请翻到下一页——我们的几何之旅,从公理 I 开始。