一、形式化的一般程序及其本质

一、形式化的一般程序及其本质

形式化是将一套特制的人工符号（形式语言）应用于演绎体系以使其严格化、精确化的程序和方法。形式化总是使某一理论形式化，这是指把该理论中的概念转换为形式语言中的符号，命题转换为符号公式，定理的推演转换成符号公式的变形，并把一个证明转换成符号公式的有穷序列，从而把对理论中概念、命题、推理的研究，转化为对符号表达式组成的形式系统的研究。它表现为一系列连续的操作。波亨斯基指出：“形式化系统总是按如下顺序形成的：先确定有意义的符号，然后从符号中抽象掉意义，并用形式化方法构成系统，最后对这个所构成的系统作一种新的诠释。”⁽¹⁾我认为，上述说法基本上是正确的。形式化程序包括三个大步骤：做预备性研究，构造形式系统，对形式系统进行解释。下面对这些步骤逐一加以说明。

1．做预备性研究

形式系统内的符号是不携带任何意义的，因而其中的公式、公式之间的变换本身也不具有任何意义，整个形式系统是在不考虑其意义的情况下加以构造的。但是，我们创制特殊的人工符号语言，并用它去构造形式系统，毕竟不是玩符号游戏，而是带有一定目的的，这表现在最后我们要对形式系统加以解释，对其中的符号、公式、公式的变换赋以一定的意义，令它们表达一定对象域中的概念、命题和推理等。实际上，这种在形式系统构成之后加给它的解释，在形式系统构造之前已部分地存在于构造者的观念中。研究者所要形式化的那一理论本身，就构成了形式化的直观背景。由此产生一个问题：假如所要形式化的理论本身的概念是模糊的，命题是有歧义的，命题之间的逻辑关系是混乱的，我们能够将其成功地形式化吗？回答只能是否定的。因为形式化只是把已有的研究成果组织为理论体系的方法，在没有对问题作深入、细致、周密的研究之前，就匆匆使用形式化方法，所得到的系统一定是空洞无物或者错误百出的，因而是无价值的。一套精巧、复杂的技术性架构，如果没有深刻的思想支撑着，就是一堆毫无价值的精神性垃圾。普特南曾表达了类似的看法：“你可以通过讨论‘递归规则’和‘语言共相’给传统的错误穿上现代的服装，但它们仍然是传统的错误。语义理论的问题是要从下述局面中摆脱出来：将一语词的意义看作是像一系列概念之类的东西；同时也不要对这种能够使人误入歧途的观点加以形式化。”⁽²⁾因此，要把一个理论形式化，常常需要先做一些预备性研究，例如，澄清该理论中的概念与命题，消除它们的歧义与不精确之处，弄清楚它们之间的逻辑关系，以便确定哪些概念、命题是基本的，哪些概念、命题是派生的，如此等等。任何成功的形式化，总是先要做这一番梳理、廓清的工作。例如，普赖尔、冯·赖特、亨迪卡、齐硕姆这样一些逻辑学家在构造时态逻辑、道义逻辑、认知逻辑的形式系统时，总是先在相关领域做一番哲学探究，并写有相关论题的哲学论著，或者在相应的逻辑著作中有大量的哲学讨论。

2．构造形式系统

这是整个形式化程序中最为关键的一步。所谓形式系统，实际上是一个形式语言加上一套演绎装置。所以，构造形式系统，要先设计一个形式语言，然后为其配备演绎装置，最后推出所需的全部定理。

2.1　形式语言

可以这样说，任何一种语言至少包含两个构成要素：一是字母表，它规定了本语言中所包含的全部字母，例如英语共有26个字母（汉语中没有字母表，类似于字母的也许是一个个笔画）；一是一套语法规则，它规定如何由字母生成词、由词生成句子。一个形式语言恰好包含了这两个构成要素：字母表和形成规则。字母表规定了一形式系统的初始符号，若要使用这些符号之外的符号，则要通过定义引进。由字母表内的初始符号可以形成各种符号序列（串），形成规则规定，哪些符号序列是合式的，哪些是不合式的，合式的符号串称为合式公式，简称公式。这里以使用最广的一阶语言L为例，说明形式语言的一般构造与性质。

一阶语言L

Ⅰ　字母表

（1）个体变项：x1，x2，x3，…

（2）个体常项（可能空）：a1，a2，a3，…

（3）谓词符号：

（4）函数符号（可能空）：

（5）联结词：﹁，→

（6）量词：

（7）辅助性符号：（，）

这里，联结词和量词构成L的逻辑符号，而个体变项、个体常项、谓词符号、函数符号一起构成L的非逻辑符号，其中分别表示第i个n元谓词符号和第i个n元函数符号。

Ⅱ　形成规则

L的形成规则包括两类，陈述如下：

（1）项的形成规则

（i）个体变项和个体常项是项。

（ii）如果是L的函数符号，并且t1，…，tn是L的项，则是项。

（iii）项仅由（1）和（2）生成。

（2）公式的形成规则

（i）如果的谓词符号，并且t1，…，tn是L的项，则是L的公式。

（ii）如果A、B是公式，则（﹁A）、（A→B）、也是公式，是任意的个体变项。

（iii）公式仅由（1）和（2）生成。

项（term）相当于一种语言中的语词，公式（formulae）相当于一种语言中的句子，前面带量词的叫量化公式。在量化公式中，若量词后面无括号，则量词后面最短的合式公式叫做该量词的辖域；若量词后面有括号，处于括号内的公式是该量词的辖域。处在量词辖域内的一切与量词里的变项相同的变项都被此量词所约束，叫做约束变项；而不在任何量词的辖域内，或虽在某量词的辖域内但与该量词内的变项不同的变项，则不为该量词所约束，叫做自由变项。含有一个或多个自由变项的量化公式叫做开公式，不含任何自由变项的量化公式叫做闭公式。

需要指出的是，上述字母表中所引入的联结词﹁、→以及量词是功能完备的，足以表达一切一阶语言的句子。但是，若通过定义在一阶语言中引入联结词∨、∧、↔以及量词将更为方便。因此，陈述有关的定义如下：

与自然语言相比，如此形成的形式语言具有一系列明显的优点。所谓自然语言，就是人们日常所使用的语言，即在某一社会中历史地形成的民族的或部落的语言，例如汉语、英语、俄语、印第安语。自然语言是一定范围内的人们之间基本的和通用的交往手段，也是形成、存贮、传递科学知识的适当手段，毫无例外地适用于他们的各种活动之中。但是，自然语言具有严重的缺点：（1）它不精确，具有严重的歧义。例如，《现代汉语词典》中列明，“打”字分别可以作动词、量词和介词，其中作为动词的“打”字就有24个义项。自然语言语词的这种多义性和歧义性常常成为谬误推理的一个源泉，例如“中国人是勤劳勇敢的，某某懒汉是中国人，所以，某某懒汉是勤劳勇敢的”。（2）自然语言的语法是复杂的、非单义的，甚至是有些混乱的。各民族语言的语法系统同整个语言一样，是在人类历史发展过程中逐渐自发形成的，即使在同一种语言内，也缺乏统一的、严格的、单义的调节词、词组的规则，甚至存在许多对现行规则的偏离，更别说规则本身在各种语言中非常不统一了。所有这些就导致在自然语言中，语言的语法结构和思想的逻辑结构之间不存在普遍且必然的一致，使得语言有可能歪曲和臆造思想。（3）自然语言的表达方式有时是极其笨拙的，例如为了表达立方差

它只能用这样笨拙的形式：“两个数的立方差等于两项的乘积，这两项中的一项是这两个数之差，而另一项是一个多项式，即第一个数的平方，加上第一个数和第二个数的乘积，再加上第二个数的平方。”有些更为复杂的科学公式，用自然语言是根本无法表达的。

但是，形式语言却克服了自然语言的上述缺陷。尽管它也有某种直观背景，但一经创立出来，它就脱离了与直观背景的一切联系，本身除了用自己的形状表达结构信息之外，再不传达任何意义信息，因此它是单义的；并且，它内部的词（项）和句（公式）是由明确陈述的句法规则递归生成的，不允许有对规则的任何偏离，因此它异常精确；此外，由于它是人工创制的，人们通常选用一些相当简短的符号，这就使得它结构简明，书写方便，表达能力极强，且容易理解。由于具有这些优点，形式语言就成为表达精密的科学知识的令人满意的工具。

2.2　演绎装置

一个形式系统的演绎装置包括两部分：一是作为演绎出发点的公理，一是指导演绎如何进行的变形规则。任何其他的形式系统都需要逻辑为其提供推理工具，因此都需要假定逻辑的形式系统，特别是要预设一阶逻辑的形式系统。因此，这里给出一阶逻辑形式系统K，它是由一阶语言L加下述演绎装置构成的：

Ⅳ　公理

A1 A→（B→A）

A2（A→（B→C））→（（A→B）→（A→C））

A3（﹁B→﹁A）→（A→B）

A4（xi）A→A，如果xi在A中不自由出现。

A5（xi）A→A（t），如果A（xi）是L的公式，t是L的项，且在A（xi）中对xi代入自由。

，如果A中不包含变元xi的自由出现。

Ⅴ　变形规则

分离规则：从A和A→B推出B；

概括规则：从A推出（xi）A，其中xi是任意的个体变项。

在K中，证明、定理、演绎、后承等概念得到了严格的定义：

K中的一个证明是L的一个有穷非空的合式公式序列A1，…，An，使得对于每一i（1≤i≤n），Ai或者是K的公理，或者是由序列前面的公式经使用K的变形规则而得到。如果公式A是K中构成证明的某个序列的最后公式，则称A是K中的定理，记作，该序列则是K中关于A的一个证明。

如果Γ是L的合式公式集，K中Γ的一个演绎是一个类似于证明的序列，所不同的是Ai可能是Γ中的公式。如果公式A是K中构成从Γ的一个演绎的某个序列的最后公式，则称A为K中的公式集Γ的一个后承，记作，该序列则是从Γ到A的一个演绎。

例如，下述公式序列：

（1）（A→（（A→A）→A））→（（A→（A→A））→（A→A））

（2）A→（（A→A）→A）

（3）（A→（A→A））→（A→A）

（4）（A→（A→A））

（5）（A→A）

就是K中的一个证明，因为其中的（1）为公理A2，（2）为公理A1，（3）由（1）、（2）经使用分离规则得到，（4）为公理A1，（5）由（3）、（4）经使用分离规则得到，每一步都符合K中证明的要求，因此，（A→A）就是K中的定理。

由此可以看出，K中的证明完全变成了符号公式之间的变换，变换只涉及符号的形状，而丝毫不涉及这些符号的意义。这实际上体现了形式化方法的实质：完全撇开所使用的符号的意义，撇开该符号系统所适用的对象范围，只凭借明确给出的与符号的字形（结构）相关的语法规则构造形式系统，然后对如此构造的系统进行解释。在如此构造的系统中，符号与符号的关系得到了最严格、最精确、最充分的刻画。

3．步骤Ⅲ：元逻辑研究

形式系统一经构造完成之后，本身立刻就成为研究的对象，成为对象理论。以形式系统为对象的理论称为元理论。如果元理论的对象是逻辑形式系统，特别是一阶逻辑形式系统，则称这种元理论为元逻辑。形式系统内所使用的人工符号语言称为对象语言，这种语言无法刻画形式系统的性质，而且也不能说明自身的性质。为了完成这种说明和刻画，就需要一种区别于对象语言的语言，称为元语言。元语言往往是自然语言加特定的符号语言，在元理论研究中就要使用这种语言。

元理论是从语法和语义两个角度研究形式系统的性质的。语法处理和研究形式系统内符号与符号之间的关系。逻辑语法包括两部分：基本语法和理论语法。前者涉及形式系统的构造，它实际上规定了用形式化方法构造形式系统的程序：首先是给出该系统的字母表，其次是给出形成规则，再次是给出公理，最后是给出变形规则，剩下的工作就是根据变形规则从公理推出定理。理论语法则把构造好的形式系统本身作为研究对象，研究后者的一系列语法特性，诸如语法意义上的一致性、完全性、独立性、可判定性等。语法研究要使用语法元语言，例如我们前面陈述一阶语言L的形成规则、公理、变形规则时，谈到L的合式公式，我们使用了大写字母A、B、C等，这些就是语法语言，通常所谓“矛盾式”、“合式公式”、“证明”、“可证”、“定理”、“演绎”等是典型的语法概念，用语法语言陈述的定理叫语法定理。语义处理和研究形式系统中符号和它所指称、所刻画的对象之间的关系。前已指出，我们构造形式系统是有某种直观背景和预定目的的，而这目的之实现必须凭借形式系统的解释。解释把形式系统与一定的对象域连接起来，从而赋予形式系统内的初始符号和公式以一定的意义。至此为止，原本没有任何意义的形式系统就成为反映一定的对象领域的一个有内容的形式理论，形式化的目的在这时就算最后达到了。一旦进入意义领域，我们就开始了对于形式系统的语义学研究。这是关于形式系统的元理论研究的重要方面，它研究一形式系统是否具有语义的一致性、完全性、范畴性等问题。语义研究要使用语义语言，例如，“真”、“假”、“重言式”、“满足”、“普遍有效”、“解释”、“模型”等是典型的语义概念，用语义语言陈述的定理叫语义元定理。与元定理相对应，用对象语言陈述的形式系统内的定理叫做内定理。在下一节，我们将继续讨论形式系统的解释或模型方面的问题。

总括起来，元理论要研究有关形式系统的下列问题：

第一，形式系统是否具有一致性（或相容性）？

一致性有语法和语义两种涵义。语义一致性是指：一切在这形式系统内可证的公式都是真的。或者说，该形式系统至少有一个模型。语义一致性又叫做可靠性（soundness）。语法一致性是指：并非任一合式公式都在这系统内可证；对于其语言中含有否定号“﹁”的系统来说，这种说法等价于：不存在这样的合式公式A，A和﹁A都在这系统内可证。因此，一致性（无论它是语法的还是语义的）不仅是指一形式系统中没有逻辑矛盾，而且是指它不可能产生矛盾。附带指出，从语义一致性可推出语法一致性。

第二，形式系统是否具有完全性？

完全性也有语法和语义两种涵义。语法完全性又有强的和弱的两种意义。强完全性是指属于一形式系统的每一公式或者是可证的，或者是不可证的；弱完全性是指，如果把一形式系统中不可证的公式加到公理之中，该系统必将导致矛盾。语义完全性则是指：一形式系统内所有与真命题相应的合式公式都在这一系统内可证。

第三，形式系统是否具有可判定性？

可判定性是与能行方法的概念分不开的。所谓能行方法，就是每一步都由某种事先给定的规则规定了的，并且在有穷步内结束的方法。所谓能行可判定，是指对一类问题有一能行方法，对任给该类中的问题，能在有穷步内确定它是否有某个性质，或者任给一对象能在有穷步内确定它是否属于该类。例如，对于形式系统，下述问题一般都是能行可判定的：任一符号是不是系统内的初始符号；任一符号的有穷序列是不是系统内的公式；任一公式是不是公理；任一公式是不是从给定公式根据变形规则得到；任一公式的有穷序列是不是一个证明。但是下述问题，如任一公式是否可证、是否为一定理，任一公式是否常真、是否普遍有效，任一公式是否可满足，却不是对每一个形式系统都是能行可判定的。

第四，形式系统的公理集是否具有独立性？

独立性就是相对于给定的变形规则的可推演性。一公式集合M是独立的，如果M中的任一公式A都不能根据给定的推演规则从M中其他公式推演出来。

第五，形式系统是否具有范畴性？

范畴性只是相对于有模型并且有两个以上的模型的形式系统而言的。具体来说，它是指一个形式系统的所有模型都是同构的，而两个模型同构则是指：两个模型的论域中的元素及其关系能够保持一一对应。

在形式系统的上述元逻辑特性中，一致性是最重要的特性，它涉及到一个形式系统是否能够成立的问题：因为不一致的形式系统包含逻辑矛盾，而按照逻辑定律，从逻辑矛盾可以推出任一命题，这就意味着在该系统内可接受的（真）语句和不可接受的（假）语句之间没有任何区别，而这会毁掉一切科学，因此这样的系统是没有价值的。一致性之外的其他元逻辑特性是次一级的：完全性涉及到一个系统的推演能力，独立性涉及一形式系统选择公理时是否经济，它们都带有某种审美的意味。不过，也不能因此轻视它们，这些特性对于形式系统来说都是十分重要的，特别是完全性，能够把某一范围内的真命题全部推演出来的（即完全的）系统当然是最适用、最理想的。因此，既一致又完全的系统一直是逻辑学家追求的目标。

这里，我们可以区分下述两对概念：

形式化和符号化　所谓符号化，通常是指下述两种情形之一：一是以使用自然语言为主，同时也使用某些特制的人工符号去表示所讨论的理论中特定的概念、命题甚至定理。这可以叫做初步的符号化，它有悠久的历史，并几乎被应用于一切科学之中。二是指将所讨论的理论中的概念、命题、推理分别全部转换为人工符号、符号序列、符号序列的变换，并且这些符号及其序列还必须保持严格的结构联系。这可以叫做严格意义的符号化，即构造形式语言。显然，符号化特别是严格意义的符号化是形式化的前提，但是前者并不就是后者，初步的符号化距离形式化还十分遥远，即使是严格意义的符号化，也只是形式化过程的一个步骤、一个环节，只是形式系统的一个构成要素，形式系统是由形式语言和演绎装置两部分构成的。因此，把符号化等同于形式化是错误的。

形式化和公理化　所谓公理化，是指把一个科学理论构造成为公理系统的演绎方法，它至少包含以下步骤：一是从该理论的诸多概念中挑选出一组初始概念，该理论的其他概念，都由初始概念通过定义引入，称为导出概念；二是从它的一系列命题中挑选出一组公理，而其余的命题都应用逻辑规则从公理推演出来，称为定理。应用逻辑规则从公理推演定理的过程被称为一个证明，每一个定理都须经由证明而肯定。由初始概念、导出概念、公理和定理构成的演绎体系，被称为公理系统。很显然，形式化的前提是公理化，但又不等同于公理化，这是因为：有些公理系统的对象域是事先给定的，并且基本上是用自然语言加上特定的符号语言陈述的；而形式系统事先不假定任何论域，事后容许多种不同的解释，并且全部是用人工构造的形式语言陈述的。所以，就其抽象化和符号化的程度而言，形式化比一般的公理化高得多。可以这样说，形式化是严格符号化与公理化相结合的产物，是公理化发展的高级阶段。