生命即是信息的累积
2022-02-24
tags: 信息, 归纳, 压缩
我的博士课题研究“Symbolic Minimization on Relational Databases Based on Logic Rules”已经基本完成。这项研究让我从一个新的视角观察科学技术以及文明的演进,于是想要记录一些新的想法。
1. 科学范式
关系型数据库的开山鼻祖Jim Gray在2007年召开的NRC-CSTB(National Research Council-Computer Science and Telecommunications Board)大会上提出了科学研究的四种范式:实验归纳、模型推演、仿真模拟、以及数据密集型科学发现。结合科学发展的历史可以发现,归纳(Induction)与演绎(Deduction)总是这些范式中不可或缺的模式或者流程。而时代的发展只是将这二者通过不同的技术手段实现,从而不断提升其效率而已。
从信息的角度看,我们认识这个世界的过程其实就是不断地记录信息再压缩的过程。我们记录事件、现象,再从中发现规律,并用这些规律解释事件和现象,从而将具体的事件和现象替代为更加紧凑的物理或数学模型,即“必要已知+模型”。在这些模型之上,我们可以进一步演绎推理出一些新的内容,指导我们下一步的发现,直到发现一些和理论模型不一致的内容,再通过重复前一步的流程归纳新的知识修正现有的模型。每一次发现新的知识都可以将已有的信息进行一次压缩,并开启一个新的迭代。这个过程可以通过如下图片粗略描述:

在这个图中,我并无意包含推动科学发展之外的信息,比如无聊的综艺和我发的闷骚朋友圈。
在压缩的过程中,我们实际上完成了将信息的存储从空间到时间的转换。也许“时间换空间”或者“空间换时间”的说法对于具有计算机背景的人来说不算陌生,但是我们必须认识到,这样的过程并不是简单的编程或者算法技巧,而是在更深的层次上描述我们所处的时空的一个固有角度。广义相对论描述了物质在四维时空中的运动,而这个视角则描述了信息在时间和空间中的移动和转换。进一步说,如果我们把信息与物质的运动、能量的流动建立联系,那么也许会有另一种完全不同的描述时空属性的模型。
就目前我所具有的认知而言,我们生活的宇宙空间有限,而时间单向无限。那么,不断地产生信息与混乱对抗,并把这些信息蕴含在无限的时间之中,直到物质无限混乱但信息无限丰富,就是宇宙演化的意义和目的吗?在这样的结局之中,宇宙将用自身解释自身,用自己刻画自己,但是这是可能的吗?宇宙中的物质总量可以记录所有必要的信息吗?极致的混乱难道不是和信息冲突的吗?
2. 计算的信息
说到信息的转换,我其实一直有一个疑问:计算过程所包含的信息量应当如何衡量?此处所指的“计算过程”是广义的包含所有信息处理的过程,可以是具体的计算机算法,也可以是社会根据法律以及俗约的运转过程。通常我们所指的信息的量是被存储下来的可以被空间属性测量的数据,比如一段文本、一张图片、或者一个程序。但是不同格式的文件,比如“.txt”和“.pdf”,它们可能描述的都是同样的文本内容,但是需要通过不同的流程、标准才能处理,那么这样的流程和规定就包含了我们用于解析对应信息的信息。再比如,命题逻辑有一套它具有的运算法则,一阶逻辑也有它运行的法则。而一阶逻辑的运算法则可以兼容命题逻辑,反之则不行。那我们是否可以定性地说:一阶逻辑的运算法则中包含的信息量大于命题逻辑的运算法则的信息量?
实际上,如果仅仅给出一段数据而不给出这段数据的结构规定以及运算法则,我们是无法理解这段数据的。因此,我们处理的数据的信息量不仅仅包含我们平时所关注的在存储介质上的信息量以及用于处理这些数据的程序所占用的存储空间,还应该包含我们正确理解这些信息的必要信息,即,所有处理信息的主体所达成的一致规范。而这些信息又要如何衡量呢?这些所有的信息汇总在一起,又是否符合上文所描述的规律呢?