复杂性中的思维物质TXT第28部分小说阅读和下载-策策文学

输入问题类型输出　
测量数据、症状等→分类或诊断→规则/模式的识别　
约束→设计→满足性质的对象　
初始态、目标态→计划→将初始态转变到目标态的行动顺序　
初始态→模拟→未来的后果状态　　　
图5．8专家系统的问题类型　
　　　　一类已经深入分析过的问题涉及到“诊断”，例如医学中的诊断。这种专家系统的输入由测量的数据、症状等等所构成，它在结果中提供了从数据规则中识别出来的模式。另一类问题涉及到“设计”。此问题是如何发现在相应约束下的产物。计划问题的解答要求某种行动序列，把初始态转变成目标态。模拟问题从模型的初始态出发，必须计算其后续状态并进行评价。　
　　　　问题求解策略是由产生规则推导出来的，这里必须由所谓的规则解释者进行选取。如果有几种规则是可用的，冲突求解策略将决定哪一条规则是适用的。例如，可能的规则可以用优先性和一般性的程度整理出次序。然后，选取具有最高程度的优先性或专业性的规则就可能是合适的。　
　　　　在推理中的规则组合可以由所谓前向和后向链接来实现。前向链接从一定的数据和事实A出发，运用此演绎机制直至推导出一定的目标D（图5．9）。　　　
　　　　从方法论的观点看，专家系统的前向和后向链接程序，只不过是众所周知的古典逻辑学家和哲学家帕波斯的发现确证的必要性或充足理由的方法。不足为奇的是，几乎所有专家系统的推理策略都是以众所周知的哲学方法论为基础的。　
　　　　今天，AI中运用的大多数哲学理论都不是直接从哲学文献中获取来的，但是这无损于它们的哲学意义。然而，有一些著名专家系统的作者却是直接受到了哲学家的影响。　
　　　　要弄明白AI是哲学逻辑和方法论，人们只要仔细考虑一些专家系统。它们的问题分类决定了何种策略适合于问题求解。一般地说，一种策略的目的也就是减少问题的复杂性。　
　　　　DENDRAL程序所涉及的任务，是从数据中决定出分子的结构，数据中包含着化合物的分子式和化合物的质谱。输出整理成有序的表格，列出各种可能的结构式。其问题求解的策略被称作“产生和检验”，其算法是产生出与给定的分子式一致的有机分子的拓扑结构，以及产生出分子中的化学键最可能从何处断裂的规则。简言之，我们可以说，该程序是采用尽早修剪掉坏的分枝的方法来减少求解生成树的复杂性。方法论上，它涉及某种确证标准。　
　　　　一般地，如下的要点具有重要性，而不论其化学应用如何：　
　　　　a）有某个形式对象的集合，其中包含了解答。　
　　　　b）有某种产生机制，例如某种对于该集合的完整计数过程。　
　　　　c）有某种检验，例如判断所鉴定出的某种产生出来的元素是否在解答集中。　
　　　　这种一般方法由如下的算法来定义，例如由如下的遵从丘奇定理的递归函数来定义：　
　　　　函数GENERATE－AND…TEST（SET）：　
　　　　如果要检验的集合SET为空，　
　　　　那么失败，　
　　　　否则让ELEM是SET的“如下”元素；　
　　　　如果ELEM是目标元素，　
　　　　那么将其作为解答，否则对于集合SET在没有元素ELEM情况下重复这一函数。　
　　　　对于翻译成AI编程语言LISP，必须引入一些递归辅助函数，例如GENERATE（产生一定集合的某个元素），GOALP（是判断函数，如果论据是解答集的一部分则提供T（真），否则NIL），SOLUTION（为“输出”准备的解答元素），和REMOVE（提供集合减去给定元素）。当设计一张符号表时，考虑到LISP中通常的缩写，例如　DE（定义）、COND（条件）。EQ（方程）、T（真）以及LISP的约定（例如括号规则），如下的算法在LISP中是可接受的：（DE　GENERATE…AND…TEST（SET）（COND（（EQ　SET　NIL）’FAIL）　
　　　　　　（T（LET（ELEM（GENERATE　SET））　
　　　　　　（COND（（GOALP　ELEM）（SOLUTION　ELEM））　
　　　　　　（T（GENERATE－AND－TEST　
　　　　　　REMOVE　ELEM　SET）））））））　
　　　　对于给定的化学分子式，所有的化学结构都系统地产生出来，例如对于C5H12，第一步是：　　　　
　　　　一些化学结构被排除了，因为它们是不稳定的或相矛盾的。下一步，计算出相应的质谱并与经验上确定的质谱进行比较。这个比较也就是检验过程。GENERAIE－AND－TEST从而在技术上实现了一种方法论，排除了不可能的假定并检验可能的变体。　
　　　　META…DENDRAL程序是设计来改进DENDRAL程序的，涉及何种分子键将在质谱仪中被打破。所以META－DEN－DRAL运用了DENDRAL程序再加上确证的预测标准，这被亨佩尔批判地分析过。　
　　　　帮助医生进行诊断感染的MYCIN程序，是一种后向链接的演绎系统。MYCIN的知识库中，大约有300种血液细菌感染生成方式。下面是一个典型例子：　
　　　　如果感染的类型是基本的细菌血症，怀疑的入侵点是胃肠道，培养部位是一处无菌部位，那么这就表明此种有机体是拟肠杆菌。　
　　　　运用这样的知识，MYCIN进行后向运行。对于所有100种诊断假设，MYCIN试图逼近从实验室结果和临床观察获得的基本事实。由于MYCIN工作在推论往往不确定的领域中，它的设计者把看来合情概率推理的理论与基本的产生装置结合起来。该理论用来为与/或（AND／OR）树中每一个结论建立起所谓的确定性因子（图5．10）。　　　　
　　　　这里，Fi是使用者指定给一事实的确定性因子，Ci表明一结论的确定性因子，Ai是产生规则所预期的可信度。确定性因子在AND节点和OR节点处指向前面的式子进行计算。如果一个确定性因子为0．2或更小，相应事实的真假被看作是未知的，就规定其值为0。　
　　　　该程序计算出归纳合理性的大小取决于保证事实的多少。这种方式使我们想起鲁道夫·卡纳普的归纳理论。卡纳普自然是不相信培根的普遍归纳结论的。结论总是演绎性的。对此不需要波普尔式忠告，否则专家系统不会运行。然而，像MYCIN系统中所用的概率测量则使得该系统对于使用者更透明。　
　　　　另一方面，也可以这样说，在此采用了“假说和检验”策略的波普尔纲领，即产生出最有趣的假说并进行严峻检验。有这样的程序，有助于用统计数据构造起线性的因果解释。另一些程序运用昔日哲学家的知识，归纳推理是单调的，即意味着从一组前提归纳地导出的结论，可能并不是前提的协调拓展。例如，鸟会飞，吱吱叫是鸟，于是推论出吱吱叫会飞，但是它不会飞，如果我知道吱吱叫是鸵鸟。　
　　　　另一种策略是将复杂问题分解成简单部分或复杂性较小的子问题，例如乔治·波利亚的启发性数学手册《如何求解》中就使用了这种策略。因此，应用领域必须允许分解为独立的部分。但是，显然，相关性复杂网络并不总能分解而不改变系统的原先状态。例如，人类环境的生态网络或精神病医生必须要分析的复杂的心灵相关性。系统并非总是其部分之加和。　
　　　　科学哲学中的一些划界可以翻译为以知识为基础的系统的性质。如果研究使得理论概念得到广泛运用而成为一个理论的固有特性，那么发现过程就可以描述为依赖理论的（理论推动的）。相反的观点，通常叫做培根观点，把大批数据作为其起始点。那么，发现过程就称作数据推动的。在理论的和数据的知识处理之间的划界，在AI中是众所周知的。　
　　　　现在我将从以知识为基础的系统中勾画出一些程序，这些系统使得各种各样学科的任务得以完成，其优点前面也已经提到了。我的第一个例子涉及到数学。AM是一个以知识为基础的系统，可以说，它从数论中递归地产生出和重新发现了概念。与经验科学中的程序形成鲜明对照的是，AM成功的标准并非是一个概念与经验数据的吻合，“有趣”的方面却是它产生出例子、新问题等等的能力。这种程序是1977年用LISP语言写出的，始于诸如集合、表格、相等和操作这样的基本概念，可以提出引导发现过程的建议。启发过程是在原来的基础上提出新任务并创立新概念。新的任务按照其有趣的程度整理成一定次序。由若干不同启发过程提出的种种任务，比由单个规则提出的任务更为有趣。　
　　　　运用这种措施来引导它对数学概念空间进行搜索，AM为整数、乘法和质数定义了概念，并发现了关于质数的命题（例如因子唯一分解性定理）。　
　　　　不过，更深入的分析表明，对发现的历史过程进行模拟的要求是难以满足的。AM的成功完全决定于编程语言LISP的特征。然而，分析显示了与人们研究过程的有趣类似。　
　　　　如同其名称LISP表明的，符号表是系统地作出的。两个表可以递归地定义为相等的，当两者是原子的且原子是相等的，否则当表头是相等的且表的其余部分是相等的。在LISP中，递归的布尔函数标记如下：　
　　　　（DE　LIST－EQUAL（XY）　
　　　　　　（COND（（OR（ATOM　X）（ATOM　Y））　
　　　　（EQ　X　Y））　
　　　　（T（AND　
　　　　（LIST－EQUAL（CAR　X）（CAR　Y））　
　　　　（LIST－EQUAL（CDR　X）（CDR　Y））））））　
　　　　这里，CAR和CDR分别是LISP中，对于给定的符号表进行表头和表的其余部分分类的基本操作。AM的一个启发的概括规则推广了等价这一术语。然后，两个表被称作“广义相等的”，如果两者是原子的且原子是相等的，否则表的其余部分是“广义相等的”。在LISP中：　
　　　　（DEL－E－1（XY）　
　　　　　　（COND（（OR（ATOM　X）（ATOM　Y））　
　　　　（EQ　X　Y）　
　　　　（T（L－E－1（CDR　X）（CDR　Y）））））　
　　　　由此推广，所有具有相同长度的表都被看作是等价的。它们定义了叫做“数”的一类。儿童面对具体对象时实现的这种发现过程，由AM通过变换规则进行了模拟。加法是两个表的连接。由启发变换规则来形成已产生概念的逆时，发现了质数概念。在AM基础上改进的EURISKO（1983），不仅仅可以发现新的概念，还可以发现新的启发过程。　
　　　　一系列叫做BACON的程序对定量经验定律的发现进行了分析。BACON系统的名字取自弗朗西斯·培根，因为其中运用了培根关于科学推理性质的思想。它们是数据驱动的知识处理系统，其中包括数据收集，找出在两个或更多个变量之间的规则并对其进行检验。BACON的基本方法并不需要涉及数据的语法意义，它们对于数据进行操作，不对数据的结构作任何特殊的假定。有时，需要人们对于独立项进行实验控制，传统的“一次改变一项”的方法可以用来从相关变量中分开每一独立项的效应。BACON程序可以再产生出物理定律，包括波义耳定律、开普勒第三定律、伽利略定律和欧姆定律。　
　　　　有关考察表明，这种以知识为基础的系统至少要遵从这样的前提条件：对于不同学科间规律的关联，应该满足同样的方法论和启发框架条件。相应的以知识为基础的系统，不仅仅是再产生一定的定律，这些定律是在不同的历史背景中发现的，而且也对称地产生出完整的方法论概念的范围和挑选出有趣的应用。最新的BACON程序不仅仅是数据推动的，因而是严格的意义上的“培根式的”，而且还是理论推动的。在其对称性和守恒定律的理论前提下，它产生出了例如动量守恒定律。　
　　　　另一系列程序能够从经验数据中归纳出定性定律（GLAUBER，STAHL，DALTON）。这些程序还可以从一些现象中归纳出结构性和解释性模型。定性定律通常是化学中的定律。　
　　　　科学家与机器之间的竞争并非是有意的。不过，对于科学定律和理论做出系统的结构性分类已经实现。它可以使人们对科学定律及其发现条件的复杂性进行新的洞察。　
　　　　对于科学发现的多种多样活动的若干方面，诸如发现定量定律，产生出定性定律，推导出物质的成分和提出结构模型。一种整合的发现系统已经显示出曙光，它把个别系统作为组件结合起来。每一组件都接受其他一个或多个组件的输入。　
　　　　例如，STAHL集中在确定化学物质的成分上，而DAL－TON则关心反应中涉及到的微粒数目。因此，STAHL可以看作是，为DALTON所论的问题奠定了详细的结构模型基础。以这种方式，有可能发展起越来越复杂的以知识为基础的系统，将研究分解为知识处理和问题求解。　
　　　　甚至在这样的扩大了的研究框架中，我们仍然没有涉及到实验计划或新测量手段的发明所依赖的机制。任

《复杂性中的思维物质》

下载本书

复杂性中的思维物质- 第28部分