《科学发现的逻辑 作者:波珀》

下载本书

添加书签

科学发现的逻辑 作者:波珀- 第21部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
闹鞴劾砺鄢龇ⅲ涝洞锊坏酵臣瞥率觥词古μ畈雇珺ernoulli定理之间的鸿沟也不能达到。

  63。Bernoulli定理和收敛问题

  从认识论观点看,我对上述大数定律的演绎是不满意的;因为收敛公理在我们的分析中所起的作用是很不清楚的。

  实际上通过把我的研究限于具有频率极限的数学序列已不言而喻地引入了这类公理(参阅第57节)。结果甚至容易使人认为我们的结果——大数定律的推导——是无关紧要的;因为“绝对自由”的序列在统计学上是稳定的这一事实可被认为是它们的收敛所蕴含的,而它们的收敛如果不是不证自明也是不言自明地被假定的。

  但是正如von Mises已清楚地表明的那样,这个观点是错误的。因为有些序列满足收敛公理,虽然Bernoulli定理对它们不适用,因为具有频率接近1的任何长度的节段,出现在与p有一定程度离散的频率中。(极限p在这些情况下的存在是由于这个事实:虽然离散可无限增加,但它们相互抵销。)这些序列看起来仿佛它们在任意大的节段中是发散的。即使相应的频率序列事实上是收敛的。因此大数定律根本不是收敛公理的无关紧要的推断,而且,这个公理对于推导大数定律完全不充分。这就是为什么我对随机公理的修改,“绝对自由”的要求是不可缺少的。

  然而,我们的理论重建,提示了这样一种可能性:大数定律也许是独立于收敛公理的。因为我们已经看到,Bernoulli定理是直接从二项式公式中得出的;此外,我已证明,可为有穷序列推导出第一个二项式公式,因此当然无需任何收敛公理。还必须假定的一切是参考序列α的自由度至少是n-1;这是一个从中得出特殊乘法定理的可靠性以及第一个二项式公式的可靠性的假定。为了过渡到极限,为了获得Bernoulli定理,只需假定我们使n如我们希望的那样大。因此就能看出,Bernoulli定理大概是对的,即使对于有穷序列也是如此,如果对于一个足够大的n它们的自由度为n的话。

  所以看来Bernoulli定理的演绎并不依赖于假定频率极限存在的公理,而是仅依赖于“绝对自由度”或随机性。极限概念仅起次要的作用:它用来把相对频率的概念(在第一个例子中给它下定义只是为了有穷类,没有它,n…自由度的概念就不能提出)应用于能无限延伸的序列。

  此外,不应忘记,Bernoulli本人是在经典理论的框架内演绎他的定理的,这个理论不包含收敛公理;也不应忘记,作为频率极限的概率定义只是经典形式体系的一种解释——而且不是惟一可能的一种解释。

  我将试图用除n-自由度(应适当地加以定义)外无需假定任何东西就可推演出这个定理来证明我的推测——Bernoulli定理独立于收敛公理。并且我将试图证明它甚至适用于其主要性质并不具有频率极限的那些数学序列。

  只要能够证明这一点,我就会认为我之推演出大数定律从认识论家的观点来看是令人满意的。因为似机遇经验序列证明,我已描述为“收敛”或“统计学上稳定的”那种特殊行为,是一个“经验事实”——或至少有时人们这样告诉我们(参阅第61节)。通过用统计方法记录长节段的行为,人们能够确定相对频率越来越逼近一个限定的值,相对频率在其中涨落的间隔变得越来越小。对这种所谓的“经验事实”,已进行过如此多的讨论和分析,确实往往认为它是大数定律的经验验证,对这种“经验事实”可以从不同角度来看。具有归纳主义倾向的思想家大多数认为它是基本的自然律,不能还原为任何更简单的陈述;认为它是必须完全加以接受的我们世界的特性。他们认为以适当形式——例如以收敛公理的形式——表示的这个自然律应该作为概率论的基础,从而使概率论具有一门自然科学的性质。

  我对这种所谓“经验事实”的态度是不同的。我倾向于认为,它可还原为序列的似定律性质;可从这些序列的自由度为n的事实中推导出来。我认为Bermoulli和Poisson在概率论领域的成就正是在于他们发现了一种方法以表明这种所谓“经验事实”是重言式,表明从小规模的无序(假如它满足表述得合适的n-自由度条件)合乎逻辑地得出一种大规模的稳定性秩序。

  如果我们能够无需假定收敛公理而演绎出Bernoulli定理,那么我们就可把大数定律的认识论问题还原为一个公理独立性问题,因而还原为一个纯粹的逻辑问题。这种演绎也说明为什么收敛公理在各种实际应用(试图计算经验序列的近似行为)中起了很好的作用。因为即使对收敛序列的限制结果弄清是不必要的,利用收敛数学序列来计算经验序列的近似行为(它根据逻辑上的理由在统计学上是稳定的)肯定不是不合适的。

  64.收敛公理的排除“机遇理论基本问题”的解决

  迄今频率极限除了具有提供一个可应用于无穷序列相对频率的明确概念外,在我们的概率论的重建中没有其他功能,因此我们可以借助它来定义(不受后效约束的)“绝对自由度”。因为正是相对频率被要求不受根据先行者作出选择的影响。

  我们早就把我们的研究限制在具有频率极限的二择一,因此不言而喻地引入了收敛公理。现在,为了使我们摆脱这个公理,我将摆脱这个限制,而不用任何其它限制来代替它。这就是说我将不得不建构一个频率概念,它能接管被排除的频率极限的功能,并可应用于所有的无穷参考序列。

  满足这些条件的一个频率概念是相对频率序列聚点的概念。(如果在任何给定的元素之后有一些与α的离差小于一定量,即使这个量很小,就说α值是某一序列的聚点。)这个概念可不加限制地应用于所有无穷序列,这一点可从这个事实中看出,即对于每一个有穷的二择一,与之相应的相对频率序列中必有至少一个这样的聚点存在。由于相对频率决不可能大于1,也不可能小于0,相对频率序列必定由1和0连结起来。而且作为一个无穷的连结起来的序列,它必须(根据著名的Bolzano和Weierstrass)至少有一个聚点。

  简而言之,与一个二择一α相应的相对频率序列的第一个聚点被称为“α的中频率(midddle frequency)”。因此,我们可以说:如果一个序列α有一个并且只有一个中频率,那么同时这就是它的频率极限;反之亦然:如果它没有频率极限,那么它就有不止一个中频率。

  将会发现中频率概念十分适合于我们的目的。正如前面p 是序列α的频率极限这一点是我们的估计——也许是假说性估计——一样,我们现在也可以使用p是α的中频率这一估计。而且假如我们采取必要的预防措施,我们能够借助这些估计的中频率进行计算,类似我们用频率极限计算一样。此外,中频率概念可应用于所有可能的无穷参考序列,没有任何限制。

  如果我们现在试图把我们的符号αF’(β)解释为中频率,而不是频率极限,并且我们因而改变客观概率的定义(第59节),我们的公式大多数仍然是可推导的。然而有一个困难:某一中频率不是惟一的。如果我们估计或推测一个中频率是αF’(β)=p ,那么这不排除αF’(β)有除了p以外的值。如果我们假定这并非如此,那就不言而喻要引入收敛公理。如果在另一方面,我们定义客观概率无需这种具有惟一性的假定,那么我们就获得(至少在第一个例子中)一个模棱两可的概率概念;因为在某些条件下一个序列可同时拥有都是“绝对自由的”若干中频率。但是这是难以接受的,因为我们习惯于用不含糊的或惟一的概率;也就是假定在同一参考序列内对于同一性质,可能有一个,并且只可能有一个概率p。

  然而,无需极限公理定义惟一的概率概念的困难是容易克服的。我们可引入惟一性要求(毕竟是最自然的程度)作为最后一步,在假定了序列将是“绝对自由的”以后。这使我们对我们的似机遇序列定义以及客观概率定义提出下列修改作为对问题的一种解决办法。

  设α为一个二择一(有一个或数个中频率)。设α的1有一个或只有一个“绝对自由的”中频率p;于是我们说α是似机遇或随机的,并且p是1在α内的客观概率。

  这有助于把这个定义分为两个公理性要求。

  (1)随机性要求:对于似机遇的二择一,至少必须有一个“绝对自由的”中频率,即它的客观概率p。

  (2)惟一性要求:对于同一似机遇的二择一的同一性质,必定有一个且只有一个概率p。

  前面建构的实例保证了这个新公理系统的无矛盾性。有可能建构不具有频率极限的序列,虽然它们有一个且只有一个概率。这表明新的公理要来实际上比老的更广泛,更不确切。如果我们以下列形式陈述(如我们可以陈述的那样)我们的老公理,这个事实甚至会变得更加明显:

  (1)随机性要求:如上。

  (2)惟一性要求:如上。

  (2’)收敛公理:对于同一似机遇二择一的同一性质除了它的概率p外不存在其他中频率。

  我们可从建议的要求系统中演绎出Bernoulli定理,以及同它一起的经典概率计算定理。这就解决了我们的问题:现在有可能在频率理论的框架内演绎出大数定律,而无需利用收敛公理。此外,不仅第61节公式(1)和Bernoulli定理的文字表述仍然不变,而且我们给予它的解释也仍然不变:在一个没有频率极限的似机遇序列情况下,几乎所有足够长的序列表明与p只有小的离差,这仍然是正确的。在这些序列中(正如在有频率极限的似机遇序列一样)具有拟发散行为的任何长度的节段,也就是与p的离差有任何量的节段,当然不时会出现。但是这些节段比较罕见,因为它们必定被其中所有的(或几乎所有的)节段具有拟收敛行为的序列极端长的部分所补偿。正如计算所表明的,这些延伸部分一定会比它们补偿的具有发散行为的节段长几个数量级。

  这也就是解决“机遇理论基本问题”(在第49节就是这样称呼的)的地方。从单个事件的不可预测性和不规则性到概率计算规则对这些事件的可应用性,这看起来自相矛盾的推论实际上是可靠的。假如根据这样一个假说性假定,即在根据先行者所作的任何选择中只出现一个循环的频率——“中频率”——因而没有后效发生,我们就能够以相当的逼近度来表示不规则性。因为根据这些假定,有可能证明大数定律是重言的。坚持这样的结论,即在可以说任何事情在这时和那时都会发生的——虽然某些事情的发生只是罕见的——不规则序列中,某种规则性或稳定性将出现在十分大的子序列中,这是可以允许的,并非自相矛盾的(有人有此主张)。这个结论也不是不重要的,因为为了这个结论我们就需要特殊的数学工具(Bolzano和Weierstrass定理,n-自由度概念,以及Bernoulli定理)。当我们知道,不规则性的假定可以置于某种频率假说(不受后效约束的假说)的形式中,并且知道,如果我们要证明从不可预测性到可预测性,从无知到知识的推论的可靠性,它就必须置于这种形式中,那么这种推论外表的自相矛盾就消失了。

  现在已变得很清楚,为什么老的理论不可能适当处理我所说的“基本问题”。大家承认,主观理论能够演绎出Bernoulli定理;但是在大数定理时兴以后它决不能用频率前后一致地解释它(参阅第62节)。因此它决不能说明概率预测统计学上的成功,另一方面,老的频率理论,根据它的收敛公理则明确要求有规则性。因此在这个理论内不会有从小规模的不规则性推论到大规模的稳定性问题,因为它只涉及从大规模的稳定性(收敛公理)同小规模的不规则性(随机公理)结合在一起,推论到大规模的特殊形式的和稳定性(Bernoulli定理,大数定律)。

  收敛公理不是概率计算基础的一个必要部分。我用这个结果来结束我的数学计算分析。

  现在我们回来考虑性质截然不同的方法论问题,尤其是如何判定概率陈述问题。

  65.可判定性问题

  无论我们可给概率概念下什么定义,或我们选择什么样的公理表述:只要二项式公式在系统内是可推导出来的,概率陈述就是不可证伪的。概率假说并不排除任何可观察的东西;概率陈述不可能同一个基础陈述发生
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架