12小时mba教程TXT第23部分小说阅读和下载-策策文学

说，即要保证随机抽选的样本，对所有有选举权的人组成的总体具有代表性。　

个相反的典型例子是：在预测　1948年美国总统大选结果时，由于选取了不具　

有代表性的样本，导致偏差增大，致使预测失败。实际上，在那次大选中，　

真正当选的是杜鲁门，而预测的却是戴维。　

　　　　　检验的有效性和可靠性　

　　　　　检验的有效性是指对所要研究的变量能准确地加以度量；检验的可靠性　

是指在多次检验中，同样的结果能反复出现。而有的时候，检验的结果可能　

无效并且不可靠。更危险的情况却是结果表明出可靠性，但实际上却是无效　

的。例如，由于社会文化等方向的影响，一些研究人员设计出对妇女地位不　

公平的问卷，即使某项关于妇女的调查结果反复出现（表现出其可靠性），但　

它却是无效的，因为从一开始它就有偏差，无法做到准确度量。　

　　　　　本章中所列举的检验方法，有助于我们分析数据并得出结论。这些检验　

都有量化的标准，如　t　值用于t　一检验（t—test），F　用于变化。一般数理统　

计书后都附有统计检验值表。用计算结果和检验值进行比较，可以得到有用　

的结论。例如，我们可能会得出结论说，所检验的某种关系非常强或者很显　

著，这个结果在某种程度上证实了我们的假设。　

　　　　　但是，检验的结果落在什么范围内才算是可靠的呢？换句专业术语说就　

是：误差界限或置信区间是什么？误差界限和置信区间通常用概率值来表　

示，有三种形式：　

　　　　　P≤0。01，表明某结果出现的可能性不少于99％，其误差不超过1％；　

　　　　　P≤0。05，表明出现某结果的可能性不少于　95％，其误差不会　1　超过　5　

％；　

　　　　　P≤0。1，表明出现某结果的可能性不少于90％，其误差不会超过10。　

　　　　　选择哪种置信区间要视情况而定。例如，对探索性研究和关键性、决定　

性的研究，可能选取不同的置信区间。如果实际一些的话，前者用P≤0。05；　

后者用P≤0。01。（如果我们想提高置信度、降低误差限，就必须抽取较大的　

样本，而这样做很可能会既不经济又费时间）。相反，如果你是一个挑剔的消　

费者，去小贩那里买东西，你所选择的置信区间，就要用　P≤0。01，而不是　

用P≤0。05　了。因为前者更符合你挑剔的目的。　

　　　　　频率分布　

　　　　　在进行数据分析时，我们感兴趣的是数据（观察值）集中或者离散、相似　

或者差异的程度。数据的波动程度是指数据的离散度，可以用图形来表示，　

即图形分布。　

…　Page　137…

　　　　　图形分布大致可分为三类：　

　　　　　（1）对称分布（正态分布）　

　　　　　对称分布的图形如钟形（见图　6—1）。大多数观察值落在图形的中部，其　

他的均匀分布在两边。例如人的身材，过于矮小和过于高大的人，在整个人　

群中所占的比例极小；较为矮小和较高大的人占较大的比例；而中等身材的　

人占最大的比例。所以，我们说，人的身材的比例分布基本上属于对称分布。　

　　　　　（2）偏斜分布　

　　　　　偏斜分布的图形如图　6—2所示。它是指大多数观察值分布在一边（或说　

聚集在一边），而较少数处于另一边。它又有两种形态：一种是如图6—2　

　　　　　（a）所示的向下偏斜；另一种是图　6—2（b）所示的向上偏斜。例如，假定　

两个群均以图6—2　的横轴代表收入水平，收入水平从低到高排列，假设两群　

体中所拿最低收入相同，最高收入也相同。纵轴代表拿某种收入人数的话，　

那么就可以看出，图　6—2（b）所代表的群体；比　6—2（a）所代表的群体要富　

裕。　

　　　　　（3）双峰分布　

　　　　　这种图形的形状像驼峰，见图　6—3。它表明观察值形成为两个集中区　

域。例如某班级考试的成绩，得较低分数和较高分数的人都较多，只有少数　

人得中等分数，所以形成双峰分布。　

…　Page　138…

　　　　　　　　　　　　　　　　　　　　　　　　三、最主要的统计度量方法　

　　　　　总体中观察值的分布状况，可以用分布图很好地表现出来。另外还有一　

些测度方法可以反映观察值的分布信息，它们包括：　

　　　　　集中趋势的度量　

　　　　　（1）平均值　

　　　　　平均值是所有观察值的和与观察值个数的比值。例如有　7个销售商（观察　

值个数为　7），他们在6　月份各自销售的产品数量为1、9、10、12、13、17、　

17，那么6　月份平均每人销售产品数为　

　　　　　　　　　　　　　　　　1＋9＋10＋12＋13＋17＋17　　　　　　　　　　　　　79　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　＝　　　　　=　11。28（个）　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　7　　　　　　　　　　　　　　　　　7　

　　　　　如果我们是销售商的管理者，就会用他们　6　月份的平均人销售量同以前　

的月份相比，看看是否具有某种趋势。平均销售量比总销售额更能反映销售　

能力和盈利能力。因为有时销售总额高，并不表明销售人员干得好，而可能　

是因为增加了销售人员的缘故。如果明年六月有　14个销售人员，比今年六月　

多　1倍，而总销售额只比今年增长　50％，尽管销售收入增加了，但其盈利能　

力实际却在下降。这说明有时平均值比总值更能反映问题的实质。但平均值　

极易受极端值的影响。　

　　　　　（2）中位数　

　　　　　将所有观察值由低到高排序，处于中间位置的观察值即为中位数。中位　

数是位置平均数，它把整个序列分成两半：一半比它小；另一半比它大。对　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　N＋1　

于奇数个观察值，中位数所在位置是　　　　　　　　　　　　　　　　　　　　　　　　　　　（N为观察值总数）；对于偶数个观　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　2　

察值，中位数的值等于中间位置两个观察值的平均值。如上例中，7　个销售　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　7＋1　

商销量的中位数所在位置是　　　　　　　　　　　　　　　　　　　　　　＝4，即销售1：2　个为中位数（1、9、10、　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　2　

　〔12〕、13、17、17——译者注）。　

　　　　　中位数的优点是不受极端值的影响。在上例中，有一个人6　月份仅销出　

1件产品，远低于其他　6　人，属于极端值。中位数只考察观察值的位置，只　

要中间项不变，其前后各项数值虽有变化，但中位数不变。所以，中位数同　

平均值相比，掩盖了存在个人销量极低（即极端值——译者注）的事实。　

　　　　　究竟用平均值还是中位数作为平均数，视情况而定。如在上例中，一个　

勇于迸取的管理者，在给销售人员下指标时，一般会倾向于选择使用中位数。　

相反，如果那个销售人员不是销出　1件，而是销出35件产品，则管理者在他　

给上司的报告中，就愿意使用平均值，以表明他所领导的部门的突出业绩。　

因为此时，中位数仍是12个，而平均值则为：　

　　　　　　　　　　　　　　　　35＋　9　＋　10＋　12　＋　13＋　17　＋　17　　113　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　=　　　　　＝16。6（个）　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　7　　　　　　　　　　　　　　　　　7　

　　　　　（3）众数　

…　Page　139…

　　　　　众数是指在所有观察值中，出现次数最多的那个观察值。例如，在　7个　

销售人员的销售记录中，17　出现了两次，则　17就是众数（1，9，10，12，13，　

　〔17〕，　〔17〕。如果观察值数列中各值皆不相同，也就没有众数。　

　　　　　众数有助于确定需优先考虑的事物和今后需加努力的重点。在市场战略　

决策中经常要使用它。例如，为了最有效地利用有限的资金，皮鞋厂在生产　

皮鞋时，需要了解各种尺码鞋的需求量，以决定生产什么尺码及生产的数量，　

这时，就需要用众数，而不是平均值。　

　　　　　集中趋势需采用何种平均数度量，要视现象的分布及特点而定。　

　　　　　离散趋势的度量　

　　　　　（1）极差　

　　　　　极差是最粗略的离散程度度量方法，是指观察值中最大值与最小值之　

差。我们仍用前述销售人员的例子，最大、最小销量分别是　17和　1，则极差　

为　17－1＝16。　

　　　　　极差是计量离差的简便方法，它由两个极端值来决定，所以容易受到极　

端值变化的影响，而与中间数值的分布无关。因而它不能充分地反映现象的　

实际差异。　

　　　　　（2）标准差　

　　　　　标准差是计量离散趋势最重要、也是最常用的指标。它反映了各个观察　

值偏离平均值的程度。其计算公式为：　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　A（X　　…　x　）2　

　　　　　　　　　　　　　　　　　　　　　　　　　　　标准差　=　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　N　

　式中：x　　＝平均值　

　　　　　　　　X＝实际观察值　

　　　　　　　　N＝观察对象的个数　

　　　　　此公式用于计算总体标准差，在计算随机样本的标准差时，公式中要以　

N—1来代替N，这样，样本标准差才是总体标准差的无偏估计。　

　　　　　标准差计算示例（1）　

　　　　　我们仍用前面的例子，共有　7个销售商，各人销量分别为：1，9，　10，　

12，13，17，17，平均值为11。28。那么标准差的计算过程如下表6—1所示。　

　　　　　表　6—1　

…　Page　140…

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　2　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　x　　　　　　　　　　　　　　　　　　　x　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　（X）　　　　（　　）　　　　　　　　　　　　　（X…　　）　

　　　第一位销售商卖了　1件产品　　　　　　　　　　　　　　　　　　　1…11。28　＝…10。28　　　　　　　　　　平方后＝　105。68　

　　　　　　二　　　　　　　　　　　　　　　9　　　　　　　　　　　　9…11。28　＝…2。28　　　　　　　　　　　平方后＝　5。2　

　　　　　　三　　　　　　　　　　　　　　　10　　　　　　　　　　　10…11。28　＝…1。28　　　　　　　　　　平方后＝　1。64　

　　　　　　四　　　　　　　　　　　　　　　12　　　　　　　　　　　12…11。28　＝0。72　　　　　　　　　　　平方后＝　0。52？　

　　　　　　五　　　　　　　　　　　　　　　13　　　　　　　　　　　13…11。28　＝1。72　　　　　　　　　　　平方后＝　2。96　

　　　　　　六　　　　　　　　　　　　　　　17　　　　　　　　　　　17…11。28　＝5。72　　　　　　　　　　　平方后＝　32。72　

　　　　　　七　　　　　　　　　　　　　　　17　　　　　　　　　　　17…11。28　＝5。72　　　　　　　　　　　平方后＝　32。72　

　　　N—　7　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　181。44　

　　　　　　A（X　　…　x）2　　　　　　181。44　

　　　　　　　　　　　　　　　　　　=　　　　　　　　　　=　　25。92　=　5。09　

　　　　　　　　　　N　　　　　　　　　　　　　7　

　　　　　经过上述计算，标准差为5。09。　

　　　　　一般来说。计算标准差比较复杂，在数据很多的情况下，没有人用手工　

计算。在所有MBA　教程中的数学公式，都可用计算机计算，你只要输入原始　

数据就行了。　

　　　　　中心极限定理　

　　　　　为评价标准差指标的价值，我们首先应当了解它在中心极限定理中的意　

义。（中心极限定理：对于任意一个平均数为μ标准差为σ的总体进行随机抽　

样时，随着样本量　N　的增大，样本平均数x　　就趋向子正态分布，其平均数为　

x　　，山标准差为σ/　　n　。中心极限定理说明无论是从正态分布总体，还是从　

非正态分布总体中抽样，只要样本容易足够大，其样本平均数也趋向正态分　

布——译者注）请记住以下的叙述：　

　　　　　（1）无论任何分布（正态的或是其他的），其样本平均值都非常接近总体平　

均值。　

　　　　　（2）为了对总体有代表性，样本量至少为30。　

　　　　　（3）在所有观察对象中（见图　6—4）：　

　　　　　34％落在平均值上方第一个　“部分”内；　

　　　　　34％落在平均值下方第一个　“部分”内；　

　　　　　13％落在平均值上方第二个　“部分”内；　

　　　　　13％落在平均值下方第二个　“部分”内；　

　　　　　3％落在平均值上方第三个　“部分”内；　

　　　　　3％落在平均值下方第三个　“部分”内。　

　　　　　（4）上面所指的　“部分”，就是标准差。　

　　　　　如果你是一位经理，管理着　100位销售人员，

《12小时mba教程》

下载本书

12小时mba教程- 第23部分