《12小时mba教程》

下载本书

添加书签

12小时mba教程- 第23部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!

说,即要保证随机抽选的样本,对所有有选举权的人组成的总体具有代表性。 

个相反的典型例子是:在预测 1948年美国总统大选结果时,由于选取了不具 

有代表性的样本,导致偏差增大,致使预测失败。实际上,在那次大选中, 

真正当选的是杜鲁门,而预测的却是戴维。 



     检验的有效性和可靠性 

     检验的有效性是指对所要研究的变量能准确地加以度量;检验的可靠性 

是指在多次检验中,同样的结果能反复出现。而有的时候,检验的结果可能 

无效并且不可靠。更危险的情况却是结果表明出可靠性,但实际上却是无效 

的。例如,由于社会文化等方向的影响,一些研究人员设计出对妇女地位不 

公平的问卷,即使某项关于妇女的调查结果反复出现(表现出其可靠性),但 

它却是无效的,因为从一开始它就有偏差,无法做到准确度量。 

     本章中所列举的检验方法,有助于我们分析数据并得出结论。这些检验 

都有量化的标准,如 t 值用于t 一检验(t—test),F 用于变化。一般数理统 

计书后都附有统计检验值表。用计算结果和检验值进行比较,可以得到有用 

的结论。例如,我们可能会得出结论说,所检验的某种关系非常强或者很显 

著,这个结果在某种程度上证实了我们的假设。 

     但是,检验的结果落在什么范围内才算是可靠的呢?换句专业术语说就 

是:误差界限或置信区间是什么?误差界限和置信区间通常用概率值来表 

示,有三种形式: 

     P≤0。01,表明某结果出现的可能性不少于99%,其误差不超过1%; 

     P≤0。05,表明出现某结果的可能性不少于 95%,其误差不会 1 超过 5 

%; 

     P≤0。1,表明出现某结果的可能性不少于90%,其误差不会超过10。 

     选择哪种置信区间要视情况而定。例如,对探索性研究和关键性、决定 

性的研究,可能选取不同的置信区间。如果实际一些的话,前者用P≤0。05; 

后者用P≤0。01。(如果我们想提高置信度、降低误差限,就必须抽取较大的 

样本,而这样做很可能会既不经济又费时间)。相反,如果你是一个挑剔的消 

费者,去小贩那里买东西,你所选择的置信区间,就要用 P≤0。01,而不是 

用P≤0。05 了。因为前者更符合你挑剔的目的。 



     频率分布 

     在进行数据分析时,我们感兴趣的是数据(观察值)集中或者离散、相似 

或者差异的程度。数据的波动程度是指数据的离散度,可以用图形来表示, 

即图形分布。 


… Page 137…

     图形分布大致可分为三类: 



     (1)对称分布(正态分布) 

     对称分布的图形如钟形(见图 6—1)。大多数观察值落在图形的中部,其 

他的均匀分布在两边。例如人的身材,过于矮小和过于高大的人,在整个人 

群中所占的比例极小;较为矮小和较高大的人占较大的比例;而中等身材的 

人占最大的比例。所以,我们说,人的身材的比例分布基本上属于对称分布。 



     (2)偏斜分布 

     偏斜分布的图形如图 6—2所示。它是指大多数观察值分布在一边(或说 

聚集在一边),而较少数处于另一边。它又有两种形态:一种是如图6—2 

     (a)所示的向下偏斜;另一种是图 6—2(b)所示的向上偏斜。例如,假定 

两个群均以图6—2 的横轴代表收入水平,收入水平从低到高排列,假设两群 

体中所拿最低收入相同,最高收入也相同。纵轴代表拿某种收入人数的话, 

那么就可以看出,图 6—2(b)所代表的群体;比 6—2(a)所代表的群体要富 

裕。 



     (3)双峰分布 

     这种图形的形状像驼峰,见图 6—3。它表明观察值形成为两个集中区 

域。例如某班级考试的成绩,得较低分数和较高分数的人都较多,只有少数 

人得中等分数,所以形成双峰分布。 


… Page 138…

                        三、最主要的统计度量方法 



     总体中观察值的分布状况,可以用分布图很好地表现出来。另外还有一 

些测度方法可以反映观察值的分布信息,它们包括: 



     集中趋势的度量 

     (1)平均值 

     平均值是所有观察值的和与观察值个数的比值。例如有 7个销售商(观察 

值个数为 7),他们在6 月份各自销售的产品数量为1、9、10、12、13、17、 

17,那么6 月份平均每人销售产品数为 



                1+9+10+12+13+17+17             79 

                                            =     = 11。28(个) 

                             7                 7 

     如果我们是销售商的管理者,就会用他们 6 月份的平均人销售量同以前 

的月份相比,看看是否具有某种趋势。平均销售量比总销售额更能反映销售 

能力和盈利能力。因为有时销售总额高,并不表明销售人员干得好,而可能 

是因为增加了销售人员的缘故。如果明年六月有 14个销售人员,比今年六月 

多 1倍,而总销售额只比今年增长 50%,尽管销售收入增加了,但其盈利能 

力实际却在下降。这说明有时平均值比总值更能反映问题的实质。但平均值 

极易受极端值的影响。 



     (2)中位数 

     将所有观察值由低到高排序,处于中间位置的观察值即为中位数。中位 

数是位置平均数,它把整个序列分成两半:一半比它小;另一半比它大。对 

                                     N+1 

于奇数个观察值,中位数所在位置是                           (N为观察值总数);对于偶数个观 

                                       2 

察值,中位数的值等于中间位置两个观察值的平均值。如上例中,7 个销售 

                            7+1 

商销量的中位数所在位置是                      =4,即销售1:2 个为中位数(1、9、10、 

                              2 

 〔12〕、13、17、17——译者注)。 

     中位数的优点是不受极端值的影响。在上例中,有一个人6 月份仅销出 

1件产品,远低于其他 6 人,属于极端值。中位数只考察观察值的位置,只 

要中间项不变,其前后各项数值虽有变化,但中位数不变。所以,中位数同 

平均值相比,掩盖了存在个人销量极低(即极端值——译者注)的事实。 

     究竟用平均值还是中位数作为平均数,视情况而定。如在上例中,一个 

勇于迸取的管理者,在给销售人员下指标时,一般会倾向于选择使用中位数。 

相反,如果那个销售人员不是销出 1件,而是销出35件产品,则管理者在他 

给上司的报告中,就愿意使用平均值,以表明他所领导的部门的突出业绩。 

因为此时,中位数仍是12个,而平均值则为: 



                35+ 9 + 10+ 12 + 13+ 17 + 17  113 

                                            =     =16。6(个) 

                             7                 7 



     (3)众数 


… Page 139…

     众数是指在所有观察值中,出现次数最多的那个观察值。例如,在 7个 

销售人员的销售记录中,17 出现了两次,则 17就是众数(1,9,10,12,13, 

 〔17〕, 〔17〕。如果观察值数列中各值皆不相同,也就没有众数。 

     众数有助于确定需优先考虑的事物和今后需加努力的重点。在市场战略 

决策中经常要使用它。例如,为了最有效地利用有限的资金,皮鞋厂在生产 

皮鞋时,需要了解各种尺码鞋的需求量,以决定生产什么尺码及生产的数量, 

这时,就需要用众数,而不是平均值。 

     集中趋势需采用何种平均数度量,要视现象的分布及特点而定。 



     离散趋势的度量 



     (1)极差 

     极差是最粗略的离散程度度量方法,是指观察值中最大值与最小值之 

差。我们仍用前述销售人员的例子,最大、最小销量分别是 17和 1,则极差 

为 17-1=16。 

     极差是计量离差的简便方法,它由两个极端值来决定,所以容易受到极 

端值变化的影响,而与中间数值的分布无关。因而它不能充分地反映现象的 

实际差异。 



     (2)标准差 

     标准差是计量离散趋势最重要、也是最常用的指标。它反映了各个观察 

值偏离平均值的程度。其计算公式为: 



                                      A(X  … x )2 

                           标准差 = 

                                           N 

 式中:x  =平均值 

        X=实际观察值 

        N=观察对象的个数 

     此公式用于计算总体标准差,在计算随机样本的标准差时,公式中要以 

N—1来代替N,这样,样本标准差才是总体标准差的无偏估计。 

     标准差计算示例(1) 

     我们仍用前面的例子,共有 7个销售商,各人销量分别为:1,9, 10, 

12,13,17,17,平均值为11。28。那么标准差的计算过程如下表6—1所示。 



     表 6—1 


… Page 140…

                                                                   2 

                                            x                   x 

                                    (X)    (  )             (X…  ) 

   第一位销售商卖了 1件产品                   1…11。28 =…10。28          平方后= 105。68 

      二               9            9…11。28 =…2。28           平方后= 5。2 

      三               10           10…11。28 =…1。28          平方后= 1。64 

      四               12           12…11。28 =0。72           平方后= 0。52? 

      五               13           13…11。28 =1。72           平方后= 2。96 

      六               17           17…11。28 =5。72           平方后= 32。72 

      七               17           17…11。28 =5。72           平方后= 32。72 

   N— 7                                                     181。44 

      A(X  … x)2      181。44 

                  =          =  25。92 = 5。09 

          N             7 



     经过上述计算,标准差为5。09。 

     一般来说。计算标准差比较复杂,在数据很多的情况下,没有人用手工 

计算。在所有MBA 教程中的数学公式,都可用计算机计算,你只要输入原始 

数据就行了。 



     中心极限定理 

     为评价标准差指标的价值,我们首先应当了解它在中心极限定理中的意 

义。(中心极限定理:对于任意一个平均数为μ标准差为σ的总体进行随机抽 

样时,随着样本量 N 的增大,样本平均数x  就趋向子正态分布,其平均数为 

x  ,山标准差为σ/  n 。中心极限定理说明无论是从正态分布总体,还是从 

非正态分布总体中抽样,只要样本容易足够大,其样本平均数也趋向正态分 

布——译者注)请记住以下的叙述: 

     (1)无论任何分布(正态的或是其他的),其样本平均值都非常接近总体平 

均值。 

     (2)为了对总体有代表性,样本量至少为30。 

     (3)在所有观察对象中(见图 6—4): 

     34%落在平均值上方第一个 “部分”内; 

     34%落在平均值下方第一个 “部分”内; 

     13%落在平均值上方第二个 “部分”内; 

     13%落在平均值下方第二个 “部分”内; 

     3%落在平均值上方第三个 “部分”内; 

     3%落在平均值下方第三个 “部分”内。 

     (4)上面所指的 “部分”,就是标准差。 

     如果你是一位经理,管理着 100位销售人员,
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架