实验心理学TXT第79部分小说阅读和下载-策策文学

芸芸视频水久联系方式㈣：747883097　TL：028　8104　2202网址：http：／／7
推荐：北京师范大学心理学专业20门主干课程DS视频图文并茂，音质圆润，
　　●
47883097　qzonf　qq　
提供试看　　期待咨询　　　　／435
　　　　。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。J！。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。．一
第十二章个飘差异s发最f
　　　　一个可以是任何性别的询问者（C）。询问者呆在一个远离其余
　　　　两人的房间里。询问者的比赛目标是确定另两个人中谁是男人
　　　　和谁是士人。他（询问者）只知道他们是X和Y，在比赛结束
　　　　时，他或者说“X是A，Y是B”，或者说“X是B＋Y是Ap。允许
　　　　询问者向他们提出诸如此类的问题：
　　　　c：x愿意告诉我他或她头发的长度吗？现在假定X确实
　　　　是A，那么A必须回答。A的目标是努力让C作出错误的辨
　　　　认。他的回答可能因此是“我的头发是后短侧长的发式，最长的
　　　　约九英寸。”
　　　　为了不泄露A和B的语调信息，所以答案是用文字表述
　　　　的＋可以手写，不过最好是打印的。理想的安排是用电传抒字机
　　　　在两个房间沟通。或者，通过中间人重复问题和答案。B的比
　　　　赛目标是帮助询问者。她的最好蓑略是给出真实的答案。她可
　　　　以附加诸如“我是一个女人，不要听信他的！”之类的信息到她的
　　　　答案中，但是由于A（男人）也会做出类似的回答，所以她的帮助
　　　　将无济于事。
　　　　我们现在提问：“当一台机器取代比赛中A的位置时，会发
　　　　生什么？”机器参加后所有的比赛规则和步骤都与上述相同，那
　　　　幺询问者的错误率套改变吗？这些问题又回到了我们最初的问
　　　　题#“机器能思考吗？”（图林，1950，ppt　433434）
　　　　模仿比赛通常也被称为图林测验。假设，这个测验能够确定是
否机器、计算机或者别的什么东西有智力。有关机器智力的判明标
准在图林的测验中被具体提出了：如果一个询问者与一台机器分开，
并且一个人不能辨认出它们回答问题的印月Ⅱ答案，那么可以说一台
机器是有智力的。更坦白地说，一台机器的输出能够模仿一个人时，
这台机器就拥有智力。
　　　　图林指出，至少原则上，在模仿比赛中的机器可以被看作一个
人。对于许多心理学家和计算机科学家来说，图林测验在智力的判
明上是有效的。在一些支持图林测验的观点的基础上，有关人工智
能（AI）可能存在的信念已经广为流传了。关于AI有两种菩遍的观
　　　　：㈣：　747883097　TL。　028　8194　2202日址：http：　i1747883097　qzone　qq　
436／嚣翠嚣磊黩蓊登霉
　　　　，理学专业20门主干课程DS视频图文并茂，音质圆润，提供试看　　期待咨询
　　　　／实验心理学
一
L■
点（　Searle，1980）。第一种被称为强AI．它完全遵照图林的意图，认
为机器能够拥有智力。换言之，强AI观点认为，机器可能会拥有像
人一样的被称为智力的认知状态。这种认知状态可以在操纵机器的
程序中找到。此种观点的智力只是程序中形式符号的操纵。AI的
第二种类型被称为弱AI，它涉及用计算机程序对人类智力的模拟。
它是通过计算机程序的手段来检验认知理论的。弱Al方法没有引
起更多的反对，我们也不想在这儿讨论它。而是代之以集中讨论强
AI，因为它引发了大量的争论。
　　　　操作定义
　　　　图林测验已经被许多人从积极的意义上接受了，因为它有两个
重要的特征。第一个是，以模仿比赛为手段来评估机器智力时用了374
一个实验；是否询问者相信一台机器等同于一个人。第二个特征对
于我们的目的尤其重要。图林所描述的实验产生了一个操作定义。
　　　　操作定义在第6章以阚限概念为例被讨论了。操作定义是建造
如智力等结构的一个规则，通遗这个规则的使用其他的科学家也可
以产生和测量该结构从而重复以往的研究。饥饿的一个操作定义是
先在一段时间内不让狗吃食物，之后再测量它会吃多少食物。类似
地，根据图林的智力操作定义，我们可以把智力的产生看成能够回答
问题的机器程序，并且还可以用回答引发的欺骗量来测量智力。这
似乎是个完全可接受的操作定义，那么它为什么仍引起了如此多的
争论呢？
　　　　图林测验被反对的根本原因是，操作定义在原则上可靠，但它们
却未必有效。一个操作定义的主要价值在于增进沟通。因此，如果
某人宣称机器有智力，那么只是意味着这台机器通过了图林测验这
一事实＋此外大概一无所长了。
　　在表述的清晰性方面，图林测验显然是很好的。一贯（即可信
地）产生图林所指的智力的必要条件被明确给出了。但是，关于强
AI的争论集中在，是否图林测验充分反映了我们叫做人的智力的东
西。因此，在图林测验能否标志智力这一效度方面的问题上有着许
””””4…”…　　　　／437
提供试看　　期待咨询
寨十二章个鼬差异s发展f
多的反对意见。本文中欢度是指定义的真实或可靠。图林测验定义
的是智力，还是别的什么东西？计算机引发的欺骗量能够反映智
力吗？
　　　　最近操作定义总是被局限在它们的可应用性上，即它们的效度
方面。重新思考一下前面提出的饥饿的操作定义：禁食一段时间并
观察之后的食物摄人量。这能充分说明我们所指的饥饿吗？可能没
有。人类的进食有很多原因，与食物剥夺有关的只是其中之一。有
时我们吃饭是为了社交；有时我们吃饭是因为我们特别想吃某类食
物；有时我们吃饭是因为我们已经几个小时没进食了。而且，上述操
作定义是不对称的，因为不吃并不意味着我们的胃是满的。有时我
们不吃是因为我们的胃不适；有时我们不吃是因为我们正在努力减
肥｛有时我们不吃是因为我们刚刚已经吃过了。为了解释这些观察，
我们在表述饥饿的概念时，就需要把多元的操作定义融会贯通于同
一个理论中。我们不得不使用会聚操作（见第7和14章）。
　　　　对强A1的许多批评都与上述针对饥饿定义列出的类同。“机
器不是人。计算机能讲话吗？它能写诗吗？”图林预料到了一些批375
评，并相信它们将来能被解答——是的，一个计算机程序能够以一种
观寨者（询问者）分辨不出是人还是机器所为的方式做那些事情。正
如图林（1950）所说，“问答法几乎适宜于引进任何一个我们希望包括
的人类努力领域。我们不希望由于不能在选美中获胜而贬损机器的
无能＋也不希望由于同飞机的比赛中失利而贬损一个人。我们比赛
条件的不当使得这些无能或失利根本不相干。‘目击者’可能会吹
牛，可能会尽情地满足和炫耀他们的魅力、力量或英雄主义，如果他
们认为这样可取的话I但是询问者可能不需要实际的展示”（p_　435）。
一些批评以及图林对之的反驳或许是能通过观察与实验来解决的经
验方面的问题，但是，即使机器被发展得能做这些事情，仍然会出现
新的批评。现在我们讨论图林测验被度方面的批评。
中文房间
针对强AI可能性的一个主要讨论是由哲学家塞尔（1980，
∥润
雕圆
n质
h芷日
黠
吧文
船圉
。频
坞视
81
g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
臻●
芸荐
芸推
　　　　：㈣：　747883097　TL。　028　8194　2202日址：http：　i1747883097　qzone　qq　
438虞喜翠嚣磊黩享勰霉
　　　　，理学专业20门主干课程DS视频图文并茂，音质圆润，提供试看　　期待咨询
　　　　／实验心理学
1990）发起的，他的反对是关于图林测验的基本效度的。塞尔也用一
个假设的实验来支持他的论点。他让我们想像一个不懂中文的人。
为了便于讨论，让我们假设这个人就是你。体被隔离在一个房间里＋
并且在房间里放置了一本用你的母语写出的指导书，它明确规定了
当一张胡乱涂写的纸条塞进来时你应该做什么。这些指导语让你把
它们与房间中已有的一些卡片进行匹配。这些卡片上也有着一些不
同类型的线条。当你找到了指导语要求的卡片时，就把它们放到一
个槽里，咀便最后拿到房间外面。
　　　　你有所不知，这些卡片上写的是中文；而且你也不知道，你确实
正在按照要求用中文回答问题。这个假想的实验假设，你的指导语
足够详细以至于你能够充分地回答问题，尽管你根本不懂中文一一
你甚至不知道自己正在操纵着中文符号。因此，你正在参加的是图
林测验的一个变式，因为人们正在用中文问“这个房间”的问题（由此
得名中文房间），并且询问者应该不能区分你的答案和舍说中文人的
答案。你正在娴熟地操纵着一套形式符号，但这些符号对于你来说
没有任何意义。
　　　　塞尔相信，在一个真实的中文房间比赛中，你会通过图林测验
的。这意味着你在中文方面有才能和智力吗？塞尔的回答是不。虽
然你通过了图林测验，但你根本不理解中文。你的所作所为完全类
同于一个愚弄询问者使其相信是人而不是正在回答问题的计算机。
计算机程序很类似于你在中文房间中所操纵的符号；此外，与你相像
的还有，计算机_没有给符号赋予意义或理解。根据塞尔的观点＋这只376
能意味着图林测验是无效的，它不能证明机器有智力。
　　塞尔叉进一步论证了他的观点。他提出真正的理解需要一个在
实验情境中有着因果推理能力的大脑。休不可能像理解你的母语那
样去理解中文，因为你不能生成它。对于中文来说，所有你能够做
的，与在“智力”活动中一台机器所能做到的一样，就是遵照指导语去
操纵符号。塞尔（1990）指出，有生理基础的人脑或许不是能够思维
的惟一机器；但他又指出，创造人工思维的机器的可能性是“不存
在的”。
47883097　qzonf　qq　
㈣试看躺咨询　　　　　/439
　　　　塞尔中文房间的讨论及其有关大脑的观点并非没遇到过挑战
（见Churchland和Churchland，1990）。基本问题似乎是：什么可咀
作为智力的充分测验？只能操纵符号的装置的行为算作智力吗？强
Al的回答是算。塞尔的回答是不算——一个模拟中文说话的程序
是不理解中文的＋就像一个模拟消化的程序不能真正消化食物一样。
　　　　定义智力
　　　　仿；现在可能要问，“智力还有其他的被广为接受的操作定义吗？”
其简短回答是没有。在这里，我们将探讨一些智力的其他定义和与
操作定义概念有关的附加问题。
　　　　你可能已经注意到了，当我们在本章的第一部分讨论信度时，我
们没有定义智力。这是因为测验的发起者常常有一个当时实用的问
题。比纳只是想要确定法国学校学生适当的等级水平。在这些实用
的情境中，测验的效度是由某一标准决定的，比如在校就读的成功。
事实上，斯坦福一比纳和韦克斯勒测验在预测学业成绩方面做得很
好。因此，你可能想说，如果智力测验有很好的效标效度（测验预测
学业成绩）的话，那么智力就是测验测量的东西。但这个问题是两面
的。一方面，大多数智力测验集中在数学和言语能力上，以至于它们
忽略了色括音乐能力和理解他人能力在内的其他种类的重要智力活
动；另一方面，从学业角度定义智力能力常常被看作是一个狭隘的和
有文化偏差的智力定义方式。典型的IQ测验并不能测量出一个人
的成功和环境适应能力。按照一些批评家的观点，IQ测验反映的是
上、中层白人的价值，而不反映智力对整个社会意味着什么。因此，
争论一直存在，人们的IQ分数可能也与常识或有效率的生活没什
么关系。而且＋即使人们是高教的并且有常识，他们的IQ分数仍不377
会预测他们在另一个情境中的成功，比如在沙漠中存活下来或在丛
林中保护了自己并得以谋生。
　　　　因此，把智力的定义确定为智力测验所测量的并接受下来并不
能解决许多问题。把智力局限在专门技术的范围内，很可能会遭致
一般公众的反对，因为他们的关于什么是智力的概念与之不同
∥润
雕圆
n质
h芷日
黠
吧文
船圉
。频
坞视
81
g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
撬●
芸推
一
U
：　747883097　TL

《实验心理学》

下载本书

实验心理学- 第79部分