人工智能的优缺点(人工智能的优缺点)
在早期,人类不得不用轮子和火等工具和武器来对抗自然。15世纪,古腾堡发明的印刷机广泛改变了人们的生活。19世纪,工业革命利用自然资源发展电力,推动了制造业、交通运输业和通讯业的发展。20世纪,通过对天道空和太道空的探索,通过计算机的发明和小型化,人类成为了个人电脑、互联网、万维网和智能手机,并不断向前发展。60年来,我们见证了一个世界的诞生,这个世界出现了海量的数据、事实和信息,这些数据、事实和信息必须转化为知识(一个例子是人类基因编码中包含的数据,如图1.0所示)。介绍了人工智能的概念框架,阐述了人工智能的成功应用领域和方法、近期历史和未来展望。
图1.0人类基因编码中包含的数据
人工智能的定义
在日常语言中,“人造”一词的意思是合成的,通常有否定的意思,即“人造物体的质量不如自然物体”。然而,人造物体通常优于真实或自然物体。例如,人造花是由丝和线制成的像芽或花一样的物体,不需要阳光或水分作为营养,但可以为家庭或公司提供实用的装饰功能。
虽然人造花可能感觉不如天然花好,但它们看起来就像真花一样。
另一个例子是由蜡烛、煤油灯或电灯泡产生的人造光。显然,只有当太阳出现在天空空时,我们才能获得阳光,但我们可以随时获得人造光。从这个角度来看,人造光优于自然光。
最后,考虑到人工交通工具(如汽车、火车、飞机和自行车)与跑步、步行和其他自然交通方式(如骑马)相比,在速度和耐用性方面具有许多优势。然而,人工交通也有一些明显的缺点——地球上无处不在的高速公路,充满汽车尾气的大气环境,人们内心的平静(和睡眠)经常被飞机的噪音打断。
就像人造光、人造花和交通一样,人工智能不是自然的,而是人工的。要确定人工智能的优缺点,首先要了解和定义智能。
在想什么?什么是智力?
智能的定义可能比人工定义更难以捉摸。r .斯腾伯格对人类意识的主题给出了如下有用的定义:智力是个体从经验中学习、理性思考、记住重要信息和满足日常生活需要的认知能力。
我们都熟悉标准化测试,例如,给定以下系列:1、3、6、10、15、21。询问下一个号码。
您可能会注意到连续数字之间的差异间隔是1。比如1到3的差是2,3到6的差是3,以此类推。所以这个问题的正确答案是28。这个问题旨在衡量我们识别模式中突出特征的熟练程度。我们通过经验发现模式。
按照以下顺序试试你的运气:
a.1,2,2,3,3,3,4,4,4,4,?
b.2,3,3,5,5,5,7,7,7,7,?
既然您已经定义了智能,那么您可能会有以下问题。
(1)如何判断某些人(或事物)是否有智力?
(2)动物聪明吗?
(3)如果动物有智力,如何评价其智力?
大多数人都能轻松回答第一个问题。我们通过与他人交流(如发表评论或提问)来观察他们的反应,并每天多次重复这个过程来评估他们的智力。虽然我们不直接进入他们的思想,但我们相信间接的问答方式可以为我们提供对内部大脑活动的准确评估。
如果坚持用问答的方式评价智力,如何评价深圳生物的智力?如果你有宠物,你可能已经有答案了。小狗似乎记得一两个月没见的人,迷路后也能找到回家的路。
小猫经常在吃饭的时候听到开罐头的声音会很兴奋。这只是一个简单的巴甫洛夫反射,还是小猫有意识地把罐头的声音和晚餐的快乐联系起来?
关于动物智力有一个有趣的轶事:大约在1900年,德国柏林有一匹马,名叫“聪明的汉斯”,据说它精通数学(见图1.1)。
图1.1“聪明的汉斯”——马做微积分?
当汉斯加上或算出平方根时,观众都惊呆了。从那以后,人们发现汉斯没有观众就不会表现好。事实上,汉斯的天才在于他识别人类情感的能力,而不是他对数学的掌握。
马通常有敏锐的听觉。当汉斯接近正确答案时,观众变得相对兴奋,心跳加速。也许汉斯有一种惊人的能力来检测这些变化并得到正确的答案。虽然你可能不愿意把汉斯的行为归因于智力,但在得出结论之前,你应该参考斯腾伯格对智力的早期定义。
有些生物只显示群体智能。比如蚂蚁是一种简单的昆虫,单只蚂蚁的行为在人工智能学科中很难分类。另一方面,蚁群表现出非凡的解决复杂问题的能力,比如找到从巢穴到食物来源的最佳路径、搬运重物和形成桥梁。集体智慧源于个体昆虫之间的有效交流。在第12章中,当讨论高级搜索方法时,新兴智能和集群智能将被讨论得相对更多。大脑的质量和大脑与身体的质量比通常被认为是动物智力的指标。海豚在这两个指标上与人类相当。海豚的呼吸是自控的,这可以说明它们的大脑太重了,也可以说明一个有趣的事实,那就是海豚的两个半球交替睡觉。
在动物自我意识测试中,比如镜子测试,海豚得到了很好的分数,它们意识到镜子里的图像实际上是自己的图像。海洋世界等公园的游客可以看到海豚会玩复杂的把戏。这表明海豚有记忆序列和完成复杂身体动作的能力。
使用工具是智力的另一块“试金石”,经常被用来区分直立人和以前的人类祖先。海豚和人类有着共同的特征。例如,海豚在觅食时使用深海海绵(一种多细胞动物)来保护它们的嘴。显然,智力不是人类独有的特征。在某种程度上,许多生命形式是智能的。
你应该问自己以下问题:“你认为拥有生命是拥有智慧的必要前提吗?”或者“无生命的物体,比如电脑,能有智能吗?”人工智能宣称的目标是创造与人类思维相当的计算机软件和/或硬件系统,换句话说,就是展示与人类智能相关的特征。一个关键问题是“机器会思考吗?”更一般地说,你可能会问:“人类、动物或机器有智能吗?”
在这个节点上,强调思维和智力的区别是明智的。思维是推理、分析、评估和形成想法和概念的工具。不是所有的思维对象都有智力。智力可能是高效和有效的思维。很多人对这个问题有偏见。他们说:“电脑是由硅和电力组成的,所以他们不会思考。”或者走向另一个极端:“电脑的表现比人快,所以它们的智商也比人高。”真相可能存在于这两个极端之间。
正如我们已经讨论过的,不同的动物物种有不同程度的智力。我们将描述在人工智能领域开发的软件和硬件系统,它们也有不同程度的智能。我们不太重视评估动物智能,也没有开发标准化的动物智能测试,但我们对确定机器智能是否存在的测试非常感兴趣。
也许拉斐尔的说法是最恰当的:“人工智能是一门允许机器完成人类需要智能才能完成的事情的科学。”
图灵测试
在前一节“你如何确定智力”和“动物有智力吗?”这两个问题都解决了。第二个问题的答案不一定是简单的“是”或“不是”——有些人比别人聪明,有些动物比别人聪明。机器智能也遇到了同样的问题。
艾伦·图灵寻求可操作的方法来回答智能问题,想把功能(智能能做什么)和实现(如何实现智能)分开。
补充信息
抽象是一种策略,它忽略了对象或概念(如内功)的实现,从而可以更清晰地了解工件及其与外界的关系。换句话说,您可以将这个对象视为一个黑盒,只关注对象的输入和输出(参见图1.2)。
图1.2黑盒的输入和输出
一般来说,抽象是一个有用且必要的工具。比如你想学开车,把车当黑匣子可能是个好主意。你不必一开始就研究自动变速箱和动力传动系统,但你可以专注于系统输入,如油门踏板、刹车、转向信号灯和输出,如前进、停止、左转和右转。数据结构的过程中也用到抽象,所以想要知道栈的行为,可以把重点放在基本的栈操作上,比如pop (pop)和push (insert),而不要陷入如何构造列表的细节中(比如是使用线性链表还是循环链表,或者是使用链表还是连续分配空)。
图灵测试的定义
艾伦·图灵提出了两个模拟游戏。在模拟游戏中,一个人或实体的行为就像是另一个人。在第一个模拟游戏中,一个人在一个中间有窗帘的房间里。窗帘两边各有一个人,一边的人(称为审讯者)必须确定另一边的人是男是女。提问者(性别无关)通过提出一系列问题来完成这项任务。游戏假设男人可能会在他的回答中撒谎,而女人总是诚实的。为了使询问者无法从发音中确定性别,用电脑交流代替说话,如图1.3所示。如果帷幕的另一边有一个人,他成功地欺骗了询问者,那么他就赢了。
图1.3第一款图灵模拟游戏
图灵测试最初的形式是一男一女坐在窗帘后面,询问者必须正确识别他们的性别(图灵可能是受到那个时代流行游戏的启发,发明了这个测试。这个游戏也促使他去测试机器智能。正如埃里希·弗洛姆所写[8]:男女平等,但不一定相同。比如不同性别的人对颜色和花的认识不同,购物的时间也不同。区分男女和智力问题有什么关系?图灵认为可能存在不同类型的思维,理解和包容这些差异非常重要。图1.4显示了图灵测试的第二个版本。
图1.4第二个图灵模拟游戏
第二个游戏更适合人工智能的研究。问询者还在有窗帘的房间里。这一次,窗帘后面可能会有一台电脑或者一个人。这里的机器扮演着男人的角色,偶尔也会撒谎,但人们总是诚实的。询问者提出问题,然后评估答案,以确定他是与人交流还是与机器交流。如果一台计算机成功欺骗了查询者,它将通过图灵测试,因此被认为是智能的。
众所周知,在进行算术计算时,机器比人类快很多倍。如果窗帘后面的“人”能在几微秒内得到三角函数泰勒级数的近似结果,就可以很容易地识别出窗帘后面的计算机不是人。
自然,在任何图灵测试中,计算机成功欺骗查询者的可能性都很小。为了得到一个有效的智能“晴雨表”,这个测试必须执行多次。同样,在图灵原始版本的这次测试中,人和计算机都在幕布后面,询问者必须正确区分它们。
补充信息
图灵测试
没有一个计算机系统通过图灵测试。然而,1990年,慈善家休·吉恩·罗布纳举办了一场实现图灵测试的竞赛。第一台通过图灵测试的计算机将获得一枚金牌和10万美元的罗伯纳奖。同时,每年在比赛中表现最好的电脑将获得铜牌和2000美元左右的奖金。
图灵测试中你会问什么问题?考虑以下示例:
(1 000 017)?多少钱?像这样的计算可能不是一个好主意。记住,计算机试图欺骗询问者。计算机可能不会在几分之一秒内做出响应并给出正确答案。它可能会故意花更长的时间,它可能会出错,因为它“知道”人类不熟悉这些计算。
目前天气怎么样?假设电脑可能不会向窗外看,那么你可能会试着问天气。但是,电脑通常连接到万维网,所以在回答之前也连接到天气网站。
你怕死吗?因为电脑很难伪装人的情绪,你可能会问这个问题或者其他类似的问题:“黑色让你有什么感觉?”或者“谈恋爱是什么感觉?”但请记住,你现在是在试图判断智力,人类的情绪可能不是智力的有效“晴雨表”。
图灵期望很多人反对他在原论文中提出的“机器智能”思想,其中之一就是所谓的“鸵鸟政策反对”。人们相信思考的能力使人成为万物的灵魂。承认计算机会思考可能会挑战这个只有人类才能享受的崇高栖息地。
许多人认为是人的灵魂使人能够思考。如果我们用这种能力创造机器,我们将篡夺“上帝”的权威。图灵反驳了这种观点,说人们只是准备等待具有灵魂禀赋的容器来执行上帝的意志。最后,我们提到洛夫莱斯夫人的反对意见(她经常被称为文学史上第一位计算机程序员)。
在评论分析引擎时,她非常轻松地说,“单凭这台机器无法让我们感到惊讶”。她重申了许多人的信念,即计算机不能执行任何未编程的活动。图灵反对这种观点,说机器总是让他感到惊讶。他坚持认为,这一反对意见的支持者同意,人类的智力可以立即推断出给定事实或行为的所有后果。图灵的原始论文在收集这些反对意见和其他反对意见时提到了这些读者。
图灵测试的争议与批判
内德·布洛克认为,英语文本是用ASCII编码的,换句话说,它是由计算机中的一系列0和1来表示的。因此,一个特定的图灵测试,即一系列的问题和答案,可以存储为一个非常大的数字。例如,假设图灵测试的长度有一个上限,其中“你怕死吗?你怕死吗?)开头的前三个字符存储为二进制数,如图1.5所示。
图1.5使用ASCII码存储图灵测试的开始字符
假设一个典型的图灵测试持续一个小时,在此期间测试人员问了大约50个问题,得到了50个答案,那么测试对应的二进制数应该非常长。现在,假设有一个存储所有图灵测试的大型数据库。这些图灵测试包含50个或更少的问题,并有合理的答案。
然后,计算机可以通过查表通过测试。当然,能够处理如此大量数据的计算机系统还不存在。然而,如果计算机通过图灵测试,Block会问:“你认为这样的机器是智能的吗?你觉得舒服吗?”换句话说,Block的批评是图灵测试可以通过机械查表的方法而不是智能来通过图灵测试。
约翰·塞尔对图灵测试的批评更为根本。想象一下提问者像预期的那样提问——但这次是用中文。另一个房间的人不懂中文,但他有一本详细的规则书。虽然中文问题是用潦草的字迹呈现的,但房间里的人会参考规则手册,按照规则处理汉字,用中文写下答案,如图1.6所示。
图1.6中文室辩论
询问者得到了语法正确和语义合理的问题答案。这是否意味着房间里的人都熟悉中文?如果你的答案是“不是”,那么人类和中国规则书的结合是否精通中文?答案仍然是“不”——房间里的人不是在学习或理解中文,而只是在处理符号。同样,计算机运行程序来接收、处理和使用符号来回答,而不必学习或理解符号本身的含义。
塞尔还让我们想象一个场景,人们在体育馆里互相传纸条,如果不是一个人拿着一本规则书的话。当一个人收到这样的纸条时,规则簿将决定这个人是应该生成一个输出,还是只是把信息传递给体育馆里的另一个人,如图1.7所示。
图1.7中国房间辩论的变体
现在,中国知识存在于哪里?属于全民,还是去体育馆?
想想最后一个例子。描述一个真正懂中文的人的大脑,如图1.8所示。这个人可以用中文接收问题,并用中文准确地解释和回答。
图1.8说中文的人用中文接收和回答问题
同样,汉语的知识存在于哪里?是在单个神经元中还是在这些神经元的集合中?(它一定存在于某个地方!布洛克和塞尔对图灵测试批判的关键点在于,图灵测试只能从外部观察,无法洞察一个实体的内部状态。也就是说,我们不应该期望通过将智能代理(人或机器)视为黑箱来学习一些关于智能的新知识。然而,这并不总是正确的。19世纪,物理学家欧内斯特·卢瑟福用粒子轰击金箔,正确地推导出了物质的内部状态——它主要由空白色空组成。
他预测这些高能粒子要么穿过金箔,要么稍微偏转。这个结果与他的原子轨道理论是一致的:原子是由被轨道电子包围的致密核组成的。这是我们现在的原子模型,很多学过高中化学的人都很熟悉。卢瑟福通过外部观察成功地理解了原子的内部状态。
总之,智力很难定义。正是因为很难定义智能,很难确定一个“智能体”是否具备这种属性,图灵才开发了图灵测试。在论文中,他含蓄地指出,任何能够通过图灵测试的智能体,都必须具备“大脑能力”来应对任何合理的智能挑战,这种智能挑战相当于人们普遍意义上所接受的人类水平。