本月累计签到次数:

今天获取 积分

机器人应用

机器人应用

浏览

jingjing 发表了文章 来自相关话题

1077 浏览

干货 | 剖析工业机器人应用项目中的光纤传感器

智能科技类 国产女汉子 2017-03-14 11:51 发表了文章 来自相关话题

光纤传感器介紹


光纤传感器是一种放大器分离型的光电传感器,光纤传感器中也有对射型、回归反射型和扩散反射型。光纤传感器能够检测一些由于空间太小一般传感器无法安装的场合,或特殊环境下。

光纤传感器因为光纤的优点以及它的数字化显示、管理,是目前光电传感器发展的主流。









高温检测









光纤工作原理



















光纤传感器的特点


1. 检测距离长

2. 对检测物体的限制少:以检测物体引起的遮光和反射为检测原理,所以不象接近传感器等将检测物体限定在具有導磁性,它可对玻璃·塑料、木材、液体等几乎所有物体进行检测。

3. 响应时间短:光本身为高速,并且传感器的电路都由电子零件构成,所以不包含机械性工作时间,响应时间非常短。

4. 分辨率高:能通过先进技术使投光光束集中为小光点,或通过构成特殊的受光光学系统,来实现高分辨率。也可进行微小物体的检测和高精度的位置检测。

5. 便于调整:在投射可视光的类型中,投光光束是眼睛可见的,便于对检测物体的位置进行调整。

6. 可实现颜色判别:通过检测物体形成的光的反射率和吸收率根据被投光的光线波长和检测物体的颜色组合而有所差异。利用这种性质,可对检测物体的颜色进行检测。




光纤传感器术语


检测距离

对射型:投光器与受光器直接的距离;

回归反射型:投受光器到反射板的距离;

扩散反射型/限定反射性/距离设定型:投受光器与检测物体直接的距离;









应差距离

动作距离与复位距离的差;(主要指扩散反射型)









响应时间

从输入光的断续开始到控制输出的动作或复位为止的时间









遮光动作与入光动作


遮光是遮断或者减少进入受光器的光束时使用输出型;入光则是增加进入受光器的光束时使用输出型。









自我诊断功能

判断光量的稳定度。一般光电传感器都带有绿色稳定指示灯,绿色和橙色灯同时亮表示稳定检测。自我诊断输出:不稳定时输出。









外部输入诊断


通过将对射型投光器的导线「粉」― 「蓝」间短路,可在任意时间使投光停止。

投光器和受光器间没有检测物体时(工作前),对投光器进行ON/OFF设置,如果受光器侧的输出没有变化,说明传感器发生异常。









标准检测物体

对射型和回归反射型是根据光学结构的对角线长度将直径较大的不透明体的尺寸作为标准物体。一般的对射型是以投、受光器的对角线长度作为标准检测物体的长度。回归反射型则是以反射板的对角线长度作为标准检测物体的直径。扩散反射型是根据投光束的直径将大张的白纸作为标准检测物体。









光纤传感器应用

使用光电传感器计算速冻饺子的个数









更多内容请关注:www.imefuture.com 








 来源:工业机器人培训、 过去与未来 侵删 查看全部
光纤传感器介紹


光纤传感器是一种放大器分离型的光电传感器,光纤传感器中也有对射型、回归反射型和扩散反射型。光纤传感器能够检测一些由于空间太小一般传感器无法安装的场合,或特殊环境下。

光纤传感器因为光纤的优点以及它的数字化显示、管理,是目前光电传感器发展的主流。

1.JPG





高温检测

2.JPG





光纤工作原理

3.jpg


4.JPG


5.JPG





光纤传感器的特点


1. 检测距离长

2. 对检测物体的限制少:以检测物体引起的遮光和反射为检测原理,所以不象接近传感器等将检测物体限定在具有導磁性,它可对玻璃·塑料、木材、液体等几乎所有物体进行检测。

3. 响应时间短:光本身为高速,并且传感器的电路都由电子零件构成,所以不包含机械性工作时间,响应时间非常短。

4. 分辨率高:能通过先进技术使投光光束集中为小光点,或通过构成特殊的受光光学系统,来实现高分辨率。也可进行微小物体的检测和高精度的位置检测。

5. 便于调整:在投射可视光的类型中,投光光束是眼睛可见的,便于对检测物体的位置进行调整。

6. 可实现颜色判别:通过检测物体形成的光的反射率和吸收率根据被投光的光线波长和检测物体的颜色组合而有所差异。利用这种性质,可对检测物体的颜色进行检测。




光纤传感器术语


检测距离

对射型:投光器与受光器直接的距离;

回归反射型:投受光器到反射板的距离;

扩散反射型/限定反射性/距离设定型:投受光器与检测物体直接的距离;

6.JPG





应差距离

动作距离与复位距离的差;(主要指扩散反射型)

7.jpg





响应时间

从输入光的断续开始到控制输出的动作或复位为止的时间

8.JPG





遮光动作与入光动作


遮光是遮断或者减少进入受光器的光束时使用输出型;入光则是增加进入受光器的光束时使用输出型。

9.JPG





自我诊断功能

判断光量的稳定度。一般光电传感器都带有绿色稳定指示灯,绿色和橙色灯同时亮表示稳定检测。自我诊断输出:不稳定时输出。

10.jpg





外部输入诊断


通过将对射型投光器的导线「粉」― 「蓝」间短路,可在任意时间使投光停止。

投光器和受光器间没有检测物体时(工作前),对投光器进行ON/OFF设置,如果受光器侧的输出没有变化,说明传感器发生异常。

11.JPG





标准检测物体

对射型和回归反射型是根据光学结构的对角线长度将直径较大的不透明体的尺寸作为标准物体。一般的对射型是以投、受光器的对角线长度作为标准检测物体的长度。回归反射型则是以反射板的对角线长度作为标准检测物体的直径。扩散反射型是根据投光束的直径将大张的白纸作为标准检测物体。

12.JPG





光纤传感器应用

使用光电传感器计算速冻饺子的个数

13.jpg





更多内容请关注:www.imefuture.com 

智造家二维码.jpg




 来源:工业机器人培训、 过去与未来 侵删
1 回答
879 浏览

「人工智能百年研究」首份报告:2030 年的人工智能与生活 | 行研报告

机械自动化类 我是谁 2016-10-11 10:37 发表了文章 来自相关话题

这篇来自斯坦福的「人工智能百年研究」报告是计划持续至少 100 年的、研究系列中的第一篇。它描述了目前人工智能相关技术、法律以及道德上的挑战,并对人工智能的研究、应用、政策上的方向提出了指导与建议。(因微信字数限制,请点击「阅读原文」下载完整中文报告。)





 
 
[login]
 序言

2014 年秋季,人工智能百年研究项目启动,这是一项关于人工智能领域,及其对人类、社区、社会影响的长期学术研究。这项研究包含使用人工智能计算系统的科学、工程和应用实现。监督该「百年研究」的常务委员会组建了一个研究小组来每五年评估一次人工智能所处的状态——这是本项目的核心活动。

本研究小组要回顾从上次报告到现在这段时间人工智能的进展,展望未来潜在的进展并且描述这些进展对于技术、社会的挑战与机遇,涉及的领域包括:道德伦理、经济以及与人类认知兼容的系统设计等等。

 
「百年研究」定期进行专家回顾的首要目标是:提供一个随着人工智能领域发展的,关于人工智能及其影响的收集性和连通性的集合。这些研究希望能在人工智能领域的科研、发展以及系统设计方面,在帮助确保那些系统能广泛地有益于个人和社会的项目与政策上提供专业推断上的方向指南及综合评估。


这篇报告是计划持续至少 100 年的研究系列中的第一篇。常务委员会在 2015 年的暑期成立了一个研究小组来负责组建现在这个初始的研究小组,并任命了得克萨斯大学奥斯汀分校的教授 Peter Stone 担任该小组的主席。这个包含了 17 名成员的研究小组由人工智能学术界、公司实验室和产业界的专家,以及了解人工智能的法律、政治科学、政治以及经济方面的学者组成,并于 2015 年秋季中期启动。


参与者代表着不同的专业、地区、性别以及职业阶段。常务委员会广泛讨论了研究小组相应的责任,包括人工智能最近的发展与在工作、环境、运输、公共安全、医疗、社区参与以及政府的潜在社会影响。委员会考虑多种聚焦研究的方式,包括调查子领域及其状态、研究特定的技术(例如机器学习与自然语言处理)以及研究特定的应用领域(例如医疗与运输)。

 
委员会最终选择了「 2030 年的人工智能与生活( AI and Life in 2030 )」为主题,以强调人工智能的各种用途与影响的发生不是独立于彼此,也不独立于其他许多社会和技术上的发展。意识到了城市在大多数人类生活中的核心作用之后,我们将专注重点缩小到大多数人居住的大都市。







第一部分:什么是人工智能?


本章节介绍了研究人员和从业者如何定义「人工智能」以及目前正在蓬勃发展的人工智能研究和应用领域。它提出了人工智能是什么和不是什么的定义,并介绍了一些当前人工智能研究的「热点」领域。


本章节为第二部分和第三部分的内容奠定了基础。第二部分阐述了人工智能在八个领域中的影响与未来,第三部分介绍了涉及人工智能设计和公共政策的问题,并提出在保护民主价值的同时如何鼓励人工智能创新的建议。



1.1定义人工智能


奇怪的是,人工智能缺乏一个精确的、被普遍接受的定义,这或许有助于该领域的加速成长、繁荣以及前进。虽然人工智能的从业者、研究人员和开发人员由一种粗略的方向感和一个「与它相处」的命令所引导,人工智能的定义仍然很重要,而 Nils J. Nilsson 就提供了一个有用的定义:「人工智能就是致力于让机器变得智能的活动,而智能就是使实体在其环境中有远见地、适当地实现功能性的能力」。


电子计算器智能吗?像 Nilsson 一样,研究小组以一种宽泛的视角来看待此问题,认为智力取决于一个多维频谱。根据这一观点,算术计算器和人脑之间的区别不是某一类,而是规模、速度、自主性和通用性的区别。

 
同样的因素可以用来评估智能的其他各例——智能语音识别软件、动物大脑、汽车巡航控制系统、围棋程序、自动调温器——并将它们放置在频谱中的适当位置。虽然我们的宽泛解释把计算器列在了智能频谱中,但是如此简单的设备与今天的人工智能相比几乎没有相似之处。

 
从这个角度看,对人工智能的表征取决于个人愿意「适当地」并「有远见地」为功能提供合成软件和硬件的信用。一个简单的电子计算器比人脑计算快得多而且几乎从不出错。

 
人工智能的边界已经远远走在前面,而计算器可以实现的功能只是当下的智能手机的百万分之一。目前人工智能开发人员正在改进、推广和扩大从当下的智能手机中所建立起来的智能。事实上人工智能领域是一个不断努力推动机器智能向前发展的过程。

 
具有讽刺意味的是,人工智能正在遭受失去话语权的长期灾难,最终不可避免地会被拉到边界内,即一个被称为「人工智能效应」( AI effect )或「奇怪悖论」( odd paradox )的重复模式——人工智能将一种新技术带到了普通大众中去,人们习惯了这种技术,它便不再被认为是人工智能,然后更新的技术出现了。


同样的模式将在未来继续下去。人工智能并没有「交付」一个惊雷般改变生活的产品。相反人工智能技术正在以一个连续的、进步的方式继续更好的发展。







1.2人工智能研究趋势


直到本世纪初,人工智能的吸引点主要在于它所传递的承诺,但在过去的十五年里,大多这样的承诺已经得到兑现。人工智能技术已经充斥了我们的生活。当它们成为了社会的一股中心力量时,该领域正在从仅仅建立智能系统,转向了建立有人类意识的、值得信赖的智能系统。


几个因素加速了人工智能革命。其中最重要的是机器学习的成熟,部分由云计算资源和广泛普及的、基于 Web 的数据收集所支持。机器学习已经被「深度学习」急剧地向前推进了,后者是利用被称作「反向传播的方法」所训练的适应性人工神经网络的一种形式。


信息处理算法的这种性能飞跃一直伴随着用于基本操作的硬件技术的显著进步,比如感觉、感知和目标识别。数据驱动型产品的新平台和新市场,以及发现新产品和新市场的经济激励机制,也都促进了人工智能驱动型技术的问世。


所有这些趋势都推动着下文中所描述的「热门」研究领域。这只是想要通过某个或另一个度量标准来反映目前比其他领域得到更大关注的领域。它们不一定比其他领域更重要或更有价值。事实上目前的一些「热门」领域在过去几年中并不怎么流行,而其他领域可能在未来会以类似的方式重新出现。

 

1. 大规模机器学习


许多机器学习的基本问题(如监督和非监督学习)是很好理解的。目前努力的一个重点是将现有算法扩展到更庞大的数据集上。例如鉴于传统方法能够负担得起若干遍数据集的处理,现代方法是为单次处理所设计;某些情况只认同非线性方法(那些只关注一部分数据的方法)。




2. 深度学习

 
成功训练卷积神经网络的能力非常有益于计算机视觉领域,比如目标识别、视频标签、行为识别和几个相关变体的应用。深度学习也在大举进军感知方面的其他领域,如音频、语音和自然语言处理。

 

3. 强化学习


鉴于传统机器学习主要关注于模式挖掘,强化学习将重点转移到决策中,这种技术将有助于促进人工智能在现实世界中更深入地进入相关研究和实践领域。作为一种经验驱动型的序贯决策框架,强化学习已经存在了几十年,但是这个方法在实践中没有取得很大成功,主要是由于表征和缩放的问题。深度学习的出现为强化学习提供了「一贴强心剂」。


由谷歌 DeepMind 开发的计算机程序 AlphaGo 在五次对抗比赛中击败了人类围棋冠军,它最近所取得的成功在很大程度上要归功于强化学习。AlphaGo 是通过使用一个人类专家数据库来初始化一个自动代理的方法被训练的,但随后提炼的方法是通过大量地自我对抗游戏以及应用强化学习。








4. 机器人


至少在静态环境中,机器人导航在很大程度上被解决了。目前的努力是在考虑如何训练机器人以广泛型的、预测性的方式与周围世界进行交互。互动环境中产生的一个自然要求是操纵,这是当下所感兴趣的另一个话题。


深度学习革命只是刚开始影响机器人,这在很大程度上是因为要获得大的标记数据集还很困难,这些数据集已推动了其他基于学习的人工智能领域。

 
免去了标记数据需求的强化学习可能会有助于弥合这一差距,但是它要求系统在没有错误地伤害自己或其他系统的情况下能够安全地探索出一个政策空间。在可信赖的机器感知方面的进步,包括计算机视觉、力和触觉感知,其中大部分将由机器学习驱动,它们将继续成为推进机器人能力的关键。








5. 计算机视觉

 
计算机视觉是目前最突出的机器感知形式。它是受深度学习的兴起影响最大的人工智能子领域。直到几年前,支持向量机还是大多视觉分类任务所选择的方法。但是特别是在 GPU 中的大规模计算的汇合,使得更大数据集的可获得性(尤其是通过互联网)以及神经网络算法的改进导致了基准任务功能的显著提高(比如 ImageNet 中的分类器)。计算机首次能够比人类更好地执行一些(狭义定义的)视觉分类任务。目前的研究多是关注于为图像和视频自动添加字幕。

 

6. 自然语言处理

 
自然语言处理是另一个通常与自动语音识别一同被当做非常活跃的机器感知领域。它很快成为一种拥有大数据集的主流语言商品。谷歌宣布目前其 20% 的手机查询都是通过语音进行的,并且最近的演示已经证明了实时翻译的可能性。现在研究正在转向发展精致而能干的系统,这些系统能够通过对话而不只是响应程式化的要求来与人互动。




7. 协同系统


协同系统方面进行的是对模型和算法的研究,用以帮助开发能够与其他系统和人类协同工作的自主系统。该研究依赖于开发正式的协作模型,并学习让系统成为有效合作伙伴所需的能力。能够利用人类和机器的互补优势的应用正吸引到越来越多的关注——对人类来说可以帮助人工智能系统克服其局限性,对代理来说可以扩大人类的能力和活动。

 

8. 众包和人类计算

 
在完成许多任务方面由于人类的能力是优于自动化方法的,因而在众包和人类计算方面,也需要通过利用人类智力来解决那些计算机无法单独解决好的问题。该领域研究调查了增强计算机系统的方法,这项研究的提出仅仅是在大约 15 年前,现在它已经在人工智能领域确立了自己的存在。最有名的众包例子是维基百科,它是一个由网络公民维护和更新的知识库,并且在规模上和深度上远远超越了传统编译的信息源,比如百科全书和词典。

 
众包专注于设计出创新的方式来利用人类智力。Citizen 科学平台激发志愿者去解决科学问题,而诸如亚马逊的 Mechanical Turk 等有偿众包平台,则提供对所需要的人类智力的自动访问。通过短时间内收集大量标记训练数据和/或人机交互数据,该领域的工作促进了人工智能的其它分支学科的进步,包括计算机视觉和自然语言处理。基于人类和机器的不同能力和成本,目前的研究成果探索出了它们之间理想的任务分离。








9. 算法博弈理论与 (基于) 计算机 (统计技术的) 社会选择

 
包括激励结构、人工智能在内的经济和社会计算维度吸引到了新的关注。自 20 世纪 80 年代初以来,分布式人工智能和多代理(multi-agent)系统就已经被研究了,于 20 世纪 90 年代末开始有显著起色,并由互联网所加速。一个自然的要求是系统能够处理潜在的不恰当激励,包括自己所感兴趣的人类参加者或公司,以及自动化的、基于人工智能的、代表它们的代理。


备受关注的主题包括:计算机制设计,一种激励设计的经济理论,它寻求激励兼容的系统,其中输入会被如实报告;基于计算机统计技术的社会选择,一种有关如何为替代品排列顺序的理论;激励对齐信息获取,预测市场、评分规则、同行预测;算法博弈理论,市场、网络游戏和室内游戏的平衡,比如poker——它在近几年通过抽象技术和无遗憾学习已经取得了显著的进步。



10. 物联网(IoT)


越来越多的研究机构致力于这样一个想法:一系列设备可以相互连接以收集和分享它们的感官信息。这些设备可以包括家电、汽车、建筑、相机和其他东西。基于技术和无线网络连接设备,人工智能可以为了智能的、有用的目的去处理和使用所产生的大量数据。目前这些设备使用的是令人眼花缭乱的各种不兼容的通信协议。人工智能可以帮助克服这个「巴别塔」。

 

11. 神经形态计算


传统计算机执行计算的冯诺依曼模型,它分离了输入/输出、指令处理和存储器模块。随着深度神经网络在一系列任务中的成功,制造商正在积极追求计算的替代模型——特别是那些受到生物神经网络所启发的——为了提高硬件的效率和计算系统的稳定性的模型。


目前这种神经形态的计算机尚未清楚地显示出巨大成功,而是刚开始有望实现商业化。但可能它们在不久的将来会变成寻常事物(即使仅作为冯诺依曼所增加的兄弟姐妹们)。深度神经网络在应用景观中已经激起了异常波动。当这些网络可以在专门的神经形态硬件上被训练和被执行,而不是像今天这样在标准的冯诺依曼结构中被模拟时,一个更大的波动可能会到来。




12. 总体趋势以及人工智能研究的未来

 
数据驱动型范式的巨大成功取代了传统的人工智能范式。诸如定理证明、基于逻辑的知识表征与推理,这些程序获得的关注度在降低,部分原因是与现实世界基础相连接的持续挑战。规划(Planning)在七十和八十年代是人工智能研究的一根支柱,也受到了后期较少的关注,部分原因是它强烈依赖于建模假设,难以在实际的应用中得到满足。


基于模型的方法——比如视觉方面基于物理的方法和机器人技术中的传统控制与制图——已经有很大一部分让位于通过检测手边任务的动作结果来实现闭环的数据驱动型方法。即使最近非常受欢迎的贝叶斯推理和图形模式似乎也正在失宠,被数据和深度学习显著成果的洪流所淹没。


研究小组预计在接下来的十五年中,会有更多关注集中在针对人类意识系统的开发上。这意味着它们是明确按照要与之互动的人类特点来进行建模与设计的。很多人的兴趣点在于试图找到新的、创造性的方法开发互动和可扩展的方式来教机器人。


此外在考虑社会和经济维度的人工智能时,物联网型的系统——设备和云——正变得越来越受欢迎。在未来的几年中,对人类安全的感知、新的目标识别能力和机器人平台将会增加,数据驱动型产品数量与其市场规模将会变大。


研究小组还预计当从业者意识到纯粹的端到端深度学习方法的不可避免的局限性时,会重新出现一些人工智能的传统形式。我们不鼓励年轻的研究人员重新发明理论,而是在人工智能领域以及相关领域(比如控制理论、认知科学和心理学)的第一个五十年期间,保持对于该领域多方面显著进展的觉察。








第二部分:人工智能在各领域的应用


虽然人工智能的很多研究和应用会基于一些通用技术,比如说机器学习,但在不同的经济和社会部门还是会有所区别,我们称之为不同的领域(domain)。接下来的这部分将介绍人工智能研究和应用的不同类型,以及影响和挑战,主要有八个方面:交通、家庭服务机器人、医疗健康、教育、低资源社区、公共安全、工作和就业、娱乐。


基于这些分析,我们还预测了一个有代表性的北美城市在未来 15 年的趋势。与人工智能的流行文化中的典型叙述不同,我们寻求提供一个平衡的观点来分析,人工智能是如何开始影响我们日常生活的,以及从现在到 2030 年,这些影响将如何发展。


2.1交通


交通可能会成为首批几个特定应用领域之一。在这些领域,大众需要对人工智能系统在执行危险任务中的可靠性和安全性加以信任。自动化交通会很快司空见惯,公众对嵌入人工智能系统的实体交通工具的首次体验,将强有力地影响其对人工智能的感知。




2.2家庭服务机器人


过去十五年中,机器人已经进入了人们的家庭。但应用种类的增长慢得让人失望,与此同时,日益复杂的人工智能也被部署到了已有的应用之中。人工智能的进步常常从机械的革新中获取灵感,而这反过来又带来了新的人工智能技术。

 
未来十五年,在典型的北美城市里,机械和人工智能技术的共同进步将有望增加家用机器人的使用和应用的安全性和可靠性。特定用途的机器人将被用于快递、清洁办公室和强化安全,但在可预见的未来内,技术限制和可靠机械设备的高成本将继续限制其在应用领域的商业机会。至于自动驾驶汽车和其它新型的交通机器,创造可靠的、成熟的硬件的难度不应该被低估。






 

2.3医疗


人工智能而言,医疗领域一直被视为一个很有前景的应用领域。基于人工智能的应用在接下来的几年能够为千百万人改进健康结果和生活质量,但这是在它们被医生、护士、病人所信任,政策、条例和商业障碍被移除的情况下。主要的应用包括临床决策支持、病人监控、辅导、在外科手术或者病人看护中的自动化设备、医疗系统的管理。


近期的成功,比如挖掘社交媒体数据推断潜在的健康风险、机器学习预测风险中的病人、机器人支持外科手术,已经为人工智能在医疗领域的应用扩展出了极大的应用可能。与医学专家和病人的交互方法的改进将会是一大挑战。

 
至于其他领域,数据是一个关键点。在从个人监护设备和手机 App 上、临床电子数据记录上收集有用的数据方面,我们已经取得了巨大的进展,从协助医疗流程和医院运行的机器人那里收集的数据可能较少一些。但使用这些数据帮助个体病人和群体病人进行更精细的针对和治疗已经被证明极其的困难。

 
研究和部署人工智能应用已经被过时的条例和激励机制拉扯后腿。在这样大型的、复杂的系统中,贫乏的人机交互方法和固有的难题以及部署技术的风险也阻碍了人工智能在医疗的实现。减少或者移除这些障碍,结合目前的创新,有潜力在接下来几年为千百万人极大的改进健康结果和生活质量。

 


2.4教育

在过去的十五年间,教育界见证了为数众多的人工智能科技的进步。诸如 K-12 线上教育以及大学配套设备等等应用已经被教育家和学习者们广泛利用。尽管素质教育还是需要人类教师的活跃参与,但人工智能在所有层面上都带来了强化教育的希望,尤其是大规模定制化教育。如何通过人工智能技术来最优化整合人类互动与面对面学习,将是一个关键性的挑战。

 
机器人早已经成为了广为欢迎的教育设备,最早可以追溯到 1980 年 MIT Media Lab 所研制出的 Lego Mindstorms。智能辅导系统( ITS )也成为了针对科学、数学、语言学以及其他学科相匹配的学生互动导师。

 
自然语言处理,尤其是在与机器学习和众包结合以后,有力推进了线上学习。帮助让教师在扩大教室规模的同时还能做到解决个体学生的学习需求与风格。大型线上学习的系统所得的数据已经为学习分析产生了迅速增长的动力。


但是,学院与大学采用人工智能技术的步伐依然很缓慢,主要是由于资金的缺乏,以及其可以帮助学生达成学习目标的有力证据。一个典型美国北部城市的未来五十年,智能导师与其他人工智能技术帮助教师在课堂或家中工作的规模很有可能会显著扩大,因为意愿学习是基于虚拟现实的应用。但是计算机为基础的学习系统将无法完全替代学校里的教师们。

 

更广大的社会成果


对于大多数人民难以获得教育的国家,如果可以应用在线教育的工具,那么在线资源将会产生重要的积极影响。在线教育资源的发展应该能让支持国际教育项目的基金会可以通过提供工具和相对简单的使用培训来更轻松地提供素质教育。比如说,针对 iPad 开发出了大量的、且大部分免费的教育应用。

 
在消极的一面,现在学生已有把自己的社会接触限制在电子设备上的趋势了,他们在网络程序的互动上花费了大量时间,却没有进行社会接触。如果教育也越来越多地通过网络进行,那么在学生的社会发展阶段缺乏与同龄人有规律的面对面接触会带来怎样的影响呢?特定的技术已经表明这会产生在神经方面的影响。另一方面,自闭症儿童已经开始从与人工智能系统的互动中受益了。






 


2.5低资源社区


人工智能存在许多机会去改善生活于一个典型北美城市的低资源社区中的人民生活状况——事实上在某些情况下已经有所改变。了解这些人工智能的直接贡献也可能会激发对于发展中国家最为贫穷的地区的潜在贡献。在人工智能的数据收集过程中并没有对这个人群的显著关注,而且传统上人工智能资助者在缺乏商业应用的研究中表现得投资乏力。

 
有了有针对性的激励和资金优先次序,人工智能技术可以帮助解决低资源社区的需求。萌芽中的努力是有希望的。人工智能可能会有有助于对抗失业和其他社会问题带来的恐惧,它或许会提供缓解措施和解决方案,特别是通过受影响的社区用于其建立信任的方式来实现。



2.6公共安全与防护


城市已经为公共安全与防护部署人工智能技术了。到 2030 年, 典型的北美城市将在很大程度上依赖它们。这些措施包括可以检测到指向一个潜在犯罪的异常现象的监控摄像机、无人机和预测警务应用。与大多数问题一样,好处与风险并存。


获得公众信任是至关重要的。虽然会存在一些合理的担心,即与人工智能合作的警务可能会在某些情况下变得霸道或是无处不在,而相反的情况也是可能的。人工智能可能使警务变得更有针对性并只在需要时被使用。而且假设经过仔细的部署,人工智能也可能有助于消除一些人类决策中固有的偏见。


对于人工智能分析学更成功的一个应用是检测白领犯罪,比如信用卡诈骗罪。网络安全(包括垃圾邮件)是一个被广泛关注的问题,而机器学习也对其有所影响。


人工智能工具也可能被证明有助于警察管理犯罪现场或是搜索和救援活动,它可以帮助指挥官排列任务的优先次序以及分配资源,尽管这些工具还没有为这些活动的自动化做好准备。在一般的机器学习尤其是在转换学习中的改进——在新情境中基于与过去情况的相似性而加快学习——可能有利于这样的系统。









2.7就业与劳资


尽管人工智能很有可能会对典型北美城市的就业与工作场所产生深远的影响,但对当前的影响我们目前还难以作出评估——是积极的还是消极的。在过去十五年,由于经济衰退和日益的全球化,尤其是中国参与到了世界经济中,就业状况已经发生了改变,非人工智能的数字技术也发生了很大的变化。自 1990 年代以来,美国经历了生产率和 GDP 的连续增长,但平均收入却停滞不前,就业人口比率也已经下降。


有一些数字技术有重大影响(好的影响或坏的影响)的行业的显著案例,而在一些其它的行业,自动化将很有可能在不久的将来发生重大的改变。许多这些改变已经得到了「例行的」数字技术的推动,其中包括企业资源规划、网络化、信息处理和搜索。理解这些改变应该能为人工智能影响未来劳动力需求的方式(包括技能需求的改变)提供见解。

 
到目前为止,数字技术已经给中等技能的工作(比如旅行代理)带来了更大的影响,而不是非常低技能或非常高技能的工作。另一方面,数字系统所能完成的任务的范围正随着人工智能的演进而提升,这很可能会逐渐增大所谓的「例行任务」的范围。人工智能正向高端的领域蔓延,包括一些机器之前无法执行的专业服务。

 
为了获得成功,人工智能创新将需要克服可以理解的人们对被边缘化的恐惧。在短期内,人工智能很有可能会取代任务,而非工作,同时还将会创造新类型的工作。但新类型的工作比将可能失去的已有工作更难以想象。就业领域的变化通常是渐进的,不会出现剧烈的过渡。

 
随着人工智能进入工作场所,这很有可能是一个持续的趋势。影响的范围也将扩大,从少量的替代或增强到完全的替代。比如说,尽管大部分律师的工作还没被自动化,但人工智能在法律信息提取和主题建模方面的应用已经自动化了一部分第一年工作的律师新人的工作。在不远的将来,包括放射科医生到卡车司机到园丁等许多类型的工作都可能会受到影响。


人工智能也可能会影响工作场所的大小和位置。许多组织和机构很庞大的原因是他们所执行的功能只能通过增加人力来扩大规模,要么是「横向」扩展地理区域,要么是「纵向」增多管理层级。随着人工智能对许多功能的接管,扩展不再意味着会带来大型的组织。

 
许多人已经指出一些知名的互联网公司只有很少数量的员工,但其它公司并不是这样。人类企业可能存在一个自然的规模大小,在这样的企业中,CEO 能够认识公司里的每一个人。通过将创造有效地外包给人工智能驱动的劳动力市场,企业会倾向于自然的大小。

 
人工智能也将创造工作,特别是在某些行业中,通过使某些特定任务更重要,以及通过产生新的交互模型创造新类型的工作。复杂的信息系统可被用于创造新的市场,这往往会带来降低门槛和增加参与的影响——从应用商店到 Airbnb 再到 TaskRabbit。人工智能界有一个活跃的研究社区在研究创造新市场和使已有市场更高效地运作的进一步的方式。


尽管工作本身有内在的价值,但大部分人工作是为了购买他们看重的商品和服务。因为人工智能系统可以执行之前需要人力的工作,因此它们可以导致许多商品和服务的成本下降,实实在在地让每个人都更富有。当正如当前的政治辩论中所给出的例子一样,失业对人们的影响比对散布的经济效益的影响更显著——尤其是那些直接受其影响的人;而不幸的是,人工智能常常被视作是工作的威胁,而不是生活水平的提升。


人们甚至在某些方面存在恐惧——害怕人工智能会在短短一代人的时间内迅速取代所有的人类工作,包括那些需要认知和涉及到判断的工作。这种突变是不太可能发生的,但人工智能会逐渐侵入几乎所有就业领域,这需要在计算机可以接管的工作上替换掉人力。

 
人工智能对认知型人类工作的经济影响将类似于自动化和机器人在制造业工作上对人类的影响。许多中年工人失去了工厂里的高薪工作以及伴随这个工作的家庭和社会中的社会经济地位。长期来看,一个对劳动力的更大影响是失去高薪的「认知型」工作。

 
随着劳动力在生产部门的重要性的下降(与拥有知识资本相比),大多数市民可能会发现他们的工作的价值不足以为一种社会可以接受的生活标准买单。这些变化将需要政治上的,而非单纯经济上的响应——需要考虑应该配置怎样的社会安全网来保护人们免受经济的大规模结构性转变的影响。如果缺少了缓解政策,这些转变的一小群受益者将成为社会的上层。


短期来看,教育、再训练和发明新的商品和服务可以减轻这些影响。更长期来看,目前的社会安全网可能需要进化成更好的服务于每个人的社会服务,例如医疗和教育或有保障的基本收入。事实上,瑞士和芬兰等国家已经在积极地考虑这些措施了。


人工智能可能会被认为是一种财富创造的完全不同的机制,每个人都应该从全世界人工智能所生产的财富中分得一部分。对于人工智能技术所创造的经济成果的分配方式,相信不久之后就会开始出现社会争议了。因为传统社会中由孩子支持他们年老的父母,也许我们的人工智能「孩子」也应该支持我们——它们的智能的「父母」。








2.8娱乐


随着过去十五年互联网的爆发式增长,很少有人能想象没有它的生活。在人工智能的驱动下,互联网已经将用户生成的内容作为了信息和娱乐的一个可行来源。Facebook 这样的社交网络现在几乎已经无处不在,而且它们也成为了社会互动和娱乐的个性化渠道——有时候会损害人际交往。WhatsApp 和 Snapchat 等应用可以让智能手机用户与同伴保持「接触」,分享娱乐和信息源。


在《第二人生》这样的在线社区和《魔兽世界》这样的角色扮演游戏中,人们想象在虚拟世界中有一个虚拟的存在。亚马逊 Kindle 这样的专用设备已经重新定义了打发时间的要领。现在只需手指点点划划几下,就可以浏览和获取书籍了;一个口袋大小的设备就可以存储成千上万本书,而阅读体验基本上同可手持的纸质书差不多。


现在我们有了共享和浏览博客、视频、照片和专题讨论的可信平台,此外还有各种各样用户生成的内容。为了在互联网的规模上运行,这些平台必须依赖现在正被积极开发的技术,其中包括自然语言处理、信息检索、图像处理、众包和机器学习。比如,现在已经开发出了协同过滤(collaborative filtering)这样的算法,它可以基于用户的人口统计学细节和浏览历史推荐相关的电影、歌曲或文章。


为了跟上时代的步伐,传统的娱乐资源也已经开始拥抱人工智能。正如书和电影《点球成金》中给出的例子,职业运动现在已经转向了密集的量化分析。除了总体表现统计,赛场上的信号也可以使用先进的传感器和相机进行监控。用于谱曲和识别音轨的软件已经面世。


来自计算机视觉和 NLP 的技术已被用于创建舞台表演。即使非专业用户也可以在 WordsEye 等平台上练习自己的创造力,这个应用可以根据自然语言文本自动生成 3D 场景。人工智能也已经被用于协助艺术品的历史搜索,并在文体学( stylometry )得到了广泛的应用,最近还被用在了绘画分析上。


人类对人工智能所驱动的娱乐的热情是很令人惊讶的,但也有人担心这会导致人与人之间的人际交互减少。少数人预言说人们会因为在屏幕上花费了太多时间而不再与人互动。孩子们常常更愿意在家里快乐地玩他们的设备,而不愿意出去和他们的朋友玩耍。人工智能会使娱乐更加交互式,更加个性化和更有参与感。应该引导一些研究来理解如何利用这些性质为个人和社会利益服务。







第三部分:人工智能公共政策前景与建议


人工智能应用的目标必须是对社会有价值。我们的政策建议也会遵循这个目标,而且即便这个报告主要关注的是 2030 年的北美城市,建议依然广泛适用于其他城市,同时不受时间限制。一些提升解读和人工智能系统能力并参与其使用的策略可以帮助建立信任,同时防止重大失败。


在增强和提升人类能力和互动时需要小心,还要避免对不同社会阶层的歧视。要强调多做鼓励这个方向以及沟通公共政策探讨的研究。鉴于美国目前的产业监管,需要新的或重组的法律和政策来应对人工智能可能带来的广泛影响。


政策不需要更多也不要更严,而是应该鼓励有用的创新,生成并转化专业知识,并广泛促进企业与公民对解决这些技术带来的关键社会问题的责任感。长期来看,人工智能将会带来新财富,整个社会也要探讨人工智能技术带来的经济成果的分配问题。



3.1现今与未来的人工智能政策


为了帮助解决个人和社会对快速发展的人工智能技术产生的忧虑,该研究小组提供了三个一般性政策建议。

1. 在所有层级的政府内,制定一个积累人工智能技术专业知识的程序。

有效的监管需要更多的能理解并能分析人工智能技术、程序目标以及整体社会价值之间互动的专家。

缺少足够的安全或其他指标方面的专业技术知识,国家或地方政府官员或许拒绝批准一个非常有前途的应用。或者缺少足够训练的政府官员可能只会简单采纳行业技术专家的说法,批准一个未经充分审查的敏感的应用进入市场。不理解人工智能系统如何与人工行为和社会价值互动,官员们会从错误的角度来评估人工智能对项目目标的影响。

 
2. 为研究人工智能的平等、安全、隐私和对社会的影响,扫清感知到的和实际的障碍。

在一些相关的联邦法律中,如《计算机欺诈和滥用法案》( Computer Fraud and Abuse Act )和《数字千年版权法的反规避条款》( Theanti-circumvention Provision Of The Digital Millennium Copyright Act ),涉及专有的人工智能系统如何被学者、记者和其他研究人员评价的内容还很模糊。当人工智能系统带来了一些实质性后果需要被审查和追究责任时,这些法律的研究就非常重要了。


3. 为人工智能社会影响的跨学科研究提供公共和私人资金支持。

从整个社会来看,我们对人工智能技术的社会影响的研究投入不足。资金要投给那些能够从多角度分析人工智能的跨学科团队,研究范围从智能的基础研究到评估安全、隐私和其他人工智能影响的方法。以下是具体问题:

当一辆自动驾驶汽车或智能医疗设备出现失误时,应该由谁来负责?如何防止人工智能应用产生非法歧视?谁来享有人工智能技术带来的效率提升的成果,以及对于那些技能被淘汰的人应该采取什么样的保护?

随着人工智能被越来越广泛和深入地整合到工业和消费产品中,一些领域中需要调整现有的建立监管制度以适应人工智能创新,或者在某些情况下,根据广泛接受的目标和原则,从根本上重新配置监管制度。

在美国,已经通过各种机构将监管具体到各个行业。在设备中使用人工智能实现医疗诊断和治疗由食品药品监督管理局( FDA )监管,包括定义产品类型和指定产生方法,还有软件工程的标准。无人机在管制空域中的使用由美国联邦航空局( FAA )监管。面向消费者的人工智能系统将由联邦贸易委员会( FTC )监管。金融市场使用的人工智能技术,如高频交易,由证券交易委员会( SEC )监管。

 
除了针对具体行业制定监管的方法外,「重要基础设施」中定义模糊和广泛的监管类别可能适用于人工智能应用。

鉴于目前美国行政法结构,短期内制定出全面的人工智能政策法规似乎不太可能。但是,可以根据人工智能在各种情境中可能出现的法律和政策问题,广泛列出多个类别。







3.2未来的指导原则

面对人工智能技术将带来的深刻变化,要求「更多」和「更强硬」的监管的压力是不可避免的。对人工智能是什么和不是什么的误解(尤其在这个恐慌易于散布的背景下)可能引发对有益于所有人的技术的反对。那将会是一个悲剧性的错误。扼杀创新或将创新转移到它处的监管方法同样也只会适得其反。

幸运的是,引导当前数字技术的成功监管原则可以给我们带来指导。比如,一项最近公布的多年研究对比了欧洲四个国家和美国的隐私监管,其结果却很反直觉。西班牙和法国这样的有严格的详细法规的国家在企业内部孕育出了一种「合规心态」( compliance mentality ),其影响是抑制创新和强大的隐私保护。


这些公司并不将隐私保护看作是内部责任,也不会拿出专门的员工来促进其业务或制造流程中的隐私保护,也不会参与必需范围之外的隐私倡议或学术研究;这些公司只是将隐私看作是一项要满足规范的行为。他们关注的重点是避免罚款或惩罚,而非主动设计技术和采纳实际技术来保护隐私。

相对地,美国和德国的监管环境是模糊的目标和强硬的透明度要求,和有意义的执法的结合,从而在促进公司将隐私看作是他们的责任上做得更加成功。广泛的法律授权鼓励企业发展执行隐私控制的专业人员和流程、参与到外部的利益相关者中并采用他们的做法以实现技术进步。对更大的透明度的要求使民间社会团队和媒体可以变成法庭上和法庭外的公共舆论中的可靠执法者,从而使得隐私问题在公司董事会上更加突出,这又能让他们进一步投资隐私保护。


在人工智能领域也是一样,监管者可以强化涉及内部和外部责任、透明度和专业化的良性循环,而不是定义狭窄的法规。随着人工智能与城市的整合,它将继续挑战对隐私和责任等价值的已有保护。和其它技术一样,人工智能也可以被用于好的或恶意的目的。


这份报告试图同时强调这两方面的可能性。我们迫切的需要一场重要的辩论:如何最好地引导人工智能以使之丰富我们的生活和社会,同时还能鼓励这一领域的创新。应该对政策进行评估,看其是否能促进人工智能所带来的益处的发展和平等共享,还是说会将力量和财富集中到少数权贵的手里。因为我们并不能完美清晰地预测未来的人工智能技术及其所将带来的影响,所以相关政策一定要根据出现的社会难题和线索不断地重新评估。


截至本报告发布时,重要的人工智能相关的进展已经在过去十五年内给北美的城市造成了影响,而未来十五年还将有更大幅度的发展发生。最近的进展很大程度是由于互联网所带来的大型数据集的增长和分析、传感技术的进步和最近的「深度学习」的应用。


未来几年,随着人工智能在交通和医疗等领域内的应用,它们必须以一种能构建信任和理解的方式引入,同时还要尊重人权和公民权利。在鼓励创新的同时,政策和流程也应该解决隐私和安全方面的影响,而且应该确保人工智能所带来的好处能得到广泛而公正的分配。如果人工智能研究及其应用将会给 2030 年及以后的北美城市生活带来积极的影响,那么这样做就是非常关键的。
 
[/login]
 
 
 
文章来源于网络智造家平台提供 查看全部
2.1_.jpg


这篇来自斯坦福的「人工智能百年研究」报告是计划持续至少 100 年的、研究系列中的第一篇。它描述了目前人工智能相关技术、法律以及道德上的挑战,并对人工智能的研究、应用、政策上的方向提出了指导与建议。(因微信字数限制,请点击「阅读原文」下载完整中文报告。)

2.2_.jpg

 
 
[login]
 序言

2014 年秋季,人工智能百年研究项目启动,这是一项关于人工智能领域,及其对人类、社区、社会影响的长期学术研究。这项研究包含使用人工智能计算系统的科学、工程和应用实现。监督该「百年研究」的常务委员会组建了一个研究小组来每五年评估一次人工智能所处的状态——这是本项目的核心活动。

本研究小组要回顾从上次报告到现在这段时间人工智能的进展,展望未来潜在的进展并且描述这些进展对于技术、社会的挑战与机遇,涉及的领域包括:道德伦理、经济以及与人类认知兼容的系统设计等等。

 
「百年研究」定期进行专家回顾的首要目标是:提供一个随着人工智能领域发展的,关于人工智能及其影响的收集性和连通性的集合。这些研究希望能在人工智能领域的科研、发展以及系统设计方面,在帮助确保那些系统能广泛地有益于个人和社会的项目与政策上提供专业推断上的方向指南及综合评估。


这篇报告是计划持续至少 100 年的研究系列中的第一篇。常务委员会在 2015 年的暑期成立了一个研究小组来负责组建现在这个初始的研究小组,并任命了得克萨斯大学奥斯汀分校的教授 Peter Stone 担任该小组的主席。这个包含了 17 名成员的研究小组由人工智能学术界、公司实验室和产业界的专家,以及了解人工智能的法律、政治科学、政治以及经济方面的学者组成,并于 2015 年秋季中期启动。


参与者代表着不同的专业、地区、性别以及职业阶段。常务委员会广泛讨论了研究小组相应的责任,包括人工智能最近的发展与在工作、环境、运输、公共安全、医疗、社区参与以及政府的潜在社会影响。委员会考虑多种聚焦研究的方式,包括调查子领域及其状态、研究特定的技术(例如机器学习与自然语言处理)以及研究特定的应用领域(例如医疗与运输)。

 
委员会最终选择了「 2030 年的人工智能与生活( AI and Life in 2030 )」为主题,以强调人工智能的各种用途与影响的发生不是独立于彼此,也不独立于其他许多社会和技术上的发展。意识到了城市在大多数人类生活中的核心作用之后,我们将专注重点缩小到大多数人居住的大都市。

2.3_.jpg



第一部分:什么是人工智能?


本章节介绍了研究人员和从业者如何定义「人工智能」以及目前正在蓬勃发展的人工智能研究和应用领域。它提出了人工智能是什么和不是什么的定义,并介绍了一些当前人工智能研究的「热点」领域。


本章节为第二部分和第三部分的内容奠定了基础。第二部分阐述了人工智能在八个领域中的影响与未来,第三部分介绍了涉及人工智能设计和公共政策的问题,并提出在保护民主价值的同时如何鼓励人工智能创新的建议。



1.1定义人工智能


奇怪的是,人工智能缺乏一个精确的、被普遍接受的定义,这或许有助于该领域的加速成长、繁荣以及前进。虽然人工智能的从业者、研究人员和开发人员由一种粗略的方向感和一个「与它相处」的命令所引导,人工智能的定义仍然很重要,而 Nils J. Nilsson 就提供了一个有用的定义:「人工智能就是致力于让机器变得智能的活动,而智能就是使实体在其环境中有远见地、适当地实现功能性的能力」。


电子计算器智能吗?像 Nilsson 一样,研究小组以一种宽泛的视角来看待此问题,认为智力取决于一个多维频谱。根据这一观点,算术计算器和人脑之间的区别不是某一类,而是规模、速度、自主性和通用性的区别。

 
同样的因素可以用来评估智能的其他各例——智能语音识别软件、动物大脑、汽车巡航控制系统、围棋程序、自动调温器——并将它们放置在频谱中的适当位置。虽然我们的宽泛解释把计算器列在了智能频谱中,但是如此简单的设备与今天的人工智能相比几乎没有相似之处。

 
从这个角度看,对人工智能的表征取决于个人愿意「适当地」并「有远见地」为功能提供合成软件和硬件的信用。一个简单的电子计算器比人脑计算快得多而且几乎从不出错。

 
人工智能的边界已经远远走在前面,而计算器可以实现的功能只是当下的智能手机的百万分之一。目前人工智能开发人员正在改进、推广和扩大从当下的智能手机中所建立起来的智能。事实上人工智能领域是一个不断努力推动机器智能向前发展的过程。

 
具有讽刺意味的是,人工智能正在遭受失去话语权的长期灾难,最终不可避免地会被拉到边界内,即一个被称为「人工智能效应」( AI effect )或「奇怪悖论」( odd paradox )的重复模式——人工智能将一种新技术带到了普通大众中去,人们习惯了这种技术,它便不再被认为是人工智能,然后更新的技术出现了。


同样的模式将在未来继续下去。人工智能并没有「交付」一个惊雷般改变生活的产品。相反人工智能技术正在以一个连续的、进步的方式继续更好的发展。

2.4_.jpg



1.2人工智能研究趋势


直到本世纪初,人工智能的吸引点主要在于它所传递的承诺,但在过去的十五年里,大多这样的承诺已经得到兑现。人工智能技术已经充斥了我们的生活。当它们成为了社会的一股中心力量时,该领域正在从仅仅建立智能系统,转向了建立有人类意识的、值得信赖的智能系统。


几个因素加速了人工智能革命。其中最重要的是机器学习的成熟,部分由云计算资源和广泛普及的、基于 Web 的数据收集所支持。机器学习已经被「深度学习」急剧地向前推进了,后者是利用被称作「反向传播的方法」所训练的适应性人工神经网络的一种形式。


信息处理算法的这种性能飞跃一直伴随着用于基本操作的硬件技术的显著进步,比如感觉、感知和目标识别。数据驱动型产品的新平台和新市场,以及发现新产品和新市场的经济激励机制,也都促进了人工智能驱动型技术的问世。


所有这些趋势都推动着下文中所描述的「热门」研究领域。这只是想要通过某个或另一个度量标准来反映目前比其他领域得到更大关注的领域。它们不一定比其他领域更重要或更有价值。事实上目前的一些「热门」领域在过去几年中并不怎么流行,而其他领域可能在未来会以类似的方式重新出现。

 

1. 大规模机器学习


许多机器学习的基本问题(如监督和非监督学习)是很好理解的。目前努力的一个重点是将现有算法扩展到更庞大的数据集上。例如鉴于传统方法能够负担得起若干遍数据集的处理,现代方法是为单次处理所设计;某些情况只认同非线性方法(那些只关注一部分数据的方法)。




2. 深度学习

 
成功训练卷积神经网络的能力非常有益于计算机视觉领域,比如目标识别、视频标签、行为识别和几个相关变体的应用。深度学习也在大举进军感知方面的其他领域,如音频、语音和自然语言处理。

 

3. 强化学习


鉴于传统机器学习主要关注于模式挖掘,强化学习将重点转移到决策中,这种技术将有助于促进人工智能在现实世界中更深入地进入相关研究和实践领域。作为一种经验驱动型的序贯决策框架,强化学习已经存在了几十年,但是这个方法在实践中没有取得很大成功,主要是由于表征和缩放的问题。深度学习的出现为强化学习提供了「一贴强心剂」。


由谷歌 DeepMind 开发的计算机程序 AlphaGo 在五次对抗比赛中击败了人类围棋冠军,它最近所取得的成功在很大程度上要归功于强化学习。AlphaGo 是通过使用一个人类专家数据库来初始化一个自动代理的方法被训练的,但随后提炼的方法是通过大量地自我对抗游戏以及应用强化学习。

2.5_.jpg




4. 机器人


至少在静态环境中,机器人导航在很大程度上被解决了。目前的努力是在考虑如何训练机器人以广泛型的、预测性的方式与周围世界进行交互。互动环境中产生的一个自然要求是操纵,这是当下所感兴趣的另一个话题。


深度学习革命只是刚开始影响机器人,这在很大程度上是因为要获得大的标记数据集还很困难,这些数据集已推动了其他基于学习的人工智能领域。

 
免去了标记数据需求的强化学习可能会有助于弥合这一差距,但是它要求系统在没有错误地伤害自己或其他系统的情况下能够安全地探索出一个政策空间。在可信赖的机器感知方面的进步,包括计算机视觉、力和触觉感知,其中大部分将由机器学习驱动,它们将继续成为推进机器人能力的关键。

2.6_.jpg




5. 计算机视觉

 
计算机视觉是目前最突出的机器感知形式。它是受深度学习的兴起影响最大的人工智能子领域。直到几年前,支持向量机还是大多视觉分类任务所选择的方法。但是特别是在 GPU 中的大规模计算的汇合,使得更大数据集的可获得性(尤其是通过互联网)以及神经网络算法的改进导致了基准任务功能的显著提高(比如 ImageNet 中的分类器)。计算机首次能够比人类更好地执行一些(狭义定义的)视觉分类任务。目前的研究多是关注于为图像和视频自动添加字幕。

 

6. 自然语言处理

 
自然语言处理是另一个通常与自动语音识别一同被当做非常活跃的机器感知领域。它很快成为一种拥有大数据集的主流语言商品。谷歌宣布目前其 20% 的手机查询都是通过语音进行的,并且最近的演示已经证明了实时翻译的可能性。现在研究正在转向发展精致而能干的系统,这些系统能够通过对话而不只是响应程式化的要求来与人互动。




7. 协同系统


协同系统方面进行的是对模型和算法的研究,用以帮助开发能够与其他系统和人类协同工作的自主系统。该研究依赖于开发正式的协作模型,并学习让系统成为有效合作伙伴所需的能力。能够利用人类和机器的互补优势的应用正吸引到越来越多的关注——对人类来说可以帮助人工智能系统克服其局限性,对代理来说可以扩大人类的能力和活动。

 

8. 众包和人类计算

 
在完成许多任务方面由于人类的能力是优于自动化方法的,因而在众包和人类计算方面,也需要通过利用人类智力来解决那些计算机无法单独解决好的问题。该领域研究调查了增强计算机系统的方法,这项研究的提出仅仅是在大约 15 年前,现在它已经在人工智能领域确立了自己的存在。最有名的众包例子是维基百科,它是一个由网络公民维护和更新的知识库,并且在规模上和深度上远远超越了传统编译的信息源,比如百科全书和词典。

 
众包专注于设计出创新的方式来利用人类智力。Citizen 科学平台激发志愿者去解决科学问题,而诸如亚马逊的 Mechanical Turk 等有偿众包平台,则提供对所需要的人类智力的自动访问。通过短时间内收集大量标记训练数据和/或人机交互数据,该领域的工作促进了人工智能的其它分支学科的进步,包括计算机视觉和自然语言处理。基于人类和机器的不同能力和成本,目前的研究成果探索出了它们之间理想的任务分离。

2.7_.jpg




9. 算法博弈理论与 (基于) 计算机 (统计技术的) 社会选择

 
包括激励结构、人工智能在内的经济和社会计算维度吸引到了新的关注。自 20 世纪 80 年代初以来,分布式人工智能和多代理(multi-agent)系统就已经被研究了,于 20 世纪 90 年代末开始有显著起色,并由互联网所加速。一个自然的要求是系统能够处理潜在的不恰当激励,包括自己所感兴趣的人类参加者或公司,以及自动化的、基于人工智能的、代表它们的代理。


备受关注的主题包括:计算机制设计,一种激励设计的经济理论,它寻求激励兼容的系统,其中输入会被如实报告;基于计算机统计技术的社会选择,一种有关如何为替代品排列顺序的理论;激励对齐信息获取,预测市场、评分规则、同行预测;算法博弈理论,市场、网络游戏和室内游戏的平衡,比如poker——它在近几年通过抽象技术和无遗憾学习已经取得了显著的进步。



10. 物联网(IoT)


越来越多的研究机构致力于这样一个想法:一系列设备可以相互连接以收集和分享它们的感官信息。这些设备可以包括家电、汽车、建筑、相机和其他东西。基于技术和无线网络连接设备,人工智能可以为了智能的、有用的目的去处理和使用所产生的大量数据。目前这些设备使用的是令人眼花缭乱的各种不兼容的通信协议。人工智能可以帮助克服这个「巴别塔」。

 

11. 神经形态计算


传统计算机执行计算的冯诺依曼模型,它分离了输入/输出、指令处理和存储器模块。随着深度神经网络在一系列任务中的成功,制造商正在积极追求计算的替代模型——特别是那些受到生物神经网络所启发的——为了提高硬件的效率和计算系统的稳定性的模型。


目前这种神经形态的计算机尚未清楚地显示出巨大成功,而是刚开始有望实现商业化。但可能它们在不久的将来会变成寻常事物(即使仅作为冯诺依曼所增加的兄弟姐妹们)。深度神经网络在应用景观中已经激起了异常波动。当这些网络可以在专门的神经形态硬件上被训练和被执行,而不是像今天这样在标准的冯诺依曼结构中被模拟时,一个更大的波动可能会到来。




12. 总体趋势以及人工智能研究的未来

 
数据驱动型范式的巨大成功取代了传统的人工智能范式。诸如定理证明、基于逻辑的知识表征与推理,这些程序获得的关注度在降低,部分原因是与现实世界基础相连接的持续挑战。规划(Planning)在七十和八十年代是人工智能研究的一根支柱,也受到了后期较少的关注,部分原因是它强烈依赖于建模假设,难以在实际的应用中得到满足。


基于模型的方法——比如视觉方面基于物理的方法和机器人技术中的传统控制与制图——已经有很大一部分让位于通过检测手边任务的动作结果来实现闭环的数据驱动型方法。即使最近非常受欢迎的贝叶斯推理和图形模式似乎也正在失宠,被数据和深度学习显著成果的洪流所淹没。


研究小组预计在接下来的十五年中,会有更多关注集中在针对人类意识系统的开发上。这意味着它们是明确按照要与之互动的人类特点来进行建模与设计的。很多人的兴趣点在于试图找到新的、创造性的方法开发互动和可扩展的方式来教机器人。


此外在考虑社会和经济维度的人工智能时,物联网型的系统——设备和云——正变得越来越受欢迎。在未来的几年中,对人类安全的感知、新的目标识别能力和机器人平台将会增加,数据驱动型产品数量与其市场规模将会变大。


研究小组还预计当从业者意识到纯粹的端到端深度学习方法的不可避免的局限性时,会重新出现一些人工智能的传统形式。我们不鼓励年轻的研究人员重新发明理论,而是在人工智能领域以及相关领域(比如控制理论、认知科学和心理学)的第一个五十年期间,保持对于该领域多方面显著进展的觉察。

2.8_.jpg




第二部分:人工智能在各领域的应用


虽然人工智能的很多研究和应用会基于一些通用技术,比如说机器学习,但在不同的经济和社会部门还是会有所区别,我们称之为不同的领域(domain)。接下来的这部分将介绍人工智能研究和应用的不同类型,以及影响和挑战,主要有八个方面:交通、家庭服务机器人、医疗健康、教育、低资源社区、公共安全、工作和就业、娱乐。


基于这些分析,我们还预测了一个有代表性的北美城市在未来 15 年的趋势。与人工智能的流行文化中的典型叙述不同,我们寻求提供一个平衡的观点来分析,人工智能是如何开始影响我们日常生活的,以及从现在到 2030 年,这些影响将如何发展。


2.1交通


交通可能会成为首批几个特定应用领域之一。在这些领域,大众需要对人工智能系统在执行危险任务中的可靠性和安全性加以信任。自动化交通会很快司空见惯,公众对嵌入人工智能系统的实体交通工具的首次体验,将强有力地影响其对人工智能的感知。




2.2家庭服务机器人


过去十五年中,机器人已经进入了人们的家庭。但应用种类的增长慢得让人失望,与此同时,日益复杂的人工智能也被部署到了已有的应用之中。人工智能的进步常常从机械的革新中获取灵感,而这反过来又带来了新的人工智能技术。

 
未来十五年,在典型的北美城市里,机械和人工智能技术的共同进步将有望增加家用机器人的使用和应用的安全性和可靠性。特定用途的机器人将被用于快递、清洁办公室和强化安全,但在可预见的未来内,技术限制和可靠机械设备的高成本将继续限制其在应用领域的商业机会。至于自动驾驶汽车和其它新型的交通机器,创造可靠的、成熟的硬件的难度不应该被低估。

2.9_.jpg


 

2.3医疗


人工智能而言,医疗领域一直被视为一个很有前景的应用领域。基于人工智能的应用在接下来的几年能够为千百万人改进健康结果和生活质量,但这是在它们被医生、护士、病人所信任,政策、条例和商业障碍被移除的情况下。主要的应用包括临床决策支持、病人监控、辅导、在外科手术或者病人看护中的自动化设备、医疗系统的管理。


近期的成功,比如挖掘社交媒体数据推断潜在的健康风险、机器学习预测风险中的病人、机器人支持外科手术,已经为人工智能在医疗领域的应用扩展出了极大的应用可能。与医学专家和病人的交互方法的改进将会是一大挑战。

 
至于其他领域,数据是一个关键点。在从个人监护设备和手机 App 上、临床电子数据记录上收集有用的数据方面,我们已经取得了巨大的进展,从协助医疗流程和医院运行的机器人那里收集的数据可能较少一些。但使用这些数据帮助个体病人和群体病人进行更精细的针对和治疗已经被证明极其的困难。

 
研究和部署人工智能应用已经被过时的条例和激励机制拉扯后腿。在这样大型的、复杂的系统中,贫乏的人机交互方法和固有的难题以及部署技术的风险也阻碍了人工智能在医疗的实现。减少或者移除这些障碍,结合目前的创新,有潜力在接下来几年为千百万人极大的改进健康结果和生活质量。

 


2.4教育

在过去的十五年间,教育界见证了为数众多的人工智能科技的进步。诸如 K-12 线上教育以及大学配套设备等等应用已经被教育家和学习者们广泛利用。尽管素质教育还是需要人类教师的活跃参与,但人工智能在所有层面上都带来了强化教育的希望,尤其是大规模定制化教育。如何通过人工智能技术来最优化整合人类互动与面对面学习,将是一个关键性的挑战。

 
机器人早已经成为了广为欢迎的教育设备,最早可以追溯到 1980 年 MIT Media Lab 所研制出的 Lego Mindstorms。智能辅导系统( ITS )也成为了针对科学、数学、语言学以及其他学科相匹配的学生互动导师。

 
自然语言处理,尤其是在与机器学习和众包结合以后,有力推进了线上学习。帮助让教师在扩大教室规模的同时还能做到解决个体学生的学习需求与风格。大型线上学习的系统所得的数据已经为学习分析产生了迅速增长的动力。


但是,学院与大学采用人工智能技术的步伐依然很缓慢,主要是由于资金的缺乏,以及其可以帮助学生达成学习目标的有力证据。一个典型美国北部城市的未来五十年,智能导师与其他人工智能技术帮助教师在课堂或家中工作的规模很有可能会显著扩大,因为意愿学习是基于虚拟现实的应用。但是计算机为基础的学习系统将无法完全替代学校里的教师们。

 

更广大的社会成果


对于大多数人民难以获得教育的国家,如果可以应用在线教育的工具,那么在线资源将会产生重要的积极影响。在线教育资源的发展应该能让支持国际教育项目的基金会可以通过提供工具和相对简单的使用培训来更轻松地提供素质教育。比如说,针对 iPad 开发出了大量的、且大部分免费的教育应用。

 
在消极的一面,现在学生已有把自己的社会接触限制在电子设备上的趋势了,他们在网络程序的互动上花费了大量时间,却没有进行社会接触。如果教育也越来越多地通过网络进行,那么在学生的社会发展阶段缺乏与同龄人有规律的面对面接触会带来怎样的影响呢?特定的技术已经表明这会产生在神经方面的影响。另一方面,自闭症儿童已经开始从与人工智能系统的互动中受益了。


2.10_.jpg

 


2.5低资源社区


人工智能存在许多机会去改善生活于一个典型北美城市的低资源社区中的人民生活状况——事实上在某些情况下已经有所改变。了解这些人工智能的直接贡献也可能会激发对于发展中国家最为贫穷的地区的潜在贡献。在人工智能的数据收集过程中并没有对这个人群的显著关注,而且传统上人工智能资助者在缺乏商业应用的研究中表现得投资乏力。

 
有了有针对性的激励和资金优先次序,人工智能技术可以帮助解决低资源社区的需求。萌芽中的努力是有希望的。人工智能可能会有有助于对抗失业和其他社会问题带来的恐惧,它或许会提供缓解措施和解决方案,特别是通过受影响的社区用于其建立信任的方式来实现。



2.6公共安全与防护


城市已经为公共安全与防护部署人工智能技术了。到 2030 年, 典型的北美城市将在很大程度上依赖它们。这些措施包括可以检测到指向一个潜在犯罪的异常现象的监控摄像机、无人机和预测警务应用。与大多数问题一样,好处与风险并存。


获得公众信任是至关重要的。虽然会存在一些合理的担心,即与人工智能合作的警务可能会在某些情况下变得霸道或是无处不在,而相反的情况也是可能的。人工智能可能使警务变得更有针对性并只在需要时被使用。而且假设经过仔细的部署,人工智能也可能有助于消除一些人类决策中固有的偏见。


对于人工智能分析学更成功的一个应用是检测白领犯罪,比如信用卡诈骗罪。网络安全(包括垃圾邮件)是一个被广泛关注的问题,而机器学习也对其有所影响。


人工智能工具也可能被证明有助于警察管理犯罪现场或是搜索和救援活动,它可以帮助指挥官排列任务的优先次序以及分配资源,尽管这些工具还没有为这些活动的自动化做好准备。在一般的机器学习尤其是在转换学习中的改进——在新情境中基于与过去情况的相似性而加快学习——可能有利于这样的系统。

2.11_.jpg





2.7就业与劳资


尽管人工智能很有可能会对典型北美城市的就业与工作场所产生深远的影响,但对当前的影响我们目前还难以作出评估——是积极的还是消极的。在过去十五年,由于经济衰退和日益的全球化,尤其是中国参与到了世界经济中,就业状况已经发生了改变,非人工智能的数字技术也发生了很大的变化。自 1990 年代以来,美国经历了生产率和 GDP 的连续增长,但平均收入却停滞不前,就业人口比率也已经下降。


有一些数字技术有重大影响(好的影响或坏的影响)的行业的显著案例,而在一些其它的行业,自动化将很有可能在不久的将来发生重大的改变。许多这些改变已经得到了「例行的」数字技术的推动,其中包括企业资源规划、网络化、信息处理和搜索。理解这些改变应该能为人工智能影响未来劳动力需求的方式(包括技能需求的改变)提供见解。

 
到目前为止,数字技术已经给中等技能的工作(比如旅行代理)带来了更大的影响,而不是非常低技能或非常高技能的工作。另一方面,数字系统所能完成的任务的范围正随着人工智能的演进而提升,这很可能会逐渐增大所谓的「例行任务」的范围。人工智能正向高端的领域蔓延,包括一些机器之前无法执行的专业服务。

 
为了获得成功,人工智能创新将需要克服可以理解的人们对被边缘化的恐惧。在短期内,人工智能很有可能会取代任务,而非工作,同时还将会创造新类型的工作。但新类型的工作比将可能失去的已有工作更难以想象。就业领域的变化通常是渐进的,不会出现剧烈的过渡。

 
随着人工智能进入工作场所,这很有可能是一个持续的趋势。影响的范围也将扩大,从少量的替代或增强到完全的替代。比如说,尽管大部分律师的工作还没被自动化,但人工智能在法律信息提取和主题建模方面的应用已经自动化了一部分第一年工作的律师新人的工作。在不远的将来,包括放射科医生到卡车司机到园丁等许多类型的工作都可能会受到影响。


人工智能也可能会影响工作场所的大小和位置。许多组织和机构很庞大的原因是他们所执行的功能只能通过增加人力来扩大规模,要么是「横向」扩展地理区域,要么是「纵向」增多管理层级。随着人工智能对许多功能的接管,扩展不再意味着会带来大型的组织。

 
许多人已经指出一些知名的互联网公司只有很少数量的员工,但其它公司并不是这样。人类企业可能存在一个自然的规模大小,在这样的企业中,CEO 能够认识公司里的每一个人。通过将创造有效地外包给人工智能驱动的劳动力市场,企业会倾向于自然的大小。

 
人工智能也将创造工作,特别是在某些行业中,通过使某些特定任务更重要,以及通过产生新的交互模型创造新类型的工作。复杂的信息系统可被用于创造新的市场,这往往会带来降低门槛和增加参与的影响——从应用商店到 Airbnb 再到 TaskRabbit。人工智能界有一个活跃的研究社区在研究创造新市场和使已有市场更高效地运作的进一步的方式。


尽管工作本身有内在的价值,但大部分人工作是为了购买他们看重的商品和服务。因为人工智能系统可以执行之前需要人力的工作,因此它们可以导致许多商品和服务的成本下降,实实在在地让每个人都更富有。当正如当前的政治辩论中所给出的例子一样,失业对人们的影响比对散布的经济效益的影响更显著——尤其是那些直接受其影响的人;而不幸的是,人工智能常常被视作是工作的威胁,而不是生活水平的提升。


人们甚至在某些方面存在恐惧——害怕人工智能会在短短一代人的时间内迅速取代所有的人类工作,包括那些需要认知和涉及到判断的工作。这种突变是不太可能发生的,但人工智能会逐渐侵入几乎所有就业领域,这需要在计算机可以接管的工作上替换掉人力。

 
人工智能对认知型人类工作的经济影响将类似于自动化和机器人在制造业工作上对人类的影响。许多中年工人失去了工厂里的高薪工作以及伴随这个工作的家庭和社会中的社会经济地位。长期来看,一个对劳动力的更大影响是失去高薪的「认知型」工作。

 
随着劳动力在生产部门的重要性的下降(与拥有知识资本相比),大多数市民可能会发现他们的工作的价值不足以为一种社会可以接受的生活标准买单。这些变化将需要政治上的,而非单纯经济上的响应——需要考虑应该配置怎样的社会安全网来保护人们免受经济的大规模结构性转变的影响。如果缺少了缓解政策,这些转变的一小群受益者将成为社会的上层。


短期来看,教育、再训练和发明新的商品和服务可以减轻这些影响。更长期来看,目前的社会安全网可能需要进化成更好的服务于每个人的社会服务,例如医疗和教育或有保障的基本收入。事实上,瑞士和芬兰等国家已经在积极地考虑这些措施了。


人工智能可能会被认为是一种财富创造的完全不同的机制,每个人都应该从全世界人工智能所生产的财富中分得一部分。对于人工智能技术所创造的经济成果的分配方式,相信不久之后就会开始出现社会争议了。因为传统社会中由孩子支持他们年老的父母,也许我们的人工智能「孩子」也应该支持我们——它们的智能的「父母」。

2.12_.jpg




2.8娱乐


随着过去十五年互联网的爆发式增长,很少有人能想象没有它的生活。在人工智能的驱动下,互联网已经将用户生成的内容作为了信息和娱乐的一个可行来源。Facebook 这样的社交网络现在几乎已经无处不在,而且它们也成为了社会互动和娱乐的个性化渠道——有时候会损害人际交往。WhatsApp 和 Snapchat 等应用可以让智能手机用户与同伴保持「接触」,分享娱乐和信息源。


在《第二人生》这样的在线社区和《魔兽世界》这样的角色扮演游戏中,人们想象在虚拟世界中有一个虚拟的存在。亚马逊 Kindle 这样的专用设备已经重新定义了打发时间的要领。现在只需手指点点划划几下,就可以浏览和获取书籍了;一个口袋大小的设备就可以存储成千上万本书,而阅读体验基本上同可手持的纸质书差不多。


现在我们有了共享和浏览博客、视频、照片和专题讨论的可信平台,此外还有各种各样用户生成的内容。为了在互联网的规模上运行,这些平台必须依赖现在正被积极开发的技术,其中包括自然语言处理、信息检索、图像处理、众包和机器学习。比如,现在已经开发出了协同过滤(collaborative filtering)这样的算法,它可以基于用户的人口统计学细节和浏览历史推荐相关的电影、歌曲或文章。


为了跟上时代的步伐,传统的娱乐资源也已经开始拥抱人工智能。正如书和电影《点球成金》中给出的例子,职业运动现在已经转向了密集的量化分析。除了总体表现统计,赛场上的信号也可以使用先进的传感器和相机进行监控。用于谱曲和识别音轨的软件已经面世。


来自计算机视觉和 NLP 的技术已被用于创建舞台表演。即使非专业用户也可以在 WordsEye 等平台上练习自己的创造力,这个应用可以根据自然语言文本自动生成 3D 场景。人工智能也已经被用于协助艺术品的历史搜索,并在文体学( stylometry )得到了广泛的应用,最近还被用在了绘画分析上。


人类对人工智能所驱动的娱乐的热情是很令人惊讶的,但也有人担心这会导致人与人之间的人际交互减少。少数人预言说人们会因为在屏幕上花费了太多时间而不再与人互动。孩子们常常更愿意在家里快乐地玩他们的设备,而不愿意出去和他们的朋友玩耍。人工智能会使娱乐更加交互式,更加个性化和更有参与感。应该引导一些研究来理解如何利用这些性质为个人和社会利益服务。

2.13_.jpg



第三部分:人工智能公共政策前景与建议


人工智能应用的目标必须是对社会有价值。我们的政策建议也会遵循这个目标,而且即便这个报告主要关注的是 2030 年的北美城市,建议依然广泛适用于其他城市,同时不受时间限制。一些提升解读和人工智能系统能力并参与其使用的策略可以帮助建立信任,同时防止重大失败。


在增强和提升人类能力和互动时需要小心,还要避免对不同社会阶层的歧视。要强调多做鼓励这个方向以及沟通公共政策探讨的研究。鉴于美国目前的产业监管,需要新的或重组的法律和政策来应对人工智能可能带来的广泛影响。


政策不需要更多也不要更严,而是应该鼓励有用的创新,生成并转化专业知识,并广泛促进企业与公民对解决这些技术带来的关键社会问题的责任感。长期来看,人工智能将会带来新财富,整个社会也要探讨人工智能技术带来的经济成果的分配问题。



3.1现今与未来的人工智能政策


为了帮助解决个人和社会对快速发展的人工智能技术产生的忧虑,该研究小组提供了三个一般性政策建议。

1. 在所有层级的政府内,制定一个积累人工智能技术专业知识的程序。

有效的监管需要更多的能理解并能分析人工智能技术、程序目标以及整体社会价值之间互动的专家。

缺少足够的安全或其他指标方面的专业技术知识,国家或地方政府官员或许拒绝批准一个非常有前途的应用。或者缺少足够训练的政府官员可能只会简单采纳行业技术专家的说法,批准一个未经充分审查的敏感的应用进入市场。不理解人工智能系统如何与人工行为和社会价值互动,官员们会从错误的角度来评估人工智能对项目目标的影响。

 
2. 为研究人工智能的平等、安全、隐私和对社会的影响,扫清感知到的和实际的障碍。

在一些相关的联邦法律中,如《计算机欺诈和滥用法案》( Computer Fraud and Abuse Act )和《数字千年版权法的反规避条款》( Theanti-circumvention Provision Of The Digital Millennium Copyright Act ),涉及专有的人工智能系统如何被学者、记者和其他研究人员评价的内容还很模糊。当人工智能系统带来了一些实质性后果需要被审查和追究责任时,这些法律的研究就非常重要了。


3. 为人工智能社会影响的跨学科研究提供公共和私人资金支持。

从整个社会来看,我们对人工智能技术的社会影响的研究投入不足。资金要投给那些能够从多角度分析人工智能的跨学科团队,研究范围从智能的基础研究到评估安全、隐私和其他人工智能影响的方法。以下是具体问题:

当一辆自动驾驶汽车或智能医疗设备出现失误时,应该由谁来负责?如何防止人工智能应用产生非法歧视?谁来享有人工智能技术带来的效率提升的成果,以及对于那些技能被淘汰的人应该采取什么样的保护?

随着人工智能被越来越广泛和深入地整合到工业和消费产品中,一些领域中需要调整现有的建立监管制度以适应人工智能创新,或者在某些情况下,根据广泛接受的目标和原则,从根本上重新配置监管制度。

在美国,已经通过各种机构将监管具体到各个行业。在设备中使用人工智能实现医疗诊断和治疗由食品药品监督管理局( FDA )监管,包括定义产品类型和指定产生方法,还有软件工程的标准。无人机在管制空域中的使用由美国联邦航空局( FAA )监管。面向消费者的人工智能系统将由联邦贸易委员会( FTC )监管。金融市场使用的人工智能技术,如高频交易,由证券交易委员会( SEC )监管。

 
除了针对具体行业制定监管的方法外,「重要基础设施」中定义模糊和广泛的监管类别可能适用于人工智能应用。

鉴于目前美国行政法结构,短期内制定出全面的人工智能政策法规似乎不太可能。但是,可以根据人工智能在各种情境中可能出现的法律和政策问题,广泛列出多个类别。

2.14_.jpg



3.2未来的指导原则

面对人工智能技术将带来的深刻变化,要求「更多」和「更强硬」的监管的压力是不可避免的。对人工智能是什么和不是什么的误解(尤其在这个恐慌易于散布的背景下)可能引发对有益于所有人的技术的反对。那将会是一个悲剧性的错误。扼杀创新或将创新转移到它处的监管方法同样也只会适得其反。

幸运的是,引导当前数字技术的成功监管原则可以给我们带来指导。比如,一项最近公布的多年研究对比了欧洲四个国家和美国的隐私监管,其结果却很反直觉。西班牙和法国这样的有严格的详细法规的国家在企业内部孕育出了一种「合规心态」( compliance mentality ),其影响是抑制创新和强大的隐私保护。


这些公司并不将隐私保护看作是内部责任,也不会拿出专门的员工来促进其业务或制造流程中的隐私保护,也不会参与必需范围之外的隐私倡议或学术研究;这些公司只是将隐私看作是一项要满足规范的行为。他们关注的重点是避免罚款或惩罚,而非主动设计技术和采纳实际技术来保护隐私。

相对地,美国和德国的监管环境是模糊的目标和强硬的透明度要求,和有意义的执法的结合,从而在促进公司将隐私看作是他们的责任上做得更加成功。广泛的法律授权鼓励企业发展执行隐私控制的专业人员和流程、参与到外部的利益相关者中并采用他们的做法以实现技术进步。对更大的透明度的要求使民间社会团队和媒体可以变成法庭上和法庭外的公共舆论中的可靠执法者,从而使得隐私问题在公司董事会上更加突出,这又能让他们进一步投资隐私保护。


在人工智能领域也是一样,监管者可以强化涉及内部和外部责任、透明度和专业化的良性循环,而不是定义狭窄的法规。随着人工智能与城市的整合,它将继续挑战对隐私和责任等价值的已有保护。和其它技术一样,人工智能也可以被用于好的或恶意的目的。


这份报告试图同时强调这两方面的可能性。我们迫切的需要一场重要的辩论:如何最好地引导人工智能以使之丰富我们的生活和社会,同时还能鼓励这一领域的创新。应该对政策进行评估,看其是否能促进人工智能所带来的益处的发展和平等共享,还是说会将力量和财富集中到少数权贵的手里。因为我们并不能完美清晰地预测未来的人工智能技术及其所将带来的影响,所以相关政策一定要根据出现的社会难题和线索不断地重新评估。


截至本报告发布时,重要的人工智能相关的进展已经在过去十五年内给北美的城市造成了影响,而未来十五年还将有更大幅度的发展发生。最近的进展很大程度是由于互联网所带来的大型数据集的增长和分析、传感技术的进步和最近的「深度学习」的应用。


未来几年,随着人工智能在交通和医疗等领域内的应用,它们必须以一种能构建信任和理解的方式引入,同时还要尊重人权和公民权利。在鼓励创新的同时,政策和流程也应该解决隐私和安全方面的影响,而且应该确保人工智能所带来的好处能得到广泛而公正的分配。如果人工智能研究及其应用将会给 2030 年及以后的北美城市生活带来积极的影响,那么这样做就是非常关键的。
 
[/login]
 
 
 
  • 文章来源于网络
  • 智造家平台提供

527 浏览

机器人很难生产衣服?那我们就先把它变成纸板!

机械自动化类 jingjing 2016-09-20 11:01 发表了文章 来自相关话题

  尽管如今的机器人是越来越能干了,上天入地、飞檐走壁,几乎无所不能,但有一件事对于它们来说却是难于上青天——缝纫。不过,最近美国 Sewbo 公司推出了据说是全球首个缝纫机器人,它能够缝制完整的衬衣。






        机器人的手臂通常很难处理松软而柔韧的面料,只能加工诸如座垫这类形状简单的物件,但要生产一件完整的衣服几乎是不可能的。

        为了解决这一难题,Sewbo 另辟蹊径,从面料上着手,用聚乙烯醇让面料暂时硬化,以易于机器人对其进行“组装”。

该公司的创始人 Zornow 表示:


“我们试用了各种面料,硬化的过程对它们均起到了作用,包括棉、牛仔布、蕾丝以及一些装饰面料。这仅限于能够全程湿透的材料,所以不适用于涂层材料,例如皮革或者已经作了防水处理的面料。”

       在面料拼接过程中,机器人并不是使用缝衣针,而是用一台超声波焊机缝合硬挺的织物片边缘,再将面料进行加热,使之变得柔软,这个时候可以根据需要对其衣服进行重塑,待冷却后定型。






       在组装完成后,只需要将衣服放入热水中简单冲洗便可除去面料上的水溶增强剂,得到一件正常材质的衣服,增强剂可回收再利用。






        这项技术在购物袋、座垫、病号服等方面都有应用的空间,甚至有望用于制服的制作,据说美国军方对 Sewbo 的概念很是感兴趣。“我们正在与他们探讨。”Zornow 透露道。此外,该公司正在与一些工厂、自动化承包商谈判。
 
 
 
 
 
 
文章来源于网络智造家平台提供 查看全部
  尽管如今的机器人是越来越能干了,上天入地、飞檐走壁,几乎无所不能,但有一件事对于它们来说却是难于上青天——缝纫。不过,最近美国 Sewbo 公司推出了据说是全球首个缝纫机器人,它能够缝制完整的衬衣。

5.0_.jpg


        机器人的手臂通常很难处理松软而柔韧的面料,只能加工诸如座垫这类形状简单的物件,但要生产一件完整的衣服几乎是不可能的。

        为了解决这一难题,Sewbo 另辟蹊径,从面料上着手,用聚乙烯醇让面料暂时硬化,以易于机器人对其进行“组装”。

该公司的创始人 Zornow 表示:


“我们试用了各种面料,硬化的过程对它们均起到了作用,包括棉、牛仔布、蕾丝以及一些装饰面料。这仅限于能够全程湿透的材料,所以不适用于涂层材料,例如皮革或者已经作了防水处理的面料。”

       在面料拼接过程中,机器人并不是使用缝衣针,而是用一台超声波焊机缝合硬挺的织物片边缘,再将面料进行加热,使之变得柔软,这个时候可以根据需要对其衣服进行重塑,待冷却后定型。

5.1_.gif


       在组装完成后,只需要将衣服放入热水中简单冲洗便可除去面料上的水溶增强剂,得到一件正常材质的衣服,增强剂可回收再利用。

5.2_.gif


        这项技术在购物袋、座垫、病号服等方面都有应用的空间,甚至有望用于制服的制作,据说美国军方对 Sewbo 的概念很是感兴趣。“我们正在与他们探讨。”Zornow 透露道。此外,该公司正在与一些工厂、自动化承包商谈判。
 
 
 
 
 
 
  • 文章来源于网络
  • 智造家平台提供

684 浏览
721 浏览

【SLAM】移动机器人定位与地图创建方法

机械自动化类 小螺号 2016-09-14 16:03 发表了文章 来自相关话题

1.引言

机器人的研究越来越多的得到关注和投入,随着计算机技术和人工智能的发展,智能自主移动机器人成为机器人领域的一个重要研究方向和研究热点。移动机器人的定位和地图创建是自主移动机器人领域的热点研究问题。对于已知环境中的机器人自主定位和已知机器人位置的地图创建已经有了一些实用的解决方法。然而在很多环境中机器人不能利用全局定位系统进行定位,而且事先获取机器人工作环境的地图很困难,甚至是不可能的。这时机器人需要在自身位置不确定的条件下,在完全未知环境中创建地图,同时利用地图进行自主定位和导航。这就是移动机器人的同时定位与地图创建(SLAM) 问题,最先是由SmithSelf 和Cheeseman在1988年提出来的,被认为是实现真正全自主移动机器人的关键。

SLAM问题可以描述为:机器人在未知环境中从一个未知位置开始移动,在移动过程中根据位置估计和传感器数据进行自身定位,同时建造增量式地图。在SLAM中,机器人利用自身携带的传感器识别未知环境中的特征标志,然后根据机器人与特征标志之间的相对位置和里程计的读数估计机器人和特征标志的全局坐标。这种在线的定位与地图创建需要保持机器人与特征标志之间的详细信息。近几年来,SLAM的研究取得了很大的进展,并已应用于各种不同的环境,如:室内环境、水下、室外环境。
 

2.SLAM的关键性问题

2.1地图的表示方式

目前各国研究者已经提出了多种表示法,大致可分为三类:栅格表示、几何信息表示和拓扑图表示,每种方法都有自己的优缺点。

栅格地图表示法即将整个环境分为若干相同大小的栅格,对于每个栅格各指出其中是否存在障碍物。这种方法最早由Elfes和Moravec提出,而后Elfes进行了进一步的研究。它的优点在于创建和维护容易,尽量的保留了整个环境的各种信息,同时借助于该地图,可以方便地进行自定位和路径规划。缺点在于:当栅格数量增大时(在大规模环境或对环境划分比较详细时),对地图的维护行为将变得困难,同时定位过程中搜索空间很大,如果没有较好的简化算法,实现实时应用比较困难。

几何信息地图表示法是指机器人收集对环境的感知信息,从中提取更为抽象的几何特征,例如线段或曲线,使用这些几何信息描述环境。该方法更为紧凑,且便于位置估计和目标识别。几何方法利用卡尔曼滤波在局部区域内可获得较高精度,且计算量小,但在广域环境中却难以维持精确的坐标信息。但几何信息的提取需要对感知信息作额外处理,且需要一定数量的感知数据才能得到结果。

拓扑地图抽象度高,特别在环境大而简单时。这种方法将环境表示为一张拓扑意义中的图(graph),图中的节点对应于环境中的一个特征状态、地点。如果节点间存在直接连接的路径则相当于图中连接节点的弧。其优点是:

(1)有利于进一步的路径和任务规划,
(2)存储和搜索空间都比较小,计算效率高,
(3)可以使用很多现有成熟、高效的搜索和推理算法。

缺点在于对拓扑图的使用是建立在对拓扑节点的识别匹配基础上的,如当环境中存在两个很相似的地方时,拓扑图方法将很难确定这是否为同一点。

2.2不确定信息的描述

在完全未知环境中由机器人依靠其自身携带的传感器所提供的信息建立环境模型是移动机器人进行自主定位和导航的前提之一。所谓完全未知环境是指机器人对环境一无所知不存在任何先验信息,如环境形状、障碍物位置、人为设定的参照物等。在这种环境下,移动机器人必须依赖传感器所获得的信息,如里程计、声纳、激光测距仪、视觉等。由于传感器自身的限制,感知信息存在不同程度的不确定性,例如激光测距仪的不确定性主要来自距离的测量误差以及反光镜旋转和激光散射引起的测量角误差。如图1-1所示,感知信息的不确定性必然导致所构建的环境模型也不可能是完全精确的,同样,当依靠模型和感知进行决策时也带有不确定性,即不确定性具有传递性。






对不确定性进行度量的方法主要有概率度量、信任度量、可能性度量、模糊度量和证据理论等。目前,在AMR地图构建中使用较多的是概率度量和模糊度量。概率度量主要存在两种形式:

(1)以均值、方差和协方差等概率特征来描述不确定信息。这种度量方法的优点是均值等概率特征具有明确的几何意义,缺点是概率特征的离散计算公式还没有确定的形式;
(2)以概率模型来描述不确定信息,主要采用Bayes法则与Markov假设。这种度量方法的优点是以随机概率模型描述机器人的位姿和环境信息,鲁棒性非常好,缺点是概率模型的计算量非常大而且必须事先知道模型的先验概率,给实际应用造成了困难。

2.3定位与环境特征提取

移动机器人自定位与环境建模问题是紧密相关的。环境模型的准确性依赖于定位精度,而定位的实现又离不开环境模型。在未知环境中,机器人没有什么参照物,只能依靠自己并不十分准确的传感器来获取外界信息,如同一个盲人在一个陌生环境中摸索的情况。这种情况下,定位是比较困难的。有地图的定位和有定位的地图创建都是容易解决的,但无地图的定位和未解决定位的地图创建如同"鸡--蛋"问题,无从下手。已有的研究中对这类问题的解决方法可分为两类:

1) 利用自身携带的多种内部传感器(包括里程仪、罗盘、加速度计等),通过多种传感信息的融合减少定位的误差,使用的融合算法多为基于卡尔曼滤波的方法。这类方法由于没有参考外部信息,在长时间的漫游后误差的积累会比较大。
2) 在依靠内部传感器估计自身运动的同时,使用外部传感器(如激光测距仪、视觉等)感知环境,对获得的信息进行分析提取环境特征并保存,在下一步通过对环境特征的比较对自身位置进行校正。但这种方法依赖于能够取得环境特征。环境特征提取的方法有:

(1)  Hough transform是一类基于灰度图检测直线和其他曲线的方法。该方法需要一簇能被搜索的预先准备的特定曲线,并根据显示的灰度图中一簇曲线产生曲线参数。
(2)  Clustering分析是一种数据探测工具,对于未分类样例是有效的,同时,它的目标就是把所针对对象分组成自然类别或基于相似性或距离的簇类。在被提取对象类别未知的情况中,簇技术是一类比HoughTransform更有效的技术。簇类应是以“凝聚”为中心,而不是支离破碎的、不相交的。而环境特征有时是很难提取出的,例如:环境特征不够明显时或者传感器信息比较少,难以从一次感知信息中获得环境特征。

2.4数据关联

数据关联是对两个特征标志进行匹配,确定它们是否对应环境中的同一物体。SLAM中的数据关联主要需要完成三个任务:1)新特征标志的检测2)特征标志的匹配3)地图之间的匹配。虽然在目标跟踪、传感融合等领域,数据关联已经得到较好的解决,但是这些方法的计算量大,不能满足SLAM的实时性要求。实现m个标志与拥有n个标志的地图之间的数据关联的复杂度与m之间呈指数关系,假设每个观测到的标志i有 个可能的匹配,那么对于m个标志需要在指数空间 =  中搜索正确的匹配。数据关联的搜索空间与环境的复杂程度以及机器人的定位误差有关,环境的复杂程度的增加会使m增大,而误差的增大会使Ni 增大。

2.5累积误差

SLAM中的误差主要来自三个方面:1)观测误差2)里程计的误差3)错误的数据关联带来的误差。当机器人在已知地图的环境中进行定位时,机器人可以通过观测位置已知的特征标志对里程计的误差进行补偿,每一次观测使机器人的位置误差趋向于观测误差与特征标志的位置误差之和。然而在SLAM中,由于机器人的位置和环境中的特征标志的位置都是未知的,观测信息不能有效纠正里程计的误差,机器人的位置误差随着机器人的运动距离而增大。而机器人的位置误差的增大将导致错误的数据关联,从而增大特征标志的位置误差:反过来,特征标志的误差又将增大机器人的位置误差。因此,机器人的位置误差与特征标志的位置误差密切相关。它们之间的相互影响使机器人和特征标志的位置估计产生累计误差,难以保证地图的一致性。
 

3.SLAM的实现方法

目前SLAM方法大致可分为两类:
1)基于概率模型的方法:基于卡尔曼滤波的完全SLAM、压缩滤波、FastSLAM等
2)非概率模型方法:SM-SLAM、扫描匹配、数据融合(dataassociation)、基于模糊逻辑等。

3.1基于卡尔曼滤波器的实现方法

从统计学的观点看,SLAM是一个滤波问题,也就是根据系统的初始状态和从0到t时刻的观测信息与控制信息(里程计的读数)估计系统的当前状态。在SLAM中,系统的状态 = ,由机器人的位姿r和地图信息m组成(包含各特征标志的位置信息)。假设系统的运动模型和观测模型是带高斯噪声的线性模型,系统的状态 服从高斯分布,那SLAM可以采用卡尔曼滤波器来实现。基于卡尔曼滤波器的SLAM 包括系统状态预测和更新两步,同时还需要进行地图信息的管理,如:新特征标志的加入与特征标志的删除等。

卡尔曼滤波器假设系统是线性系统,但是实际中机器人的运动模型与观测模型是非线性的。因此通常采用扩展卡尔曼滤波器(Extended Kalman Filter),扩展卡尔曼滤波器通过一阶泰勒展开来近似表示非线性模型。另一种适用于非线性模型的卡尔曼滤波器是UKF(Unscented Kalman Filter),UKF采用条件高斯分布来近似后验概率分布,与EKF相比,UKF的线性化精度更高,而且不需要计算雅可比矩阵。

卡尔曼滤波器已经成为实现SLAM的基本方法。其协方差矩阵包含了机器人的位置和地图的不确定信息。当机器人连续地观测环境中的特征标志时,协方差矩阵的任何子矩阵的行列式呈单调递减。从理论上讲,当观测次数趋向于无穷时,每个特征标志的协方差只与机器人起始位置的协方差有关。卡尔曼滤波器的时间复杂度是O( ),由于每一时刻机器人只能观测到少数的几个特征标志,基于卡尔曼滤波器的SLAM的时间复杂度可以优化为O( ),n表示地图中的特征标志数。

3.2局部子地图法

局部子地图法从空间的角度将SLAM分解为一些较小的子问题。子地图法中主要需要考虑以下几个问题:1)如何划分子地图2)如何表示子地图间的相互关系3)如何将子地图的信息传递给全局地图以及能否保证全局地图的一致性。

最简单局部子地图方法是不考虑各子地图之间的相互关系,将全局地图划分为包括固定特征标志数的独立子地图,在各子地图中分别实现SLAM,这种方法的时间复杂度为O(1)。但是,由于丢失了表示不同子地图之间相关关系的有用信息,这种方法不能保证地图的全局一致性。

对此,Leonard 等人提出了DSM(DecoupledStochastic Mapping)方法,DSM中各子地图分别保存自己的机器人位置估计,当机器人从一个子地图A进入另一个子地图B时,采用基于EKF的方法来将子地图A中的信息传送给子地图B;B.Williams等人提出了一种基于CLSF(ConstrainedLocal Submap Filter)的SLAM方法,CLSF在地图中创建全局坐标已知的子地图,机器人前进过程中只利用观测信息更新机器人和局部子地图中的特征标志的位置,并且按一定的时间间隔把局部子地图信息传送给全局地图。虽然实验表明这两种算法具有很好的性能,但是没有从理论上证明它们能够保持地图的一致性。J.Guivant等人提出了一种没有任何信息丢失的SLAM优化算法CEKF(CompressedExtended Kalman Filter)。CEKF将已经观测到的特征标志分为A与B部分,A表示与机器人当前位置相邻的区域,被称为活动子地图。当机器人在活动子地图A中运动时,利用观测信息实时更新机器人的位置与子地图A,并采用递归的方法记录观测信息对子地图B的影响;当机器人离开活动子地图A时,将观测信息无损失地传送给子地图B,一次性地实现子地图B的更新,同时创建新的活动子地图。该方法的计算时间由两部分组成:活动子地图中的SLAM,其时间复杂度为O( ), 是活动子地图A中特征标志的数目;子地图B的更新,其时间复杂度为O( ) , 是地图B中特征标志的数目。当子地图合并的时间间隔较大时,CEKF能有效减少SLAM的计算量。

3.3去相关法

降低SLAM复杂度的另一种方法是将表示相关关系的协方差矩阵中一些取值较小的元素忽略掉,使其变为一个稀疏矩阵。然而这也会因信息的丢失而使地图失去一致性。但是,如果能改变协方差矩阵的表示方式,使其中的很多的元素接近于零或等于零,那么就可以将其安全地忽略了。基于扩展信息滤波器EIF(ExtendedInformation Filter)的SLAM就是出于这一思想。EIF EKF的基于信息的表达形式,它们的区别在于表示信息的形式不一样。EIF采用协方差矩阵的逆矩阵来表征SLAM中的不确定信息,并称之为信息矩阵。两个不相关的信息矩阵的融合可以简单地表示为两个矩阵相加。信息矩阵中每个非对角线上的元素表示机器人与特征标志之间或特征标志与特征标志之间的一种约束关系,这些约束关系可以通过系统状态的信关系进行局部更新。这种局部更新使得信息矩阵近似于稀疏矩阵,对其进行稀疏化产生的误差很小。根据这一点,S.Thrun等人提出了一种基于稀疏信息滤波器SEIF(Sparse Extended InformationFilter)的SLAM方法,并证明利用稀疏的信息矩阵实现SLAM的时间复杂度是O(1)。虽然EIF可以有效降低SLAM的时间复杂度,但是在地图信息的表示和管理方面还存在一些问题。首先,在常数时间内只能近似算得系统状态的均值;其次,在基于EIF 的SLAM 方法中,特征标志的增删不方便。

3.4分解法(FastSLAM)

M.Montemerlo 等人提出了一种基于粒子滤波器(ParticleFilter) FastSLAM 方法。FastSLAM 将SLAM分解为机器人定位和特征标志的位置估计两个过程。 粒子滤波器中的每个粒子代表机器人的一条可能运动路径,利用观测信息计算每个粒子的权重,以评价每条路径的好坏。对于每个粒子来说,机器人的运动路径是确定的,因此特征标志之间相互独立,特征标志的观测信息只与机器人的位姿有关,每个粒子可以采用n个卡尔曼滤波器分别估计地图中n个特征的位置。假设需要k个粒子实现SLAM、FastSLAM,总共有kn个卡尔曼滤波器。FastSLAM的时间复杂度为O(kn),通过利用树型的数据结构进行优化,其时间复杂度可以达到O(klog n)。Fast2SLAM方法的另一个主要优点是通过采用粒子滤波器估计机器人的位姿,可以很好地表示机器人的非线性、非高斯运动模型。

3.5基于多机器人协作的SLAM

一些研究者对基于多机器人协作的同时定位与地图创建CSLAM(CooperativeSimultaneous Localizationand Mapping)进行了探讨和研究。 与单机器人相比,通过机器人之间的相互协调与合作以及信息共享,CSLAM可以提高地图创建的效率和提高定位与地图的精度。CSLAM按照地图的存储与处理方式的不同可以分为两大类型:集中式CSLAM和分布式CSLAM。在集中式CSLAM中,存在一个中央处理模块,每个机器人分别在自己所在的局部地图中进行定位与地图创建,然后利用无线通信装置将在局部地图中获得的信息传送给中央模块。这种方法通过子地图的匹配,可以充分利用子地图间的冗余信息提高定位与地图创建的精度。但是,当机器人数量增加时中央模块的计算量会显著增大,而且集中式的信息传递需要很大的带宽;系统的可靠性也比较低,一旦中央模块出现故障,整个系统都会陷入瘫痪状态。在分布式CSLAM中,不存在中央模块,每个机器人都拥有自己的全局地图,在每一时刻机器人把来自其他相邻机器人的信息和自己的观测信息融合到自己的全局地图中,然后以点对点的方式将新的信息传送给其他机器人。每个机器人只能获得与其相邻的机器人的位置信息,不知道整个系统的拓扑结构。这种方法与分布式的信息融合十分相似,可以利用信息滤波器来实现。由于两个不相关信息矩阵的信息融合可以通过两个矩阵的相加而实现,所以利用信息滤波器实现分布式CSLAM可以避免复杂的计算。

4.研究方向与发展趋势

综上所述,近几年来机器人领域的研究者对SLAM进行了大量的研究,特别是在降低计算复杂度、提高鲁棒性等方面取得了很大的进展。随着研究的深入,以下的几方面成为了当前SLAM的研究热点方向。
1.扩展SLAM的应用环境:将目前局限二维静态环境中的研究与应用扩展到与现实中的环境切合的动态的三维环境;
2.深入研究基于多机器人协作的SLAM,提高其应用水平;
3.研究更有效的SLAM实现方法,将人工智能、智能控制等领域的方法引入到SLAM中,开发更有效的SLAM算法.;
4.研究更好的地图表达方式,特别是复杂地形和大环境中的地图表达方式;
5.研究更好的将视觉处理与其他传感器结合,提高环境特征提取的精度,减少误差,提高定位和构图的精确性。

机器人2025本期第二版导读
DeepMind与英国医院合作:用机器学习治疗头部和颈部的癌症
 
文章来源于 机器人2025 查看全部

1.引言

机器人的研究越来越多的得到关注和投入,随着计算机技术和人工智能的发展,智能自主移动机器人成为机器人领域的一个重要研究方向和研究热点。移动机器人的定位和地图创建是自主移动机器人领域的热点研究问题。对于已知环境中的机器人自主定位和已知机器人位置的地图创建已经有了一些实用的解决方法。然而在很多环境中机器人不能利用全局定位系统进行定位,而且事先获取机器人工作环境的地图很困难,甚至是不可能的。这时机器人需要在自身位置不确定的条件下,在完全未知环境中创建地图,同时利用地图进行自主定位和导航。这就是移动机器人的同时定位与地图创建(SLAM) 问题,最先是由SmithSelf 和Cheeseman在1988年提出来的,被认为是实现真正全自主移动机器人的关键。

SLAM问题可以描述为:机器人在未知环境中从一个未知位置开始移动,在移动过程中根据位置估计和传感器数据进行自身定位,同时建造增量式地图。在SLAM中,机器人利用自身携带的传感器识别未知环境中的特征标志,然后根据机器人与特征标志之间的相对位置和里程计的读数估计机器人和特征标志的全局坐标。这种在线的定位与地图创建需要保持机器人与特征标志之间的详细信息。近几年来,SLAM的研究取得了很大的进展,并已应用于各种不同的环境,如:室内环境、水下、室外环境。
 

2.SLAM的关键性问题

2.1地图的表示方式

目前各国研究者已经提出了多种表示法,大致可分为三类:栅格表示、几何信息表示和拓扑图表示,每种方法都有自己的优缺点。

栅格地图表示法即将整个环境分为若干相同大小的栅格,对于每个栅格各指出其中是否存在障碍物。这种方法最早由Elfes和Moravec提出,而后Elfes进行了进一步的研究。它的优点在于创建和维护容易,尽量的保留了整个环境的各种信息,同时借助于该地图,可以方便地进行自定位和路径规划。缺点在于:当栅格数量增大时(在大规模环境或对环境划分比较详细时),对地图的维护行为将变得困难,同时定位过程中搜索空间很大,如果没有较好的简化算法,实现实时应用比较困难。

几何信息地图表示法是指机器人收集对环境的感知信息,从中提取更为抽象的几何特征,例如线段或曲线,使用这些几何信息描述环境。该方法更为紧凑,且便于位置估计和目标识别。几何方法利用卡尔曼滤波在局部区域内可获得较高精度,且计算量小,但在广域环境中却难以维持精确的坐标信息。但几何信息的提取需要对感知信息作额外处理,且需要一定数量的感知数据才能得到结果。

拓扑地图抽象度高,特别在环境大而简单时。这种方法将环境表示为一张拓扑意义中的图(graph),图中的节点对应于环境中的一个特征状态、地点。如果节点间存在直接连接的路径则相当于图中连接节点的弧。其优点是:

(1)有利于进一步的路径和任务规划,
(2)存储和搜索空间都比较小,计算效率高,
(3)可以使用很多现有成熟、高效的搜索和推理算法。

缺点在于对拓扑图的使用是建立在对拓扑节点的识别匹配基础上的,如当环境中存在两个很相似的地方时,拓扑图方法将很难确定这是否为同一点。

2.2不确定信息的描述

在完全未知环境中由机器人依靠其自身携带的传感器所提供的信息建立环境模型是移动机器人进行自主定位和导航的前提之一。所谓完全未知环境是指机器人对环境一无所知不存在任何先验信息,如环境形状、障碍物位置、人为设定的参照物等。在这种环境下,移动机器人必须依赖传感器所获得的信息,如里程计、声纳、激光测距仪、视觉等。由于传感器自身的限制,感知信息存在不同程度的不确定性,例如激光测距仪的不确定性主要来自距离的测量误差以及反光镜旋转和激光散射引起的测量角误差。如图1-1所示,感知信息的不确定性必然导致所构建的环境模型也不可能是完全精确的,同样,当依靠模型和感知进行决策时也带有不确定性,即不确定性具有传递性。

1.PNG


对不确定性进行度量的方法主要有概率度量、信任度量、可能性度量、模糊度量和证据理论等。目前,在AMR地图构建中使用较多的是概率度量和模糊度量。概率度量主要存在两种形式:

(1)以均值、方差和协方差等概率特征来描述不确定信息。这种度量方法的优点是均值等概率特征具有明确的几何意义,缺点是概率特征的离散计算公式还没有确定的形式;
(2)以概率模型来描述不确定信息,主要采用Bayes法则与Markov假设。这种度量方法的优点是以随机概率模型描述机器人的位姿和环境信息,鲁棒性非常好,缺点是概率模型的计算量非常大而且必须事先知道模型的先验概率,给实际应用造成了困难。

2.3定位与环境特征提取

移动机器人自定位与环境建模问题是紧密相关的。环境模型的准确性依赖于定位精度,而定位的实现又离不开环境模型。在未知环境中,机器人没有什么参照物,只能依靠自己并不十分准确的传感器来获取外界信息,如同一个盲人在一个陌生环境中摸索的情况。这种情况下,定位是比较困难的。有地图的定位和有定位的地图创建都是容易解决的,但无地图的定位和未解决定位的地图创建如同"鸡--蛋"问题,无从下手。已有的研究中对这类问题的解决方法可分为两类:

1) 利用自身携带的多种内部传感器(包括里程仪、罗盘、加速度计等),通过多种传感信息的融合减少定位的误差,使用的融合算法多为基于卡尔曼滤波的方法。这类方法由于没有参考外部信息,在长时间的漫游后误差的积累会比较大。
2) 在依靠内部传感器估计自身运动的同时,使用外部传感器(如激光测距仪、视觉等)感知环境,对获得的信息进行分析提取环境特征并保存,在下一步通过对环境特征的比较对自身位置进行校正。但这种方法依赖于能够取得环境特征。环境特征提取的方法有:

(1)  Hough transform是一类基于灰度图检测直线和其他曲线的方法。该方法需要一簇能被搜索的预先准备的特定曲线,并根据显示的灰度图中一簇曲线产生曲线参数。
(2)  Clustering分析是一种数据探测工具,对于未分类样例是有效的,同时,它的目标就是把所针对对象分组成自然类别或基于相似性或距离的簇类。在被提取对象类别未知的情况中,簇技术是一类比HoughTransform更有效的技术。簇类应是以“凝聚”为中心,而不是支离破碎的、不相交的。而环境特征有时是很难提取出的,例如:环境特征不够明显时或者传感器信息比较少,难以从一次感知信息中获得环境特征。

2.4数据关联

数据关联是对两个特征标志进行匹配,确定它们是否对应环境中的同一物体。SLAM中的数据关联主要需要完成三个任务:1)新特征标志的检测2)特征标志的匹配3)地图之间的匹配。虽然在目标跟踪、传感融合等领域,数据关联已经得到较好的解决,但是这些方法的计算量大,不能满足SLAM的实时性要求。实现m个标志与拥有n个标志的地图之间的数据关联的复杂度与m之间呈指数关系,假设每个观测到的标志i有 个可能的匹配,那么对于m个标志需要在指数空间 =  中搜索正确的匹配。数据关联的搜索空间与环境的复杂程度以及机器人的定位误差有关,环境的复杂程度的增加会使m增大,而误差的增大会使Ni 增大。

2.5累积误差

SLAM中的误差主要来自三个方面:1)观测误差2)里程计的误差3)错误的数据关联带来的误差。当机器人在已知地图的环境中进行定位时,机器人可以通过观测位置已知的特征标志对里程计的误差进行补偿,每一次观测使机器人的位置误差趋向于观测误差与特征标志的位置误差之和。然而在SLAM中,由于机器人的位置和环境中的特征标志的位置都是未知的,观测信息不能有效纠正里程计的误差,机器人的位置误差随着机器人的运动距离而增大。而机器人的位置误差的增大将导致错误的数据关联,从而增大特征标志的位置误差:反过来,特征标志的误差又将增大机器人的位置误差。因此,机器人的位置误差与特征标志的位置误差密切相关。它们之间的相互影响使机器人和特征标志的位置估计产生累计误差,难以保证地图的一致性。
 

3.SLAM的实现方法

目前SLAM方法大致可分为两类:
1)基于概率模型的方法:基于卡尔曼滤波的完全SLAM、压缩滤波、FastSLAM等
2)非概率模型方法:SM-SLAM、扫描匹配、数据融合(dataassociation)、基于模糊逻辑等。

3.1基于卡尔曼滤波器的实现方法

从统计学的观点看,SLAM是一个滤波问题,也就是根据系统的初始状态和从0到t时刻的观测信息与控制信息(里程计的读数)估计系统的当前状态。在SLAM中,系统的状态 = ,由机器人的位姿r和地图信息m组成(包含各特征标志的位置信息)。假设系统的运动模型和观测模型是带高斯噪声的线性模型,系统的状态 服从高斯分布,那SLAM可以采用卡尔曼滤波器来实现。基于卡尔曼滤波器的SLAM 包括系统状态预测和更新两步,同时还需要进行地图信息的管理,如:新特征标志的加入与特征标志的删除等。

卡尔曼滤波器假设系统是线性系统,但是实际中机器人的运动模型与观测模型是非线性的。因此通常采用扩展卡尔曼滤波器(Extended Kalman Filter),扩展卡尔曼滤波器通过一阶泰勒展开来近似表示非线性模型。另一种适用于非线性模型的卡尔曼滤波器是UKF(Unscented Kalman Filter),UKF采用条件高斯分布来近似后验概率分布,与EKF相比,UKF的线性化精度更高,而且不需要计算雅可比矩阵。

卡尔曼滤波器已经成为实现SLAM的基本方法。其协方差矩阵包含了机器人的位置和地图的不确定信息。当机器人连续地观测环境中的特征标志时,协方差矩阵的任何子矩阵的行列式呈单调递减。从理论上讲,当观测次数趋向于无穷时,每个特征标志的协方差只与机器人起始位置的协方差有关。卡尔曼滤波器的时间复杂度是O( ),由于每一时刻机器人只能观测到少数的几个特征标志,基于卡尔曼滤波器的SLAM的时间复杂度可以优化为O( ),n表示地图中的特征标志数。

3.2局部子地图法

局部子地图法从空间的角度将SLAM分解为一些较小的子问题。子地图法中主要需要考虑以下几个问题:1)如何划分子地图2)如何表示子地图间的相互关系3)如何将子地图的信息传递给全局地图以及能否保证全局地图的一致性。

最简单局部子地图方法是不考虑各子地图之间的相互关系,将全局地图划分为包括固定特征标志数的独立子地图,在各子地图中分别实现SLAM,这种方法的时间复杂度为O(1)。但是,由于丢失了表示不同子地图之间相关关系的有用信息,这种方法不能保证地图的全局一致性。

对此,Leonard 等人提出了DSM(DecoupledStochastic Mapping)方法,DSM中各子地图分别保存自己的机器人位置估计,当机器人从一个子地图A进入另一个子地图B时,采用基于EKF的方法来将子地图A中的信息传送给子地图B;B.Williams等人提出了一种基于CLSF(ConstrainedLocal Submap Filter)的SLAM方法,CLSF在地图中创建全局坐标已知的子地图,机器人前进过程中只利用观测信息更新机器人和局部子地图中的特征标志的位置,并且按一定的时间间隔把局部子地图信息传送给全局地图。虽然实验表明这两种算法具有很好的性能,但是没有从理论上证明它们能够保持地图的一致性。J.Guivant等人提出了一种没有任何信息丢失的SLAM优化算法CEKF(CompressedExtended Kalman Filter)。CEKF将已经观测到的特征标志分为A与B部分,A表示与机器人当前位置相邻的区域,被称为活动子地图。当机器人在活动子地图A中运动时,利用观测信息实时更新机器人的位置与子地图A,并采用递归的方法记录观测信息对子地图B的影响;当机器人离开活动子地图A时,将观测信息无损失地传送给子地图B,一次性地实现子地图B的更新,同时创建新的活动子地图。该方法的计算时间由两部分组成:活动子地图中的SLAM,其时间复杂度为O( ), 是活动子地图A中特征标志的数目;子地图B的更新,其时间复杂度为O( ) , 是地图B中特征标志的数目。当子地图合并的时间间隔较大时,CEKF能有效减少SLAM的计算量。

3.3去相关法

降低SLAM复杂度的另一种方法是将表示相关关系的协方差矩阵中一些取值较小的元素忽略掉,使其变为一个稀疏矩阵。然而这也会因信息的丢失而使地图失去一致性。但是,如果能改变协方差矩阵的表示方式,使其中的很多的元素接近于零或等于零,那么就可以将其安全地忽略了。基于扩展信息滤波器EIF(ExtendedInformation Filter)的SLAM就是出于这一思想。EIF EKF的基于信息的表达形式,它们的区别在于表示信息的形式不一样。EIF采用协方差矩阵的逆矩阵来表征SLAM中的不确定信息,并称之为信息矩阵。两个不相关的信息矩阵的融合可以简单地表示为两个矩阵相加。信息矩阵中每个非对角线上的元素表示机器人与特征标志之间或特征标志与特征标志之间的一种约束关系,这些约束关系可以通过系统状态的信关系进行局部更新。这种局部更新使得信息矩阵近似于稀疏矩阵,对其进行稀疏化产生的误差很小。根据这一点,S.Thrun等人提出了一种基于稀疏信息滤波器SEIF(Sparse Extended InformationFilter)的SLAM方法,并证明利用稀疏的信息矩阵实现SLAM的时间复杂度是O(1)。虽然EIF可以有效降低SLAM的时间复杂度,但是在地图信息的表示和管理方面还存在一些问题。首先,在常数时间内只能近似算得系统状态的均值;其次,在基于EIF 的SLAM 方法中,特征标志的增删不方便。

3.4分解法(FastSLAM)

M.Montemerlo 等人提出了一种基于粒子滤波器(ParticleFilter) FastSLAM 方法。FastSLAM 将SLAM分解为机器人定位和特征标志的位置估计两个过程。 粒子滤波器中的每个粒子代表机器人的一条可能运动路径,利用观测信息计算每个粒子的权重,以评价每条路径的好坏。对于每个粒子来说,机器人的运动路径是确定的,因此特征标志之间相互独立,特征标志的观测信息只与机器人的位姿有关,每个粒子可以采用n个卡尔曼滤波器分别估计地图中n个特征的位置。假设需要k个粒子实现SLAM、FastSLAM,总共有kn个卡尔曼滤波器。FastSLAM的时间复杂度为O(kn),通过利用树型的数据结构进行优化,其时间复杂度可以达到O(klog n)。Fast2SLAM方法的另一个主要优点是通过采用粒子滤波器估计机器人的位姿,可以很好地表示机器人的非线性、非高斯运动模型。

3.5基于多机器人协作的SLAM

一些研究者对基于多机器人协作的同时定位与地图创建CSLAM(CooperativeSimultaneous Localizationand Mapping)进行了探讨和研究。 与单机器人相比,通过机器人之间的相互协调与合作以及信息共享,CSLAM可以提高地图创建的效率和提高定位与地图的精度。CSLAM按照地图的存储与处理方式的不同可以分为两大类型:集中式CSLAM和分布式CSLAM。在集中式CSLAM中,存在一个中央处理模块,每个机器人分别在自己所在的局部地图中进行定位与地图创建,然后利用无线通信装置将在局部地图中获得的信息传送给中央模块。这种方法通过子地图的匹配,可以充分利用子地图间的冗余信息提高定位与地图创建的精度。但是,当机器人数量增加时中央模块的计算量会显著增大,而且集中式的信息传递需要很大的带宽;系统的可靠性也比较低,一旦中央模块出现故障,整个系统都会陷入瘫痪状态。在分布式CSLAM中,不存在中央模块,每个机器人都拥有自己的全局地图,在每一时刻机器人把来自其他相邻机器人的信息和自己的观测信息融合到自己的全局地图中,然后以点对点的方式将新的信息传送给其他机器人。每个机器人只能获得与其相邻的机器人的位置信息,不知道整个系统的拓扑结构。这种方法与分布式的信息融合十分相似,可以利用信息滤波器来实现。由于两个不相关信息矩阵的信息融合可以通过两个矩阵的相加而实现,所以利用信息滤波器实现分布式CSLAM可以避免复杂的计算。

4.研究方向与发展趋势

综上所述,近几年来机器人领域的研究者对SLAM进行了大量的研究,特别是在降低计算复杂度、提高鲁棒性等方面取得了很大的进展。随着研究的深入,以下的几方面成为了当前SLAM的研究热点方向。
1.扩展SLAM的应用环境:将目前局限二维静态环境中的研究与应用扩展到与现实中的环境切合的动态的三维环境;
2.深入研究基于多机器人协作的SLAM,提高其应用水平;
3.研究更有效的SLAM实现方法,将人工智能、智能控制等领域的方法引入到SLAM中,开发更有效的SLAM算法.;
4.研究更好的地图表达方式,特别是复杂地形和大环境中的地图表达方式;
5.研究更好的将视觉处理与其他传感器结合,提高环境特征提取的精度,减少误差,提高定位和构图的精确性。

机器人2025本期第二版导读
DeepMind与英国医院合作:用机器学习治疗头部和颈部的癌症
 
文章来源于 机器人2025
1 回答
1077 浏览

干货 | 剖析工业机器人应用项目中的光纤传感器

智能科技类 国产女汉子 2017-03-14 11:51 发表了文章 来自相关话题

光纤传感器介紹


光纤传感器是一种放大器分离型的光电传感器,光纤传感器中也有对射型、回归反射型和扩散反射型。光纤传感器能够检测一些由于空间太小一般传感器无法安装的场合,或特殊环境下。

光纤传感器因为光纤的优点以及它的数字化显示、管理,是目前光电传感器发展的主流。









高温检测









光纤工作原理



















光纤传感器的特点


1. 检测距离长

2. 对检测物体的限制少:以检测物体引起的遮光和反射为检测原理,所以不象接近传感器等将检测物体限定在具有導磁性,它可对玻璃·塑料、木材、液体等几乎所有物体进行检测。

3. 响应时间短:光本身为高速,并且传感器的电路都由电子零件构成,所以不包含机械性工作时间,响应时间非常短。

4. 分辨率高:能通过先进技术使投光光束集中为小光点,或通过构成特殊的受光光学系统,来实现高分辨率。也可进行微小物体的检测和高精度的位置检测。

5. 便于调整:在投射可视光的类型中,投光光束是眼睛可见的,便于对检测物体的位置进行调整。

6. 可实现颜色判别:通过检测物体形成的光的反射率和吸收率根据被投光的光线波长和检测物体的颜色组合而有所差异。利用这种性质,可对检测物体的颜色进行检测。




光纤传感器术语


检测距离

对射型:投光器与受光器直接的距离;

回归反射型:投受光器到反射板的距离;

扩散反射型/限定反射性/距离设定型:投受光器与检测物体直接的距离;









应差距离

动作距离与复位距离的差;(主要指扩散反射型)









响应时间

从输入光的断续开始到控制输出的动作或复位为止的时间









遮光动作与入光动作


遮光是遮断或者减少进入受光器的光束时使用输出型;入光则是增加进入受光器的光束时使用输出型。









自我诊断功能

判断光量的稳定度。一般光电传感器都带有绿色稳定指示灯,绿色和橙色灯同时亮表示稳定检测。自我诊断输出:不稳定时输出。









外部输入诊断


通过将对射型投光器的导线「粉」― 「蓝」间短路,可在任意时间使投光停止。

投光器和受光器间没有检测物体时(工作前),对投光器进行ON/OFF设置,如果受光器侧的输出没有变化,说明传感器发生异常。









标准检测物体

对射型和回归反射型是根据光学结构的对角线长度将直径较大的不透明体的尺寸作为标准物体。一般的对射型是以投、受光器的对角线长度作为标准检测物体的长度。回归反射型则是以反射板的对角线长度作为标准检测物体的直径。扩散反射型是根据投光束的直径将大张的白纸作为标准检测物体。









光纤传感器应用

使用光电传感器计算速冻饺子的个数









更多内容请关注:www.imefuture.com 








 来源:工业机器人培训、 过去与未来 侵删 查看全部
光纤传感器介紹


光纤传感器是一种放大器分离型的光电传感器,光纤传感器中也有对射型、回归反射型和扩散反射型。光纤传感器能够检测一些由于空间太小一般传感器无法安装的场合,或特殊环境下。

光纤传感器因为光纤的优点以及它的数字化显示、管理,是目前光电传感器发展的主流。

1.JPG





高温检测

2.JPG





光纤工作原理

3.jpg


4.JPG


5.JPG





光纤传感器的特点


1. 检测距离长

2. 对检测物体的限制少:以检测物体引起的遮光和反射为检测原理,所以不象接近传感器等将检测物体限定在具有導磁性,它可对玻璃·塑料、木材、液体等几乎所有物体进行检测。

3. 响应时间短:光本身为高速,并且传感器的电路都由电子零件构成,所以不包含机械性工作时间,响应时间非常短。

4. 分辨率高:能通过先进技术使投光光束集中为小光点,或通过构成特殊的受光光学系统,来实现高分辨率。也可进行微小物体的检测和高精度的位置检测。

5. 便于调整:在投射可视光的类型中,投光光束是眼睛可见的,便于对检测物体的位置进行调整。

6. 可实现颜色判别:通过检测物体形成的光的反射率和吸收率根据被投光的光线波长和检测物体的颜色组合而有所差异。利用这种性质,可对检测物体的颜色进行检测。




光纤传感器术语


检测距离

对射型:投光器与受光器直接的距离;

回归反射型:投受光器到反射板的距离;

扩散反射型/限定反射性/距离设定型:投受光器与检测物体直接的距离;

6.JPG





应差距离

动作距离与复位距离的差;(主要指扩散反射型)

7.jpg





响应时间

从输入光的断续开始到控制输出的动作或复位为止的时间

8.JPG





遮光动作与入光动作


遮光是遮断或者减少进入受光器的光束时使用输出型;入光则是增加进入受光器的光束时使用输出型。

9.JPG





自我诊断功能

判断光量的稳定度。一般光电传感器都带有绿色稳定指示灯,绿色和橙色灯同时亮表示稳定检测。自我诊断输出:不稳定时输出。

10.jpg





外部输入诊断


通过将对射型投光器的导线「粉」― 「蓝」间短路,可在任意时间使投光停止。

投光器和受光器间没有检测物体时(工作前),对投光器进行ON/OFF设置,如果受光器侧的输出没有变化,说明传感器发生异常。

11.JPG





标准检测物体

对射型和回归反射型是根据光学结构的对角线长度将直径较大的不透明体的尺寸作为标准物体。一般的对射型是以投、受光器的对角线长度作为标准检测物体的长度。回归反射型则是以反射板的对角线长度作为标准检测物体的直径。扩散反射型是根据投光束的直径将大张的白纸作为标准检测物体。

12.JPG





光纤传感器应用

使用光电传感器计算速冻饺子的个数

13.jpg





更多内容请关注:www.imefuture.com 

智造家二维码.jpg




 来源:工业机器人培训、 过去与未来 侵删
879 浏览

「人工智能百年研究」首份报告:2030 年的人工智能与生活 | 行研报告

机械自动化类 我是谁 2016-10-11 10:37 发表了文章 来自相关话题

这篇来自斯坦福的「人工智能百年研究」报告是计划持续至少 100 年的、研究系列中的第一篇。它描述了目前人工智能相关技术、法律以及道德上的挑战,并对人工智能的研究、应用、政策上的方向提出了指导与建议。(因微信字数限制,请点击「阅读原文」下载完整中文报告。)





 
 
[login]
 序言

2014 年秋季,人工智能百年研究项目启动,这是一项关于人工智能领域,及其对人类、社区、社会影响的长期学术研究。这项研究包含使用人工智能计算系统的科学、工程和应用实现。监督该「百年研究」的常务委员会组建了一个研究小组来每五年评估一次人工智能所处的状态——这是本项目的核心活动。

本研究小组要回顾从上次报告到现在这段时间人工智能的进展,展望未来潜在的进展并且描述这些进展对于技术、社会的挑战与机遇,涉及的领域包括:道德伦理、经济以及与人类认知兼容的系统设计等等。

 
「百年研究」定期进行专家回顾的首要目标是:提供一个随着人工智能领域发展的,关于人工智能及其影响的收集性和连通性的集合。这些研究希望能在人工智能领域的科研、发展以及系统设计方面,在帮助确保那些系统能广泛地有益于个人和社会的项目与政策上提供专业推断上的方向指南及综合评估。


这篇报告是计划持续至少 100 年的研究系列中的第一篇。常务委员会在 2015 年的暑期成立了一个研究小组来负责组建现在这个初始的研究小组,并任命了得克萨斯大学奥斯汀分校的教授 Peter Stone 担任该小组的主席。这个包含了 17 名成员的研究小组由人工智能学术界、公司实验室和产业界的专家,以及了解人工智能的法律、政治科学、政治以及经济方面的学者组成,并于 2015 年秋季中期启动。


参与者代表着不同的专业、地区、性别以及职业阶段。常务委员会广泛讨论了研究小组相应的责任,包括人工智能最近的发展与在工作、环境、运输、公共安全、医疗、社区参与以及政府的潜在社会影响。委员会考虑多种聚焦研究的方式,包括调查子领域及其状态、研究特定的技术(例如机器学习与自然语言处理)以及研究特定的应用领域(例如医疗与运输)。

 
委员会最终选择了「 2030 年的人工智能与生活( AI and Life in 2030 )」为主题,以强调人工智能的各种用途与影响的发生不是独立于彼此,也不独立于其他许多社会和技术上的发展。意识到了城市在大多数人类生活中的核心作用之后,我们将专注重点缩小到大多数人居住的大都市。







第一部分:什么是人工智能?


本章节介绍了研究人员和从业者如何定义「人工智能」以及目前正在蓬勃发展的人工智能研究和应用领域。它提出了人工智能是什么和不是什么的定义,并介绍了一些当前人工智能研究的「热点」领域。


本章节为第二部分和第三部分的内容奠定了基础。第二部分阐述了人工智能在八个领域中的影响与未来,第三部分介绍了涉及人工智能设计和公共政策的问题,并提出在保护民主价值的同时如何鼓励人工智能创新的建议。



1.1定义人工智能


奇怪的是,人工智能缺乏一个精确的、被普遍接受的定义,这或许有助于该领域的加速成长、繁荣以及前进。虽然人工智能的从业者、研究人员和开发人员由一种粗略的方向感和一个「与它相处」的命令所引导,人工智能的定义仍然很重要,而 Nils J. Nilsson 就提供了一个有用的定义:「人工智能就是致力于让机器变得智能的活动,而智能就是使实体在其环境中有远见地、适当地实现功能性的能力」。


电子计算器智能吗?像 Nilsson 一样,研究小组以一种宽泛的视角来看待此问题,认为智力取决于一个多维频谱。根据这一观点,算术计算器和人脑之间的区别不是某一类,而是规模、速度、自主性和通用性的区别。

 
同样的因素可以用来评估智能的其他各例——智能语音识别软件、动物大脑、汽车巡航控制系统、围棋程序、自动调温器——并将它们放置在频谱中的适当位置。虽然我们的宽泛解释把计算器列在了智能频谱中,但是如此简单的设备与今天的人工智能相比几乎没有相似之处。

 
从这个角度看,对人工智能的表征取决于个人愿意「适当地」并「有远见地」为功能提供合成软件和硬件的信用。一个简单的电子计算器比人脑计算快得多而且几乎从不出错。

 
人工智能的边界已经远远走在前面,而计算器可以实现的功能只是当下的智能手机的百万分之一。目前人工智能开发人员正在改进、推广和扩大从当下的智能手机中所建立起来的智能。事实上人工智能领域是一个不断努力推动机器智能向前发展的过程。

 
具有讽刺意味的是,人工智能正在遭受失去话语权的长期灾难,最终不可避免地会被拉到边界内,即一个被称为「人工智能效应」( AI effect )或「奇怪悖论」( odd paradox )的重复模式——人工智能将一种新技术带到了普通大众中去,人们习惯了这种技术,它便不再被认为是人工智能,然后更新的技术出现了。


同样的模式将在未来继续下去。人工智能并没有「交付」一个惊雷般改变生活的产品。相反人工智能技术正在以一个连续的、进步的方式继续更好的发展。







1.2人工智能研究趋势


直到本世纪初,人工智能的吸引点主要在于它所传递的承诺,但在过去的十五年里,大多这样的承诺已经得到兑现。人工智能技术已经充斥了我们的生活。当它们成为了社会的一股中心力量时,该领域正在从仅仅建立智能系统,转向了建立有人类意识的、值得信赖的智能系统。


几个因素加速了人工智能革命。其中最重要的是机器学习的成熟,部分由云计算资源和广泛普及的、基于 Web 的数据收集所支持。机器学习已经被「深度学习」急剧地向前推进了,后者是利用被称作「反向传播的方法」所训练的适应性人工神经网络的一种形式。


信息处理算法的这种性能飞跃一直伴随着用于基本操作的硬件技术的显著进步,比如感觉、感知和目标识别。数据驱动型产品的新平台和新市场,以及发现新产品和新市场的经济激励机制,也都促进了人工智能驱动型技术的问世。


所有这些趋势都推动着下文中所描述的「热门」研究领域。这只是想要通过某个或另一个度量标准来反映目前比其他领域得到更大关注的领域。它们不一定比其他领域更重要或更有价值。事实上目前的一些「热门」领域在过去几年中并不怎么流行,而其他领域可能在未来会以类似的方式重新出现。

 

1. 大规模机器学习


许多机器学习的基本问题(如监督和非监督学习)是很好理解的。目前努力的一个重点是将现有算法扩展到更庞大的数据集上。例如鉴于传统方法能够负担得起若干遍数据集的处理,现代方法是为单次处理所设计;某些情况只认同非线性方法(那些只关注一部分数据的方法)。




2. 深度学习

 
成功训练卷积神经网络的能力非常有益于计算机视觉领域,比如目标识别、视频标签、行为识别和几个相关变体的应用。深度学习也在大举进军感知方面的其他领域,如音频、语音和自然语言处理。

 

3. 强化学习


鉴于传统机器学习主要关注于模式挖掘,强化学习将重点转移到决策中,这种技术将有助于促进人工智能在现实世界中更深入地进入相关研究和实践领域。作为一种经验驱动型的序贯决策框架,强化学习已经存在了几十年,但是这个方法在实践中没有取得很大成功,主要是由于表征和缩放的问题。深度学习的出现为强化学习提供了「一贴强心剂」。


由谷歌 DeepMind 开发的计算机程序 AlphaGo 在五次对抗比赛中击败了人类围棋冠军,它最近所取得的成功在很大程度上要归功于强化学习。AlphaGo 是通过使用一个人类专家数据库来初始化一个自动代理的方法被训练的,但随后提炼的方法是通过大量地自我对抗游戏以及应用强化学习。








4. 机器人


至少在静态环境中,机器人导航在很大程度上被解决了。目前的努力是在考虑如何训练机器人以广泛型的、预测性的方式与周围世界进行交互。互动环境中产生的一个自然要求是操纵,这是当下所感兴趣的另一个话题。


深度学习革命只是刚开始影响机器人,这在很大程度上是因为要获得大的标记数据集还很困难,这些数据集已推动了其他基于学习的人工智能领域。

 
免去了标记数据需求的强化学习可能会有助于弥合这一差距,但是它要求系统在没有错误地伤害自己或其他系统的情况下能够安全地探索出一个政策空间。在可信赖的机器感知方面的进步,包括计算机视觉、力和触觉感知,其中大部分将由机器学习驱动,它们将继续成为推进机器人能力的关键。








5. 计算机视觉

 
计算机视觉是目前最突出的机器感知形式。它是受深度学习的兴起影响最大的人工智能子领域。直到几年前,支持向量机还是大多视觉分类任务所选择的方法。但是特别是在 GPU 中的大规模计算的汇合,使得更大数据集的可获得性(尤其是通过互联网)以及神经网络算法的改进导致了基准任务功能的显著提高(比如 ImageNet 中的分类器)。计算机首次能够比人类更好地执行一些(狭义定义的)视觉分类任务。目前的研究多是关注于为图像和视频自动添加字幕。

 

6. 自然语言处理

 
自然语言处理是另一个通常与自动语音识别一同被当做非常活跃的机器感知领域。它很快成为一种拥有大数据集的主流语言商品。谷歌宣布目前其 20% 的手机查询都是通过语音进行的,并且最近的演示已经证明了实时翻译的可能性。现在研究正在转向发展精致而能干的系统,这些系统能够通过对话而不只是响应程式化的要求来与人互动。




7. 协同系统


协同系统方面进行的是对模型和算法的研究,用以帮助开发能够与其他系统和人类协同工作的自主系统。该研究依赖于开发正式的协作模型,并学习让系统成为有效合作伙伴所需的能力。能够利用人类和机器的互补优势的应用正吸引到越来越多的关注——对人类来说可以帮助人工智能系统克服其局限性,对代理来说可以扩大人类的能力和活动。

 

8. 众包和人类计算

 
在完成许多任务方面由于人类的能力是优于自动化方法的,因而在众包和人类计算方面,也需要通过利用人类智力来解决那些计算机无法单独解决好的问题。该领域研究调查了增强计算机系统的方法,这项研究的提出仅仅是在大约 15 年前,现在它已经在人工智能领域确立了自己的存在。最有名的众包例子是维基百科,它是一个由网络公民维护和更新的知识库,并且在规模上和深度上远远超越了传统编译的信息源,比如百科全书和词典。

 
众包专注于设计出创新的方式来利用人类智力。Citizen 科学平台激发志愿者去解决科学问题,而诸如亚马逊的 Mechanical Turk 等有偿众包平台,则提供对所需要的人类智力的自动访问。通过短时间内收集大量标记训练数据和/或人机交互数据,该领域的工作促进了人工智能的其它分支学科的进步,包括计算机视觉和自然语言处理。基于人类和机器的不同能力和成本,目前的研究成果探索出了它们之间理想的任务分离。








9. 算法博弈理论与 (基于) 计算机 (统计技术的) 社会选择

 
包括激励结构、人工智能在内的经济和社会计算维度吸引到了新的关注。自 20 世纪 80 年代初以来,分布式人工智能和多代理(multi-agent)系统就已经被研究了,于 20 世纪 90 年代末开始有显著起色,并由互联网所加速。一个自然的要求是系统能够处理潜在的不恰当激励,包括自己所感兴趣的人类参加者或公司,以及自动化的、基于人工智能的、代表它们的代理。


备受关注的主题包括:计算机制设计,一种激励设计的经济理论,它寻求激励兼容的系统,其中输入会被如实报告;基于计算机统计技术的社会选择,一种有关如何为替代品排列顺序的理论;激励对齐信息获取,预测市场、评分规则、同行预测;算法博弈理论,市场、网络游戏和室内游戏的平衡,比如poker——它在近几年通过抽象技术和无遗憾学习已经取得了显著的进步。



10. 物联网(IoT)


越来越多的研究机构致力于这样一个想法:一系列设备可以相互连接以收集和分享它们的感官信息。这些设备可以包括家电、汽车、建筑、相机和其他东西。基于技术和无线网络连接设备,人工智能可以为了智能的、有用的目的去处理和使用所产生的大量数据。目前这些设备使用的是令人眼花缭乱的各种不兼容的通信协议。人工智能可以帮助克服这个「巴别塔」。

 

11. 神经形态计算


传统计算机执行计算的冯诺依曼模型,它分离了输入/输出、指令处理和存储器模块。随着深度神经网络在一系列任务中的成功,制造商正在积极追求计算的替代模型——特别是那些受到生物神经网络所启发的——为了提高硬件的效率和计算系统的稳定性的模型。


目前这种神经形态的计算机尚未清楚地显示出巨大成功,而是刚开始有望实现商业化。但可能它们在不久的将来会变成寻常事物(即使仅作为冯诺依曼所增加的兄弟姐妹们)。深度神经网络在应用景观中已经激起了异常波动。当这些网络可以在专门的神经形态硬件上被训练和被执行,而不是像今天这样在标准的冯诺依曼结构中被模拟时,一个更大的波动可能会到来。




12. 总体趋势以及人工智能研究的未来

 
数据驱动型范式的巨大成功取代了传统的人工智能范式。诸如定理证明、基于逻辑的知识表征与推理,这些程序获得的关注度在降低,部分原因是与现实世界基础相连接的持续挑战。规划(Planning)在七十和八十年代是人工智能研究的一根支柱,也受到了后期较少的关注,部分原因是它强烈依赖于建模假设,难以在实际的应用中得到满足。


基于模型的方法——比如视觉方面基于物理的方法和机器人技术中的传统控制与制图——已经有很大一部分让位于通过检测手边任务的动作结果来实现闭环的数据驱动型方法。即使最近非常受欢迎的贝叶斯推理和图形模式似乎也正在失宠,被数据和深度学习显著成果的洪流所淹没。


研究小组预计在接下来的十五年中,会有更多关注集中在针对人类意识系统的开发上。这意味着它们是明确按照要与之互动的人类特点来进行建模与设计的。很多人的兴趣点在于试图找到新的、创造性的方法开发互动和可扩展的方式来教机器人。


此外在考虑社会和经济维度的人工智能时,物联网型的系统——设备和云——正变得越来越受欢迎。在未来的几年中,对人类安全的感知、新的目标识别能力和机器人平台将会增加,数据驱动型产品数量与其市场规模将会变大。


研究小组还预计当从业者意识到纯粹的端到端深度学习方法的不可避免的局限性时,会重新出现一些人工智能的传统形式。我们不鼓励年轻的研究人员重新发明理论,而是在人工智能领域以及相关领域(比如控制理论、认知科学和心理学)的第一个五十年期间,保持对于该领域多方面显著进展的觉察。








第二部分:人工智能在各领域的应用


虽然人工智能的很多研究和应用会基于一些通用技术,比如说机器学习,但在不同的经济和社会部门还是会有所区别,我们称之为不同的领域(domain)。接下来的这部分将介绍人工智能研究和应用的不同类型,以及影响和挑战,主要有八个方面:交通、家庭服务机器人、医疗健康、教育、低资源社区、公共安全、工作和就业、娱乐。


基于这些分析,我们还预测了一个有代表性的北美城市在未来 15 年的趋势。与人工智能的流行文化中的典型叙述不同,我们寻求提供一个平衡的观点来分析,人工智能是如何开始影响我们日常生活的,以及从现在到 2030 年,这些影响将如何发展。


2.1交通


交通可能会成为首批几个特定应用领域之一。在这些领域,大众需要对人工智能系统在执行危险任务中的可靠性和安全性加以信任。自动化交通会很快司空见惯,公众对嵌入人工智能系统的实体交通工具的首次体验,将强有力地影响其对人工智能的感知。




2.2家庭服务机器人


过去十五年中,机器人已经进入了人们的家庭。但应用种类的增长慢得让人失望,与此同时,日益复杂的人工智能也被部署到了已有的应用之中。人工智能的进步常常从机械的革新中获取灵感,而这反过来又带来了新的人工智能技术。

 
未来十五年,在典型的北美城市里,机械和人工智能技术的共同进步将有望增加家用机器人的使用和应用的安全性和可靠性。特定用途的机器人将被用于快递、清洁办公室和强化安全,但在可预见的未来内,技术限制和可靠机械设备的高成本将继续限制其在应用领域的商业机会。至于自动驾驶汽车和其它新型的交通机器,创造可靠的、成熟的硬件的难度不应该被低估。






 

2.3医疗


人工智能而言,医疗领域一直被视为一个很有前景的应用领域。基于人工智能的应用在接下来的几年能够为千百万人改进健康结果和生活质量,但这是在它们被医生、护士、病人所信任,政策、条例和商业障碍被移除的情况下。主要的应用包括临床决策支持、病人监控、辅导、在外科手术或者病人看护中的自动化设备、医疗系统的管理。


近期的成功,比如挖掘社交媒体数据推断潜在的健康风险、机器学习预测风险中的病人、机器人支持外科手术,已经为人工智能在医疗领域的应用扩展出了极大的应用可能。与医学专家和病人的交互方法的改进将会是一大挑战。

 
至于其他领域,数据是一个关键点。在从个人监护设备和手机 App 上、临床电子数据记录上收集有用的数据方面,我们已经取得了巨大的进展,从协助医疗流程和医院运行的机器人那里收集的数据可能较少一些。但使用这些数据帮助个体病人和群体病人进行更精细的针对和治疗已经被证明极其的困难。

 
研究和部署人工智能应用已经被过时的条例和激励机制拉扯后腿。在这样大型的、复杂的系统中,贫乏的人机交互方法和固有的难题以及部署技术的风险也阻碍了人工智能在医疗的实现。减少或者移除这些障碍,结合目前的创新,有潜力在接下来几年为千百万人极大的改进健康结果和生活质量。

 


2.4教育

在过去的十五年间,教育界见证了为数众多的人工智能科技的进步。诸如 K-12 线上教育以及大学配套设备等等应用已经被教育家和学习者们广泛利用。尽管素质教育还是需要人类教师的活跃参与,但人工智能在所有层面上都带来了强化教育的希望,尤其是大规模定制化教育。如何通过人工智能技术来最优化整合人类互动与面对面学习,将是一个关键性的挑战。

 
机器人早已经成为了广为欢迎的教育设备,最早可以追溯到 1980 年 MIT Media Lab 所研制出的 Lego Mindstorms。智能辅导系统( ITS )也成为了针对科学、数学、语言学以及其他学科相匹配的学生互动导师。

 
自然语言处理,尤其是在与机器学习和众包结合以后,有力推进了线上学习。帮助让教师在扩大教室规模的同时还能做到解决个体学生的学习需求与风格。大型线上学习的系统所得的数据已经为学习分析产生了迅速增长的动力。


但是,学院与大学采用人工智能技术的步伐依然很缓慢,主要是由于资金的缺乏,以及其可以帮助学生达成学习目标的有力证据。一个典型美国北部城市的未来五十年,智能导师与其他人工智能技术帮助教师在课堂或家中工作的规模很有可能会显著扩大,因为意愿学习是基于虚拟现实的应用。但是计算机为基础的学习系统将无法完全替代学校里的教师们。

 

更广大的社会成果


对于大多数人民难以获得教育的国家,如果可以应用在线教育的工具,那么在线资源将会产生重要的积极影响。在线教育资源的发展应该能让支持国际教育项目的基金会可以通过提供工具和相对简单的使用培训来更轻松地提供素质教育。比如说,针对 iPad 开发出了大量的、且大部分免费的教育应用。

 
在消极的一面,现在学生已有把自己的社会接触限制在电子设备上的趋势了,他们在网络程序的互动上花费了大量时间,却没有进行社会接触。如果教育也越来越多地通过网络进行,那么在学生的社会发展阶段缺乏与同龄人有规律的面对面接触会带来怎样的影响呢?特定的技术已经表明这会产生在神经方面的影响。另一方面,自闭症儿童已经开始从与人工智能系统的互动中受益了。






 


2.5低资源社区


人工智能存在许多机会去改善生活于一个典型北美城市的低资源社区中的人民生活状况——事实上在某些情况下已经有所改变。了解这些人工智能的直接贡献也可能会激发对于发展中国家最为贫穷的地区的潜在贡献。在人工智能的数据收集过程中并没有对这个人群的显著关注,而且传统上人工智能资助者在缺乏商业应用的研究中表现得投资乏力。

 
有了有针对性的激励和资金优先次序,人工智能技术可以帮助解决低资源社区的需求。萌芽中的努力是有希望的。人工智能可能会有有助于对抗失业和其他社会问题带来的恐惧,它或许会提供缓解措施和解决方案,特别是通过受影响的社区用于其建立信任的方式来实现。



2.6公共安全与防护


城市已经为公共安全与防护部署人工智能技术了。到 2030 年, 典型的北美城市将在很大程度上依赖它们。这些措施包括可以检测到指向一个潜在犯罪的异常现象的监控摄像机、无人机和预测警务应用。与大多数问题一样,好处与风险并存。


获得公众信任是至关重要的。虽然会存在一些合理的担心,即与人工智能合作的警务可能会在某些情况下变得霸道或是无处不在,而相反的情况也是可能的。人工智能可能使警务变得更有针对性并只在需要时被使用。而且假设经过仔细的部署,人工智能也可能有助于消除一些人类决策中固有的偏见。


对于人工智能分析学更成功的一个应用是检测白领犯罪,比如信用卡诈骗罪。网络安全(包括垃圾邮件)是一个被广泛关注的问题,而机器学习也对其有所影响。


人工智能工具也可能被证明有助于警察管理犯罪现场或是搜索和救援活动,它可以帮助指挥官排列任务的优先次序以及分配资源,尽管这些工具还没有为这些活动的自动化做好准备。在一般的机器学习尤其是在转换学习中的改进——在新情境中基于与过去情况的相似性而加快学习——可能有利于这样的系统。









2.7就业与劳资


尽管人工智能很有可能会对典型北美城市的就业与工作场所产生深远的影响,但对当前的影响我们目前还难以作出评估——是积极的还是消极的。在过去十五年,由于经济衰退和日益的全球化,尤其是中国参与到了世界经济中,就业状况已经发生了改变,非人工智能的数字技术也发生了很大的变化。自 1990 年代以来,美国经历了生产率和 GDP 的连续增长,但平均收入却停滞不前,就业人口比率也已经下降。


有一些数字技术有重大影响(好的影响或坏的影响)的行业的显著案例,而在一些其它的行业,自动化将很有可能在不久的将来发生重大的改变。许多这些改变已经得到了「例行的」数字技术的推动,其中包括企业资源规划、网络化、信息处理和搜索。理解这些改变应该能为人工智能影响未来劳动力需求的方式(包括技能需求的改变)提供见解。

 
到目前为止,数字技术已经给中等技能的工作(比如旅行代理)带来了更大的影响,而不是非常低技能或非常高技能的工作。另一方面,数字系统所能完成的任务的范围正随着人工智能的演进而提升,这很可能会逐渐增大所谓的「例行任务」的范围。人工智能正向高端的领域蔓延,包括一些机器之前无法执行的专业服务。

 
为了获得成功,人工智能创新将需要克服可以理解的人们对被边缘化的恐惧。在短期内,人工智能很有可能会取代任务,而非工作,同时还将会创造新类型的工作。但新类型的工作比将可能失去的已有工作更难以想象。就业领域的变化通常是渐进的,不会出现剧烈的过渡。

 
随着人工智能进入工作场所,这很有可能是一个持续的趋势。影响的范围也将扩大,从少量的替代或增强到完全的替代。比如说,尽管大部分律师的工作还没被自动化,但人工智能在法律信息提取和主题建模方面的应用已经自动化了一部分第一年工作的律师新人的工作。在不远的将来,包括放射科医生到卡车司机到园丁等许多类型的工作都可能会受到影响。


人工智能也可能会影响工作场所的大小和位置。许多组织和机构很庞大的原因是他们所执行的功能只能通过增加人力来扩大规模,要么是「横向」扩展地理区域,要么是「纵向」增多管理层级。随着人工智能对许多功能的接管,扩展不再意味着会带来大型的组织。

 
许多人已经指出一些知名的互联网公司只有很少数量的员工,但其它公司并不是这样。人类企业可能存在一个自然的规模大小,在这样的企业中,CEO 能够认识公司里的每一个人。通过将创造有效地外包给人工智能驱动的劳动力市场,企业会倾向于自然的大小。

 
人工智能也将创造工作,特别是在某些行业中,通过使某些特定任务更重要,以及通过产生新的交互模型创造新类型的工作。复杂的信息系统可被用于创造新的市场,这往往会带来降低门槛和增加参与的影响——从应用商店到 Airbnb 再到 TaskRabbit。人工智能界有一个活跃的研究社区在研究创造新市场和使已有市场更高效地运作的进一步的方式。


尽管工作本身有内在的价值,但大部分人工作是为了购买他们看重的商品和服务。因为人工智能系统可以执行之前需要人力的工作,因此它们可以导致许多商品和服务的成本下降,实实在在地让每个人都更富有。当正如当前的政治辩论中所给出的例子一样,失业对人们的影响比对散布的经济效益的影响更显著——尤其是那些直接受其影响的人;而不幸的是,人工智能常常被视作是工作的威胁,而不是生活水平的提升。


人们甚至在某些方面存在恐惧——害怕人工智能会在短短一代人的时间内迅速取代所有的人类工作,包括那些需要认知和涉及到判断的工作。这种突变是不太可能发生的,但人工智能会逐渐侵入几乎所有就业领域,这需要在计算机可以接管的工作上替换掉人力。

 
人工智能对认知型人类工作的经济影响将类似于自动化和机器人在制造业工作上对人类的影响。许多中年工人失去了工厂里的高薪工作以及伴随这个工作的家庭和社会中的社会经济地位。长期来看,一个对劳动力的更大影响是失去高薪的「认知型」工作。

 
随着劳动力在生产部门的重要性的下降(与拥有知识资本相比),大多数市民可能会发现他们的工作的价值不足以为一种社会可以接受的生活标准买单。这些变化将需要政治上的,而非单纯经济上的响应——需要考虑应该配置怎样的社会安全网来保护人们免受经济的大规模结构性转变的影响。如果缺少了缓解政策,这些转变的一小群受益者将成为社会的上层。


短期来看,教育、再训练和发明新的商品和服务可以减轻这些影响。更长期来看,目前的社会安全网可能需要进化成更好的服务于每个人的社会服务,例如医疗和教育或有保障的基本收入。事实上,瑞士和芬兰等国家已经在积极地考虑这些措施了。


人工智能可能会被认为是一种财富创造的完全不同的机制,每个人都应该从全世界人工智能所生产的财富中分得一部分。对于人工智能技术所创造的经济成果的分配方式,相信不久之后就会开始出现社会争议了。因为传统社会中由孩子支持他们年老的父母,也许我们的人工智能「孩子」也应该支持我们——它们的智能的「父母」。








2.8娱乐


随着过去十五年互联网的爆发式增长,很少有人能想象没有它的生活。在人工智能的驱动下,互联网已经将用户生成的内容作为了信息和娱乐的一个可行来源。Facebook 这样的社交网络现在几乎已经无处不在,而且它们也成为了社会互动和娱乐的个性化渠道——有时候会损害人际交往。WhatsApp 和 Snapchat 等应用可以让智能手机用户与同伴保持「接触」,分享娱乐和信息源。


在《第二人生》这样的在线社区和《魔兽世界》这样的角色扮演游戏中,人们想象在虚拟世界中有一个虚拟的存在。亚马逊 Kindle 这样的专用设备已经重新定义了打发时间的要领。现在只需手指点点划划几下,就可以浏览和获取书籍了;一个口袋大小的设备就可以存储成千上万本书,而阅读体验基本上同可手持的纸质书差不多。


现在我们有了共享和浏览博客、视频、照片和专题讨论的可信平台,此外还有各种各样用户生成的内容。为了在互联网的规模上运行,这些平台必须依赖现在正被积极开发的技术,其中包括自然语言处理、信息检索、图像处理、众包和机器学习。比如,现在已经开发出了协同过滤(collaborative filtering)这样的算法,它可以基于用户的人口统计学细节和浏览历史推荐相关的电影、歌曲或文章。


为了跟上时代的步伐,传统的娱乐资源也已经开始拥抱人工智能。正如书和电影《点球成金》中给出的例子,职业运动现在已经转向了密集的量化分析。除了总体表现统计,赛场上的信号也可以使用先进的传感器和相机进行监控。用于谱曲和识别音轨的软件已经面世。


来自计算机视觉和 NLP 的技术已被用于创建舞台表演。即使非专业用户也可以在 WordsEye 等平台上练习自己的创造力,这个应用可以根据自然语言文本自动生成 3D 场景。人工智能也已经被用于协助艺术品的历史搜索,并在文体学( stylometry )得到了广泛的应用,最近还被用在了绘画分析上。


人类对人工智能所驱动的娱乐的热情是很令人惊讶的,但也有人担心这会导致人与人之间的人际交互减少。少数人预言说人们会因为在屏幕上花费了太多时间而不再与人互动。孩子们常常更愿意在家里快乐地玩他们的设备,而不愿意出去和他们的朋友玩耍。人工智能会使娱乐更加交互式,更加个性化和更有参与感。应该引导一些研究来理解如何利用这些性质为个人和社会利益服务。







第三部分:人工智能公共政策前景与建议


人工智能应用的目标必须是对社会有价值。我们的政策建议也会遵循这个目标,而且即便这个报告主要关注的是 2030 年的北美城市,建议依然广泛适用于其他城市,同时不受时间限制。一些提升解读和人工智能系统能力并参与其使用的策略可以帮助建立信任,同时防止重大失败。


在增强和提升人类能力和互动时需要小心,还要避免对不同社会阶层的歧视。要强调多做鼓励这个方向以及沟通公共政策探讨的研究。鉴于美国目前的产业监管,需要新的或重组的法律和政策来应对人工智能可能带来的广泛影响。


政策不需要更多也不要更严,而是应该鼓励有用的创新,生成并转化专业知识,并广泛促进企业与公民对解决这些技术带来的关键社会问题的责任感。长期来看,人工智能将会带来新财富,整个社会也要探讨人工智能技术带来的经济成果的分配问题。



3.1现今与未来的人工智能政策


为了帮助解决个人和社会对快速发展的人工智能技术产生的忧虑,该研究小组提供了三个一般性政策建议。

1. 在所有层级的政府内,制定一个积累人工智能技术专业知识的程序。

有效的监管需要更多的能理解并能分析人工智能技术、程序目标以及整体社会价值之间互动的专家。

缺少足够的安全或其他指标方面的专业技术知识,国家或地方政府官员或许拒绝批准一个非常有前途的应用。或者缺少足够训练的政府官员可能只会简单采纳行业技术专家的说法,批准一个未经充分审查的敏感的应用进入市场。不理解人工智能系统如何与人工行为和社会价值互动,官员们会从错误的角度来评估人工智能对项目目标的影响。

 
2. 为研究人工智能的平等、安全、隐私和对社会的影响,扫清感知到的和实际的障碍。

在一些相关的联邦法律中,如《计算机欺诈和滥用法案》( Computer Fraud and Abuse Act )和《数字千年版权法的反规避条款》( Theanti-circumvention Provision Of The Digital Millennium Copyright Act ),涉及专有的人工智能系统如何被学者、记者和其他研究人员评价的内容还很模糊。当人工智能系统带来了一些实质性后果需要被审查和追究责任时,这些法律的研究就非常重要了。


3. 为人工智能社会影响的跨学科研究提供公共和私人资金支持。

从整个社会来看,我们对人工智能技术的社会影响的研究投入不足。资金要投给那些能够从多角度分析人工智能的跨学科团队,研究范围从智能的基础研究到评估安全、隐私和其他人工智能影响的方法。以下是具体问题:

当一辆自动驾驶汽车或智能医疗设备出现失误时,应该由谁来负责?如何防止人工智能应用产生非法歧视?谁来享有人工智能技术带来的效率提升的成果,以及对于那些技能被淘汰的人应该采取什么样的保护?

随着人工智能被越来越广泛和深入地整合到工业和消费产品中,一些领域中需要调整现有的建立监管制度以适应人工智能创新,或者在某些情况下,根据广泛接受的目标和原则,从根本上重新配置监管制度。

在美国,已经通过各种机构将监管具体到各个行业。在设备中使用人工智能实现医疗诊断和治疗由食品药品监督管理局( FDA )监管,包括定义产品类型和指定产生方法,还有软件工程的标准。无人机在管制空域中的使用由美国联邦航空局( FAA )监管。面向消费者的人工智能系统将由联邦贸易委员会( FTC )监管。金融市场使用的人工智能技术,如高频交易,由证券交易委员会( SEC )监管。

 
除了针对具体行业制定监管的方法外,「重要基础设施」中定义模糊和广泛的监管类别可能适用于人工智能应用。

鉴于目前美国行政法结构,短期内制定出全面的人工智能政策法规似乎不太可能。但是,可以根据人工智能在各种情境中可能出现的法律和政策问题,广泛列出多个类别。







3.2未来的指导原则

面对人工智能技术将带来的深刻变化,要求「更多」和「更强硬」的监管的压力是不可避免的。对人工智能是什么和不是什么的误解(尤其在这个恐慌易于散布的背景下)可能引发对有益于所有人的技术的反对。那将会是一个悲剧性的错误。扼杀创新或将创新转移到它处的监管方法同样也只会适得其反。

幸运的是,引导当前数字技术的成功监管原则可以给我们带来指导。比如,一项最近公布的多年研究对比了欧洲四个国家和美国的隐私监管,其结果却很反直觉。西班牙和法国这样的有严格的详细法规的国家在企业内部孕育出了一种「合规心态」( compliance mentality ),其影响是抑制创新和强大的隐私保护。


这些公司并不将隐私保护看作是内部责任,也不会拿出专门的员工来促进其业务或制造流程中的隐私保护,也不会参与必需范围之外的隐私倡议或学术研究;这些公司只是将隐私看作是一项要满足规范的行为。他们关注的重点是避免罚款或惩罚,而非主动设计技术和采纳实际技术来保护隐私。

相对地,美国和德国的监管环境是模糊的目标和强硬的透明度要求,和有意义的执法的结合,从而在促进公司将隐私看作是他们的责任上做得更加成功。广泛的法律授权鼓励企业发展执行隐私控制的专业人员和流程、参与到外部的利益相关者中并采用他们的做法以实现技术进步。对更大的透明度的要求使民间社会团队和媒体可以变成法庭上和法庭外的公共舆论中的可靠执法者,从而使得隐私问题在公司董事会上更加突出,这又能让他们进一步投资隐私保护。


在人工智能领域也是一样,监管者可以强化涉及内部和外部责任、透明度和专业化的良性循环,而不是定义狭窄的法规。随着人工智能与城市的整合,它将继续挑战对隐私和责任等价值的已有保护。和其它技术一样,人工智能也可以被用于好的或恶意的目的。


这份报告试图同时强调这两方面的可能性。我们迫切的需要一场重要的辩论:如何最好地引导人工智能以使之丰富我们的生活和社会,同时还能鼓励这一领域的创新。应该对政策进行评估,看其是否能促进人工智能所带来的益处的发展和平等共享,还是说会将力量和财富集中到少数权贵的手里。因为我们并不能完美清晰地预测未来的人工智能技术及其所将带来的影响,所以相关政策一定要根据出现的社会难题和线索不断地重新评估。


截至本报告发布时,重要的人工智能相关的进展已经在过去十五年内给北美的城市造成了影响,而未来十五年还将有更大幅度的发展发生。最近的进展很大程度是由于互联网所带来的大型数据集的增长和分析、传感技术的进步和最近的「深度学习」的应用。


未来几年,随着人工智能在交通和医疗等领域内的应用,它们必须以一种能构建信任和理解的方式引入,同时还要尊重人权和公民权利。在鼓励创新的同时,政策和流程也应该解决隐私和安全方面的影响,而且应该确保人工智能所带来的好处能得到广泛而公正的分配。如果人工智能研究及其应用将会给 2030 年及以后的北美城市生活带来积极的影响,那么这样做就是非常关键的。
 
[/login]
 
 
 
文章来源于网络智造家平台提供 查看全部
2.1_.jpg


这篇来自斯坦福的「人工智能百年研究」报告是计划持续至少 100 年的、研究系列中的第一篇。它描述了目前人工智能相关技术、法律以及道德上的挑战,并对人工智能的研究、应用、政策上的方向提出了指导与建议。(因微信字数限制,请点击「阅读原文」下载完整中文报告。)

2.2_.jpg

 
 
[login]
 序言

2014 年秋季,人工智能百年研究项目启动,这是一项关于人工智能领域,及其对人类、社区、社会影响的长期学术研究。这项研究包含使用人工智能计算系统的科学、工程和应用实现。监督该「百年研究」的常务委员会组建了一个研究小组来每五年评估一次人工智能所处的状态——这是本项目的核心活动。

本研究小组要回顾从上次报告到现在这段时间人工智能的进展,展望未来潜在的进展并且描述这些进展对于技术、社会的挑战与机遇,涉及的领域包括:道德伦理、经济以及与人类认知兼容的系统设计等等。

 
「百年研究」定期进行专家回顾的首要目标是:提供一个随着人工智能领域发展的,关于人工智能及其影响的收集性和连通性的集合。这些研究希望能在人工智能领域的科研、发展以及系统设计方面,在帮助确保那些系统能广泛地有益于个人和社会的项目与政策上提供专业推断上的方向指南及综合评估。


这篇报告是计划持续至少 100 年的研究系列中的第一篇。常务委员会在 2015 年的暑期成立了一个研究小组来负责组建现在这个初始的研究小组,并任命了得克萨斯大学奥斯汀分校的教授 Peter Stone 担任该小组的主席。这个包含了 17 名成员的研究小组由人工智能学术界、公司实验室和产业界的专家,以及了解人工智能的法律、政治科学、政治以及经济方面的学者组成,并于 2015 年秋季中期启动。


参与者代表着不同的专业、地区、性别以及职业阶段。常务委员会广泛讨论了研究小组相应的责任,包括人工智能最近的发展与在工作、环境、运输、公共安全、医疗、社区参与以及政府的潜在社会影响。委员会考虑多种聚焦研究的方式,包括调查子领域及其状态、研究特定的技术(例如机器学习与自然语言处理)以及研究特定的应用领域(例如医疗与运输)。

 
委员会最终选择了「 2030 年的人工智能与生活( AI and Life in 2030 )」为主题,以强调人工智能的各种用途与影响的发生不是独立于彼此,也不独立于其他许多社会和技术上的发展。意识到了城市在大多数人类生活中的核心作用之后,我们将专注重点缩小到大多数人居住的大都市。

2.3_.jpg



第一部分:什么是人工智能?


本章节介绍了研究人员和从业者如何定义「人工智能」以及目前正在蓬勃发展的人工智能研究和应用领域。它提出了人工智能是什么和不是什么的定义,并介绍了一些当前人工智能研究的「热点」领域。


本章节为第二部分和第三部分的内容奠定了基础。第二部分阐述了人工智能在八个领域中的影响与未来,第三部分介绍了涉及人工智能设计和公共政策的问题,并提出在保护民主价值的同时如何鼓励人工智能创新的建议。



1.1定义人工智能


奇怪的是,人工智能缺乏一个精确的、被普遍接受的定义,这或许有助于该领域的加速成长、繁荣以及前进。虽然人工智能的从业者、研究人员和开发人员由一种粗略的方向感和一个「与它相处」的命令所引导,人工智能的定义仍然很重要,而 Nils J. Nilsson 就提供了一个有用的定义:「人工智能就是致力于让机器变得智能的活动,而智能就是使实体在其环境中有远见地、适当地实现功能性的能力」。


电子计算器智能吗?像 Nilsson 一样,研究小组以一种宽泛的视角来看待此问题,认为智力取决于一个多维频谱。根据这一观点,算术计算器和人脑之间的区别不是某一类,而是规模、速度、自主性和通用性的区别。

 
同样的因素可以用来评估智能的其他各例——智能语音识别软件、动物大脑、汽车巡航控制系统、围棋程序、自动调温器——并将它们放置在频谱中的适当位置。虽然我们的宽泛解释把计算器列在了智能频谱中,但是如此简单的设备与今天的人工智能相比几乎没有相似之处。

 
从这个角度看,对人工智能的表征取决于个人愿意「适当地」并「有远见地」为功能提供合成软件和硬件的信用。一个简单的电子计算器比人脑计算快得多而且几乎从不出错。

 
人工智能的边界已经远远走在前面,而计算器可以实现的功能只是当下的智能手机的百万分之一。目前人工智能开发人员正在改进、推广和扩大从当下的智能手机中所建立起来的智能。事实上人工智能领域是一个不断努力推动机器智能向前发展的过程。

 
具有讽刺意味的是,人工智能正在遭受失去话语权的长期灾难,最终不可避免地会被拉到边界内,即一个被称为「人工智能效应」( AI effect )或「奇怪悖论」( odd paradox )的重复模式——人工智能将一种新技术带到了普通大众中去,人们习惯了这种技术,它便不再被认为是人工智能,然后更新的技术出现了。


同样的模式将在未来继续下去。人工智能并没有「交付」一个惊雷般改变生活的产品。相反人工智能技术正在以一个连续的、进步的方式继续更好的发展。

2.4_.jpg



1.2人工智能研究趋势


直到本世纪初,人工智能的吸引点主要在于它所传递的承诺,但在过去的十五年里,大多这样的承诺已经得到兑现。人工智能技术已经充斥了我们的生活。当它们成为了社会的一股中心力量时,该领域正在从仅仅建立智能系统,转向了建立有人类意识的、值得信赖的智能系统。


几个因素加速了人工智能革命。其中最重要的是机器学习的成熟,部分由云计算资源和广泛普及的、基于 Web 的数据收集所支持。机器学习已经被「深度学习」急剧地向前推进了,后者是利用被称作「反向传播的方法」所训练的适应性人工神经网络的一种形式。


信息处理算法的这种性能飞跃一直伴随着用于基本操作的硬件技术的显著进步,比如感觉、感知和目标识别。数据驱动型产品的新平台和新市场,以及发现新产品和新市场的经济激励机制,也都促进了人工智能驱动型技术的问世。


所有这些趋势都推动着下文中所描述的「热门」研究领域。这只是想要通过某个或另一个度量标准来反映目前比其他领域得到更大关注的领域。它们不一定比其他领域更重要或更有价值。事实上目前的一些「热门」领域在过去几年中并不怎么流行,而其他领域可能在未来会以类似的方式重新出现。

 

1. 大规模机器学习


许多机器学习的基本问题(如监督和非监督学习)是很好理解的。目前努力的一个重点是将现有算法扩展到更庞大的数据集上。例如鉴于传统方法能够负担得起若干遍数据集的处理,现代方法是为单次处理所设计;某些情况只认同非线性方法(那些只关注一部分数据的方法)。




2. 深度学习

 
成功训练卷积神经网络的能力非常有益于计算机视觉领域,比如目标识别、视频标签、行为识别和几个相关变体的应用。深度学习也在大举进军感知方面的其他领域,如音频、语音和自然语言处理。

 

3. 强化学习


鉴于传统机器学习主要关注于模式挖掘,强化学习将重点转移到决策中,这种技术将有助于促进人工智能在现实世界中更深入地进入相关研究和实践领域。作为一种经验驱动型的序贯决策框架,强化学习已经存在了几十年,但是这个方法在实践中没有取得很大成功,主要是由于表征和缩放的问题。深度学习的出现为强化学习提供了「一贴强心剂」。


由谷歌 DeepMind 开发的计算机程序 AlphaGo 在五次对抗比赛中击败了人类围棋冠军,它最近所取得的成功在很大程度上要归功于强化学习。AlphaGo 是通过使用一个人类专家数据库来初始化一个自动代理的方法被训练的,但随后提炼的方法是通过大量地自我对抗游戏以及应用强化学习。

2.5_.jpg




4. 机器人


至少在静态环境中,机器人导航在很大程度上被解决了。目前的努力是在考虑如何训练机器人以广泛型的、预测性的方式与周围世界进行交互。互动环境中产生的一个自然要求是操纵,这是当下所感兴趣的另一个话题。


深度学习革命只是刚开始影响机器人,这在很大程度上是因为要获得大的标记数据集还很困难,这些数据集已推动了其他基于学习的人工智能领域。

 
免去了标记数据需求的强化学习可能会有助于弥合这一差距,但是它要求系统在没有错误地伤害自己或其他系统的情况下能够安全地探索出一个政策空间。在可信赖的机器感知方面的进步,包括计算机视觉、力和触觉感知,其中大部分将由机器学习驱动,它们将继续成为推进机器人能力的关键。

2.6_.jpg




5. 计算机视觉

 
计算机视觉是目前最突出的机器感知形式。它是受深度学习的兴起影响最大的人工智能子领域。直到几年前,支持向量机还是大多视觉分类任务所选择的方法。但是特别是在 GPU 中的大规模计算的汇合,使得更大数据集的可获得性(尤其是通过互联网)以及神经网络算法的改进导致了基准任务功能的显著提高(比如 ImageNet 中的分类器)。计算机首次能够比人类更好地执行一些(狭义定义的)视觉分类任务。目前的研究多是关注于为图像和视频自动添加字幕。

 

6. 自然语言处理

 
自然语言处理是另一个通常与自动语音识别一同被当做非常活跃的机器感知领域。它很快成为一种拥有大数据集的主流语言商品。谷歌宣布目前其 20% 的手机查询都是通过语音进行的,并且最近的演示已经证明了实时翻译的可能性。现在研究正在转向发展精致而能干的系统,这些系统能够通过对话而不只是响应程式化的要求来与人互动。




7. 协同系统


协同系统方面进行的是对模型和算法的研究,用以帮助开发能够与其他系统和人类协同工作的自主系统。该研究依赖于开发正式的协作模型,并学习让系统成为有效合作伙伴所需的能力。能够利用人类和机器的互补优势的应用正吸引到越来越多的关注——对人类来说可以帮助人工智能系统克服其局限性,对代理来说可以扩大人类的能力和活动。

 

8. 众包和人类计算

 
在完成许多任务方面由于人类的能力是优于自动化方法的,因而在众包和人类计算方面,也需要通过利用人类智力来解决那些计算机无法单独解决好的问题。该领域研究调查了增强计算机系统的方法,这项研究的提出仅仅是在大约 15 年前,现在它已经在人工智能领域确立了自己的存在。最有名的众包例子是维基百科,它是一个由网络公民维护和更新的知识库,并且在规模上和深度上远远超越了传统编译的信息源,比如百科全书和词典。

 
众包专注于设计出创新的方式来利用人类智力。Citizen 科学平台激发志愿者去解决科学问题,而诸如亚马逊的 Mechanical Turk 等有偿众包平台,则提供对所需要的人类智力的自动访问。通过短时间内收集大量标记训练数据和/或人机交互数据,该领域的工作促进了人工智能的其它分支学科的进步,包括计算机视觉和自然语言处理。基于人类和机器的不同能力和成本,目前的研究成果探索出了它们之间理想的任务分离。

2.7_.jpg




9. 算法博弈理论与 (基于) 计算机 (统计技术的) 社会选择

 
包括激励结构、人工智能在内的经济和社会计算维度吸引到了新的关注。自 20 世纪 80 年代初以来,分布式人工智能和多代理(multi-agent)系统就已经被研究了,于 20 世纪 90 年代末开始有显著起色,并由互联网所加速。一个自然的要求是系统能够处理潜在的不恰当激励,包括自己所感兴趣的人类参加者或公司,以及自动化的、基于人工智能的、代表它们的代理。


备受关注的主题包括:计算机制设计,一种激励设计的经济理论,它寻求激励兼容的系统,其中输入会被如实报告;基于计算机统计技术的社会选择,一种有关如何为替代品排列顺序的理论;激励对齐信息获取,预测市场、评分规则、同行预测;算法博弈理论,市场、网络游戏和室内游戏的平衡,比如poker——它在近几年通过抽象技术和无遗憾学习已经取得了显著的进步。



10. 物联网(IoT)


越来越多的研究机构致力于这样一个想法:一系列设备可以相互连接以收集和分享它们的感官信息。这些设备可以包括家电、汽车、建筑、相机和其他东西。基于技术和无线网络连接设备,人工智能可以为了智能的、有用的目的去处理和使用所产生的大量数据。目前这些设备使用的是令人眼花缭乱的各种不兼容的通信协议。人工智能可以帮助克服这个「巴别塔」。

 

11. 神经形态计算


传统计算机执行计算的冯诺依曼模型,它分离了输入/输出、指令处理和存储器模块。随着深度神经网络在一系列任务中的成功,制造商正在积极追求计算的替代模型——特别是那些受到生物神经网络所启发的——为了提高硬件的效率和计算系统的稳定性的模型。


目前这种神经形态的计算机尚未清楚地显示出巨大成功,而是刚开始有望实现商业化。但可能它们在不久的将来会变成寻常事物(即使仅作为冯诺依曼所增加的兄弟姐妹们)。深度神经网络在应用景观中已经激起了异常波动。当这些网络可以在专门的神经形态硬件上被训练和被执行,而不是像今天这样在标准的冯诺依曼结构中被模拟时,一个更大的波动可能会到来。




12. 总体趋势以及人工智能研究的未来

 
数据驱动型范式的巨大成功取代了传统的人工智能范式。诸如定理证明、基于逻辑的知识表征与推理,这些程序获得的关注度在降低,部分原因是与现实世界基础相连接的持续挑战。规划(Planning)在七十和八十年代是人工智能研究的一根支柱,也受到了后期较少的关注,部分原因是它强烈依赖于建模假设,难以在实际的应用中得到满足。


基于模型的方法——比如视觉方面基于物理的方法和机器人技术中的传统控制与制图——已经有很大一部分让位于通过检测手边任务的动作结果来实现闭环的数据驱动型方法。即使最近非常受欢迎的贝叶斯推理和图形模式似乎也正在失宠,被数据和深度学习显著成果的洪流所淹没。


研究小组预计在接下来的十五年中,会有更多关注集中在针对人类意识系统的开发上。这意味着它们是明确按照要与之互动的人类特点来进行建模与设计的。很多人的兴趣点在于试图找到新的、创造性的方法开发互动和可扩展的方式来教机器人。


此外在考虑社会和经济维度的人工智能时,物联网型的系统——设备和云——正变得越来越受欢迎。在未来的几年中,对人类安全的感知、新的目标识别能力和机器人平台将会增加,数据驱动型产品数量与其市场规模将会变大。


研究小组还预计当从业者意识到纯粹的端到端深度学习方法的不可避免的局限性时,会重新出现一些人工智能的传统形式。我们不鼓励年轻的研究人员重新发明理论,而是在人工智能领域以及相关领域(比如控制理论、认知科学和心理学)的第一个五十年期间,保持对于该领域多方面显著进展的觉察。

2.8_.jpg




第二部分:人工智能在各领域的应用


虽然人工智能的很多研究和应用会基于一些通用技术,比如说机器学习,但在不同的经济和社会部门还是会有所区别,我们称之为不同的领域(domain)。接下来的这部分将介绍人工智能研究和应用的不同类型,以及影响和挑战,主要有八个方面:交通、家庭服务机器人、医疗健康、教育、低资源社区、公共安全、工作和就业、娱乐。


基于这些分析,我们还预测了一个有代表性的北美城市在未来 15 年的趋势。与人工智能的流行文化中的典型叙述不同,我们寻求提供一个平衡的观点来分析,人工智能是如何开始影响我们日常生活的,以及从现在到 2030 年,这些影响将如何发展。


2.1交通


交通可能会成为首批几个特定应用领域之一。在这些领域,大众需要对人工智能系统在执行危险任务中的可靠性和安全性加以信任。自动化交通会很快司空见惯,公众对嵌入人工智能系统的实体交通工具的首次体验,将强有力地影响其对人工智能的感知。




2.2家庭服务机器人


过去十五年中,机器人已经进入了人们的家庭。但应用种类的增长慢得让人失望,与此同时,日益复杂的人工智能也被部署到了已有的应用之中。人工智能的进步常常从机械的革新中获取灵感,而这反过来又带来了新的人工智能技术。

 
未来十五年,在典型的北美城市里,机械和人工智能技术的共同进步将有望增加家用机器人的使用和应用的安全性和可靠性。特定用途的机器人将被用于快递、清洁办公室和强化安全,但在可预见的未来内,技术限制和可靠机械设备的高成本将继续限制其在应用领域的商业机会。至于自动驾驶汽车和其它新型的交通机器,创造可靠的、成熟的硬件的难度不应该被低估。

2.9_.jpg


 

2.3医疗


人工智能而言,医疗领域一直被视为一个很有前景的应用领域。基于人工智能的应用在接下来的几年能够为千百万人改进健康结果和生活质量,但这是在它们被医生、护士、病人所信任,政策、条例和商业障碍被移除的情况下。主要的应用包括临床决策支持、病人监控、辅导、在外科手术或者病人看护中的自动化设备、医疗系统的管理。


近期的成功,比如挖掘社交媒体数据推断潜在的健康风险、机器学习预测风险中的病人、机器人支持外科手术,已经为人工智能在医疗领域的应用扩展出了极大的应用可能。与医学专家和病人的交互方法的改进将会是一大挑战。

 
至于其他领域,数据是一个关键点。在从个人监护设备和手机 App 上、临床电子数据记录上收集有用的数据方面,我们已经取得了巨大的进展,从协助医疗流程和医院运行的机器人那里收集的数据可能较少一些。但使用这些数据帮助个体病人和群体病人进行更精细的针对和治疗已经被证明极其的困难。

 
研究和部署人工智能应用已经被过时的条例和激励机制拉扯后腿。在这样大型的、复杂的系统中,贫乏的人机交互方法和固有的难题以及部署技术的风险也阻碍了人工智能在医疗的实现。减少或者移除这些障碍,结合目前的创新,有潜力在接下来几年为千百万人极大的改进健康结果和生活质量。

 


2.4教育

在过去的十五年间,教育界见证了为数众多的人工智能科技的进步。诸如 K-12 线上教育以及大学配套设备等等应用已经被教育家和学习者们广泛利用。尽管素质教育还是需要人类教师的活跃参与,但人工智能在所有层面上都带来了强化教育的希望,尤其是大规模定制化教育。如何通过人工智能技术来最优化整合人类互动与面对面学习,将是一个关键性的挑战。

 
机器人早已经成为了广为欢迎的教育设备,最早可以追溯到 1980 年 MIT Media Lab 所研制出的 Lego Mindstorms。智能辅导系统( ITS )也成为了针对科学、数学、语言学以及其他学科相匹配的学生互动导师。

 
自然语言处理,尤其是在与机器学习和众包结合以后,有力推进了线上学习。帮助让教师在扩大教室规模的同时还能做到解决个体学生的学习需求与风格。大型线上学习的系统所得的数据已经为学习分析产生了迅速增长的动力。


但是,学院与大学采用人工智能技术的步伐依然很缓慢,主要是由于资金的缺乏,以及其可以帮助学生达成学习目标的有力证据。一个典型美国北部城市的未来五十年,智能导师与其他人工智能技术帮助教师在课堂或家中工作的规模很有可能会显著扩大,因为意愿学习是基于虚拟现实的应用。但是计算机为基础的学习系统将无法完全替代学校里的教师们。

 

更广大的社会成果


对于大多数人民难以获得教育的国家,如果可以应用在线教育的工具,那么在线资源将会产生重要的积极影响。在线教育资源的发展应该能让支持国际教育项目的基金会可以通过提供工具和相对简单的使用培训来更轻松地提供素质教育。比如说,针对 iPad 开发出了大量的、且大部分免费的教育应用。

 
在消极的一面,现在学生已有把自己的社会接触限制在电子设备上的趋势了,他们在网络程序的互动上花费了大量时间,却没有进行社会接触。如果教育也越来越多地通过网络进行,那么在学生的社会发展阶段缺乏与同龄人有规律的面对面接触会带来怎样的影响呢?特定的技术已经表明这会产生在神经方面的影响。另一方面,自闭症儿童已经开始从与人工智能系统的互动中受益了。


2.10_.jpg

 


2.5低资源社区


人工智能存在许多机会去改善生活于一个典型北美城市的低资源社区中的人民生活状况——事实上在某些情况下已经有所改变。了解这些人工智能的直接贡献也可能会激发对于发展中国家最为贫穷的地区的潜在贡献。在人工智能的数据收集过程中并没有对这个人群的显著关注,而且传统上人工智能资助者在缺乏商业应用的研究中表现得投资乏力。

 
有了有针对性的激励和资金优先次序,人工智能技术可以帮助解决低资源社区的需求。萌芽中的努力是有希望的。人工智能可能会有有助于对抗失业和其他社会问题带来的恐惧,它或许会提供缓解措施和解决方案,特别是通过受影响的社区用于其建立信任的方式来实现。



2.6公共安全与防护


城市已经为公共安全与防护部署人工智能技术了。到 2030 年, 典型的北美城市将在很大程度上依赖它们。这些措施包括可以检测到指向一个潜在犯罪的异常现象的监控摄像机、无人机和预测警务应用。与大多数问题一样,好处与风险并存。


获得公众信任是至关重要的。虽然会存在一些合理的担心,即与人工智能合作的警务可能会在某些情况下变得霸道或是无处不在,而相反的情况也是可能的。人工智能可能使警务变得更有针对性并只在需要时被使用。而且假设经过仔细的部署,人工智能也可能有助于消除一些人类决策中固有的偏见。


对于人工智能分析学更成功的一个应用是检测白领犯罪,比如信用卡诈骗罪。网络安全(包括垃圾邮件)是一个被广泛关注的问题,而机器学习也对其有所影响。


人工智能工具也可能被证明有助于警察管理犯罪现场或是搜索和救援活动,它可以帮助指挥官排列任务的优先次序以及分配资源,尽管这些工具还没有为这些活动的自动化做好准备。在一般的机器学习尤其是在转换学习中的改进——在新情境中基于与过去情况的相似性而加快学习——可能有利于这样的系统。

2.11_.jpg





2.7就业与劳资


尽管人工智能很有可能会对典型北美城市的就业与工作场所产生深远的影响,但对当前的影响我们目前还难以作出评估——是积极的还是消极的。在过去十五年,由于经济衰退和日益的全球化,尤其是中国参与到了世界经济中,就业状况已经发生了改变,非人工智能的数字技术也发生了很大的变化。自 1990 年代以来,美国经历了生产率和 GDP 的连续增长,但平均收入却停滞不前,就业人口比率也已经下降。


有一些数字技术有重大影响(好的影响或坏的影响)的行业的显著案例,而在一些其它的行业,自动化将很有可能在不久的将来发生重大的改变。许多这些改变已经得到了「例行的」数字技术的推动,其中包括企业资源规划、网络化、信息处理和搜索。理解这些改变应该能为人工智能影响未来劳动力需求的方式(包括技能需求的改变)提供见解。

 
到目前为止,数字技术已经给中等技能的工作(比如旅行代理)带来了更大的影响,而不是非常低技能或非常高技能的工作。另一方面,数字系统所能完成的任务的范围正随着人工智能的演进而提升,这很可能会逐渐增大所谓的「例行任务」的范围。人工智能正向高端的领域蔓延,包括一些机器之前无法执行的专业服务。

 
为了获得成功,人工智能创新将需要克服可以理解的人们对被边缘化的恐惧。在短期内,人工智能很有可能会取代任务,而非工作,同时还将会创造新类型的工作。但新类型的工作比将可能失去的已有工作更难以想象。就业领域的变化通常是渐进的,不会出现剧烈的过渡。

 
随着人工智能进入工作场所,这很有可能是一个持续的趋势。影响的范围也将扩大,从少量的替代或增强到完全的替代。比如说,尽管大部分律师的工作还没被自动化,但人工智能在法律信息提取和主题建模方面的应用已经自动化了一部分第一年工作的律师新人的工作。在不远的将来,包括放射科医生到卡车司机到园丁等许多类型的工作都可能会受到影响。


人工智能也可能会影响工作场所的大小和位置。许多组织和机构很庞大的原因是他们所执行的功能只能通过增加人力来扩大规模,要么是「横向」扩展地理区域,要么是「纵向」增多管理层级。随着人工智能对许多功能的接管,扩展不再意味着会带来大型的组织。

 
许多人已经指出一些知名的互联网公司只有很少数量的员工,但其它公司并不是这样。人类企业可能存在一个自然的规模大小,在这样的企业中,CEO 能够认识公司里的每一个人。通过将创造有效地外包给人工智能驱动的劳动力市场,企业会倾向于自然的大小。

 
人工智能也将创造工作,特别是在某些行业中,通过使某些特定任务更重要,以及通过产生新的交互模型创造新类型的工作。复杂的信息系统可被用于创造新的市场,这往往会带来降低门槛和增加参与的影响——从应用商店到 Airbnb 再到 TaskRabbit。人工智能界有一个活跃的研究社区在研究创造新市场和使已有市场更高效地运作的进一步的方式。


尽管工作本身有内在的价值,但大部分人工作是为了购买他们看重的商品和服务。因为人工智能系统可以执行之前需要人力的工作,因此它们可以导致许多商品和服务的成本下降,实实在在地让每个人都更富有。当正如当前的政治辩论中所给出的例子一样,失业对人们的影响比对散布的经济效益的影响更显著——尤其是那些直接受其影响的人;而不幸的是,人工智能常常被视作是工作的威胁,而不是生活水平的提升。


人们甚至在某些方面存在恐惧——害怕人工智能会在短短一代人的时间内迅速取代所有的人类工作,包括那些需要认知和涉及到判断的工作。这种突变是不太可能发生的,但人工智能会逐渐侵入几乎所有就业领域,这需要在计算机可以接管的工作上替换掉人力。

 
人工智能对认知型人类工作的经济影响将类似于自动化和机器人在制造业工作上对人类的影响。许多中年工人失去了工厂里的高薪工作以及伴随这个工作的家庭和社会中的社会经济地位。长期来看,一个对劳动力的更大影响是失去高薪的「认知型」工作。

 
随着劳动力在生产部门的重要性的下降(与拥有知识资本相比),大多数市民可能会发现他们的工作的价值不足以为一种社会可以接受的生活标准买单。这些变化将需要政治上的,而非单纯经济上的响应——需要考虑应该配置怎样的社会安全网来保护人们免受经济的大规模结构性转变的影响。如果缺少了缓解政策,这些转变的一小群受益者将成为社会的上层。


短期来看,教育、再训练和发明新的商品和服务可以减轻这些影响。更长期来看,目前的社会安全网可能需要进化成更好的服务于每个人的社会服务,例如医疗和教育或有保障的基本收入。事实上,瑞士和芬兰等国家已经在积极地考虑这些措施了。


人工智能可能会被认为是一种财富创造的完全不同的机制,每个人都应该从全世界人工智能所生产的财富中分得一部分。对于人工智能技术所创造的经济成果的分配方式,相信不久之后就会开始出现社会争议了。因为传统社会中由孩子支持他们年老的父母,也许我们的人工智能「孩子」也应该支持我们——它们的智能的「父母」。

2.12_.jpg




2.8娱乐


随着过去十五年互联网的爆发式增长,很少有人能想象没有它的生活。在人工智能的驱动下,互联网已经将用户生成的内容作为了信息和娱乐的一个可行来源。Facebook 这样的社交网络现在几乎已经无处不在,而且它们也成为了社会互动和娱乐的个性化渠道——有时候会损害人际交往。WhatsApp 和 Snapchat 等应用可以让智能手机用户与同伴保持「接触」,分享娱乐和信息源。


在《第二人生》这样的在线社区和《魔兽世界》这样的角色扮演游戏中,人们想象在虚拟世界中有一个虚拟的存在。亚马逊 Kindle 这样的专用设备已经重新定义了打发时间的要领。现在只需手指点点划划几下,就可以浏览和获取书籍了;一个口袋大小的设备就可以存储成千上万本书,而阅读体验基本上同可手持的纸质书差不多。


现在我们有了共享和浏览博客、视频、照片和专题讨论的可信平台,此外还有各种各样用户生成的内容。为了在互联网的规模上运行,这些平台必须依赖现在正被积极开发的技术,其中包括自然语言处理、信息检索、图像处理、众包和机器学习。比如,现在已经开发出了协同过滤(collaborative filtering)这样的算法,它可以基于用户的人口统计学细节和浏览历史推荐相关的电影、歌曲或文章。


为了跟上时代的步伐,传统的娱乐资源也已经开始拥抱人工智能。正如书和电影《点球成金》中给出的例子,职业运动现在已经转向了密集的量化分析。除了总体表现统计,赛场上的信号也可以使用先进的传感器和相机进行监控。用于谱曲和识别音轨的软件已经面世。


来自计算机视觉和 NLP 的技术已被用于创建舞台表演。即使非专业用户也可以在 WordsEye 等平台上练习自己的创造力,这个应用可以根据自然语言文本自动生成 3D 场景。人工智能也已经被用于协助艺术品的历史搜索,并在文体学( stylometry )得到了广泛的应用,最近还被用在了绘画分析上。


人类对人工智能所驱动的娱乐的热情是很令人惊讶的,但也有人担心这会导致人与人之间的人际交互减少。少数人预言说人们会因为在屏幕上花费了太多时间而不再与人互动。孩子们常常更愿意在家里快乐地玩他们的设备,而不愿意出去和他们的朋友玩耍。人工智能会使娱乐更加交互式,更加个性化和更有参与感。应该引导一些研究来理解如何利用这些性质为个人和社会利益服务。

2.13_.jpg



第三部分:人工智能公共政策前景与建议


人工智能应用的目标必须是对社会有价值。我们的政策建议也会遵循这个目标,而且即便这个报告主要关注的是 2030 年的北美城市,建议依然广泛适用于其他城市,同时不受时间限制。一些提升解读和人工智能系统能力并参与其使用的策略可以帮助建立信任,同时防止重大失败。


在增强和提升人类能力和互动时需要小心,还要避免对不同社会阶层的歧视。要强调多做鼓励这个方向以及沟通公共政策探讨的研究。鉴于美国目前的产业监管,需要新的或重组的法律和政策来应对人工智能可能带来的广泛影响。


政策不需要更多也不要更严,而是应该鼓励有用的创新,生成并转化专业知识,并广泛促进企业与公民对解决这些技术带来的关键社会问题的责任感。长期来看,人工智能将会带来新财富,整个社会也要探讨人工智能技术带来的经济成果的分配问题。



3.1现今与未来的人工智能政策


为了帮助解决个人和社会对快速发展的人工智能技术产生的忧虑,该研究小组提供了三个一般性政策建议。

1. 在所有层级的政府内,制定一个积累人工智能技术专业知识的程序。

有效的监管需要更多的能理解并能分析人工智能技术、程序目标以及整体社会价值之间互动的专家。

缺少足够的安全或其他指标方面的专业技术知识,国家或地方政府官员或许拒绝批准一个非常有前途的应用。或者缺少足够训练的政府官员可能只会简单采纳行业技术专家的说法,批准一个未经充分审查的敏感的应用进入市场。不理解人工智能系统如何与人工行为和社会价值互动,官员们会从错误的角度来评估人工智能对项目目标的影响。

 
2. 为研究人工智能的平等、安全、隐私和对社会的影响,扫清感知到的和实际的障碍。

在一些相关的联邦法律中,如《计算机欺诈和滥用法案》( Computer Fraud and Abuse Act )和《数字千年版权法的反规避条款》( Theanti-circumvention Provision Of The Digital Millennium Copyright Act ),涉及专有的人工智能系统如何被学者、记者和其他研究人员评价的内容还很模糊。当人工智能系统带来了一些实质性后果需要被审查和追究责任时,这些法律的研究就非常重要了。


3. 为人工智能社会影响的跨学科研究提供公共和私人资金支持。

从整个社会来看,我们对人工智能技术的社会影响的研究投入不足。资金要投给那些能够从多角度分析人工智能的跨学科团队,研究范围从智能的基础研究到评估安全、隐私和其他人工智能影响的方法。以下是具体问题:

当一辆自动驾驶汽车或智能医疗设备出现失误时,应该由谁来负责?如何防止人工智能应用产生非法歧视?谁来享有人工智能技术带来的效率提升的成果,以及对于那些技能被淘汰的人应该采取什么样的保护?

随着人工智能被越来越广泛和深入地整合到工业和消费产品中,一些领域中需要调整现有的建立监管制度以适应人工智能创新,或者在某些情况下,根据广泛接受的目标和原则,从根本上重新配置监管制度。

在美国,已经通过各种机构将监管具体到各个行业。在设备中使用人工智能实现医疗诊断和治疗由食品药品监督管理局( FDA )监管,包括定义产品类型和指定产生方法,还有软件工程的标准。无人机在管制空域中的使用由美国联邦航空局( FAA )监管。面向消费者的人工智能系统将由联邦贸易委员会( FTC )监管。金融市场使用的人工智能技术,如高频交易,由证券交易委员会( SEC )监管。

 
除了针对具体行业制定监管的方法外,「重要基础设施」中定义模糊和广泛的监管类别可能适用于人工智能应用。

鉴于目前美国行政法结构,短期内制定出全面的人工智能政策法规似乎不太可能。但是,可以根据人工智能在各种情境中可能出现的法律和政策问题,广泛列出多个类别。

2.14_.jpg



3.2未来的指导原则

面对人工智能技术将带来的深刻变化,要求「更多」和「更强硬」的监管的压力是不可避免的。对人工智能是什么和不是什么的误解(尤其在这个恐慌易于散布的背景下)可能引发对有益于所有人的技术的反对。那将会是一个悲剧性的错误。扼杀创新或将创新转移到它处的监管方法同样也只会适得其反。

幸运的是,引导当前数字技术的成功监管原则可以给我们带来指导。比如,一项最近公布的多年研究对比了欧洲四个国家和美国的隐私监管,其结果却很反直觉。西班牙和法国这样的有严格的详细法规的国家在企业内部孕育出了一种「合规心态」( compliance mentality ),其影响是抑制创新和强大的隐私保护。


这些公司并不将隐私保护看作是内部责任,也不会拿出专门的员工来促进其业务或制造流程中的隐私保护,也不会参与必需范围之外的隐私倡议或学术研究;这些公司只是将隐私看作是一项要满足规范的行为。他们关注的重点是避免罚款或惩罚,而非主动设计技术和采纳实际技术来保护隐私。

相对地,美国和德国的监管环境是模糊的目标和强硬的透明度要求,和有意义的执法的结合,从而在促进公司将隐私看作是他们的责任上做得更加成功。广泛的法律授权鼓励企业发展执行隐私控制的专业人员和流程、参与到外部的利益相关者中并采用他们的做法以实现技术进步。对更大的透明度的要求使民间社会团队和媒体可以变成法庭上和法庭外的公共舆论中的可靠执法者,从而使得隐私问题在公司董事会上更加突出,这又能让他们进一步投资隐私保护。


在人工智能领域也是一样,监管者可以强化涉及内部和外部责任、透明度和专业化的良性循环,而不是定义狭窄的法规。随着人工智能与城市的整合,它将继续挑战对隐私和责任等价值的已有保护。和其它技术一样,人工智能也可以被用于好的或恶意的目的。


这份报告试图同时强调这两方面的可能性。我们迫切的需要一场重要的辩论:如何最好地引导人工智能以使之丰富我们的生活和社会,同时还能鼓励这一领域的创新。应该对政策进行评估,看其是否能促进人工智能所带来的益处的发展和平等共享,还是说会将力量和财富集中到少数权贵的手里。因为我们并不能完美清晰地预测未来的人工智能技术及其所将带来的影响,所以相关政策一定要根据出现的社会难题和线索不断地重新评估。


截至本报告发布时,重要的人工智能相关的进展已经在过去十五年内给北美的城市造成了影响,而未来十五年还将有更大幅度的发展发生。最近的进展很大程度是由于互联网所带来的大型数据集的增长和分析、传感技术的进步和最近的「深度学习」的应用。


未来几年,随着人工智能在交通和医疗等领域内的应用,它们必须以一种能构建信任和理解的方式引入,同时还要尊重人权和公民权利。在鼓励创新的同时,政策和流程也应该解决隐私和安全方面的影响,而且应该确保人工智能所带来的好处能得到广泛而公正的分配。如果人工智能研究及其应用将会给 2030 年及以后的北美城市生活带来积极的影响,那么这样做就是非常关键的。
 
[/login]
 
 
 
  • 文章来源于网络
  • 智造家平台提供

527 浏览

机器人很难生产衣服?那我们就先把它变成纸板!

机械自动化类 jingjing 2016-09-20 11:01 发表了文章 来自相关话题

  尽管如今的机器人是越来越能干了,上天入地、飞檐走壁,几乎无所不能,但有一件事对于它们来说却是难于上青天——缝纫。不过,最近美国 Sewbo 公司推出了据说是全球首个缝纫机器人,它能够缝制完整的衬衣。






        机器人的手臂通常很难处理松软而柔韧的面料,只能加工诸如座垫这类形状简单的物件,但要生产一件完整的衣服几乎是不可能的。

        为了解决这一难题,Sewbo 另辟蹊径,从面料上着手,用聚乙烯醇让面料暂时硬化,以易于机器人对其进行“组装”。

该公司的创始人 Zornow 表示:


“我们试用了各种面料,硬化的过程对它们均起到了作用,包括棉、牛仔布、蕾丝以及一些装饰面料。这仅限于能够全程湿透的材料,所以不适用于涂层材料,例如皮革或者已经作了防水处理的面料。”

       在面料拼接过程中,机器人并不是使用缝衣针,而是用一台超声波焊机缝合硬挺的织物片边缘,再将面料进行加热,使之变得柔软,这个时候可以根据需要对其衣服进行重塑,待冷却后定型。






       在组装完成后,只需要将衣服放入热水中简单冲洗便可除去面料上的水溶增强剂,得到一件正常材质的衣服,增强剂可回收再利用。






        这项技术在购物袋、座垫、病号服等方面都有应用的空间,甚至有望用于制服的制作,据说美国军方对 Sewbo 的概念很是感兴趣。“我们正在与他们探讨。”Zornow 透露道。此外,该公司正在与一些工厂、自动化承包商谈判。
 
 
 
 
 
 
文章来源于网络智造家平台提供 查看全部
  尽管如今的机器人是越来越能干了,上天入地、飞檐走壁,几乎无所不能,但有一件事对于它们来说却是难于上青天——缝纫。不过,最近美国 Sewbo 公司推出了据说是全球首个缝纫机器人,它能够缝制完整的衬衣。

5.0_.jpg


        机器人的手臂通常很难处理松软而柔韧的面料,只能加工诸如座垫这类形状简单的物件,但要生产一件完整的衣服几乎是不可能的。

        为了解决这一难题,Sewbo 另辟蹊径,从面料上着手,用聚乙烯醇让面料暂时硬化,以易于机器人对其进行“组装”。

该公司的创始人 Zornow 表示:


“我们试用了各种面料,硬化的过程对它们均起到了作用,包括棉、牛仔布、蕾丝以及一些装饰面料。这仅限于能够全程湿透的材料,所以不适用于涂层材料,例如皮革或者已经作了防水处理的面料。”

       在面料拼接过程中,机器人并不是使用缝衣针,而是用一台超声波焊机缝合硬挺的织物片边缘,再将面料进行加热,使之变得柔软,这个时候可以根据需要对其衣服进行重塑,待冷却后定型。

5.1_.gif


       在组装完成后,只需要将衣服放入热水中简单冲洗便可除去面料上的水溶增强剂,得到一件正常材质的衣服,增强剂可回收再利用。

5.2_.gif


        这项技术在购物袋、座垫、病号服等方面都有应用的空间,甚至有望用于制服的制作,据说美国军方对 Sewbo 的概念很是感兴趣。“我们正在与他们探讨。”Zornow 透露道。此外,该公司正在与一些工厂、自动化承包商谈判。
 
 
 
 
 
 
  • 文章来源于网络
  • 智造家平台提供

684 浏览
721 浏览

【SLAM】移动机器人定位与地图创建方法

机械自动化类 小螺号 2016-09-14 16:03 发表了文章 来自相关话题

1.引言

机器人的研究越来越多的得到关注和投入,随着计算机技术和人工智能的发展,智能自主移动机器人成为机器人领域的一个重要研究方向和研究热点。移动机器人的定位和地图创建是自主移动机器人领域的热点研究问题。对于已知环境中的机器人自主定位和已知机器人位置的地图创建已经有了一些实用的解决方法。然而在很多环境中机器人不能利用全局定位系统进行定位,而且事先获取机器人工作环境的地图很困难,甚至是不可能的。这时机器人需要在自身位置不确定的条件下,在完全未知环境中创建地图,同时利用地图进行自主定位和导航。这就是移动机器人的同时定位与地图创建(SLAM) 问题,最先是由SmithSelf 和Cheeseman在1988年提出来的,被认为是实现真正全自主移动机器人的关键。

SLAM问题可以描述为:机器人在未知环境中从一个未知位置开始移动,在移动过程中根据位置估计和传感器数据进行自身定位,同时建造增量式地图。在SLAM中,机器人利用自身携带的传感器识别未知环境中的特征标志,然后根据机器人与特征标志之间的相对位置和里程计的读数估计机器人和特征标志的全局坐标。这种在线的定位与地图创建需要保持机器人与特征标志之间的详细信息。近几年来,SLAM的研究取得了很大的进展,并已应用于各种不同的环境,如:室内环境、水下、室外环境。
 

2.SLAM的关键性问题

2.1地图的表示方式

目前各国研究者已经提出了多种表示法,大致可分为三类:栅格表示、几何信息表示和拓扑图表示,每种方法都有自己的优缺点。

栅格地图表示法即将整个环境分为若干相同大小的栅格,对于每个栅格各指出其中是否存在障碍物。这种方法最早由Elfes和Moravec提出,而后Elfes进行了进一步的研究。它的优点在于创建和维护容易,尽量的保留了整个环境的各种信息,同时借助于该地图,可以方便地进行自定位和路径规划。缺点在于:当栅格数量增大时(在大规模环境或对环境划分比较详细时),对地图的维护行为将变得困难,同时定位过程中搜索空间很大,如果没有较好的简化算法,实现实时应用比较困难。

几何信息地图表示法是指机器人收集对环境的感知信息,从中提取更为抽象的几何特征,例如线段或曲线,使用这些几何信息描述环境。该方法更为紧凑,且便于位置估计和目标识别。几何方法利用卡尔曼滤波在局部区域内可获得较高精度,且计算量小,但在广域环境中却难以维持精确的坐标信息。但几何信息的提取需要对感知信息作额外处理,且需要一定数量的感知数据才能得到结果。

拓扑地图抽象度高,特别在环境大而简单时。这种方法将环境表示为一张拓扑意义中的图(graph),图中的节点对应于环境中的一个特征状态、地点。如果节点间存在直接连接的路径则相当于图中连接节点的弧。其优点是:

(1)有利于进一步的路径和任务规划,
(2)存储和搜索空间都比较小,计算效率高,
(3)可以使用很多现有成熟、高效的搜索和推理算法。

缺点在于对拓扑图的使用是建立在对拓扑节点的识别匹配基础上的,如当环境中存在两个很相似的地方时,拓扑图方法将很难确定这是否为同一点。

2.2不确定信息的描述

在完全未知环境中由机器人依靠其自身携带的传感器所提供的信息建立环境模型是移动机器人进行自主定位和导航的前提之一。所谓完全未知环境是指机器人对环境一无所知不存在任何先验信息,如环境形状、障碍物位置、人为设定的参照物等。在这种环境下,移动机器人必须依赖传感器所获得的信息,如里程计、声纳、激光测距仪、视觉等。由于传感器自身的限制,感知信息存在不同程度的不确定性,例如激光测距仪的不确定性主要来自距离的测量误差以及反光镜旋转和激光散射引起的测量角误差。如图1-1所示,感知信息的不确定性必然导致所构建的环境模型也不可能是完全精确的,同样,当依靠模型和感知进行决策时也带有不确定性,即不确定性具有传递性。






对不确定性进行度量的方法主要有概率度量、信任度量、可能性度量、模糊度量和证据理论等。目前,在AMR地图构建中使用较多的是概率度量和模糊度量。概率度量主要存在两种形式:

(1)以均值、方差和协方差等概率特征来描述不确定信息。这种度量方法的优点是均值等概率特征具有明确的几何意义,缺点是概率特征的离散计算公式还没有确定的形式;
(2)以概率模型来描述不确定信息,主要采用Bayes法则与Markov假设。这种度量方法的优点是以随机概率模型描述机器人的位姿和环境信息,鲁棒性非常好,缺点是概率模型的计算量非常大而且必须事先知道模型的先验概率,给实际应用造成了困难。

2.3定位与环境特征提取

移动机器人自定位与环境建模问题是紧密相关的。环境模型的准确性依赖于定位精度,而定位的实现又离不开环境模型。在未知环境中,机器人没有什么参照物,只能依靠自己并不十分准确的传感器来获取外界信息,如同一个盲人在一个陌生环境中摸索的情况。这种情况下,定位是比较困难的。有地图的定位和有定位的地图创建都是容易解决的,但无地图的定位和未解决定位的地图创建如同"鸡--蛋"问题,无从下手。已有的研究中对这类问题的解决方法可分为两类:

1) 利用自身携带的多种内部传感器(包括里程仪、罗盘、加速度计等),通过多种传感信息的融合减少定位的误差,使用的融合算法多为基于卡尔曼滤波的方法。这类方法由于没有参考外部信息,在长时间的漫游后误差的积累会比较大。
2) 在依靠内部传感器估计自身运动的同时,使用外部传感器(如激光测距仪、视觉等)感知环境,对获得的信息进行分析提取环境特征并保存,在下一步通过对环境特征的比较对自身位置进行校正。但这种方法依赖于能够取得环境特征。环境特征提取的方法有:

(1)  Hough transform是一类基于灰度图检测直线和其他曲线的方法。该方法需要一簇能被搜索的预先准备的特定曲线,并根据显示的灰度图中一簇曲线产生曲线参数。
(2)  Clustering分析是一种数据探测工具,对于未分类样例是有效的,同时,它的目标就是把所针对对象分组成自然类别或基于相似性或距离的簇类。在被提取对象类别未知的情况中,簇技术是一类比HoughTransform更有效的技术。簇类应是以“凝聚”为中心,而不是支离破碎的、不相交的。而环境特征有时是很难提取出的,例如:环境特征不够明显时或者传感器信息比较少,难以从一次感知信息中获得环境特征。

2.4数据关联

数据关联是对两个特征标志进行匹配,确定它们是否对应环境中的同一物体。SLAM中的数据关联主要需要完成三个任务:1)新特征标志的检测2)特征标志的匹配3)地图之间的匹配。虽然在目标跟踪、传感融合等领域,数据关联已经得到较好的解决,但是这些方法的计算量大,不能满足SLAM的实时性要求。实现m个标志与拥有n个标志的地图之间的数据关联的复杂度与m之间呈指数关系,假设每个观测到的标志i有 个可能的匹配,那么对于m个标志需要在指数空间 =  中搜索正确的匹配。数据关联的搜索空间与环境的复杂程度以及机器人的定位误差有关,环境的复杂程度的增加会使m增大,而误差的增大会使Ni 增大。

2.5累积误差

SLAM中的误差主要来自三个方面:1)观测误差2)里程计的误差3)错误的数据关联带来的误差。当机器人在已知地图的环境中进行定位时,机器人可以通过观测位置已知的特征标志对里程计的误差进行补偿,每一次观测使机器人的位置误差趋向于观测误差与特征标志的位置误差之和。然而在SLAM中,由于机器人的位置和环境中的特征标志的位置都是未知的,观测信息不能有效纠正里程计的误差,机器人的位置误差随着机器人的运动距离而增大。而机器人的位置误差的增大将导致错误的数据关联,从而增大特征标志的位置误差:反过来,特征标志的误差又将增大机器人的位置误差。因此,机器人的位置误差与特征标志的位置误差密切相关。它们之间的相互影响使机器人和特征标志的位置估计产生累计误差,难以保证地图的一致性。
 

3.SLAM的实现方法

目前SLAM方法大致可分为两类:
1)基于概率模型的方法:基于卡尔曼滤波的完全SLAM、压缩滤波、FastSLAM等
2)非概率模型方法:SM-SLAM、扫描匹配、数据融合(dataassociation)、基于模糊逻辑等。

3.1基于卡尔曼滤波器的实现方法

从统计学的观点看,SLAM是一个滤波问题,也就是根据系统的初始状态和从0到t时刻的观测信息与控制信息(里程计的读数)估计系统的当前状态。在SLAM中,系统的状态 = ,由机器人的位姿r和地图信息m组成(包含各特征标志的位置信息)。假设系统的运动模型和观测模型是带高斯噪声的线性模型,系统的状态 服从高斯分布,那SLAM可以采用卡尔曼滤波器来实现。基于卡尔曼滤波器的SLAM 包括系统状态预测和更新两步,同时还需要进行地图信息的管理,如:新特征标志的加入与特征标志的删除等。

卡尔曼滤波器假设系统是线性系统,但是实际中机器人的运动模型与观测模型是非线性的。因此通常采用扩展卡尔曼滤波器(Extended Kalman Filter),扩展卡尔曼滤波器通过一阶泰勒展开来近似表示非线性模型。另一种适用于非线性模型的卡尔曼滤波器是UKF(Unscented Kalman Filter),UKF采用条件高斯分布来近似后验概率分布,与EKF相比,UKF的线性化精度更高,而且不需要计算雅可比矩阵。

卡尔曼滤波器已经成为实现SLAM的基本方法。其协方差矩阵包含了机器人的位置和地图的不确定信息。当机器人连续地观测环境中的特征标志时,协方差矩阵的任何子矩阵的行列式呈单调递减。从理论上讲,当观测次数趋向于无穷时,每个特征标志的协方差只与机器人起始位置的协方差有关。卡尔曼滤波器的时间复杂度是O( ),由于每一时刻机器人只能观测到少数的几个特征标志,基于卡尔曼滤波器的SLAM的时间复杂度可以优化为O( ),n表示地图中的特征标志数。

3.2局部子地图法

局部子地图法从空间的角度将SLAM分解为一些较小的子问题。子地图法中主要需要考虑以下几个问题:1)如何划分子地图2)如何表示子地图间的相互关系3)如何将子地图的信息传递给全局地图以及能否保证全局地图的一致性。

最简单局部子地图方法是不考虑各子地图之间的相互关系,将全局地图划分为包括固定特征标志数的独立子地图,在各子地图中分别实现SLAM,这种方法的时间复杂度为O(1)。但是,由于丢失了表示不同子地图之间相关关系的有用信息,这种方法不能保证地图的全局一致性。

对此,Leonard 等人提出了DSM(DecoupledStochastic Mapping)方法,DSM中各子地图分别保存自己的机器人位置估计,当机器人从一个子地图A进入另一个子地图B时,采用基于EKF的方法来将子地图A中的信息传送给子地图B;B.Williams等人提出了一种基于CLSF(ConstrainedLocal Submap Filter)的SLAM方法,CLSF在地图中创建全局坐标已知的子地图,机器人前进过程中只利用观测信息更新机器人和局部子地图中的特征标志的位置,并且按一定的时间间隔把局部子地图信息传送给全局地图。虽然实验表明这两种算法具有很好的性能,但是没有从理论上证明它们能够保持地图的一致性。J.Guivant等人提出了一种没有任何信息丢失的SLAM优化算法CEKF(CompressedExtended Kalman Filter)。CEKF将已经观测到的特征标志分为A与B部分,A表示与机器人当前位置相邻的区域,被称为活动子地图。当机器人在活动子地图A中运动时,利用观测信息实时更新机器人的位置与子地图A,并采用递归的方法记录观测信息对子地图B的影响;当机器人离开活动子地图A时,将观测信息无损失地传送给子地图B,一次性地实现子地图B的更新,同时创建新的活动子地图。该方法的计算时间由两部分组成:活动子地图中的SLAM,其时间复杂度为O( ), 是活动子地图A中特征标志的数目;子地图B的更新,其时间复杂度为O( ) , 是地图B中特征标志的数目。当子地图合并的时间间隔较大时,CEKF能有效减少SLAM的计算量。

3.3去相关法

降低SLAM复杂度的另一种方法是将表示相关关系的协方差矩阵中一些取值较小的元素忽略掉,使其变为一个稀疏矩阵。然而这也会因信息的丢失而使地图失去一致性。但是,如果能改变协方差矩阵的表示方式,使其中的很多的元素接近于零或等于零,那么就可以将其安全地忽略了。基于扩展信息滤波器EIF(ExtendedInformation Filter)的SLAM就是出于这一思想。EIF EKF的基于信息的表达形式,它们的区别在于表示信息的形式不一样。EIF采用协方差矩阵的逆矩阵来表征SLAM中的不确定信息,并称之为信息矩阵。两个不相关的信息矩阵的融合可以简单地表示为两个矩阵相加。信息矩阵中每个非对角线上的元素表示机器人与特征标志之间或特征标志与特征标志之间的一种约束关系,这些约束关系可以通过系统状态的信关系进行局部更新。这种局部更新使得信息矩阵近似于稀疏矩阵,对其进行稀疏化产生的误差很小。根据这一点,S.Thrun等人提出了一种基于稀疏信息滤波器SEIF(Sparse Extended InformationFilter)的SLAM方法,并证明利用稀疏的信息矩阵实现SLAM的时间复杂度是O(1)。虽然EIF可以有效降低SLAM的时间复杂度,但是在地图信息的表示和管理方面还存在一些问题。首先,在常数时间内只能近似算得系统状态的均值;其次,在基于EIF 的SLAM 方法中,特征标志的增删不方便。

3.4分解法(FastSLAM)

M.Montemerlo 等人提出了一种基于粒子滤波器(ParticleFilter) FastSLAM 方法。FastSLAM 将SLAM分解为机器人定位和特征标志的位置估计两个过程。 粒子滤波器中的每个粒子代表机器人的一条可能运动路径,利用观测信息计算每个粒子的权重,以评价每条路径的好坏。对于每个粒子来说,机器人的运动路径是确定的,因此特征标志之间相互独立,特征标志的观测信息只与机器人的位姿有关,每个粒子可以采用n个卡尔曼滤波器分别估计地图中n个特征的位置。假设需要k个粒子实现SLAM、FastSLAM,总共有kn个卡尔曼滤波器。FastSLAM的时间复杂度为O(kn),通过利用树型的数据结构进行优化,其时间复杂度可以达到O(klog n)。Fast2SLAM方法的另一个主要优点是通过采用粒子滤波器估计机器人的位姿,可以很好地表示机器人的非线性、非高斯运动模型。

3.5基于多机器人协作的SLAM

一些研究者对基于多机器人协作的同时定位与地图创建CSLAM(CooperativeSimultaneous Localizationand Mapping)进行了探讨和研究。 与单机器人相比,通过机器人之间的相互协调与合作以及信息共享,CSLAM可以提高地图创建的效率和提高定位与地图的精度。CSLAM按照地图的存储与处理方式的不同可以分为两大类型:集中式CSLAM和分布式CSLAM。在集中式CSLAM中,存在一个中央处理模块,每个机器人分别在自己所在的局部地图中进行定位与地图创建,然后利用无线通信装置将在局部地图中获得的信息传送给中央模块。这种方法通过子地图的匹配,可以充分利用子地图间的冗余信息提高定位与地图创建的精度。但是,当机器人数量增加时中央模块的计算量会显著增大,而且集中式的信息传递需要很大的带宽;系统的可靠性也比较低,一旦中央模块出现故障,整个系统都会陷入瘫痪状态。在分布式CSLAM中,不存在中央模块,每个机器人都拥有自己的全局地图,在每一时刻机器人把来自其他相邻机器人的信息和自己的观测信息融合到自己的全局地图中,然后以点对点的方式将新的信息传送给其他机器人。每个机器人只能获得与其相邻的机器人的位置信息,不知道整个系统的拓扑结构。这种方法与分布式的信息融合十分相似,可以利用信息滤波器来实现。由于两个不相关信息矩阵的信息融合可以通过两个矩阵的相加而实现,所以利用信息滤波器实现分布式CSLAM可以避免复杂的计算。

4.研究方向与发展趋势

综上所述,近几年来机器人领域的研究者对SLAM进行了大量的研究,特别是在降低计算复杂度、提高鲁棒性等方面取得了很大的进展。随着研究的深入,以下的几方面成为了当前SLAM的研究热点方向。
1.扩展SLAM的应用环境:将目前局限二维静态环境中的研究与应用扩展到与现实中的环境切合的动态的三维环境;
2.深入研究基于多机器人协作的SLAM,提高其应用水平;
3.研究更有效的SLAM实现方法,将人工智能、智能控制等领域的方法引入到SLAM中,开发更有效的SLAM算法.;
4.研究更好的地图表达方式,特别是复杂地形和大环境中的地图表达方式;
5.研究更好的将视觉处理与其他传感器结合,提高环境特征提取的精度,减少误差,提高定位和构图的精确性。

机器人2025本期第二版导读
DeepMind与英国医院合作:用机器学习治疗头部和颈部的癌症
 
文章来源于 机器人2025 查看全部

1.引言

机器人的研究越来越多的得到关注和投入,随着计算机技术和人工智能的发展,智能自主移动机器人成为机器人领域的一个重要研究方向和研究热点。移动机器人的定位和地图创建是自主移动机器人领域的热点研究问题。对于已知环境中的机器人自主定位和已知机器人位置的地图创建已经有了一些实用的解决方法。然而在很多环境中机器人不能利用全局定位系统进行定位,而且事先获取机器人工作环境的地图很困难,甚至是不可能的。这时机器人需要在自身位置不确定的条件下,在完全未知环境中创建地图,同时利用地图进行自主定位和导航。这就是移动机器人的同时定位与地图创建(SLAM) 问题,最先是由SmithSelf 和Cheeseman在1988年提出来的,被认为是实现真正全自主移动机器人的关键。

SLAM问题可以描述为:机器人在未知环境中从一个未知位置开始移动,在移动过程中根据位置估计和传感器数据进行自身定位,同时建造增量式地图。在SLAM中,机器人利用自身携带的传感器识别未知环境中的特征标志,然后根据机器人与特征标志之间的相对位置和里程计的读数估计机器人和特征标志的全局坐标。这种在线的定位与地图创建需要保持机器人与特征标志之间的详细信息。近几年来,SLAM的研究取得了很大的进展,并已应用于各种不同的环境,如:室内环境、水下、室外环境。
 

2.SLAM的关键性问题

2.1地图的表示方式

目前各国研究者已经提出了多种表示法,大致可分为三类:栅格表示、几何信息表示和拓扑图表示,每种方法都有自己的优缺点。

栅格地图表示法即将整个环境分为若干相同大小的栅格,对于每个栅格各指出其中是否存在障碍物。这种方法最早由Elfes和Moravec提出,而后Elfes进行了进一步的研究。它的优点在于创建和维护容易,尽量的保留了整个环境的各种信息,同时借助于该地图,可以方便地进行自定位和路径规划。缺点在于:当栅格数量增大时(在大规模环境或对环境划分比较详细时),对地图的维护行为将变得困难,同时定位过程中搜索空间很大,如果没有较好的简化算法,实现实时应用比较困难。

几何信息地图表示法是指机器人收集对环境的感知信息,从中提取更为抽象的几何特征,例如线段或曲线,使用这些几何信息描述环境。该方法更为紧凑,且便于位置估计和目标识别。几何方法利用卡尔曼滤波在局部区域内可获得较高精度,且计算量小,但在广域环境中却难以维持精确的坐标信息。但几何信息的提取需要对感知信息作额外处理,且需要一定数量的感知数据才能得到结果。

拓扑地图抽象度高,特别在环境大而简单时。这种方法将环境表示为一张拓扑意义中的图(graph),图中的节点对应于环境中的一个特征状态、地点。如果节点间存在直接连接的路径则相当于图中连接节点的弧。其优点是:

(1)有利于进一步的路径和任务规划,
(2)存储和搜索空间都比较小,计算效率高,
(3)可以使用很多现有成熟、高效的搜索和推理算法。

缺点在于对拓扑图的使用是建立在对拓扑节点的识别匹配基础上的,如当环境中存在两个很相似的地方时,拓扑图方法将很难确定这是否为同一点。

2.2不确定信息的描述

在完全未知环境中由机器人依靠其自身携带的传感器所提供的信息建立环境模型是移动机器人进行自主定位和导航的前提之一。所谓完全未知环境是指机器人对环境一无所知不存在任何先验信息,如环境形状、障碍物位置、人为设定的参照物等。在这种环境下,移动机器人必须依赖传感器所获得的信息,如里程计、声纳、激光测距仪、视觉等。由于传感器自身的限制,感知信息存在不同程度的不确定性,例如激光测距仪的不确定性主要来自距离的测量误差以及反光镜旋转和激光散射引起的测量角误差。如图1-1所示,感知信息的不确定性必然导致所构建的环境模型也不可能是完全精确的,同样,当依靠模型和感知进行决策时也带有不确定性,即不确定性具有传递性。

1.PNG


对不确定性进行度量的方法主要有概率度量、信任度量、可能性度量、模糊度量和证据理论等。目前,在AMR地图构建中使用较多的是概率度量和模糊度量。概率度量主要存在两种形式:

(1)以均值、方差和协方差等概率特征来描述不确定信息。这种度量方法的优点是均值等概率特征具有明确的几何意义,缺点是概率特征的离散计算公式还没有确定的形式;
(2)以概率模型来描述不确定信息,主要采用Bayes法则与Markov假设。这种度量方法的优点是以随机概率模型描述机器人的位姿和环境信息,鲁棒性非常好,缺点是概率模型的计算量非常大而且必须事先知道模型的先验概率,给实际应用造成了困难。

2.3定位与环境特征提取

移动机器人自定位与环境建模问题是紧密相关的。环境模型的准确性依赖于定位精度,而定位的实现又离不开环境模型。在未知环境中,机器人没有什么参照物,只能依靠自己并不十分准确的传感器来获取外界信息,如同一个盲人在一个陌生环境中摸索的情况。这种情况下,定位是比较困难的。有地图的定位和有定位的地图创建都是容易解决的,但无地图的定位和未解决定位的地图创建如同"鸡--蛋"问题,无从下手。已有的研究中对这类问题的解决方法可分为两类:

1) 利用自身携带的多种内部传感器(包括里程仪、罗盘、加速度计等),通过多种传感信息的融合减少定位的误差,使用的融合算法多为基于卡尔曼滤波的方法。这类方法由于没有参考外部信息,在长时间的漫游后误差的积累会比较大。
2) 在依靠内部传感器估计自身运动的同时,使用外部传感器(如激光测距仪、视觉等)感知环境,对获得的信息进行分析提取环境特征并保存,在下一步通过对环境特征的比较对自身位置进行校正。但这种方法依赖于能够取得环境特征。环境特征提取的方法有:

(1)  Hough transform是一类基于灰度图检测直线和其他曲线的方法。该方法需要一簇能被搜索的预先准备的特定曲线,并根据显示的灰度图中一簇曲线产生曲线参数。
(2)  Clustering分析是一种数据探测工具,对于未分类样例是有效的,同时,它的目标就是把所针对对象分组成自然类别或基于相似性或距离的簇类。在被提取对象类别未知的情况中,簇技术是一类比HoughTransform更有效的技术。簇类应是以“凝聚”为中心,而不是支离破碎的、不相交的。而环境特征有时是很难提取出的,例如:环境特征不够明显时或者传感器信息比较少,难以从一次感知信息中获得环境特征。

2.4数据关联

数据关联是对两个特征标志进行匹配,确定它们是否对应环境中的同一物体。SLAM中的数据关联主要需要完成三个任务:1)新特征标志的检测2)特征标志的匹配3)地图之间的匹配。虽然在目标跟踪、传感融合等领域,数据关联已经得到较好的解决,但是这些方法的计算量大,不能满足SLAM的实时性要求。实现m个标志与拥有n个标志的地图之间的数据关联的复杂度与m之间呈指数关系,假设每个观测到的标志i有 个可能的匹配,那么对于m个标志需要在指数空间 =  中搜索正确的匹配。数据关联的搜索空间与环境的复杂程度以及机器人的定位误差有关,环境的复杂程度的增加会使m增大,而误差的增大会使Ni 增大。

2.5累积误差

SLAM中的误差主要来自三个方面:1)观测误差2)里程计的误差3)错误的数据关联带来的误差。当机器人在已知地图的环境中进行定位时,机器人可以通过观测位置已知的特征标志对里程计的误差进行补偿,每一次观测使机器人的位置误差趋向于观测误差与特征标志的位置误差之和。然而在SLAM中,由于机器人的位置和环境中的特征标志的位置都是未知的,观测信息不能有效纠正里程计的误差,机器人的位置误差随着机器人的运动距离而增大。而机器人的位置误差的增大将导致错误的数据关联,从而增大特征标志的位置误差:反过来,特征标志的误差又将增大机器人的位置误差。因此,机器人的位置误差与特征标志的位置误差密切相关。它们之间的相互影响使机器人和特征标志的位置估计产生累计误差,难以保证地图的一致性。
 

3.SLAM的实现方法

目前SLAM方法大致可分为两类:
1)基于概率模型的方法:基于卡尔曼滤波的完全SLAM、压缩滤波、FastSLAM等
2)非概率模型方法:SM-SLAM、扫描匹配、数据融合(dataassociation)、基于模糊逻辑等。

3.1基于卡尔曼滤波器的实现方法

从统计学的观点看,SLAM是一个滤波问题,也就是根据系统的初始状态和从0到t时刻的观测信息与控制信息(里程计的读数)估计系统的当前状态。在SLAM中,系统的状态 = ,由机器人的位姿r和地图信息m组成(包含各特征标志的位置信息)。假设系统的运动模型和观测模型是带高斯噪声的线性模型,系统的状态 服从高斯分布,那SLAM可以采用卡尔曼滤波器来实现。基于卡尔曼滤波器的SLAM 包括系统状态预测和更新两步,同时还需要进行地图信息的管理,如:新特征标志的加入与特征标志的删除等。

卡尔曼滤波器假设系统是线性系统,但是实际中机器人的运动模型与观测模型是非线性的。因此通常采用扩展卡尔曼滤波器(Extended Kalman Filter),扩展卡尔曼滤波器通过一阶泰勒展开来近似表示非线性模型。另一种适用于非线性模型的卡尔曼滤波器是UKF(Unscented Kalman Filter),UKF采用条件高斯分布来近似后验概率分布,与EKF相比,UKF的线性化精度更高,而且不需要计算雅可比矩阵。

卡尔曼滤波器已经成为实现SLAM的基本方法。其协方差矩阵包含了机器人的位置和地图的不确定信息。当机器人连续地观测环境中的特征标志时,协方差矩阵的任何子矩阵的行列式呈单调递减。从理论上讲,当观测次数趋向于无穷时,每个特征标志的协方差只与机器人起始位置的协方差有关。卡尔曼滤波器的时间复杂度是O( ),由于每一时刻机器人只能观测到少数的几个特征标志,基于卡尔曼滤波器的SLAM的时间复杂度可以优化为O( ),n表示地图中的特征标志数。

3.2局部子地图法

局部子地图法从空间的角度将SLAM分解为一些较小的子问题。子地图法中主要需要考虑以下几个问题:1)如何划分子地图2)如何表示子地图间的相互关系3)如何将子地图的信息传递给全局地图以及能否保证全局地图的一致性。

最简单局部子地图方法是不考虑各子地图之间的相互关系,将全局地图划分为包括固定特征标志数的独立子地图,在各子地图中分别实现SLAM,这种方法的时间复杂度为O(1)。但是,由于丢失了表示不同子地图之间相关关系的有用信息,这种方法不能保证地图的全局一致性。

对此,Leonard 等人提出了DSM(DecoupledStochastic Mapping)方法,DSM中各子地图分别保存自己的机器人位置估计,当机器人从一个子地图A进入另一个子地图B时,采用基于EKF的方法来将子地图A中的信息传送给子地图B;B.Williams等人提出了一种基于CLSF(ConstrainedLocal Submap Filter)的SLAM方法,CLSF在地图中创建全局坐标已知的子地图,机器人前进过程中只利用观测信息更新机器人和局部子地图中的特征标志的位置,并且按一定的时间间隔把局部子地图信息传送给全局地图。虽然实验表明这两种算法具有很好的性能,但是没有从理论上证明它们能够保持地图的一致性。J.Guivant等人提出了一种没有任何信息丢失的SLAM优化算法CEKF(CompressedExtended Kalman Filter)。CEKF将已经观测到的特征标志分为A与B部分,A表示与机器人当前位置相邻的区域,被称为活动子地图。当机器人在活动子地图A中运动时,利用观测信息实时更新机器人的位置与子地图A,并采用递归的方法记录观测信息对子地图B的影响;当机器人离开活动子地图A时,将观测信息无损失地传送给子地图B,一次性地实现子地图B的更新,同时创建新的活动子地图。该方法的计算时间由两部分组成:活动子地图中的SLAM,其时间复杂度为O( ), 是活动子地图A中特征标志的数目;子地图B的更新,其时间复杂度为O( ) , 是地图B中特征标志的数目。当子地图合并的时间间隔较大时,CEKF能有效减少SLAM的计算量。

3.3去相关法

降低SLAM复杂度的另一种方法是将表示相关关系的协方差矩阵中一些取值较小的元素忽略掉,使其变为一个稀疏矩阵。然而这也会因信息的丢失而使地图失去一致性。但是,如果能改变协方差矩阵的表示方式,使其中的很多的元素接近于零或等于零,那么就可以将其安全地忽略了。基于扩展信息滤波器EIF(ExtendedInformation Filter)的SLAM就是出于这一思想。EIF EKF的基于信息的表达形式,它们的区别在于表示信息的形式不一样。EIF采用协方差矩阵的逆矩阵来表征SLAM中的不确定信息,并称之为信息矩阵。两个不相关的信息矩阵的融合可以简单地表示为两个矩阵相加。信息矩阵中每个非对角线上的元素表示机器人与特征标志之间或特征标志与特征标志之间的一种约束关系,这些约束关系可以通过系统状态的信关系进行局部更新。这种局部更新使得信息矩阵近似于稀疏矩阵,对其进行稀疏化产生的误差很小。根据这一点,S.Thrun等人提出了一种基于稀疏信息滤波器SEIF(Sparse Extended InformationFilter)的SLAM方法,并证明利用稀疏的信息矩阵实现SLAM的时间复杂度是O(1)。虽然EIF可以有效降低SLAM的时间复杂度,但是在地图信息的表示和管理方面还存在一些问题。首先,在常数时间内只能近似算得系统状态的均值;其次,在基于EIF 的SLAM 方法中,特征标志的增删不方便。

3.4分解法(FastSLAM)

M.Montemerlo 等人提出了一种基于粒子滤波器(ParticleFilter) FastSLAM 方法。FastSLAM 将SLAM分解为机器人定位和特征标志的位置估计两个过程。 粒子滤波器中的每个粒子代表机器人的一条可能运动路径,利用观测信息计算每个粒子的权重,以评价每条路径的好坏。对于每个粒子来说,机器人的运动路径是确定的,因此特征标志之间相互独立,特征标志的观测信息只与机器人的位姿有关,每个粒子可以采用n个卡尔曼滤波器分别估计地图中n个特征的位置。假设需要k个粒子实现SLAM、FastSLAM,总共有kn个卡尔曼滤波器。FastSLAM的时间复杂度为O(kn),通过利用树型的数据结构进行优化,其时间复杂度可以达到O(klog n)。Fast2SLAM方法的另一个主要优点是通过采用粒子滤波器估计机器人的位姿,可以很好地表示机器人的非线性、非高斯运动模型。

3.5基于多机器人协作的SLAM

一些研究者对基于多机器人协作的同时定位与地图创建CSLAM(CooperativeSimultaneous Localizationand Mapping)进行了探讨和研究。 与单机器人相比,通过机器人之间的相互协调与合作以及信息共享,CSLAM可以提高地图创建的效率和提高定位与地图的精度。CSLAM按照地图的存储与处理方式的不同可以分为两大类型:集中式CSLAM和分布式CSLAM。在集中式CSLAM中,存在一个中央处理模块,每个机器人分别在自己所在的局部地图中进行定位与地图创建,然后利用无线通信装置将在局部地图中获得的信息传送给中央模块。这种方法通过子地图的匹配,可以充分利用子地图间的冗余信息提高定位与地图创建的精度。但是,当机器人数量增加时中央模块的计算量会显著增大,而且集中式的信息传递需要很大的带宽;系统的可靠性也比较低,一旦中央模块出现故障,整个系统都会陷入瘫痪状态。在分布式CSLAM中,不存在中央模块,每个机器人都拥有自己的全局地图,在每一时刻机器人把来自其他相邻机器人的信息和自己的观测信息融合到自己的全局地图中,然后以点对点的方式将新的信息传送给其他机器人。每个机器人只能获得与其相邻的机器人的位置信息,不知道整个系统的拓扑结构。这种方法与分布式的信息融合十分相似,可以利用信息滤波器来实现。由于两个不相关信息矩阵的信息融合可以通过两个矩阵的相加而实现,所以利用信息滤波器实现分布式CSLAM可以避免复杂的计算。

4.研究方向与发展趋势

综上所述,近几年来机器人领域的研究者对SLAM进行了大量的研究,特别是在降低计算复杂度、提高鲁棒性等方面取得了很大的进展。随着研究的深入,以下的几方面成为了当前SLAM的研究热点方向。
1.扩展SLAM的应用环境:将目前局限二维静态环境中的研究与应用扩展到与现实中的环境切合的动态的三维环境;
2.深入研究基于多机器人协作的SLAM,提高其应用水平;
3.研究更有效的SLAM实现方法,将人工智能、智能控制等领域的方法引入到SLAM中,开发更有效的SLAM算法.;
4.研究更好的地图表达方式,特别是复杂地形和大环境中的地图表达方式;
5.研究更好的将视觉处理与其他传感器结合,提高环境特征提取的精度,减少误差,提高定位和构图的精确性。

机器人2025本期第二版导读
DeepMind与英国医院合作:用机器学习治疗头部和颈部的癌症
 
文章来源于 机器人2025