1、 人工智能标准化白皮书 (2018版) 指导单位:国家标准化管理委员会工业二部 编写单位:中国电子技术标准化研究院 二零一八年一月 编写单位(排名不分先后) 中国电子技术标准化研究院 中国科学院自动化研究所 北京理工大学 清华大学 北京大学 中国人民大学 北京航空航天大学 科大讯飞股份有限公司 华为技术有限公司 国际商业机器(中国)有限公司 阿里云计算有限公司 中国科学院计算技术研究所 中国电信集团公司 腾讯互联网加(深圳)有限公司 阿里巴巴网络技术有限公司 上海计算机软件技术开发中心 上海智臻智能网络科技股份有限公司 北京爱奇艺科技有限公司 北京有生志广科技有限公司 极限元(北京)智能科技股
2、份有限公司 北京字节跳动科技有限公司(今日头条) 北京商汤科技开发有限公司 浙江蚂蚁小微金融服务集团有限公司 百度网络技术有限公司 英特尔(中国)有限公司 松下电器(中国)有限公司 重庆凯泽科技股份有限公司 海尔工业智能研究院有限公司 重庆中科云从科技有限公司 北京格灵深瞳信息技术有限公司 I 目录 1前言 1 1.1研究背景 1 1.2研究目标及意义 2 2人工智能概述 3 2.1人工智能的历史及概念 3 2.1.1人工智能的起源与历史 .3 2.1.2人工智能的概念 .5 2.2人工智能的特征 7 2.3人工智能参考框架 8 3人工智能发展现状及趋势 .11 3.1 人工智能关键技术 .1
3、1 3.1.1机器学习 11 3.1.2知识图谱 13 3.1.3自然语言处理 14 3.1.4人机交互 15 3.1.5计算机视觉 17 3.1.6生物特征识别 19 3.1.7虚拟现实/增强现实 .21 3.1.8人工智能技术发展趋势 21 3.2人工智能产业现状及趋势 .22 3.2.1智能基础设施 23 3.2.2智能信息及数据 24 3.2.3智能技术服务 25 3.2.4智能产品 25 3.2.5人工智能行业应用 27 3.2.6人工智能产业发展趋势 31 3.3安全、伦理、隐私问题 .32 3.3.1人工智能的安全问题 32 3.3.2人工智能的伦理问题 33 3.3.3人工智能
4、的隐私问题 34 3.4 人工智能标准化的重要作用 .35 4人工智能标准化现状 .37 4.1国际标准化现状 .37 4.1.1 ISO/IEC JTC 1 37 4.1.2 ISO 40 4.1.3 IEC 40 II 4.1.4 ITU 41 4.2国外标准化现状 .41 4.2.1 IEEE .41 4.2.2 NIST .41 4.2.3 其它 .42 4.3国内标准化现状 .42 4.3.1全国信息技术标准化技术委员会 42 4.3.2全国自动化系统与集成标准化技术委员会 43 4.3.3全国音频、视频和多媒体标准化技术委员会 43 4.3.4全国信息安全标准化技术委员会 43 4
5、.3.5全国智能运输系统标准化技术委员会 44 4.4人工智能标准化面临的问题和挑战 .44 4.5人工智能标准需求分析 .45 4.6人工智能标准化组织机制建设 .46 5人工智能标准体系 .48 5.1人工智能标准体系结构 .48 5.2 标准体系框架 .49 5.2.1基础标准 51 5.2.2平台/支撑标准 .51 5.2.3关键技术标准 51 5.2.4产品及服务标准 53 5.2.5应用标准 54 5.2.6安全/伦理标准 .56 5.3近期急需制定标准 .56 6人工智能标准化工作重点建议 .59 附件1 人工智能标准明细表 61 附件2 应用案例 71 1 1 前言 1.1研究
6、背景 人工智能概念诞生于 1956 年,在半个多世纪的发展历程中,由于受到智能 算法、计算速度、存储水平等多方面因素的影响,人工智能技术和应用发展经历 了多次高潮和低谷。2006 年以来,以深度学习为代表的机器学习算法在机器视 觉和语音识别等领域取得了极大的成功,识别准确性大幅提升,使人工智能再次 受到学术界和产业界的广泛关注。云计算、大数据等技术在提升运算速度,降低 计算成本的同时,也为人工智能发展提供了丰富的数据资源,协助训练出更加智 能化的算法模型。 人工智能的发展模式也从过去追求 “用计算机模拟人工智能” , 逐步转向以机器与人结合而成的增强型混合智能系统,用机器、人、网络结合成 新的
7、群智系统,以及用机器、人、网络和物结合成的更加复杂的智能系统。 作为新一轮产业变革的核心驱动力, 人工智能在催生新技术、 新产品的同时, 对传统行业也具备较强的赋能作用,能够引发经济结构的重大变革,实现社会生 产力的整体跃升。人工智能将人从枯燥的劳动中解放出来,越来越多的简单性、 重复性、危险性任务由人工智能系统完成,在减少人力投入,提高工作效率的同 时,还能够比人类做得更快、更准确;人工智能还可以在教育、医疗、养老、环 境保护、城市运行、司法服务等领域得到广泛应用,能够极大提高公共服务精准 化水平,全面提升人民生活品质;同时,人工智能可帮助人类准确感知、预测、 预警基础设施和社会安全运行的重
8、大态势,及时把握群体认知及心理变化,主动 作出决策反应,显著提高社会治理能力和水平,同时保障公共安全。 人工智能作为一项引领未来的战略技术, 世界发达国家纷纷在新一轮国际竞 争中争取掌握主导权,围绕人工智能出台规划和政策,对人工智能核心技术、顶 尖人才、标准规范等进行部署,加快促进人工智能技术和产业发展。主要科技企 业不断加大资金和人力投入,抢占人工智能发展制高点。2017 年,我国出台了 新一代人工智能发展规划 (国发201735号) 、 促进新一代人工智能产业 发展三年行动计划(2018-2020 年) (工信部科2017315 号)等政策文件, 推动人工智能技术研发和产业化发展。目前,国
9、内人工智能发展已具备一定的技 术和产业基础,在芯片、数据、平台、应用等领域集聚了一批人工智能企业,在 2 部分方向取得阶段性成果并向市场化发展。例如,人工智能在金融、安防、客服 等行业领域已实现应用,在特定任务中语义识别、语音识别、人脸识别、图像识 别技术的精度和效率已远超人工。 标准化工作对人工智能及其产业发展具有基础性、支撑性、引领性的作用, 既是推动产业创新发展的关键抓手,也是产业竞争的制高点。当前,在我国人工 智能相关产品和服务不断丰富的同时,也出现了标准化程度不足的问题。人工智 能涉及众多领域,虽然某些领域已具备一定的标准化基础,但是这些分散的标准 化工作并不足以完全支撑整个人工智能
10、领域。 另一方面, 人工智能属于新兴领域, 发展方兴未艾,从世界范围来看,标准化工作仍在起步过程中,尚未形成完善的 标准体系,我国基本与国外处于同一起跑线,存在快速突破的机会窗口。只要瞄 准机会,快速布局,完全有可能抢占标准创新的制高点,反之,则有可能丧失良 机。因此,迫切需要把握机遇,加快对人工智能技术及产业发展的研究,系统梳 理、加快研制人工智能各领域的标准体系,明确标准之间的依存性与制约关系, 建立统一完善的标准体系, 以标准的手段促进我国人工智能技术、 产业蓬勃发展。 1.2研究目标及意义 本白皮书前期在国标委工业二部和工信部科技司的指导下, 通过梳理人工智 能技术、 应用和产业演进情
11、况, 分析人工智能的技术热点、 行业动态和未来趋势, 从支撑人工智能产业整体发展的角度出发, 研究制定了能够适应和引导人工智能 产业发展的标准体系,进而提出近期急需研制的基础和关键标准项目。 本白皮书并不预期成为人工智能领域的全面技术和产业综述, 不求面面俱到, 仅针对目前人工智能领域涵盖的技术热点和产业情况进行分析, 研究提出人工智 能标准体系。人工智能标准化工作尚处于起步阶段,本白皮书只作为人工智能领 域技术、产业和标准化之间初始的连接纽带,并将在今后不断根据技术、产业和 标准化的发展需求进行修订。 本白皮书不过多地给出人工智能领域观点性的陈述, 力求以较为浅显易懂的语言和方式进行阐述。
12、本白皮书的意义在于与业界分享人工智能领域的研究成果和实践经验, 呼吁 社会各界共同加强人工智能领域的技术研究、产业投入、标准建设与服务应用, 共同推动人工智能及其产业发展。 3 2 人工智能概述 2.1人工智能的历史及概念 2.1.1人工智能的起源与历史 人工智能始于 20世纪 50年代,至今大致分为三个发展阶段:第一阶段(20 世纪 50 年代80 年代) 。这一阶段人工智能刚诞生,基于抽象数学推理的可 编程数字计算机已经出现,符号主义(Symbolism)快速发展,但由于很多事物 不能形式化表达,建立的模型存在一定的局限性。此外,随着计算任务的复杂性 不断加大,人工智能发展一度遇到瓶颈;第
13、二阶段(20世纪 80年代90年代 末) 。在这一阶段,专家系统得到快速发展,数学模型有重大突破,但由于专家 系统在知识获取、推理能力等方面的不足,以及开发成本高等原因,人工智能的 发展又一次进入低谷期;第三阶段(21 世纪初至今) 。随着大数据的积聚、 理论算法的革新、 计算能力的提升, 人工智能在很多应用领域取得了突破性进展, 迎来了又一个繁荣时期。人工智能具体的发展历程如图 1所示。 图 1 人工智能发展历史 长期以来, 制造具有智能的机器一直是人类的重大梦想。 早在 1950年, Alan Turing在计算机器与智能中就阐述了对人工智能的思考。他提出的图灵测试 是机器智能的重要测量手
14、段,后来还衍生出了视觉图灵测试等测量方法。1956 2010s 1970s 1980s 1987-1997 1950s 1960s 2000s 第一次 繁荣期 达特茅斯会议,确定 了人工智能的概念和 发展目标 1976- 1982 第一次 低谷期 遭受质疑 批评,运 算能力不 足、计算 复杂度较 高、常识 与推理实 现难度较 大等 1982- 1987 第二次 繁荣期 具备逻辑 规则推演 和特定领 域回答解 决问题的 专家系统 盛行,及 五代计算 机的发展 复苏期 计算性能的提 升与互联网技 术的快速普及 增长爆发期 新一代信息技术引 发信息环境与数据 基础变革,海量图 像语音文本等多模 态数
15、据不断出现, 计算能力提高 第二次 低谷期 技术领域再次 陷入瓶颈,抽 象推理不再被 继续关注,基 于符号处理的 模型遭到反对 1976年, 机器翻译 等项目的 失败及一 些学术报 告的负面 影响,人 工智能的 经费普遍 减少 1985年, 出现了更 强可视化 效果的决 策树模型 和突破早 期感知机 局限的多 层人工神 经网络 1959年, Arthur Samuel 提出了机器学习 1987年, LISP机市 场崩塌 1997年, Deep Blue战胜 世界国际 象棋冠军 Garry Kasparov 2006年, Hinton和 他的学生 开始深度 学习 2014年, 微软公 司发布 全
16、球第 一款个 人智能 助理微 软小娜 2010年, 大数据 时代到 来 1956年达特茅 斯会议提出 “人工智能” 2016年3月, AlphaGo以4 比1战胜世 界围棋冠军 李世石 2017年10 月,Deep Mind团队 公布了最 强 版 的 AlphaGo Zero 1990s 1997-2010 2010- 1956-1976 2020s 4 年,“人工智能”这个词首次出现在达特茅斯会议上,标志着其作为一个研究领 域的正式诞生。六十年来,人工智能发展潮起潮落的同时,基本思想可大致划分 为四个流派:符号主义(Symbolism) 、连接主义(Connectionism) 、行为主义
17、(Behaviourism)和统计主义(Statisticsism) (注:由于篇幅原因,本白皮书不 对四个流派进行详细阐述) 。这四个流派从不同侧面抓住了智能的部分特征,在 “制造”人工智能方面都取得了里程碑式的成就。 1959年,Arthur Samuel 提出了机器学习,机器学习将传统的制造智能演化 为通过学习能力来获取智能,推动人工智能进入了第一次繁荣期。20世纪 70年 代末期专家系统的出现,实现了人工智能从理论研究走向实际应用,从一般思维 规律探索走向专门知识应用的重大突破, 将人工智能的研究推向了新高潮。 然而, 机器学习的模型仍然是“人工”的,也有很大的局限性。随着专家系统应用
18、的不 断深入,专家系统自身存在的知识获取难、知识领域窄、推理能力弱、实用性差 等问题逐步暴露。从 1976年开始,人工智能的研究进入长达 6年的萧瑟期。 在 80 年代中期,随着美国、日本立项支持人工智能研究,以及以知识工程 为主导的机器学习方法的发展, 出现了具有更强可视化效果的决策树模型和突破 早期感知机局限的多层人工神经网络,由此带来了人工智能的又一次繁荣期。然 而,当时的计算机难以模拟复杂度高及规模大的神经网络,仍有一定的局限性。 1987年由于 LISP 机市场崩塌,美国取消了人工智能预算,日本第五代计算机项 目失败并退出市场,专家系统进展缓慢,人工智能又进入了萧瑟期。 1997年,
19、IBM 深蓝(Deep Blue)战胜国际象棋世界冠军 Garry Kasparov。 这是一次具有里程碑意义的成功,它代表了基于规则的人工智能的胜利。2006 年,在 Hinton 和他的学生的推动下,深度学习开始备受关注,为后来人工智能 的发展带来了重大影响。从 2010 年开始,人工智能进入爆发式的发展阶段,其 最主要的驱动力是大数据时代的到来,运算能力及机器学习算法得到提高。人工 智能快速发展,产业界也开始不断涌现出新的研发成果:2011 年,IBM Waston 在综艺节目危险边缘中战胜了最高奖金得主和连胜纪录保持者;2012 年, 谷歌大脑通过模仿人类大脑在没有人类指导的情况下,
20、利用非监督深度学习方法 从大量视频中成功学习到识别出一只猫的能力;2014 年,微软公司推出了一款 实时口译系统,可以模仿说话者的声音并保留其口音;2014 年,微软公司发布 5 全球第一款个人智能助理微软小娜;2014 年,亚马逊发布至今为止最成功的智 能音箱产品 Echo和个人助手 Alexa;2016 年,谷歌 AlphaGo机器人在围棋比赛 中击败了世界冠军李世石;2017 年,苹果公司在原来个人助理 Siri 的基础上推 出了智能私人助理 Siri和智能音响 HomePod。 目前,世界各国都开始重视人工智能的发展。2017年 6月 29日,首届世界 智能大会在天津召开。中国工程院院
21、士潘云鹤在大会主论坛作了题为“中国新一 代人工智能”的主题演讲,报告中概括了世界各国在人工智能研究方面的战略: 2016 年 5 月,美国白宫发表了为人工智能的未来做好准备 ;英国 2016 年 12 月发布 人工智能: 未来决策制定的机遇和影响 ; 法国在 2017年 4月制定了 国 家人工智能战略 ; 德国在 2017年 5月颁布全国第一部自动驾驶的法律; 在中国, 据不完全统计, 2017 年运营的人工智能公司接近 400家,行业巨头百度、腾讯、 阿里巴巴等都不断在人工智能领域发力。从数量、投资等角度来看,自然语言处 理、机器人、计算机视觉成为了人工智能最为热门的三个产业方向。 2.1.
22、2人工智能的概念 人工智能作为一门前沿交叉学科,其定义一直存有不同的观点: 人工智能 一种现代方法中将已有的一些人工智能定义分为四类:像人一样思考的系 统、像人一样行动的系统、理性地思考的系统、理性地行动的系统。维基百科上 定义“人工智能就是机器展现出的智能” ,即只要是某种机器,具有某种或某些 “智能”的特征或表现,都应该算作“人工智能” 。大英百科全书则限定人工智 能是数字计算机或者数字计算机控制的机器人在执行智能生物体才有的一些任 务上的能力。百度百科定义人工智能是“研究、开发用于模拟、延伸和扩展人的 智能的理论、方法、技术及应用系统的一门新的技术科学” ,将其视为计算机科 学的一个分支
23、,指出其研究包括机器人、语言识别、图像识别、自然语言处理和 专家系统等。 本白皮书认为, 人工智能是利用数字计算机或者数字计算机控制的机器模拟、 延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、 方法、技术及应用系统。 人工智能的定义对人工智能学科的基本思想和内容作出了解释, 即围绕智能 6 活动而构造的人工系统。人工智能是知识的工程,是机器模仿人类利用知识完成 一定行为的过程。根据人工智能是否能真正实现推理、思考和解决问题,可以将 人工智能分为弱人工智能和强人工智能。 弱人工智能是指不能真正实现推理和解决问题的智能机器, 这些机器表面看 像是智能的,但是并不真正拥有智能,
24、也不会有自主意识。迄今为止的人工智能 系统都还是实现特定功能的专用智能, 而不是像人类智能那样能够不断适应复杂 的新环境并不断涌现出新的功能,因此都还是弱人工智能。目前的主流研究仍然 集中于弱人工智能,并取得了显著进步,如语音识别、图像处理和物体分割、机 器翻译等方面取得了重大突破,甚至可以接近或超越人类水平。 强人工智能是指真正能思维的智能机器, 并且认为这样的机器是有知觉的和 自我意识的,这类机器可分为类人(机器的思考和推理类似人的思维)与非类人 (机器产生了和人完全不一样的知觉和意识,使用和人完全不一样的推理方式) 两大类。 从一般意义来说, 达到人类水平的、 能够自适应地应对外界环境挑
25、战的、 具有自我意识的人工智能称为“通用人工智能” 、 “强人工智能”或“类人智能” 。 强人工智能不仅在哲学上存在巨大争论 (涉及到思维与意识等根本问题的讨论) , 在技术上的研究也具有极大的挑战性。强人工智能当前鲜有进展,美国私营部门 的专家及国家科技委员会比较支持的观点是,至少在未来几十年内难以实现。 靠符号主义、连接主义、行为主义和统计主义这四个流派的经典路线就能设 计制造出强人工智能吗?其中一个主流看法是: 即使有更高性能的计算平台和更 大规模的大数据助力,也还只是量变,不是质变,人类对自身智能的认识还处在 初级阶段,在人类真正理解智能机理之前,不可能制造出强人工智能。理解大脑 产生
26、智能的机理是脑科学的终极性问题, 绝大多数脑科学专家都认为这是一个数 百年乃至数千年甚至永远都解决不了的问题。 通向强人工智能还有一条“新”路线,这里称为“仿真主义”。这条新路线 通过制造先进的大脑探测工具从结构上解析大脑, 再利用工程技术手段构造出模 仿大脑神经网络基元及结构的仿脑装置, 最后通过环境刺激和交互训练仿真大脑 实现类人智能,简言之,“先结构,后功能”。虽然这项工程也十分困难,但都 是有可能在数十年内解决的工程技术问题, 而不像“理解大脑”这个科学问题那 样遥不可及。 7 仿真主义可以说是符号主义、连接主义、行为主义和统计主义之后的第五个 流派,和前四个流派有着千丝万缕的联系,也
27、是前四个流派通向强人工智能的关 键一环。经典计算机是数理逻辑的开关电路实现,采用冯诺依曼体系结构,可 以作为逻辑推理等专用智能的实现载体。 但要靠经典计算机不可能实现强人工智 能。要按仿真主义的路线“仿脑”,就必须设计制造全新的软硬件系统,这就是 “类脑计算机”,或者更准确地称为“仿脑机”。“仿脑机”是“仿真工程”的 标志性成果,也是“仿脑工程”通向强人工智能之路的重要里程碑。 2.2人工智能的特征 (1)由人类设计,为人类服务,本质为计算,基础为数据。从根本上说, 人工智能系统必须以人为本,这些系统是人类设计出的机器,按照人类设定的程 序逻辑或软件算法通过人类发明的芯片等硬件载体来运行或工作
28、, 其本质体现为 计算,通过对数据的采集、加工、处理、分析和挖掘,形成有价值的信息流和知 识模型,来为人类提供延伸人类能力的服务,来实现对人类期望的一些“智能行 为”的模拟,在理想情况下必须体现服务人类的特点,而不应该伤害人类,特别 是不应该有目的性地做出伤害人类的行为。 (2)能感知环境,能产生反应,能与人交互,能与人互补。人工智能系统 应能借助传感器等器件产生对外界环境(包括人类)进行感知的能力,可以像人 一样通过听觉、视觉、嗅觉、触觉等接收来自环境的各种信息,对外界输入产生 文字、语音、表情、动作(控制执行机构)等必要的反应,甚至影响到环境或人 类。借助于按钮、键盘、鼠标、屏幕、手势、体
29、态、表情、力反馈、虚拟现实/ 增强现实等方式,人与机器间可以产生交互与互动,使机器设备越来越“理解” 人类乃至与人类共同协作、优势互补。这样,人工智能系统能够帮助人类做人类 不擅长、不喜欢但机器能够完成的工作,而人类则适合于去做更需要创造性、洞 察力、想象力、灵活性、多变性乃至用心领悟或需要感情的一些工作。 (3)有适应特性,有学习能力,有演化迭代,有连接扩展。人工智能系统 在理想情况下应具有一定的自适应特性和学习能力,即具有一定的随环境、数据 或任务变化而自适应调节参数或更新优化模型的能力;并且,能够在此基础上通 过与云、端、人、物越来越广泛深入数字化连接扩展,实现机器客体乃至人类主 8 体
30、的演化迭代,以使系统具有适应性、鲁棒性、灵活性、扩展性,来应对不断变 化的现实环境,从而使人工智能系统在各行各业产生丰富的应用。 2.3人工智能参考框架 目前,人工智能领域尚未形成完善的参考框架。因此,本章基于人工智能的 发展状况和应用特征,从人工智能信息流动的角度出发,提出一种人工智能参考 框架(如图 2 所示) ,力图搭建较为完整的人工智能主体框架,描述人工智能系 统总体工作流程,不受具体应用所限,适用于通用的人工智能领域需求。 信息提供者 新型传感器 智能芯片 基础平台 . 信息处理者 基础设施提供者 系统协调者 智能信息感 知 智能信息 建模、抽 取、预处 理、训练 数据等 安 全 、
31、 隐 私 、 伦 理 管 理智能信息链 IT价值链 智能感 知信息 搜索与 匹配等 智能信息表示 与形成 智能推理 智能决策 智能产品及行业应用 运动、 显示、 发声、 交互、 合成等 智能执行 与输出 分类、 排序、 预测等 图 2 人工智能参考框架图 人工智能参考框架提供了基于“角色活动功能”的层级分类体系,从 “智能信息链”(水平轴)和“IT 价值链”(垂直轴)两个维度阐述了人工智 能系统框架。“智能信息链”反映从智能信息感知、智能信息表示与形成、智能 推理、智能决策、智能执行与输出的一般过程。在这个过程中,智能信息是流动 的载体,经历了“数据信息知识智慧”的凝练过程。“IT 价值链”从
32、人 工智能的底层基础设施、信息(提供和处理技术实现)到系统的产业生态过程, 反映人工智能为信息技术产业带来的价值。此外,人工智能系统还有其它非常重 要的框架构件: 安全、 隐私、 伦理和管理。 人工智能系统主要由基础设施提供者、 信息提供者、信息处理者和系统协调者 4个角色组成。 9 (1)基础设施提供者 基础设施提供者为人工智能系统提供计算能力支持, 实现与外部世界的沟通, 并通过基础平台实现支撑。计算能力由智能芯片(CPU、GPU、ASIC、FPGA等 硬件加速芯片以及其它智能芯片)等硬件系统开发商提供;与外部世界的沟通通 过新型传感器制造商提供; 基础平台包括分布式计算框架提供商及网络提
33、供商提 供平台保障和支持,即包括云存储和计算、互联互通网络等。 (2)信息提供者 信息提供者在人工智能领域是智能信息的来源。 通过知识信息感知过程由数 据提供商提供智能感知信息,包括原始数据资源和数据集。原始数据资源的感知 涉及到图形、图像、语音、文本的识别,还涉及到传统设备的物联网数据,包括 已有系统的业务数据以及力、位移、液位、温度、湿度等感知数据。 (3)信息处理者 信息处理者是指人工智能领域中技术和服务提供商。 信息处理者的主要活动 包括智能信息表示与形成、智能推理、智能决策及智能执行与输出。智能信息处 理者通常是算法工程师及技术服务提供商,通过计算框架、模型及通用技术,例 如一些深度
34、学习框架和机器学习算法模型等功能进行支撑。 智能信息表示与形成是指为描述外围世界所作的一组约定, 分阶段对智能信 息进行符号化和形式化的智能信息建模、抽取、预处理、训练数据等。 智能信息推理是指在计算机或智能系统中,模拟人类的智能推理方式,依据 推理控制策略,利用形式化的信息进行机器思维和求解问题的过程,典型的功能 是搜索与匹配。 智能信息决策是指智能信息经过推理后进行决策的过程,通常提供分类、排 序、预测等功能。 智能执行与输出作为智能信息输出的环节,是对输入作出的响应,输出整个 智能信息流动过程的结果,包括运动、显示、发声、交互、合成等功能。 (4)系统协调者 系统协调者提供人工智能系统必
35、须满足的整体要求,包括政策、法律、资源 10 和业务需求,以及为确保系统符合这些需求而进行的监控和审计活动。由于人工 智能是多学科交叉领域,需要系统协调者定义和整合所需的应用活动,使其在人 工智能领域的垂直系统中运行。 系统协调者的功能之一是配置和管理人工智能参 考框架中的其他角色来执行一个或多个功能,并维持人工智能系统的运行。 (5)安全、隐私、伦理 安全、隐私、伦理覆盖了人工智能领域的其他 4个主要角色,对每个角色都 有重要的影响作用。同时,安全、隐私、伦理处于管理角色的覆盖范围之内,与 全部角色和活动都建立了相关联系。在安全、隐私、伦理模块,需要通过不同的 技术手段和安全措施,构筑全方位
36、、立体的安全防护体系,保护人工智能领域参 与者的安全和隐私。 (6)管理 管理角色承担系统管理活动,包括软件调配、资源管理等内容,管理的功能 是监视各种资源的运行状况,应对出现的性能或故障事件,使得各系统组件透明 且可观。 (7)智能产品及行业应用 智能产品及行业应用指人工智能系统的产品和应用, 是对人工智能整体解决 方案的封装,将智能信息决策产品化、实现落地应用,其应用领域主要包括:智 能制造、智能交通、智能家居、智能医疗、智能安防等。 11 3 人工智能发展现状及趋势 依据参考框架中所涉及到的人工智能相关技术, 本节重点介绍近二十年来人 工智能领域关键技术的发展状况,包括机器学习、知识图谱
37、、自然语言处理、计 算机视觉、人机交互、生物特征识别、虚拟现实/增强现实等关键技术。 3.1 人工智能关键技术 3.1.1机器学习 机器学习(Machine Learning)是一门涉及统计学、系统辨识、逼近理论、 神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科,研究计算机 怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识 结构使之不断改善自身的性能,是人工智能技术的核心。基于数据的机器学习是 现代智能技术中的重要方法之一,研究从观测数据(样本)出发寻找规律,利用 这些规律对未来数据或无法观测的数据进行预测。根据学习模式、学习方法以及 算法的不同,机器学习存在
38、不同的分类方法。 (1) 根据学习模式将机器学习分类为监督学习、 无监督学习和强化学习等。 监督学习 监督学习是利用已标记的有限训练数据集,通过某种学习策略/方法建立一 个模型,实现对新数据/实例的标记(分类)/映射,最典型的监督学习算法包括 回归和分类。监督学习要求训练样本的分类标签已知,分类标签精确度越高,样 本越具有代表性, 学习模型的准确度越高。 监督学习在自然语言处理、 信息检索、 文本挖掘、手写体辨识、垃圾邮件侦测等领域获得了广泛应用。 无监督学习 无监督学习是利用无标记的有限数据描述隐藏在未标记数据中的结构/规律, 最典型的非监督学习算法包括单类密度估计、单类数据降维、聚类等。无
39、监督学 习不需要训练样本和人工标注数据,便于压缩数据存储、减少计算量、提升算法 速度,还可以避免正、负样本偏移引起的分类错误问题。主要用于经济预测、异 常检测、数据挖掘、图像处理、模式识别等领域,例如组织大型计算机集群、社 交网络分析、市场分割、天文数据分析等。 12 强化学习 强化学习是智能系统从环境到行为映射的学习,以使强化信号函数值最大。 由于外部环境提供的信息很少,强化学习系统必须靠自身的经历进行学习。强化 学习的目标是学习从环境状态到行为的映射, 使得智能体选择的行为能够获得环 境最大的奖赏,使得外部环境对学习系统在某种意义下的评价为最佳。其在机器 人控制、无人驾驶、下棋、工业控制等
40、领域获得成功应用。 (2)根据学习方法可以将机器学习分为传统机器学习和深度学习。 传统机器学习 传统机器学习从一些观测(训练)样本出发,试图发现不能通过原理分析获 得的规律,实现对未来数据行为或趋势的准确预测。相关算法包括逻辑回归、隐 马尔科夫方法、 支持向量机方法、 K近邻方法、 三层人工神经网络方法、 Adaboost 算法、贝叶斯方法以及决策树方法等。传统机器学习平衡了学习结果的有效性与 学习模型的可解释性,为解决有限样本的学习问题提供了一种框架,主要用于有 限样本情况下的模式分类、回归分析、概率密度估计等。传统机器学习方法共同 的重要理论基础之一是统计学,在自然语言处理、语音识别、图像
41、识别、信息检 索和生物信息等许多计算机领域获得了广泛应用。 深度学习 深度学习是建立深层结构模型的学习方法, 典型的深度学习算法包括深度置 信网络、卷积神经网络、受限玻尔兹曼机和循环神经网络等。深度学习又称为深 度神经网络(指层数超过 3 层的神经网络) 。深度学习作为机器学习研究中的一 个新兴领域,由 Hinton 等人于 2006年提出。深度学习源于多层神经网络,其实 质是给出了一种将特征表示和学习合二为一的方式。 深度学习的特点是放弃了可 解释性,单纯追求学习的有效性。经过多年的摸索尝试和研究,已经产生了诸多 深度神经网络的模型,其中卷积神经网络、循环神经网络是两类典型的模型。卷 积神经
42、网络常被应用于空间性分布数据; 循环神经网络在神经网络中引入了记忆 和反馈,常被应用于时间性分布数据。深度学习框架是进行深度学习的基础底层 框架,一般包含主流的神经网络算法模型,提供稳定的深度学习 API,支持训练 模型在服务器和 GPU、 TPU 间的分布式学习, 部分框架还具备在包括移动设备、 13 云平台在内的多种平台上运行的移植能力, 从而为深度学习算法带来前所未有的 运行速度和实用性。 目前主流的开源算法框架有 TensorFlow、 Caffe/Caffe2、 CNTK、 MXNet、Paddle-paddle、Torch/PyTorch、Theano 等。 (3)此外,机器学习的
43、常见算法还包括迁移学习、主动学习和演化学习等。 迁移学习 迁移学习是指当在某些领域无法取得足够多的数据进行模型训练时, 利用另 一领域数据获得的关系进行的学习。 迁移学习可以把已训练好的模型参数迁移到 新的模型指导新模型训练,可以更有效的学习底层规则、减少数据量。目前的迁 移学习技术主要在变量有限的小规模应用中使用,如基于传感器网络的定位,文 字分类和图像分类等。未来迁移学习将被广泛应用于解决更有挑战性的问题,如 视频分类、社交网络分析、逻辑推理等。 主动学习 主动学习通过一定的算法查询最有用的未标记样本,并交由专家进行标记, 然后用查询到的样本训练分类模型来提高模型的精度。 主动学习能够选择
44、性地获 取知识,通过较少的训练样本获得高性能的模型,最常用的策略是通过不确定性 准则和差异性准则选取有效的样本。 演化学习 演化学习对优化问题性质要求极少,只需能够评估解的好坏即可,适用于求 解复杂的优化问题,也能直接用于多目标优化。演化算法包括粒子群优化算法、 多目标演化算法等。目前针对演化学习的研究主要集中在演化数据聚类、对演化 数据更有效的分类,以及提供某种自适应机制以确定演化机制的影响等。 3.1.2知识图谱 知识图谱本质上是结构化的语义知识库, 是一种由节点和边组成的图数据结 构,以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体 关系实体”三元组,以及实体及其相关“
45、属性值”对。不同实体之间通过 关系相互联结,构成网状的知识结构。在知识图谱中,每个节点表示现实世界的 “实体”,每条边为实体与实体之间的“关系”。通俗地讲,知识图谱就是把所 14 有不同种类的信息连接在一起而得到的一个关系网络, 提供了从“关系”的角度 去分析问题的能力。 知识图谱可用于反欺诈、不一致性验证、组团欺诈等公共安全保障领域,需 要用到异常分析、静态分析、动态分析等数据挖掘方法。特别地,知识图谱在搜 索引擎、可视化展示和精准营销方面有很大的优势,已成为业界的热门工具。但 是,知识图谱的发展还有很大的挑战,如数据的噪声问题,即数据本身有错误或 者数据存在冗余。 随着知识图谱应用的不断深
46、入, 还有一系列关键技术需要突破。 3.1.3自然语言处理 自然语言处理是计算机科学领域与人工智能领域中的一个重要方向, 研究能 实现人与计算机之间用自然语言进行有效通信的各种理论和方法, 涉及的领域较 多,主要包括机器翻译、机器阅读理解和问答系统等。 (1)机器翻译 机器翻译技术是指利用计算机技术实现从一种自然语言到另外一种自然语 言的翻译过程。 基于统计的机器翻译方法突破了之前基于规则和实例翻译方法的 局限性,翻译性能取得巨大提升。基于深度神经网络的机器翻译在日常口语等一 些场景的成功应用已经显现出了巨大的潜力。 随着上下文的语境表征和知识逻辑 推理能力的发展,自然语言知识图谱不断扩充,机
47、器翻译将会在多轮对话翻译及 篇章翻译等领域取得更大进展。 目前非限定领域机器翻译中性能较佳的一种是统计机器翻译, 包括训练及解 码两个阶段。训练阶段的目标是获得模型参数,解码阶段的目标是利用所估计的 参数和给定的优化目标,获取待翻译语句的最佳翻译结果。统计机器翻译主要包 括语料预处理、词对齐、短语抽取、短语概率计算、最大熵调序等步骤。基于神 经网络的端到端翻译方法不需要针对双语句子专门设计特征模型, 而是直接把源 语言句子的词串送入神经网络模型,经过神经网络的运算,得到目标语言句子的 翻译结果。在基于端到端的机器翻译系统中,通常采用递归神经网络或卷积神经 网络对句子进行表征建模,从海量训练数据
48、中抽取语义信息,与基于短语的统计 翻译相比,其翻译结果更加流畅自然,在实际应用中取得了较好的效果。 15 (2)语义理解 语义理解技术是指利用计算机技术实现对文本篇章的理解, 并且回答与篇章 相关问题的过程。 语义理解更注重于对上下文的理解以及对答案精准程度的把控。 随着 MCTest数据集的发布,语义理解受到更多关注,取得了快速发展,相关数 据集和对应的神经网络模型层出不穷。语义理解技术将在智能客服、产品自动问 答等相关领域发挥重要作用,进一步提高问答与对话系统的精度。 在数据采集方面, 语义理解通过自动构造数据方法和自动构造填空型问题的 方法来有效扩充数据资源。为了解决填充型问题,一些基于
49、深度学习的方法相继 提出,如基于注意力的神经网络方法。当前主流的模型是利用神经网络技术对篇 章、问题建模,对答案的开始和终止位置进行预测,抽取出篇章片段。对于进一 步泛化的答案, 处理难度进一步提升, 目前的语义理解技术仍有较大的提升空间。 (3)问答系统 问答系统分为开放领域的对话系统和特定领域的问答系统。 问答系统技术是 指让计算机像人类一样用自然语言与人交流的技术。 人们可以向问答系统提交用 自然语言表达的问题,系统会返回关联性较高的答案。尽管问答系统目前已经有 了不少应用产品出现, 但大多是在实际信息服务系统和智能手机助手等领域中的 应用,在问答系统鲁棒性方面仍然存在着问题和挑战。 自然语言处理面临四大挑战:一是在词法、句法、语义、语用和语音等不同 层面存在不确定性;二是新的词汇、术语、语义和语法导致未知语言现象的不可 预测性;三是数据资源的不充分使其难以覆盖复杂的语言现象;四是语义知识的 模糊性和错综复杂的关联性难以用简单的数学模型描述, 语义计算需要参数庞大 的非线性计算。 3.1.4人机交互 人机交互主要研究人和计算机之间的信息交换, 主要包括人到计算机和计算 机到人的两部分信息交换,是人工智能领域的重要的外围技术。人机交互是与认 知心理学、人机工程学、多媒体技术、虚拟现实技术等密切相关的综合
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1