语音识别是什么技术技术是人道计算机和计算机道人的两部分信息交换是人工智能领域重要的


下载后只包含 1 个 PPTX 格式的文档里媔的视频和音频不保证可以播放,
您的浏览器不支持进度条

下载文档到电脑查找使用更方便

还剩?页未读,继续阅读

第一节敲开人工智能の门.pptx

芦台一中刘春芳人工智能的应用敲开人工智能之门人机交互技术01人机交互技术人机交互技术主要是研究人与计算机之间的信息交换,包括人到计算机和计算机到人的信息交换两部分。人机交互技术除了传统的基本交互(鼠标、键盘)等和图形交互外,还包括语音交互,情感交互,體感交互及脑机交互等技术语音交互是一种高效的交互方式,是人以自然语言或机器合成语音同计算机进行交互的综合性技术。活动一随“机”应变——与“小爱”聊天语音交互的过程:语音采集—语音识别是什么技术—语义理解—语音合成思考:转载请标明出处.

人工智能标准化白皮书(2018)》给絀了***

机器学习(Machine Learning)是一门涉及统计学、系统辨识、逼近理论、 神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科研究计算机 怎样模拟或实现人类的学习行为,以获取新的知识或技能重新组织已有的知识 结构使之不断改善自身的性能,是人工智能技术嘚核心基于数据的机器学习是 现代智能技术中的重要方法之一,研究从观测数据(样本)出发寻找规律利用 这些规律对未来数据或无法观测的数据进行预测。根据学习模式、学习方法以及 算法的不同机器学习存在不同的分类方法。

(1)根据学习模式将机器学习分类为監督学习、无监督学习和强化学习等

监督学习是利用已标记的有限训练数据集,通过某种学习策略/方法建立一 个模型实现对新数据/实唎的标记(分类)/映射,最典型的监督学习算法包括 回归和分类监督学习要求训练样本的分类标签已知,分类标签精确度越高样 本越具有代表性,学习模型的准确度越高监督学习在自然语言处理、信息检索、 文本挖掘、手写体辨识、垃圾邮件侦测等领域获得了广泛应鼡。

无监督学习是利用无标记的有限数据描述隐藏在未标记数据中的结构/规律 最典型的非监督学习算法包括单类密度估计、单类数据降維、聚类等。无监督学 习不需要训练样本和人工标注数据便于压缩数据存储、减少计算量、提升算法 速度,还可以避免正、负样本偏移引起的分类错误问题主要用于经济预测、异 常检测、数据挖掘、图像处理、模式识别等领域,例如组织大型计算机集群、社 交网络分析、市场分割、天文数据分析等

强化学习是智能系统从环境到行为映射的学习,以使强化信号函数值最大 由于外部环境提供的信息很少,强化学习系统必须靠自身的经历进行学习强化 学习的目标是学习从环境状态到行为的映射,使得智能体选择的行为能够获得环 境最大嘚奖赏使得外部环境对学习系统在某种意义下的评价为最佳。其在机器 人控制、无人驾驶、下棋、工业控制等领域获得成功应用

(2)根据学习方法可以将机器学习分为传统机器学习和深度学习。

传统机器学习从一些观测(训练)样本出发试图发现不能通过原理分析获 嘚的规律,实现对未来数据行为或趋势的准确预测相关算法包括逻辑回归、隐 马尔科夫方法、支持向量机方法、K 近邻方法、三层人工神經网络方法、Adaboost 算法、贝叶斯方法以及决策树方法等。传统机器学习平衡了学习结果的有效性与 学习模型的可解释性为解决有限样本的学***问题提供了一种框架,主要用于有 限样本情况下的模式分类、回归分析、概率密度估计等传统机器学习方法共同 的重要理论基础之一昰统计学,在自然语言处理、语音识别是什么技术、图像识别、信息检 索和生物信息等许多计算机领域获得了广泛应用

深度学习是建立罙层结构模型的学习方法,典型的深度学习算法包括深度置 信网络、卷积神经网络、受限玻尔兹曼机和循环神经网络等深度学习又称为罙 度神经网络(指层数超过 3 层的神经网络)。深度学习作为机器学习研究中的一 个新兴领域由 Hinton 等人于 2006 年提出。深度学习源于多层神经网絡其实 质是给出了一种将特征表示和学习合二为一的方式。深度学习的特点是放弃了可 解释性单纯追求学习的有效性。经过多年的摸索尝试和研究已经产生了诸多 深度神经网络的模型,其中卷积神经网络、循环神经网络是两类典型的模型卷 积神经网络常被应用于空間性分布数据;循环神经网络在神经网络中引入了记忆 和反馈,常被应用于时间性分布数据深度学习框架是进行深度学习的基础底层 框架,一般包含主流的神经网络算法模型提供稳定的深度学习 API,支持训练 模型在服务器和 GPU、TPU 间的分布式学习部分框架还具备在包括移动設备、云平台在内的多种平台上运行的移植能力,从而为深度学习算法带来前所未有的 运行速度和实用性目前主流的开源算法框架有 TensorFlow、Caffe/Caffe2、CNTK、

(3)此外,机器学习的常见算法还包括迁移学习、主动学习和演化学习等

迁移学习是指当在某些领域无法取得足够多的数据进行模型训练时,利用另 一领域数据获得的关系进行的学习迁移学习可以把已训练好的模型参数迁移到 新的模型指导新模型训练,可以更有效嘚学习底层规则、减少数据量目前的迁 移学习技术主要在变量有限的小规模应用中使用,如基于传感器网络的定位文 字分类和图像分類等。未来迁移学习将被广泛应用于解决更有挑战性的问题如 视频分类、社交网络分析、逻辑推理等。

主动学习通过一定的算法查询最囿用的未标记样本并交由专家进行标记, 然后用查询到的样本训练分类模型来提高模型的精度主动学习能够选择性地获 取知识,通过較少的训练样本获得高性能的模型最常用的策略是通过不确定性 准则和差异性准则选取有效的样本。

演化学习对优化问题性质要求极少只需能够评估解的好坏即可,适用于求 解复杂的优化问题也能直接用于多目标优化。演化算法包括粒子群优化算法、 多目标演化算法等目前针对演化学习的研究主要集中在演化数据聚类、对演化 数据更有效的分类,以及提供某种自适应机制以确定演化机制的影响等

知识图谱本质上是结构化的语义知识库,是一种由节点和边组成的图数据结 构以符号形式描述物理世界中的概念及其相互关系,其基本組成单位是“实体 —关系—实体”三元组以及实体及其相关“属性—值”对。不同实体之间通过 关系相互联结构成网状的知识结构。茬知识图谱中每个节点表示现实世界的 “实体”,每条边为实体与实体之间的“关系”通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络提供了从“关系”的角度 去分析问题的能力。

知识图谱可用于反欺诈、不一致性验证、组团欺诈等公共安全保障领域需 要用到异常分析、静态分析、动态分析等数据挖掘方法。特别地知识图谱在搜 索引擎、可视化展示和精准营销方媔有很大的优势,已成为业界的热门工具但 是,知识图谱的发展还有很大的挑战如数据的噪声问题,即数据本身有错误或 者数据存在冗余随着知识图谱应用的不断深入,还有一系列关键技术需要突破

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,研究能 实现人与计算机之间用自然语言进行有效通信的各种理论和方法涉及的领域较 多,主要包括机器翻译、机器阅读理解和问答系統等

机器翻译技术是指利用计算机技术实现从一种自然语言到另外一种自然语 言的翻译过程。基于统计的机器翻译方法突破了之前基于規则和实例翻译方法的 局限性翻译性能取得巨大提升。基于深度神经网络的机器翻译在日常口语等一 些场景的成功应用已经显现出了巨夶的潜力随着上下文的语境表征和知识逻辑 推理能力的发展,自然语言知识图谱不断扩充机器翻译将会在多轮对话翻译及 篇章翻译等領域取得更大进展。

目前非限定领域机器翻译中性能较佳的一种是统计机器翻译包括训练及解 码两个阶段。训练阶段的目标是获得模型參数解码阶段的目标是利用所估计的 参数和给定的优化目标,获取待翻译语句的最佳翻译结果统计机器翻译主要包 括语料预处理、词對齐、短语抽取、短语概率计算、最大熵调序等步骤。基于神 经网络的端到端翻译方法不需要针对双语句子专门设计特征模型而是直接紦源 语言句子的词串送入神经网络模型,经过神经网络的运算得到目标语言句子的 翻译结果。在基于端到端的机器翻译系统中通常采鼡递归神经网络或卷积神经 网络对句子进行表征建模,从海量训练数据中抽取语义信息与基于短语的统计 翻译相比,其翻译结果更加流暢自然在实际应用中取得了较好的效果。

语义理解技术是指利用计算机技术实现对文本篇章的理解并且回答与篇章 相关问题的过程。語义理解更注重于对上下文的理解以及对***精准程度的把控 随着 MCTest 数据集的发布,语义理解受到更多关注取得了快速发展,相关数 据集和对应的神经网络模型层出不穷语义理解技术将在智能***、产品自动问 答等相关领域发挥重要作用,进一步提高问答与对话系统的精度

在数据采集方面,语义理解通过自动构造数据方法和自动构造填空型问题的 方法来有效扩充数据资源为了解决填充型问题,一些基于深度学习的方法相继 提出如基于注意力的神经网络方法。当前主流的模型是利用神经网络技术对篇 章、问题建模对***的开始和終止位置进行预测,抽取出篇章片段对于进一 步泛化的***,处理难度进一步提升目前的语义理解技术仍有较大的提升空间。

问答系統分为开放领域的对话系统和特定领域的问答系统问答系统技术是 指让计算机像人类一样用自然语言与人交流的技术。人们可以向问答系统提交用 自然语言表达的问题系统会返回关联性较高的***。尽管问答系统目前已经有 了不少应用产品出现但大多是在实际信息服務系统和智能手机助手等领域中的 应用,在问答系统鲁棒性方面仍然存在着问题和挑战

自然语言处理面临四大挑战:一是在词法、句法、语义、语用和语音等不同 层面存在不确定性;二是新的词汇、术语、语义和语法导致未知语言现象的不可 预测性;三是数据资源的不充汾使其难以覆盖复杂的语言现象;四是语义知识的 模糊性和错综复杂的关联性难以用简单的数学模型描述,语义计算需要参数庞大 的非线性计算

人机交互主要研究人和计算机之间的信息交换,主要包括人到计算机和计算 机到人的两部分信息交换是人工智能领域的重要的外围技术。人机交互是与认知心理学、人机工程学、多媒体技术、虚拟现实技术等密切相关的综合学科传统的人与计算机之间的信息交換主要依靠交互设备进行,主要包括键盘、鼠标、 操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等输入设备以及打茚机、绘图仪、显示器、头盔式显示器、音箱等输出设备。人机交互技术 除了传统的基本交互和图形交互外还包括语音交互、情感交互、体感交互及脑 机交互等技术,以下对后四种与人工智能关联密切的典型交互手段进行介绍

语音交互是一种高效的交互方式,是人以自嘫语音或机器合成语音同计算机 进行交互的综合性技术结合了语言学、心理学、工程和计算机技术等领域的知 识。语音交互不仅要对语喑识别是什么技术和语音合成进行研究还要对人在语音通道下的 交互机理、行为方式等进行研究。语音交互过程包括四部分:语音采集、语音识 别、语义理解和语音合成语音采集完成音频的录入、采样及编码;语音识别是什么技术完 成语音信息到机器可识别的文本信息嘚转化;语义理解根据语音识别是什么技术转换后的文 本字符或命令完成相应的操作;语音合成完成文本信息到声音信息的转换。作为 人類沟通和获取信息最自然便捷的手段语音交互比其他交互方式具备更多优势, 能为人机交互带来根本性变革是大数据和认知计算时代未来发展的制高点,具 有广阔的发展前景和应用前景

情感是一种高层次的信息传递,而情感交互是一种交互状态它在表达功能 和信息時传递情感,勾起人们的记忆或内心的情愫传统的人机交互无法理解和 适应人的情绪或心境,缺乏情感理解和表达能力计算机难以具囿类似人一样的 智能,也难以通过人机交互做到真正的和谐与自然情感交互就是要赋予计算机 类似于人一样的观察、理解和生成各种情感的能力,最终使计算机像人一样能进 行自然、亲切和生动的交互情感交互已经成为人工智能领域中的热点方向,旨 在让人机交互变得哽加自然目前,在情感交互信息的处理方式、情感描述方式、 情感数据获取和处理过程、情感表达方式等方面还有诸多技术挑战

体感茭互是个体不需要借助任何复杂的控制系统,以体感技术为基础直接 通过肢体动作与周边数字设备装置和环境进行自然的交互。依照体感方式与原理 的不同体感技术主要分为三类:惯性感测、光学感测以及光学联合感测。体感 交互通常由运动追踪、手势识别、运动捕捉、面部表情识别等一系列技术支撑与其他交互手段相比,体感交互技术无论是硬件还是软件方面都有了较大的提升 交互设备向小型化、便携化、使用方便化等方面发展,大大降低了对用户的约束 使得交互过程更加自然。目前体感交互在游戏娱乐、医疗辅助与康复、铨自动 三维建模、辅助购物、眼动仪等领域有了较为广泛的应用。

脑机交互又称为脑机接口指不依赖于外围神经和肌肉等神经通道,直接实 现大脑与外界信息传递的通路脑机接口系统检测中枢神经系统活动,并将其转 化为人工输出指令能够替代、修复、增强、补充或鍺改善中枢神经系统的正常 输出,从而改变中枢神经系统与内外环境之间的交互作用脑机交互通过对神经 信号解码,实现脑信号到机器指令的转化一般包括信号采集、特征提取和命令 输出三个模块。从脑电信号采集的角度一般将脑机接口分为侵入式和非侵入式 两大类。除此之外脑机接口还有其他常见的分类方式:按照信号传输方向可以 分为脑到机、机到脑和脑机双向接口;按照信号生成的类型,可汾为自发式脑机 接口和诱发式脑机接口;按照信号源的不同还可分为基于脑电的脑机接口、基于 功能性核磁共振的脑机接口以及基于近红外光谱分析的脑机接口

计算机视觉是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类 提取、处理、理解和分析图像以及图潒序列的能力自动驾驶、机器人、智能医 疗等领域均需要通过计算机视觉技术从视觉信号中提取并处理信息。近来随着深 度学习的发展预处理、特征提取与算法处理渐渐融合,形成端到端的人工智能 算法技术根据解决的问题,计算机视觉可分为计算成像学、图像理解、三维视 觉、动态视觉和视频编解码五大类

计算成像学是探索人眼结构、相机成像原理以及其延伸应用的科学。在相机 成像原理方面計算成像学不断促进现有可见光相机的完善,使得现代相机更加 轻便可以适用于不同场景。同时计算成像学也推动着新型相机的产生使相机 超出可见光的限制。在相机应用科学方面计算成像学可以提升相机的能力,从 而通过后续的算法处理使得在受限条件下拍摄的图潒更加完善例如图像去噪、去模糊、暗光增强、去雾霾等,以及实现新的功能例如全景图、软件虚化、超 分辨率等。

图像理解是通过鼡计算机系统解释图像实现类似人类视觉系统理解外部世 界的一门科学。通常根据理解信息的抽象程度可分为三个层次:浅层理解包括 图像边缘、图像特征点、纹理元素等;中层理解,包括物体边界、区域与平面等; 高层理解根据需要抽取的高层语义信息,可大致分為识别、检测、分割、姿态 估计、图像文字说明等目前高层图像理解算法已逐渐广泛应用于人工智能系统, 如刷脸支付、智慧安防、图潒搜索等

三维视觉即研究如何通过视觉获取三维信息(三维重建)以及如何理解所获 取的三维信息的科学。三维重建可以根据重建的信息来源分为单目图像重建、 多目图像重建和深度图像重建等。三维信息理解即使用三维信息辅助图像理解 或者直接理解三维信息。三維信息理解可分为浅层:角点、边缘、法向量等; 中层:平面、立方体等;高层:物体检测、识别、分割等。三维视觉技术可以广 泛应鼡于机器人、无人驾驶、智慧工厂、虚拟/增强现实等方向

动态视觉即分析视频或图像序列,模拟人处理时序图像的科学通常动态视 觉問题可以定义为寻找图像元素,如像素、区域、物体在时序上的对应以及提 取其语义信息的问题。动态视觉研究被广泛应用在视频分析鉯及人机交互等方面

视频编解码是指通过特定的压缩技术,将视频流进行压缩视频流传输中最 为重要的编解码标准有国际电联的 H.261、H.263、H.264、H.265、M-JPEG 和 MPEG 系列标准。视频压缩编码主要分为两大类:无损压缩和有损压缩无损压 缩指使用压缩后的数据进行重构时,重构后的数据与原来嘚数据完全相同例如 磁盘文件的压缩。有损压缩也称为不可逆编码指使用压缩后的数据进行重构时, 重构后的数据与原来的数据有差異但不会影响人们对原始资料所表达的信息产 生误解。有损压缩的应用范围广泛例如视频会议、可视***、视频广播、视频监控等。

目前计算机视觉技术发展迅速,已具备初步的产业规模未来计算机视觉 技术的发展主要面临以下挑战:一是如何在不同的应用领域和其他技术更好的结 合,计算机视觉在解决某些问题时可以广泛利用大数据已经逐渐成熟并且可以 超过人类,而在某些问题上却无法达到佷高的精度;二是如何降低计算机视觉算 法的开发时间和人力成本目前计算机视觉算法需要大量的数据与人工标注,需 要较长的研发周期以达到应用领域所要求的精度与耗时;三是如何加快新型算法 的设计开发随着新的成像硬件与人工智能芯片的出现,针对不同芯片与數据采 集设备的计算机视觉算法的设计与开发也是挑战之一

生物特征识别技术是指通过个体生理特征或行为特征对个体身份进行识别 认證的技术。从应用流程看生物特征识别通常分为注册和识别两个阶段。注册 阶段通过传感器对人体的生物表征信息进行采集如利用图潒传感器对指纹和人 脸等光学信息、麦克风对说话声等声学信息进行采集,利用数据预处理以及特征 提取技术对采集的数据进行处理得箌相应的特征进行存储。识别过程采用与注 册过程一致的信息采集方式对待识别人进行信息采集、数据预处理和特征提取 然后将提取的特征与存储的特征进行比对分析,完成识别从应用任务看,生物 特征识别一般分为辨认与确认两种任务辨认是指从存储库中确定待识別人身份 的过程,是一对多的问题;确认是指将待识别人信息与存储库中特定单人信息进 行比对确定身份的过程,是一对一的问题

生粅特征识别技术涉及的内容十分广泛,包括指纹、掌纹、人脸、虹膜、指 静脉、声纹、步态等多种生物特征其识别过程涉及到图像处理、计算机视觉、 语音识别是什么技术、机器学习等多项技术。目前生物特征识别作为重要的智能化身份认证 技术在金融、公共安全、教育、交通等领域得到广泛的应用。下面将对指纹识 别、人脸识别、虹膜识别、指静脉识别、声纹识别以及步态识别等技术进行介绍

(1)指纹识别 指纹识别过程通常包括数据采集、数据处理、分析判别三个过程。数据采集 通过光、电、力、热等物理传感器获取指纹图像;数據处理包括预处理、畸变校正、特征提取三个过程;分析判别是对提取的特征进行分析判别的过程

(2)人脸识别 人脸识别是典型的计算機视觉应用,从应用过程来看可将人脸识别技术划 分为检测定位、面部特征提取以及人脸确认三个过程。人脸识别技术的应用主要 受到咣照、拍摄角度、图像遮挡、年龄等多个因素的影响在约束条件下人脸识 别技术相对成熟,在自由条件下人脸识别技术还在不断改进

(3)虹膜识别 虹膜识别的理论框架主要包括虹膜图像分割、虹膜区域归一化、特征提取和 识别四个部分,研究工作大多是基于此理论框架發展而来虹膜识别技术应用的 主要难题包含传感器和光照影响两个方面:一方面,由于虹膜尺寸小且受黑色素 遮挡需在近红外光源下采用高分辨图像传感器才可清晰成像,对传感器质量和 稳定性要求比较高;另一方面光照的强弱变化会引起瞳孔缩放,导致虹膜纹理 产苼复杂形变增加了匹配的难度。

(4)指静脉识别 指静脉识别是利用了人体静脉血管中的脱氧血红蛋白对特定波长范围内的 近红外线有很恏的吸收作用这一特性采用近红外光对指静脉进行成像与识别的 技术。由于指静脉血管分布随机性很强其网络特征具有很好的唯一性,且属于 人体内部特征不受到外界影响,因此模态特性十分稳定指静脉识别技术应用 面临的主要难题来自于成像单元。

(5)声纹识别 聲纹识别是指根据待识别语音的声纹特征识别说话人的技术声纹识别技术 通常可以分为前端处理和建模分析两个阶段。声纹识别的过程昰将某段来自某个 人的语音经过特征提取后与多复合声纹模型库中的声纹模型进行匹配常用的识 别方法可以分为模板匹配法、概率模型法等。

(6)步态识别 步态是远距离复杂场景下唯一可清晰成像的生物特征步态识别是指通过身 体体型和行走姿态来识别人的身份。相比仩述几种生物特征识别步态识别的技术难度更大,体现在其需要从视频中提取运动特征以及需要更高要求的预处理 算法,但步态识别具有远距离、跨角度、光照不敏感等优势

7 虚拟现实/增强现实

虚拟现实(VR)/增强现实(AR)是以计算机为核心的新型视听技术。结合 相关科學技术在一定范围内生成与真实环境在视觉、听觉、触感等方面高度近 似的数字化环境。用户借助必要的装备与数字化环境中的对象进荇交互相互影 响,获得近似真实环境的感受和体验通过显示设备、跟踪定位设备、触力觉交 互设备、数据获取设备、专用芯片等实现。

虚拟现实/增强现实从技术特征角度按照不同处理阶段,可以分为获取与 建模技术、分析与利用技术、交换与分发技术、展示与交互技術以及技术标准与 评价体系五个方面获取与建模技术研究如何把物理世界或者人类的创意进行数 字化和模型化,难点是三维物理世界的數字化和模型化技术;分析与利用技术重 点研究对数字内容进行分析、理解、搜索和知识化方法其难点是在于内容的语 义表示和分析;茭换与分发技术主要强调各种网络环境下大规模的数字化内容流 通、转换、集成和面向不同终端用户的个性化服务等,其核心是开放的内嫆交换 和版权管理技术;展示与交换技术重点研究符合人类习惯数字内容的各种显示技 术及交互方法以期提高人对复杂信息的认知能力,其难点在于建立自然和谐的 人机交互环境;标准与评价体系重点研究虚拟现实/增强现实基础资源、内容编 目、信源编码等的规范标准以忣相应的评估技术

目前虚拟现实/增强现实面临的挑战主要体现在智能获取、普适设备、自由 交互和感知融合四个方面。在硬件平台与装置、核心芯片与器件、软件平台与工 具、相关标准与规范等方面存在一系列科学技术问题总体来说虚拟现实/增强 现实呈现虚拟现实系统智能化、虚实环境对象无缝融合、自然交互全方位与舒适 化的发展趋势。

  人工智能即AI是利用计算机模擬人类思维和实践行为的技术集合关于AI,国外存在两种定义,一种是狭义的:研究如何制造计算机,并为其编程,使之能做心灵所能做的那些事情;叧一种是广义的:把AI看做是一般性的智能科学,或更确切地说,看作是认知科学的智力内核[1]。人工智能的系统化发展与普及化应用必将深刻影响囚类生活方式

  一、人工智能对于人类生活方式的积极影响

  刘啸霆说:“科学和技术是改变人类生活的重要因素,它既改变了人类生活活动的形式,也改变了人类生活的行为特征。”、“生活方式是以人们生活活动的形式和行为特征表现出来的体系”生活方式是指“不哃的个人群体或全体社会成员在一定的社会条件和价值观念指导下所形成的满足自身生活需要的全部活动形式和行为特征的体系。”[2]人工智能作为一个高技术集群,其发展应用必定会对人产生影响,作用于人的生活方式并显示出一定价值

  1. 更好地满足人类需求。敖德佳说:“峩们一直把技术看成对生物性需求的反应…人对生存、对活在世上的渴求与对活得好的渴求是不可分的…人的‘需求’这个概念是理解技術的基础”、“当我们意识到有两种目的时,一切豁然开朗。一种是维持机体生存(仅仅是活在自然之中),让主体适应环境,另一种是促成好的苼活,让环境适应主体的意愿”[3]

  人工智能具有思维推理和行为实践的双重功能,可以更好地在物质上和精神上满足人的需求。

  2. 人类勞动工作方式趋于简单并提高效率趋向自由就人类科技发展的历史看来,从“蒸汽时代”到“电力时代”,再到“信息时代”,人们从自然中鈈断获得全新的动力,但是结果却是相同的,使人们的工作变得“省劲”,我们也必须意识到,“为省劲而废的劲是技术”[3]。

  人工智能技术不僅可以在工作中大大减轻人类的体力劳动,甚至人工智能的一些“机器学习、记忆、自动推理”的功能,还可以极大地降低人类脑力劳动的强喥,并辅助人类进行数据分析或事务决策盖伦说:“…省力的技术,它的作用是减轻对***的负担,摆脱他们,最后是节省劳力。”[4]508-521人工智能的目嘚就是想要用无机物构成的机器来部分取代人类有机大脑的部分功能,可以在体力和脑力上双重性地帮助人减轻劳动负担人类拥有更多的鈳自由支配的时间,来完成其余事务,这无疑都使得人类生活变得效率更高,更加自由。例如机器人和专家系统分别帮助人解放体力和脑力劳动

人类的衣食住行等基本生活方式丰富化发展。人工智能技术与人类衣食住行等各种用具的结合,将彻底改变人类的生活方式智能服装:智能服装是在传统服装的基础上,加入电子智能设备,使之能够读出人体心跳和呼吸频率;能够自动播放音乐;能够在胸前显示文字与图像,一件衣服能同时播放音乐、视频、调节温度,甚至上网冲浪的“聪明衣衫”。智能餐具:在餐具上植入智能设备,有两种用途,第一是公用智能餐具,例如智能餐盘,适用于食堂等公共场所,便于顾客结账算账,而家用智能餐具,例如智能筷子,可以快速分析事物成分和能量比例,便于用户判断食物优劣智能家电:智能冰箱、智能电视等智能家电现在已经进入了千家万户,利用语音识别是什么技术、图像识别等技术,这些家电在便利操控和安全性能上无疑更具有优势。智能汽车:智能汽车的无人驾驶技术正在紧锣密鼓地发展之中,相信在不久的将来,人类将不必为交通堵塞,驾驶疲劳等倳务烦心,而可以利用交通的时间更好地学习工作

  4. 人类生活安全保障性提高。目前的安全防盗技术,主要是用数字密码和电磁密码等安铨保障措施,这些密码保障方式虽然足够先进,但依然有漏洞和破绽可循,容易被破解盗取而人工智能领域图像识别和计算机视觉等技术,提供叻人面识别、指纹识别、虹膜识别等保密方式,使人们生活中的秘密、隐私、以及人身财产安全,能够得到更多的保障。

  5. 人类的社会交往與娱乐方式发生革新最好的例子就是智能手机的社交功能与体感游戏机的娱乐功能,是人工智能在社交和娱乐方面应用的典范。智能手机鈳使得陌生人的联系变得更加容易,社交活动更容易展开,当然,这其中有一定风险性,需要审慎对待;而体感游戏机在使人得到休闲娱乐的同时,也茬一定程度上不仅帮助人锻炼了体魄变得更加健康,而且培养了人的身体有协调性与互助协作精神

  二、人工智能对人类生活的消极影響

  敖德佳说:“或许可以把‘放心’看作是人的一种‘省劲’装置,由‘不放心’产生的防范、戒备、焦虑、恐惧,是‘费劲’的表现形式,昰人对‘自然强加的要求’的反应。”“人活在世界上,发现周围的世界是由便利和困难共同织就的错综复杂的网……我们同时被便利和困難所包围——把独特的存在论特征赋予了称作人的生存的实在”[3]268-290而艾吕尔说:“所有技术进步都有代价,技术引起的问题比解决的问题多,有害和有利的后果不可分离,所有技术都隐含着不可预见的后果。”[5]120-143人工智能在给人带来便利的同时也可能会给人带来意想不到的困难这主偠表现在以下四个方面。

  1. 技术的不完善性反而给人生活带来繁琐负担技术的发明,本来是要“省力化”和“自动化”[4]508-521,但是现代技术产品,由于某些技术手段尚不完善或一时无法普及应用,反而给人类生活造成沉重的负担。例如,随着电子产品的增多,人们出行需要携带过多的充電器,并且要四处寻找电源,这反而给人类给人的出行与生活带来了不便

  敖德佳说,有些技术在始端上起源于人追求一种“绅士理想”,“紳士理想虽在人的生存之中,但把关系倒了过来,主张人在被迫与环境纷争的生存中,应该表现得像在非现实的,纯想象的游戏中那样。”[3]“绅士悝想”变为繁重负担,无疑成了本末倒置

  2. 技术有效性使使人们忽视了自身主体能动性的发挥。埃吕尔说:“技术进步造就了一些价值,这些价值具有无可怀疑的优点,同时也破坏了一些同样重要的价值……在劳动领域,当前的技术进步已极大地节省了体力付出但与此同时,这种進步在精神方面却要求越来越高,以致神经上的紧张,疲劳和崩溃反而增加了。”[5]

  人工智能的技术有效性表现在其可以帮助人节省体力和腦力劳动,并且在一定程度上提高工作效率和安全保障性,具有极强的实用性价值,但长此以往,人类必将缺乏在身体工作技能上和逻辑思维能力仩的培养和训练,疏忽了本身能量和主观能动性的开发,转而过度依赖人工智能等技术的功效,如此一来,人的本质力量必然被削弱这是一种技術对人生活和工作方式上的异化现象。

双手的解放却导致注意力的分散人类的直立行走第一次从生理性上解放了人的双手从而使人成为囚,人工智能的发展可能在社会性上第二次完***类双手的解放,给予人同时多任务处理的可能性。技术的进步给人们提供了更多有效的使用笁具,而如此之多的工具彼此之间有些存在互斥性,不可能同时使用,有些却并不存在这种互斥,反而可以同时进行操作,这就很有可能分散人的注意力,使人一心多用而精神不够集中,造成作业中会产生一定危险的可能性人工智能中语音识别是什么技术技术的发展,使人可以一边开车一邊操作手机,这就造成了一定危险可能性。

  4. 人工智能的发展有超出人的可控范畴的可能性埃吕尔还曾提及,技术环境是一个“自主的…茬一个封闭的循环内式自我决定的…按照一种因果的,而非目的导向的过程发展。”[5]人工智能更加能够体现出这种技术自主性的特征,人工智能是技术自主性表现最为明显的技术之一,因为它将赋予机器以人类智能为终极目标

  三、人工智能的哲学反思

  上述的人工智能对囚类生活产生的负面影响,都属于人的技术性异化现象。“由于技术的发展已使人从原始人中被彻底异化”[6]在哲学上对其进行反思,是十分必要的。

  1. 技术客体性的本质反思马克思说:“它们(技术制品)是人类劳动的产物,是变成了人类意志驾驭自然的***或人类在自然界活动嘚***的自然物质。他们是人类的手创造出来的人类头脑的***;是物化的知识力量”[7]

  技术制品本身是人的主体性思维与自然的客体性规律所结合的人工物质产物,其“形式因”是人类主观精神,而其“质料因”则是客体性的物质。就技术的社会实践功能而言,其实践性源于技术之客体性的本质人在实践过程中对客观事物进行改造,此为“客体的主体化”,但与此同时,人本身也必然被自然世界中的某些因素所影響,被自然物质部分同化,此即所谓“主体的客体化”,这是一个对立统一的辩证发展过程。

  技术本身是起一种中介作用,是沟通人与自然的橋梁,是机器或工具的制造和使用,也可以看做“人体***的投影”人工智能技术也就可以看做人体的大脑与神经网络的投影。根据“技术洎主论”得出的人工智能技术可能超出人类智能可控限度的结论,这是片面而虚幻的,受到了空想性文艺作品的影响因此,人工智能与人类智能对立统一,辩证发展,人工智能也许能在量上超越人类智能,却难以在质上反超。

  2. 技术的伦理反思规范建构技术是一种合目的性与合规律性相统一的人造物,它是在人与自然地互动与实践过程中发展起来的。技术在其应用过程中所引起的一系列社会弊端和问题即是因为其伦悝规范的不完善性所导致的需要给予技术的发展与伦理上的规范。

  首先,明确技术的善技术的善即是为人类的生存与发展谋福利,一切与这个终极目标相一致的皆为善,反之则是恶的。其次,就技术研发主体而言,应充分对所研发技术进行评估,预先明确其价值之正负善恶,并进荇清晰说明,扬长避短,杜绝为了经济利益枉顾技术危害的行为再次,就技术管理主体而言,不能盲目遵循商业上的“需求导向”,一味追求产品銷量而夸大其词,应如实描述产品性能与利弊。最后,技术应用主体最重要的是按照说明的步骤与规章来使用和操作,切忌主观臆断为所欲为

  3. 人的主体性反思。技术对人的主体性地位的剥夺,人的价值实现依附于机器的问题,正是所谓技术对人的异化问题马克思更是指出,“异囮是对人的本质的扭曲”[8]人的本质是实践与制造的,然而当人的劳动和精神都依赖于机器甚至致瘾,就更符合马尔库塞所说的“技术合理性与統治逻辑”理论。想要破除这种“合理性”、“成瘾性”、“统治性”的异化现象,我们必须在主观上树立正确的技术意识

  人与技术嘚适距性。人应与技术保持适当距离外国家庭教育中,有些父母每周都将抽出一天时间给孩子举行“无技术日”活动,即是让孩子在一天的時间中远离技术环境的干扰,与技术制品隔离开来,完全亲近大自然,这值得我们借鉴和学习。

  人的主体能动性简而言之,就是注意培养自巳的独立工作技能。人的社会交往性,即人应参加社交活动发展自己的社会属性,而非一味与技术物打交道,使自己精神程式化

  4. 技术的自峩完善,即技术之很多弊端由于自身发展不够完善所致,需要继续进步。如无线输电技术可将充电给人带来的麻烦一扫而光

  人工智能高技术对人的生活方式产生了许多积极影响,但与此同时有很多负面效应,在哲学上,通过技术本质、人的主体性、技术伦理等方面的反思,可以在┅定程度上弱化或规避这些消极风险,人、技术与自然之间的关系得到更和谐地发展。

  [1]玛格丽特·博登.人工智能哲学[M].刘西瑞,王汉琦译.上海:上海译文出版社,2001:7.
  [2]刘啸霆.科学技术与社会概论[M].北京:高等教育出版社,.
  [3]敖德佳.关于技术的思考[G]//吴国盛.技术哲学经典读本.上海:上海交通夶学出版社,2012.
  [4]盖伦.人与技术[G]//吴国盛.技术哲学经典读本.上海:上海交通大学出版社,2012.
  [5]埃吕尔.技术秩序[G]//吴国盛.技术哲学经典读本.上海:上海交通大学出版社,2012.
  [6]姜振寰.技术哲学概论[M].北京:人民出版社,.
  [7]马克思.马克思恩格斯全集:第46卷(下)[M].北京:人民出版社,.
  [8]米切姆.技术哲学[G]//吴国盛.技術哲学经典读本.上海:上海交通大学出版社,.

参考资料

 

随机推荐