导读:
近期,Master连续50多场战胜人类顶尖棋手的事件余温未平,以AlphaGo为代表的人工智能先锋正在重塑人类与科技的关系,引发全社会的强烈关注和思考。
人工智能经过六十年的技术变迁,以当前登上围棋之巅为标志,已进入了汇集海量数据模型、深度学习算法和高度计算力的新阶段,特别在语音识别、图像识别等领域取得了很大的成功。
在人工智能蓬勃发展的背景下,打通芯片、系统、终端、云的融合平台逐渐兴起,实现无屏化交互、模块化配置的机器人智能大脑日嚣尘上,具有全方位感知能力和多元化应用基础的情感机器人潜力巨大。这一切均以优化整合产业链、突出多模态交互基础、明确可变现商业价值为核心,成为人工智能产业发展的新一轮重要特征趋势,孕育着值得长期跟踪和关注的未来增长点。
图 人工智能发展趋势架构
资料来源:作者整理
(一)融合芯片、系统、云的人工智能平台发展迅猛
集成人工智能算法芯片、系统和软硬件平台的完整解决方案,率先在自动驾驶和智能家居领域快速渗透。当前,人工智能领域上下游企业均加快延伸拓展,下游应用方案提供商、硬件制造商向上游神经网络芯片领域渗透,上游芯片企业向下游应用服务延伸。如Google在开发无人驾驶汽车、机器人的同时,推出深度学习开放平台
TensorFlow和全定制人工智能芯片TPU;Intel收购FPGA厂商Altera和深度学习创业公司Nervana,推出Nervana神经形态芯片和引入人工智能计算功能的新一代至强Phi处理器,并宣布与宝马、Mobileye展开深度合作,在无人驾驶领域加快布局;英伟达投入20亿美元开发人工智能芯片特斯拉P100 GPU,与采埃孚合作开发人工智能系统ProAI,并推出智能家居“Spot”设备和自动驾驶车载电脑Xavier。我国人工智能创业公司地平线机器人开发自主神经网络芯片,并推出深度神经网络应用系统,分别为面向智能家居的安徒生平台和面向智能驾驶的雨果平台。
涵盖云端大脑、神经网络和终端运营的云机器人运营网络平台正在构建,基于此应用的导盲机器人、商业服务机器人即将推广。随着人工智能、机器人技术的不断进步,未来的机器人将以“大脑在云端,网络为神经”的云端智能机器人的形态存在,而日趋复杂的网络环境为云端智能机器人的安全运营带来巨大挑战。目前已有企业开发了移动内联网云服务解决方案,为客户提供端到端的一体化安全解决方案。在此基础上,将自然语言理解、智能图像技术、机器人操控、智能翻译等功能集成于云端,实现面向智能机器人企业的专业服务。采用云端技术的META导盲机器人作为首款云端智能机器人研发成功,凭借传感器和实时操作系统,具备人脸识别、自然语言处理等人工智能能力,在视频流中准确抓取人脸,应对各种表情、姿态,并在嘈杂环境中识别各种语言杏耀娱乐怎么样可靠吗。优必选Cruzr机器人作为定制AI商业服务机器人,通过云平台实现声源定位、语音互动和自由移动等功能。总体来看,云网络在短期仅支持少部分特殊应用场景的机器人终端,随着云安全、云传输、云存储技术的飞速发展,未来应用必将全面铺开,但中间可能经历十年甚至更长时间的艰苦探索,最终形成人工智能的“云+端”全覆盖。
表 云机器人类型及典型产品
资料来源:作者整理
(二)革新交互和配置模式的机器人智能大脑方兴未艾
机器人智能大脑采用语义分析、知识图谱、自学习等多种技术,模块化平台使配置更为灵活多样。机器人智能大脑是计算机系统借助人类思维方式,以人类便于接受的方式协助人类解决或辅助处理问题的一种运行模式。机器人智能大脑平台能够为机器人提供“思维”核心,完成语义分析、知识图谱、自学习及思维相关算法等多方面的技术。在单点突破的基础上,以灵聚智能、中科汇联为代表的企业进一步将机器人思维技术进行整合创新,形成模块化平台,使机器人硬件以“搭积木”的形式配置相应智能单元,为机器人提供智能大脑。在此基础上,不断创新发展,形成复杂环境的人机交互、All-In-One的语义接入接口、基于向量的深度语义分析、非结构化知识图谱构建等。机器人智能大脑云平台通过软硬协同,让机器人用有限的表达能力,传递出更丰富的内涵。目前,智能大脑可实现机器人肢体动作、灯光、多轮交互、知识图谱、语义分析技术的交叉复用,并产生一系列实用的功能和效果,已在NAO等机器人上使用。
无屏化交互成为机器人智能大脑的核心,“AI即UI”真正贴近用户丰富应用场景。无屏化交互是人工智能应用颠覆传统单点、单向屏幕触控交互的最佳实践。无屏化交互绝不仅仅是我们熟悉的语音交互,而是融合智能传感、工业设计、心理学、智能算法为一体的、改变软件硬件整体设计理念和配置方式的系统工程。目前,受限于技术成熟度,仍以语音交互、语义分析应用为主流,但声音强度、口音、环境嘈杂度等对语音交互效果影响极大,严重影响了用户体验并阻碍了产品的推广普及。随着技术的发展和智能设备的不断普及,未来无屏化交互将成为机器人智能大脑的关键核心,无处不在的传感器能够实时捕获用户的位置信息、表情信息和其他讯息,不仅是用户的语音,包括用户的肢体动作、面部表情在内的信息将被识别并分析,通过不断迭代的自我学习,机器人或整个人工智能系统能先于用户指令得出即时反馈,可以是机器人为用户所做的具体动作、语音,也可以是连接整个家居系统、汽车系统或其他智能系统的场景应用。
(三)应用灵活多元的情感机器人正成为新兴增长点
多模态情感计算发展十分迅速,融合文字、语音、图像的全方位感知能力不断增强。多模态情感计算通过情感信息获取、识别和表达,通过视觉、听觉、嗅觉等各类传感器获取外部信息,识别人的表情、动作、语义和语调,真正理解交流者的情境、情绪和意图,不仅能够聊天谈心,还能够提供知识和生活服务,在情感交流、情感陪护、知识传达方面均发挥重要作用。其中,图像识别结合海量且高质量的图片数据训练材料,基于前沿深度学习算法深度开发;自然语言处理方面,已能实现将每个用户拆分为数十个维度进行分类,文字情绪可超20种,语音与动态表情近10种情绪识别。语音情感识别的中文语音情绪识别准确率超80%;图像理解方面,利用深度学习识别人脸情绪比变化,可以对视频的人脸表情进行实时识别;用户画像方面,记忆、洞察、推荐利用记忆功能建构用户画像,并对用户进行分析并提供个性化服务。
跨平台、开放式、定制化情感机器人API应用延展性极强,且情感反馈信息在优化推荐、广告定制、智能决策等易变现领域提升作用显著。情感机器人能够嵌入操作系统、公众号、APP、物联网、机器人等多元化使用载体。操作系统方面,竹间智能与卓易科技合作推出人工智能的手机操作系统 Freeme OS 7.0,摆脱手机“点击交互、功能调用”的单向模式,通过嵌入竹间智能小影机器人,实现“语音交流、定制应用”的双向情感互动,将情绪、记忆、操作习惯、讯息等维度全部打通。机器人方面,Pepper、Jibo和Buddy机器人可谓情感机器人应用的典范,Pepper内置情感引擎,通过对用户的面部表情、肢体语言和言语措辞,“读懂”用户的情感状态并给予反馈。Pepper、Jibo和Buddy均致力于打造应用平台,鼓励开发者开发适用于不同应用场景的各式应用程序,如全家拍照、烹饪指导、教育娱乐等丰富应用。总而言之,情感计算作为通用人工智能引擎,适用于一切与人进行互动交流的场景,且非常贴近商业价值的实现,对推荐、广告、决策类可变现应用具有深刻影响,是值得高度关注的人工智能发展亮点。
图 情感机器人API应用范围
李扬,博士,高级工程师,中国社会科学院企业管理专业毕业,现任职于众美集团公司,从事智能科技产业及园区研究,原就职于工信部赛迪智库电子信息产业研究所。
举报/反馈