都在玩人工智能,看看英特尔用它来做什么

  作为英特尔英特尔研究院在海外设立的三个“地区性的研究机构”之一,英特尔中国研究院(Intel Labs China, ILC)目前主要聚焦于研究与未来自主系统相关的关键技术,包括人工智能算法、自主系统平台和智能基础设施三大部分。那么,这个备受瞩目的科研机构最近又有什么新动向呢?接下来让我们一起来探索吧。

  与视觉理解相关的人工智能算法:让机器更懂你

  该研究方向主要包括人脸识别技术、情绪识别、场景理解等技术以及深度神经网络压缩技术。基于先进的人工智能算法,英特尔中国研究院开发了视觉内容理解和视觉内容创建能力,能够创造前所未有的体验。前瞻性的视觉理解、视觉认知主要涉及三个方面:人脸分析和情感识别;针对视觉识别高效的视觉压缩;视觉、语言和知识融合。在此次开放日活动中,英特尔中国研究院的专家重点介绍了三个方面的最新技术进展。

  1.人脸分析及情感识别技术

  在人脸分析和情感识别方面,英特尔中国研究院很早便拥有最先进的算法,并且在EmotiW比赛(自然环境下的情感识别比赛)中获得冠军,该算法的速度是第二名团队的200倍,可以应用于无人驾驶的场景当中。基于英特尔实时人像风格迁移系统,英特尔中国研究院将多种艺术人像风格实时迁移到静态的目标图像以及动态的目标视频中。该项技术可以广泛地应用于AR/VR、在线直播、影视、多媒体社交等领域。

  此外,英特尔中国研究院基于机器学习和深度学习算法开发了英特尔3D人脸面部表情捕捉技术。英特尔研究员们从数十万人脸图片数据中,训练出多个人脸识别模型,用于对视频图像进行智能分析与3D建模,不仅可以检测与识别人脸,还能精准重建3D人脸,并实时跟踪面部表情变化,将预先设计好的特效素材附着在3D人脸上并叠加到视频中,从而实现逼真炫酷的脸部特效。

  2.深度神经网络压缩技术

  当前,深度学习领域目前面临的一大挑战是,主流DNNs都是计算和存储密集型的,这导致在边缘和嵌入式设备的部署面临巨大的挑战。为此,英特尔中国研究院提出了从动态网络手术DNS、渐进网络量化INQ到MLQ多尺度编码量化的低精度深度压缩解决方案。通过这“三部曲”,可以获得百倍DNN模型无损压缩性能。根据AlexNet测试结果,该项简洁的解决方案能够超越主流深度压缩方案至少一倍,在2/4-bit精度下达到超过100倍的网络压缩。

  3.多模态图像视频解析

  近年来,如何自动生成视频描述引起了研究人员的广泛兴趣。人们希望计算机在看到一段视频的时候,可以根据视频的内容“讲故事”。但是,视频描述模型的训练通常需要大量复杂的并且带有一定主观性的人工标注。而在目前的数据集构建过程中,标注人员会在看过一段视频之后,用一句话描述视频的内容。但是,一段视频通常会发生几个不同的事件,而由于标注人员具有一定主观性,人们既不知道其描述的是哪个事件,也不知道其所描述的事件对应不同帧上的哪个区域。

  为此,英特尔中国研究院率先提出了弱监督视频密集描述生成的方法,不需要训练数据对视频中的不同事件和对应区域进行分别标注,而仅仅使用标注员对视频的一句话描述,就可以自动产生多角度的视频描述,并且从中挑选出最具代表性的描述语句。这样,计算机就不用人“手把手教”,而是可以做到“举一反三”。

  自主系统:创造机器人的“英雄”时代

  自主系统是与人工智能相关的一个研究方向。英特尔中国研究院的目标是推出一套基于CPU+FPGA异构计算的自主智能机器人开发平台,帮助研究人员基于此平台进行开发。之所以引入异构平台,是因为机器人研究需要同时引入时间和空间计算模型。CPU作为时间计算模型的完美代表,指令按时间顺序一条一条执行,可以实现灵活多变的控制;加速器则更像一种空间计算模型,利用空间的并行从而一次性完成大量数据处理,使复杂的计算得到加速处理。

  基于这一目标,HERO智能机器人开放平台(Heterogeneous Extensible Robot Open Platform)应运而生。它是英特尔中国研究院专为智能机器人(包括服务机器人、医疗机器人、自动驾驶汽车等)打造的一套低功耗、高性能、体积小的异构系统平台方案。在此方案中,CPU作为控制中心,与FPGA和其它专用加速器芯片(如Movidius的VPU)搭配,能够提供高效的性能。整套HERO硬件系统采用了英特尔酷睿™系列CPU,搭载英特尔Arria 10 GX系列1150型FPGA作为异构加速器,能够实时处理大量数据并运行多种智能算法。

  在本次开放日活动上,英特尔中国研究院宣布围绕HERO平台推出全新的合作伙伴计划。围绕该项计划,英特尔中国研究院致力于携手业界的平台级、应用级和生态级合作伙伴,通过研发合作、学术创新和行业示范,共同打造一套完整、高效和开放的平台,不断扩展应用场景,加速技术和产品的落地。

  智能基础设施:加速通信和计算的融合

  该项研究主要面向保障未来大规模智能联网设备顺利工作的支撑技术,包括无线通信技术和智能存储技术。前者研究在网络接入端的MIMO技术和移动边缘计算技术;后者研究使用英特尔最新的3D存储技术和FPGA构建的智能化方案来提供高吞吐量、低延迟、有增值服务潜力的技术。

  在本次开放日活动中,英特尔介绍了如何面向5G下一代通信网络,借助通信与计算的融合打造高质量的VR体验。当前,为了满足高质量虚拟现实体验的需求,当下的高清体验需要实现25-40倍的分辨率提升。为此,英特尔希望通过计算和网络的融合,以端到端方式实现网络扩容,从而打造远程沉浸式的互动体验。

  英特尔演示了超高分辨率全景视频采集系统,它主要适用于无线VR设备,用户可以身临其境地观赏全景视频,或者参与VR游戏互动。它使用了ISP总线同步相机快门,通过分布式构架处理采样图像,同时利用光流法拼接全景视频,并插值立体信息。该系统同时采用英特尔核心GPU高性能压缩图像,通过无线传输将主机渲染输出到远程终端,并利用OFFLOAD技术降低显示延迟。有了这些技术,电视观众即使在家里也能感受到奥运会前排座席的观赛体验,或者选择场馆内不同的观赛角度。

第 1 /  10 页
点击查看余下全文