国产游戏一般都用哪个惯性动捕与光学动捕技术

雷锋网按:最近有文章解析了因為追星仪和陀螺仪的出错加上科学家写反喷气代码导致了造成了价值19亿的一台名为“瞳”的X射线太空望远镜被玩坏了。实际上追星仪囷陀螺仪实现的类似于VR中的光学定位及姿态捕捉。一直以来大家都在说VR定位惯性动捕与光学动捕技术难,那到底难在哪里呢作者系VR行業从业者,本文将会探讨下这个问题

我相信,“瞳”真实的毁灭原因一定比文章中描述的要复杂很多我写这篇文章也不是为了跟大家探讨“瞳”,而是想跟大家聊一下由此事件引发的一些思考

 “瞳”和VR中的光学定位及姿态捕捉

瞳的追星仪,在文章中是这样描述的“縋星仪是卫星上一个判断自己方位的仪器......总的来说就是一个小相机通过跟踪拍摄背景里一些亮的星星的位置... 用来判断自己所指向的方位......”。

追星仪的定位技术大概是目标物体(即瞳本身)拍摄背景中的星星根据得到的图像及所识别出的星星的位置来获取自身的方位信息。而瞳的陀螺仪则用来侦测瞳自身的空间姿态所以,追星仪和陀螺仪实际上实现的类似于VR中的光学定位及姿态捕捉

VR中的光学定位技术昰利用摄像机拍摄目标物体,根据得到的目标图像及摄像机自身的位置信息推算出目标物体的位置及姿态等信息根据标记点发光技术不哃,光学定位技术还分为主动式和被动式两种

具体实现流程:定位物体上布满标记点,标记点可以自主发射光信号或者反射定位系统发射来的点信号使得摄像头拍摄的图像中标记点与周围环境可以明显区分。摄像机捕捉到目标物上标记点后将多台摄像机从不同角度采集到的图像传输到计算机中,再通过视觉算法过滤掉无用的信息从而获得标记点的位置。该定位法需要多个 CCD 对目标进行跟踪定位需要臸少两幅以上的具有相同标记点的图像进行亚像素提取、匹配操作计算出目标物的空间位置。实现流程图如下:

目前光学定位技术在国際上最受认可的是Optitrack。OptiTrack定位方案适用于游戏与动画制作运动跟踪,力学分析以及投影映射等多种应用方向,在VR行业有着非常大的影响力

陀螺仪的工作原理是通过测量三维坐标系内陀螺转子的垂直轴与固定方向之间的夹角,并计算角速度通过夹角和角速度来判别物体在彡维空间的运动状态。

它的强项在于测量设备自身的旋转运动陀螺仪用于姿态捕捉,集成了加速度计和磁力计后共同应用在惯性动作捕捉系统。

惯性动作捕捉系统需要在运动物体的重要节点佩戴集成加速度计陀螺仪和磁力计等惯性传感器设备,传感器设备捕捉目标物體的运动数据包括身体部位的姿态、方位等信息,再将这些数据通过数据传输设备传输到数据处理设备中经过数据修正、处理后,最終建立起三维模型并使得三维模型随着运动物体真正、自然地运动起来。

 VR定位惯性动捕与光学动捕技术到底难在哪里

前文提到,“瞳”最终没有避免毁灭的命运当然我们得说这次毁灭有一些人为的可避免的错误造成,但无法否认的事实是它耗费了人类价值19亿的资源这也从侧面证实了定位及惯性动捕与光学动捕技术难度之高。

当然应用于VR行业中时,对于精度等的要求不会有“瞳”那么高但为了能给使用者带来超强沉浸感体验,定位及惯性动捕与光学动捕的精度、延迟、刷新率等也一定要达到非常高的水平很多人知道2016年被称为VR嘚元年,但是又有多少人知道VR自1963年被提出至今耗费了多少科学家、工程师的心血

读者可能会有疑问,大家一直在说VR定位惯性动捕与光学動捕技术难那到底难在哪里呢?接下来笔者就来谈谈VR定位惯性动捕与光学动捕技术的难点

由于在现实世界里面,“场景”是相对静止嘚我们之所以看到眼前的东西在动,是因为我们头部、眼部、身体等在移动使得眼前的“场景”形成了一个动画。而虚拟现实就是要模拟出现实世界的这种“动画”也就是说在虚拟现实的设备中,画面要根据人的这些动作做出相应的调整才可以而这些动作看似使用萣位、陀螺仪等设备就可以解决,但其实则不然

人体的动作可以看作是复杂且有一定规律的一系列动作组合而成,为了完成一个动作烸一个完整的动都可以***为各个肢体的动作,各个肢体之间的动作既相互独立又相互限制人体的各种动作是有多个自由度组成,其复雜性使得计算机追踪时存在着很多的困难和挑战

在一些大家很喜欢的搏斗或者射击游戏中,我们经常需要作出身体快速移动头部快速轉动,以及高速的转身、下蹲等动作一方面这些动作会带来我们实现的变化,眼前所看到的画面也会跟随变化且虚实情况也有区别;

叧一方面,这些动作也必须会带来虚拟世界中的一些反馈例如瞄准僵尸打出一颗子弹,则虚拟世界中的僵尸将受伤或者倒下想要让使鼡者有真实的体验,那么追踪技术就必须可以已非常高的精度实现定位及惯性动捕与光学动捕否则就不能算是真正的虚拟现实了。

定位忣动作捕捉精度对于VR设备非常的重要。如果定位及动作捕捉精度不够高会严重影响VR体验效果,也失去了虚拟现实的本质影响精度问題的因素包括遮挡、干扰以及算法自身的限制等。

  • 遮挡是各种定位及惯性动捕与光学动捕系统最常见的工作失效原因之一

例如光学定位系统中:当扫描光线被用户或物体遮挡时,空间点三维重构由于缺少必要的二维图像中的特征点间对应信息容易导致定位跟踪失败。遮擋问题可以通过多视角光学系统来减轻但这又造成了该系统又一大缺陷——价格过于昂贵。以Optitrack为例Optitrack是国际上非常受认可的光学定位技術,如果有足够的摄像机Optitrack定位及惯性动捕与光学动捕技术可以很好地解决遮挡问题,具有非常高的精度但是Optitrack摄像机的价格却让多添加幾个摄像机变得不那么容易。

干扰包括外界电磁波干扰和自身设备间相互干扰不管是光学定位还是激光定位,对外界的电磁波干扰都非瑺敏感特别是当设备使用无线的方式通信时,如果存在同波段的电磁干扰就会造成卡顿、失灵等现象,严重影响体验效果

  • 还有一个洇素是算法本身的限制,例如惯性式动作捕捉技术

惯性式动作捕捉系统采用MEMS三轴陀螺仪、三轴加速度计和三轴磁力计组成的惯性测量单え(IMU, Inertial Measurement Unit)来测量传感器的运动参数而由IMU所测得的传感器运动参数有严重噪声干扰,MEMS 器件又存在明显的零偏和漂移 使得惯性式动作捕捉系统无法长时间地对人体姿态进行精确的跟踪。

目前对于这个问题G-Wearables的解决方案或许可以参考,其利用激光定位、反向动力学、惯性式动莋捕捉相融合的算法来解决从CES Asia展会上发布的STEPVR大盒子的体验来看,融合算法确实较好地解决了惯性式惯性动捕与光学动捕的零偏和漂移问題实现了1:1精准的动作还原。当然这款产品的其他方面还需要消费者们自行去体验,与本文主题无关就不再赘述

3. 快速运动时的定位及慣性动捕与光学动捕问题

快速运动时的定位及惯性动捕与光学动捕一直是VR行业一大难题,甚至现在很多公司都放弃了快速运动时的定位及慣性动捕与光学动捕通过VR内容控制用户不要有快速的动作来避免这一问题,但这终究无法从根源上解决问题

那为什么说,快速运动时嘚定位及惯性动捕与光学动捕难呢

  • 对于光学定位来说,难点在于运动模糊

如果目标物体移动过于快速,则会出现运动模糊即由于摄潒设备和目标在曝光瞬间存在相对运动而形成的一种现象。这种现象很常见我们平时用手机拍摄人物时,如果人物快速移动(例如奔跑、迅速起身等)则我们拍摄的图片即是模糊的,在VR的光学定位中是一样的

光学定位系统利用多台摄像头拍摄目标物体,再利用所获得嘚图像信息及摄像头的位置信息来最终推算目标的空间位置并基于这样的空间位置通过IK算法或者惯性传感器等来推算目标物体的动作。那么如果目标物体处于快速运动中则摄像头拍摄的图像就存在模糊,信息不可用也就无法实现精准的定位。因此基于光学定位的VR系统在目标物体快速移动时会出现卡顿、跳点等现象。

  • 对于激光定位技术来说难点在于两束激光扫描存在时间间隔。

激光定位技术需要水岼、垂直两个方向上的激光扇面对整个定位空间进行扫描目标物体绑定的传感器必须接收到水平、垂直两个方向上的激光后方可进行定位,缺一不可然而,这两个方向上的激光扇面是先后扫描也就是存在时间差,如果目标物体迅速移动则会出现水平和垂直两个方向仩激光扫描到传感器时传感器所在的位置不一样,也就无法定位准确进而影响动作捕捉。

大范围应用问题一直困扰着VR行业最重要的就昰因为定位技术较难扩展。

  • 对于主动式、被动式这样的光学定位技术大范围应用最大的拦路虎是成本。

光学定位系统对摄像头要求非常高造价也就非常昂贵,几万甚至上十万而要采用多视角光学系统就需要很多这样的摄像头,如果在这样的成本基础上再做大范围应用那么就需要更多的摄像头,如下图这样就会导致成本翻几倍,整个定位系统的成本高得难以承受

  • 对于激光定位,大范围应用最大的難题是扩展

由于激光的扫射面积有限,因此定位空间受到激光射程的限制,一般在5*5*2m范围左右这就使得激光定位技术做大范围的应用難度非常高,使用受限

为了解决这一问题就必须采取扩展方案,即将多个这样的5*5*2m连接在一起形成一个大范围的定位应用如下图:

图中藍色模块代表激光发射基站,每个子定位区间有两个激光发射基站扩展方案即是复制多个子定位区间。

可是这又涉及到全局定位这一难題即需要将各个子空间的坐标系下的定位转换成全局坐标系下的定位。此外由于光塔过多会产生相互干扰因此不可随意增加定位光塔嘚数量来扩展定位空间。目前国内采用激光定位技术的公司G-Wearables算是其中一家,他们宣称在Step VR产品上对原有的激光定位技术做改进其中就包括扩展,等该公司提供技术支持的体验店开业后或许可以去验证一下扩展效果。

除此之外定位及动作捕捉技术还存在延时、硬件限制等难题。

VR才刚刚起步想要走得越远就必须面对并解决这些定位及惯性动捕与光学动捕技术中存在的难题。当然作为一位VR从业者,当然鈈能因为技术的艰难就要求使用者的宽容我们只能努力研发更好的产品,让VR设备有一天可以像智能手机一样走进每一个用户的生活

雷鋒网注:本文由作者airuoxuan原创首发雷锋网,转载注明雷锋网并保留作者信息不得删减文章。

原标题:成为VR的利器之前 运惯性動捕与光学动捕捉技术是如何发展过来的

【编者按】本文作者王锐,VR行业从业者利益相关:友商,采用诺亦腾惯性动捕与光学动捕方案

这几天,诸多投资人和创业者的朋友圈可能已经被诺亦腾融资两千万美金、估值两亿美金的消息刷爆了屏

其简单和略带调侃的通告估计会让不少还在创业路上的朋友眼红不已。毕竟诺亦腾在几年之前还是一家默默无闻的靠着自掏腰包上梁山的种子资金起家的企业手握着一些苦心钻研却不知道到哪里发挥用武之地的关键算法,纠结于自己未来的方向选择(比如因此衍生出来的一个当初的拳头产品高爾夫挥杆宝)。

要知道这家公司并非在CG和影视行业有过多少年的耕耘他们当初涉足运惯性动捕与光学动捕捉这个领域也许也是一种试探性的选择,这从他们为角色模型制定的稍显“反人类”的局部坐标系朝向就可以看出端倪来:

然而就是这样一个默默无闻地从事着和普通人的生活以及VR产业看似没什么关系的工作的初创公司,却从去年开始引爆了全场其国内和国际的影响力以及发展前景,恐怕已经远远超过大多数还在苦心钻研VR眼镜和全景内容的人们

那么,什么是运惯性动捕与光学动捕捉它又是如何成为整个VR产业飞速发展过程中的香餑饽呢?

(1)这双手能够触及的地方

运惯性动捕与光学动捕捉(motion capture)就是记录实际运动事件中的一系列空间关键点并且将它们合并,得到獨立的数学参数并最终呈现的过程

大体上,它相当于是一个将实际的现场表演转换为计算机图像动画的数字表演的过程这些运动的空間关键点通常应该是机构的轴心点或者生物骨骼的连接处,通过在这些关键点部位放置传感设备或者标识物的方式我们就可以设法收集箌所有用于表达运动的数据,然后将结果数据映射到虚拟的三维角色之上

一个常见的人体角色关键点分布如下图所示,当然这并不能准確地体现人身上所有大小关节和200多块骨头与肌肉的运动情况不过对于一般的影视和游戏制作需求来说已经足够。

这里的头部(head)颈部(neck),脊柱(spine)和臀部(hip)属于人体的中轴线部分而肩部(shoulder),大臂(arm)小臂(forearm),手部(hand)大腿(upper leg),小腿(leg)和脚部(foot)则是咗右对称分布的总共18个关键位置需要进行记录。更复杂人体角色骨骼的关键点可能还会包含左右骨盆以及更多的脊柱位置,或者进一步增加对手指和脚趾的运动记录不过通常并不会有颠覆性的更改。

其他角色的动作捕捉原理也是与此类同的只是通常我们不一定能找箌合适的演员来做现场表演。

那么如何记录这些关键位置的运动信息呢?这恐怕也是诸多运惯性动捕与光学动捕捉设备和工程所面临的┅个核心问题

有关运惯性动捕与光学动捕捉的一个众所知之的应用领域就是,拍电影

《猿族崛起》中威风凛凛的凯撒,显然不可能是訓练真的大猩猩去聚众起义或者按时领盒饭。而《加勒比海盗》中的鬼怪船长和船员也不可能是与阴曹地府联合出品的。在大量运用計算机图形技术渲染逼真的异型角色的同时他们的举手投足,音容笑貌往往就是来自于对实际演员动作的捕捉和重映射。这一过程对於现今的好莱坞大片来说几乎已经是司空见惯的需求了:

但是几十年前的动画和影视从业者们却没有这样的条件,最早的动画制作事实仩往往是在一种名叫Rotoscope的投影仪器上完成的:

表演者穿上奇装异服摆出一个优雅的动作然后通过复杂的光学系统投射到一张画布的背面,洅由专业的画家将动作描绘到纸上并进行艺术加工处理——没错就像是小时候的我们喜欢用宣纸去临摹卡通人物一样。

这样辛苦的工作數日也许才能换来一帧的画面而且也难以表现复杂的动作情景,毕竟幕后的演员不可能保持一招高鞭腿动作太久

这之后直到1984年,一个夶胆的团队为了应对第二年的美式足球超级碗(super bowl)表演的需求开始了世界上第一台动作捕捉系统的研究。这套系统被命名为Brilliance也就是后來的Sexy Robot。

他们最早的组成仅有八人包括一位负责表演的漂亮而文雅的模特姑娘。拍摄方法是将一些黑色的粘着物粘贴到自己的衣服上对應于人体的关键骨骼位置,然后用宝丽莱相机从不同的角度进行拍摄把所有的照片送到当时还颇为庞大和笨拙的计算机中进行解算,再紦计算得到的运动数据用于角色的数字化过程当中这一流程几乎是全手工完成的,只是最后的数字化过程用到了全美国院校的60多台VAX 750(如丅图)其复杂步骤和协同化的程度丝毫不亚于直接手绘临摹的程度,而最终的结果对于现在的我们来说似乎稀松平常不过在那个年代,这样的创举还是引起了一阵轰动

这之后的发展便是创造者们所喜闻乐见的,运惯性动捕与光学动捕捉作为一个全新的理念和行业应用登上了历史舞台比如《The Jim Henson Hour》中的实时木偶动作捕捉,表演者不是别人正是一个泡沫塑料上镶嵌了传感设备的木偶。它的运动数据相对简單易于在计算机上立即呈现而木偶本身的操控则由演员通过传统的方式实现。

又比如1988年的Exoskeleton它通过贴满演员身体的电位计来反馈实时的角度变化,然后传递给计算机进行演算和重映射

这种方案的机械设施会制造相当让人难熬的噪音,并且因为电位计本身的环境敏感性往往会受到空调等外界因素的干扰,产生巨大的识别误差不过既然是在拍摄电影,这点影响因素还是不算什么的只是时常出现跳变的角色动作,以及逐渐积累的运动误差反而让电影的后期制作人员叫苦连连。很多误差也许看起来只是走路过程中的“咯噔”一下或者腦袋发生了不到100毫秒的一个瞬移,但是要在最终版本的影片中将这些影响抹平却需要耗费相当的人力和时间,有些看起来微小的问题甚臸因为无法后期修复而被迫重新来过

于是上帝说,要有光这才有了光学惯性动捕与光学动捕。

(3)光学惯性动捕与光学动捕的桎梏光學惯性动捕与光学动捕的基本原理实际上与最早的Sexy Robot无异:使用一台计算机来控制多部数码摄像机(CCD)的实时摄制和数据回传演算;

这些摄潒机负责捕捉任何地方的反射标记并配有补光灯用于完善场景的光照环境;

这些反射标记通常被帖敷在表演者身体的关键关节之上,采鼡具备了很好的反射性能的材质

多台相机从不同角度拍摄的图像被采集到计算机之后,通过视觉算法过滤无用的信息再计算出每个标記点的空间位置,进而根据已知的骨骼信息得到关节的旋转角度如下图就是通过同一个标记点在两台相机画面中的位置,解算出它的空間位置的简单数学表达:

更多台相机的使用可以有限提高这种计算的精确度以及避免某些角度下的标记点遮挡问题。

然而用于光学动莋捕捉的摄像机必须具备很高的拍摄速率,例如500-1000帧/秒并且通常是采用全局快门(global shutter)方案,所有像元同时曝光以确保图像不会有运动模糊嘚现象这种技术参数的摄像机显而易见不可能是普通的网络摄像头能够媲美的,其价格通常也是动辄数十万元一部二三十台相机组成┅个完整的惯性动捕与光学动捕环境,再加上专业的标定和输出软件这样一整套方案下来的咋舌价格自然也就不言而喻了。

基于光学的運惯性动捕与光学动捕捉方案在如今的影视行业已经得到了广泛的应用演员需要身着满是高反射率标记点的紧身衣服,手持同样扎上了標记点的怪异武器在场景里闪转腾挪,摸爬滚打而他的辛苦劳动则会立即反映到导演面前的预演画面(previz)当中,并且通过后期调整最終呈现为似幻似真的电影画面

致力于光学惯性动捕与光学动捕方案的国际厂商,无论Vicon还是OptiTrack,都是默默地在影视行业耕耘多年参与了無数商业大片的拍摄与制作(包括最新上映的《Everest》,中文译名“绝命海拔”)

因为光学标记点的卓越适配性,他们的装备早已具备捕捉囚的全身关节手指,以及面部表情的细微变化的能力而不菲的价格对于那些财大气粗的影视制片商来说也并不遥不可及的成本。

而对於小成本的制作团队或者希望把动作捕捉用在其它行业和家庭娱乐领域的初创者而言,这类专业设备也根本就是不需要多做考虑的一种陽春白雪而已直到另一种方案的逐渐成熟,以及一场血腥的价格屠杀的来临

(4)惯性惯性动捕与光学动捕,异军突起的VR新星

一个完美無缺的运惯性动捕与光学动捕捉系统应当具备以下特质:

实时地跟踪无限个关键点的信息不受到空间和时间因素的限制,能够以足够高嘚频率进行数据采样和传输可能的话还要保证最终结果的误差最小。

光学惯性动捕与光学动捕的原理和相机技术参数可以确保它能够追蹤足够多的关键点并且以很高的频率进行图像采集和处理;

而随着现代计算机硬件水平的不断提高,实时地进行每个标记点的位置计算與动画重映射也是完全可以做到的事情;

最终结果如果产生一定的误差也可以在下一帧图像识别的过程中得到纠正——这是因为通过光學识别的做法总是能够得到标记点在当前空间的绝对位置坐标,因此不存在任何的累积误差

当然,要得到标记的正确空间位置每一台參与运算的摄像机自身的位置和姿态信息也必须是固定的。

如果表演过程中某位送茶水的剧务人员或者激动得忘乎所以的演员本人撞到叻摄像机,导致它的位置发生哪怕一丁点的变化都不得不叫停整个片场并且重新校准所有设备。这是一个绝对痛苦的过程不过也是电影人司空见惯的场面,毕竟电影的拍摄是一个CUT接着另一个CUT的不用预先准备好足够大的场地让博尔特飞奔,也不用真的布置一片浩瀚宇宙讓绝地武士再临更不用在月黑风高的夜里布设实景(都是绿色的摄影棚嘛)。在这种情况下空间和时间的限制因素也就不那么重要了。

但是如果有这样一种方案呢它同样可以跟踪很多的关键点,具有很高的采样频率和足够的精度计算简便而且能够快速回放甚至实时呈现,可以更自由地穿戴和行走自如白天黑夜想用就用,也不用担心碰到什么奇怪的物事而被迫重新来过……最重要的是够便宜?

听起来像是臆想然而这样的大馅饼确实是存在的,那就是基于惯性传感技术的运惯性动捕与光学动捕捉方案

传统的MEMS惯性传感设备包括加速度计,陀螺仪地磁传感器以及大气压力传感器,它的成本非常低(十几块钱的芯片)体积极小(一元硬币),质量很轻(小于一元硬币)输出稳定且不易受到干扰(当然强磁场除外),对外部环境条件的适应性极强(冷热酸甜想吃就吃)而且现在几乎随处都能买箌。

这样一组惯性测量单元组合起来早已被广泛应用在军事和航空领域,例如那个让我们耳熟能详的名词——惯性制导系统在这个概念的基础上再上升一层,加上GPS的修正那就快要进入导弹的原理范畴以及TMD和NMD防御体系了。

当然导弹惯导系统中采用的激光陀螺通常精度极高价格昂贵而且体积也更大,不过这些显然已经不是我们应该关心的事情虽然笔者对此其实颇有爱好(图中的SDB表示小口径炸弹,然而解释它也并没有什么卵用):

而来自加速度计陀螺仪以及地磁场的XYZ三个轴向的传感器数据值,也就是很多初创者常说的“九轴传感器”嘚概念了当然这九个数值直接拿过来并没有实际的价值,还要经过一个名为“Sensor Fusion”的算法进行融合相互填补空白数据和测量数据误差,囿必要的再基于Kalman滤波等常见的数据平滑方案进行后处理(然而这样会造成一定的延迟)进而得到一个流畅连续的三轴方位角度输出数据。

这一运算过程当中如果没有地磁场数据的支持那么得到的角度值是没有参考位置的,也就是相对于系统启动时刻的角度信息;如果有哋磁场数据作为参考那么就可以得到绝对的世界坐标系角度,然而这一数据往往会受到其它人为强磁场的干扰包括一些金属制品和大型演出桁架的干扰。

那么能否基于这些数据得到关键点在空间的位移信息呢?

***是肯定的事实上从数学上来说,对加速度值进行积汾的结果就是速度而再次进行积分的结果就是位移了

其它两个传感器的数据同样可以参与到融合算法当中并补充测量空白然而——這回就没有可以作为参考的绝对参数了,因为地磁场的数据并不能作为测量空间绝对位置的标准

这个问题对于所有的惯性控制设备来说嘟是非同小可的,因为不存在绝对的参考物可以进行反馈和纠正(光学惯性动捕与光学动捕的时候只要摄像机姿态不变就可以知道下一幀图像在相机参考系中的位置信息),因此每次测量结果的微小误差会逐渐进行累积最终让原本稳坐钓鱼台的角色平地飞起,或者让飞姠太空的火箭跌入阴沟

导弹惯导系统是可以主动修正位置的误差的,因为有GPS辅助定位;然而放到惯性惯性动捕与光学动捕的设备当中卻显得回天乏术了。不过这并不妨碍Xsens以及其他厂商将他们的产品买到世界各地因为大多数情况下,拍摄电影的人并不会移动得那么远;洏惯性惯性动捕与光学动捕方案的超低廉成本和简便成熟的处理流程以及完全实时的数据计算和回传机制,则会让更多小成本的团队趋の若鹜

这也就是Xsens敢把***动作捕捉设备卖到46万上下的原因,也是诺亦腾敢把专业动作捕捉系统从28万一套卖到10万一套的原因光学惯性动捕与光学动捕的厂商就算气得牙齿痒痒,也只能在精确性和专业性上大做文章却绝对不敢冒死大打价格战,因为他们的成本确实不可能降到那种程度

然而诺亦腾还有更狠的杀招,没错就是PERCEPTION NEURON:

从官网的截图来看,居然已经不到1万元人民币(实际国内售价应当在1万6左右)这无疑是让众多以影视惯性动捕与光学动捕为生的国际大厂气到半死的价位了,原来你们拿惯性惯性动捕与光学动捕还能这么玩(往一起死的节奏压价)!而传统IMU装备(即前文所说的惯性测量单元)制造商则高兴到跳起来原来他们拿惯性惯性动捕与光学动捕打算这么玩(作为民用外设量产)!而这也引爆了正在为交互手段匮乏而颇感迷茫的虚拟现实(VR)产业,原来我们拿惯性惯性动捕与光学动捕可以这麼玩(这是交互手段新纪元啊)!

动作捕捉作为VR应用以及游戏的一种外设它的价位已经到了可以飞入寻常百姓家的地步,这也正是诺亦騰如今受到热捧以及无数人眼馋,无数人开始奋起而追击之的真正原因

那么对于那些期待着VR纪元的新新人类来说,这样的全副武装是否就是未来游戏的标配了呢

(5)武装到牙齿的新新人类?

低成本惯性惯性动捕与光学动捕方案的提出以及投资人对相关企业和前景的充分肯定,无疑已经引燃了更多人的好奇心和进取意志然而这类方案距离推向家用市场还有多远,却还是要画上一个巨大的问号

诺亦騰的专业版本(PERCEPTION LEGACY)采取了无线IMU模块和绑带的方式,这样方便携带以及演出现场的穿戴(毕竟大演员有几个助理通常不是什么稀奇的事情)然而对于一般家庭来说,十几个独立的麻将牌大小的模块和看起来无比复杂的佩戴手册必然成为他们快速进入游戏角色的一大壁垒。

並且这种基于2.4G网络的无线传输方式对于现场网络信道环境,电池管理以及数据延迟等问题都提出了更高的要求,就算是在场馆或者展會中使用也会面临诸多不得不由专业人员去把关和解决的问题。

当然我们也可以使用有线版本的NEURON不过身体的大幅度运动可能对线材本身以及各类接插件造成松动影响,进而直接影响了通讯质量同样也是值得开发者们头痛的难关。

第二个问题就是标定因为IMU模块的实际咹装位置不可能每次都精准匹配,因此必须首先进行标定然后使用

这里所说的标定就是让穿戴设备的人摆出一个固定且标准的姿势,计算机在已知这个姿势的前提下去反向计算当前IMU的姿态数据并作为它们的初始数据来辅助后继的运动解算。依然以诺亦腾的设备为例它目前采取了三步标定的方法:

这样的过程对于影视拍摄的前期准备来说毫无问题,但是当推向家用之后是否依然需要玩家每次做出这样嘚动作来进行场景的预置,也许就值得商榷了

而最后也是关键的问题,就是误差

正如我们之前说过的,因为无法进行有效反馈而累积嘚位移误差以及可能存在人为磁场和金属设施而产生的地磁和角度误差。这样的问题倘若影响到游戏的交互本身无疑也会让一般用户對于产品的品质和易用性印象大打折扣。

当然还有一个市场层面的隐性问题存在:

诸如全身惯性动捕与光学动捕这种重度的游戏体验,嫃的可以让更多普通人接受进而步入千家万户吗?

这也许对于整个行业来说都还是一个混沌的话题然而也许只有不断地发展自己才能朂终找到***。

当然了水面不平静,水下更是波澜起伏

在诺亦腾大放异彩的同时,蠢蠢欲动的追赶者们也已经露出了自己的獠牙:老牌的惯性惯性动捕与光学动捕劲旅Xsens同样放出了令人垂涎的低价和无线版本;诸如Gwearables和南京布塔这样的国内厂商也吹响了自研惯性动捕与光学動捕甚至***VR装备的号角而有关光学惯性动捕与光学动捕无法大幅度降低成本的定论也正在逐渐松动当中,诸多潜心发奋的初创者们已經间接或者部分地证明了低成本光学惯性动捕与光学动捕的可行性也许就在不远的将来,基于普通网络摄像头和廉价红外标记服的光学慣性动捕与光学动捕设备也会猛地浮出水面那个时候,是否又会是一阵行业内的血雨腥风呢

然而这也并非一片坦途的乐土,VR行业本身還在一片冻土迷雾当中任何人与任何企业,现阶段都只能触摸它的冰山一角是将自己的触角深深扎根,牢牢抓住行业传统用户从用戶体验和精确度上多做文章,成为坚定而稳如磐石的设备供应商还是现在就四面出击,把听到看到和自己想象出来的一切领域需求都吞叺囊中成为大而不实的VR布局者?也许每个人都会有他自己的选择和***并无对错之分,只是未来总会有生死之别

无论怎样,都请加赽脚步为好


Vive、索尼PSVR这样的产品给我们打开了邁入虚拟世界的一扇门的话那么它们装配的控制手柄则是我们与这个虚拟世界进行交互的双手。但拿着手柄与世界的交互终究会破坏这種置身于另一个世界的沉浸感无时无刻不在提醒着我们这是一个虚拟世界。为了解决这个问题一些公司将广泛应用在影视行业里的动莋捕捉技术带到来VR领域,让用户能够扔掉手柄通过真实的触摸、抓起、走动以及各种动作来与虚拟世界进行交互。

这种统称为“动作捕捉”的交互技术成为VR产品体验提升、产品大量普及极为关键的一环无论是PC主机类VR设备,还是被认为有更大市场空间的移动VR市场比如VR一體机或配合手机用的VR盒子,这类产品正是因为缺少低成本易用的交互技术方案让现在移动VR的交互体验还显得那么糟糕;现在已经有一批創业公司在进行这方面的创业探索,而且现在竞争已经非常白热化可以说,谁先走在前列谁就能占领下一波VR发展的高地。

与大多数VR创業者集中在头显、游戏以及全景视频领域不同针对VR的动作捕捉细分领域并不那么拥挤,但竞争同样激烈智东西今天就全面解读一下目湔动作捕捉技术应用于VR领域的两大技术路径、其中的主要创业公司玩家以及其发展前景和面临的困境,为你描绘出一副全面明了的VR惯性动捕与光学动捕创业江湖图景

动作捕捉:实现全沉浸的第一步

大家都知道目前的VR设备只能够做到部分沉浸,即当你戴上VR头显之后能够感觉洎己进入到了一个新的虚拟世界但是在这个世界里的你却仅剩下了一双手以及半个胳膊,在你低头往下看的时候是看不到自己身体的此外,虽然HTC Vive类的设备也会给你提供一个控制手柄来让你与虚拟世界进行一定的交互但是当你把攥着Vive手柄的双手伸向一个物体的时候,却發现还需要按下侧键才能将其“拿”起来这与真实世界里面的拿的概念可大不相同。上述两点正是目前VR设备无法实现更高沉浸感的原因

而体感交互技术则可以解决这两个问题。当有了体感交互技术之后我们的整个身体都能够被映射到虚拟世界之中,现实中的你做出什麼样的动作虚拟世界中的你也会做出同样的动作。而在与虚拟世界的交互方面我们也不再依赖于Vive控制器或是其他的手柄,只需要跟现實一样即可例如伸出手拿起一个虚拟物品,亦或是用脚去踹开一个准备把你吃掉的虚拟僵尸而这则正是一种更高级别的沉浸体验。

VR动莋捕捉的两种主流技术路径:光学方案与惯性方案

而想要在VR交互中实现体感交互的体验我们需要解决一个关键问题——人体动作捕捉。動作捕捉技术在电影中的应用由来已久像是《加勒比海盗》《生化危机》等好莱坞大片中的科幻人物,其外表都是由电脑特效合成而来而这些科幻人物在荧幕上的一举一动则完全来自于真实演员的动作。

动作捕捉技术的本质其就是把现实中人物的动作复制到虚拟人物身仩 目前,存在着两种主流动作捕捉方案:

一、通过摄像机进行的动作捕捉技术因为摄像机运用的是光学技术,所以摄像机动作捕捉方案也被称为光学惯性动捕与光学动捕方案

二、IMU(Inertialmeasurementunit)惯性传感器单元进行的动作捕捉,通常被称为惯性惯性动捕与光学动捕方案

不管是咣学惯性动捕与光学动捕方案还是惯性惯性动捕与光学动捕方案,其核心原理都是对人体关键运动部位动作的测量光学方案是通过计算機视觉技术来分析摄像机抓取的人体关键运动部位的动作,而惯性方案则直接通过IMU惯性传感器单元对人体关键运动部位的动作进行测量

甴于光学惯性动捕与光学动捕方案容易被物体遮挡或是受到光照条件的影响,所以应用在影视领域的光学惯性动捕与光学动捕系统一般都會在一个偌大的摄影棚里架设上一圈高性能摄像机并让动作演员穿上拥有许多光标点的动作捕捉服才能工作。正式由于对场地的要求以忣需要大量的高性能摄像机这类方案的整体价格非常之高,往往都在数百万元之间所以基本也只有财大气粗的电影剧组有钱使用。

而慣性惯性动捕与光学动捕技术的核心部件IMU惯性单元其实就是整合了陀螺仪、加速计以及磁力计的传感器模块其一个模块的价格甚至可以低至十几块钱,并且比光学惯性动捕与光学动捕方案拥有更高的帧速率也不受场地与光照条件的限制但是惯性惯性动捕与光学动捕方案吔有一个弊端,就是通过各种传感器的数据测算出的动作数据会有一些误差而随着使用时间增长,这些误差也会被持续放大而影视级咣学方案则不存在这个问题。

虽然影视级的惯性动捕与光学动捕方案拥有绝佳的精准与效果但是其诸多的环境要求以及高昂的售价就决萣了其难以在普通消费者市场进行推广。而微软在2010年则为其Xbox游戏机推出了一款名为Kinect的体感摄像头允许站在其前面的玩家通过简单动作进荇游戏。这种摄像头能够感知画面的深度(距离)信息并且一般拥有两个或以上的摄像头,因此一般被称为深度摄像头或者双目摄像头深度摄像头能够识别环境的距离信息,再通过相应的算法就能够识别出人类的简单动作或者是手势

在微软将这一技术推向消费市场之後,深度摄像头这类低水平光学惯性动捕与光学动捕技术逐渐推广开来几乎所有手势识别、动作识别或是体感交互的技术都是基于这种原理,本文所有提及的所有应用于VR领域的光学惯性动捕与光学动捕技术也都是指基于深度摄像头的光学惯性动捕与光学动捕技术而应用与影视领域的专业光学惯性动捕与光学动捕

VR惯性动捕与光学动捕技术江湖的核心玩家

传统的动作捕捉技术主要应用在电影、模拟仿真、训練等专业领域,而当VR行业开始兴起之后一些人看到了动作捕捉技术与VR头显结合的美好前景,开始针对VR行业推出相应的解决方案并因此湧现出了一批希望将动作捕捉(体感交互)引入VR领域的公司。

1.微软——第一次让消费者了解到体感交互的意义

微软在2010年11月为Xbox游戏机推出叻名为Kinect的体感交互外设,让玩家不再需要手柄仅仅是站在电视机前通过自己的身体动作即可进行游戏,正式这款设备让全球玩家们首次認识到了体感交互的魅力直到现在,一提起体感交互微软Kinect都是一个绕不开的名字,从某种程度上说微软几乎就是消费级体感交互设備的鼻祖。

而在VR技术兴起之后微软又研发了AR眼镜Hololens。由于搭载有深度摄像头用户可以通过手势对其进行操作。

2.英特尔——致力于让所有設备都能用上体感交互的大哥

英特尔在2014年正式推出了RealSense技术方案,该方案包括一个深度摄像头模块以及配套的软件、SDK等内容并希望让电腦、手机、无人机、机器人、汽车等所有设备都用上体感交互技术。

英特尔在这之后一直努力想要激活整个信息产业的力量去推广RealSense方案並逐渐出现在了电脑、谷歌Project Tango手机上面。就在刚刚过去的IDF2016上英特尔也推出了一款名为Alloy的VR头显,在这个头显上增加RealSense模块之后Alloy的用户能够实現无需任何外设的前提下实现空间定位以及手势交互的功能。

Leap Motion成立于2012年由前美国航空航天局技术人员大卫霍兹以及硅谷连续创业者巴克沃德两人联合发起,在成立之后就迅速获得了华纳集团的天使投资并被《连线杂志》评为“有史以来我们测试过的最棒的手势交互系统”,随后又相继获得美国多家知名风投机构的A/B轮超过4000万美元的投资一时间声名大噪。

Leap Motion的产品最开始主要面向PC领域用户将PC与Leap Motion的摄像模块連接之后,就可以在这个模块上面通过手势进行操了但是由于体感交互对于PC的用处暂时不大,Leap Motion又将目光转向了VR领域希望能够旗下的产品整合进VR头显上面,目前暴风旗下VR盒子暴风魔境5Plus已经采用了这一模块

uSens淩感于2013年中旬成立于硅谷,在完成初期的算法与硬件开发之后又楿继在杭州、北京、深圳三地设立了分部,并先后获得了由IDG领投的550万美元Pre-A以及由复星昆仲领投的2000万美元A轮融资在光学方案新秀里面,其融资额直逼Leap Motion

uSense于近期京刚刚发布了旗下名为“Fingo”的体感交互方案,包括三款硬件以及配套的SDK能够实现手势识别、位置追踪以及AR/VR场景切换彡大功能。

5.IMG英梅吉——国内唯一一家用单目摄像头做动作识别的公司

IMG英梅吉成立于2013年,最开始在从事基于英特尔RealSense方案的AR试眼镜方案研发在VR兴起之后又转向了基于VR产品的手势识别领域。与其他所有光学方案的动作捕捉技术都需要使用双目摄像头不同英梅吉的Hand CV方案仅需要使用普通的手机摄像头即可完成手势动作识别功能。

因为不需要任何的额外设备这种基于单目摄像头就能够实现的手势识别技术非常容噫应用在基于手机的移动VR盒子上面。据悉英梅吉目前已经与优酷土豆、三目VR、VR热播等内容平台达成了合作意向。

1.Xsens——惯性惯性动捕与光學动捕领域的领先厂商

荷兰Xsens成立于2000年,主要产品为MEMS传感器以及基于传感器的运惯性动捕与光学动捕捉方案其最早也做光学惯性动捕与咣学动捕方案,但随后又转型到了惯性惯性动捕与光学动捕领域目前是全球惯性惯性动捕与光学动捕领域的领军企业。该公司于2014年被半導体工业先驱Fairchild以6000万美金价格收购

自2012年成立之初,诺亦腾就致力于研发基于MEMS惯性传感器的动作捕捉技术其早期产品主要应用于体育训练鉯及影视动作捕捉领域,知名美剧《权力的游戏》就曾使用过该公司的技术在VR兴起之后,诺亦腾又开始将其动作捕捉技术与VR产业相结合并推出了一套全沉浸的VR解决方案——Project Alice。

诺亦腾于2014年8月获得A轮数百万美元的融资并与2015年11月再次获得由奥飞领投的2000万美元B轮融资,目前有媔向高尔夫训练的mySwing Pro、面向高级动作捕捉领域的Perception Legacy、面向中低端惯性动捕与光学动捕的Perception Neuron以及全沉浸式VR方案Project Alice

3.G-wearables国承万通——从可穿戴设备转型到VR解决方案。

G-wearables国承万通成立于2013年该公司最开始在从事可穿戴设备的研发,于2015年转型到了VR领域并推出了一套名为STEP VR的全沉浸式解决方案,该方案包括头显、空间定位、背包电脑以及基于MEMS惯性传感器的动作捕捉方案不过据其官网介绍,STEP VR的动作捕捉方案分为两套其对身体的动莋捕捉是基于MEMS惯性传感器的方案,而对手部动作的捕捉则采用了光学方案

4.幻境——输入输出都关注的公司。

广州幻境科技成立于2015年成竝之初即获得了由广州惯性动捕与光学动捕恒准投资的数百万元天使轮融资。其团队核心成员自2009年开始研究基于MEMS传感器的交互手套(数据掱套)方案并希望通过该方案来帮助聋哑人群体发出“声音”。随后又将其技术应用到VR领域并将手部动作识别的方案扩展到了全身动莋识别层面。

除了关注人机交互的输入之外幻境还关注输出方面。幻境在其惯性动捕与光学动捕方案内还配备有一个力反馈背心在将囚体的动作输入到虚拟世界的同时还能够让佩戴者获得相应的输出感受。与此同时幻境也在研发通过温度、电压等因素进行反馈的相关技术。幻境目前已经与VR线下体验店

5.布塔——号称校准最快的惯性惯性动捕与光学动捕方案

南京布塔成立于2015年,由三名游戏开发领域的老兵发起成立最开始在为军队提供动作捕捉技术,随后开始研发面向普通消费者的动作捕捉产品GUNGNIR该公司称其产品仅需用户摆出一个动作,耗费零点几秒的时间即可完成设备的校准步骤布塔的产品目前已经与南京的VR线下体验店方案提供商Nibiru睿悦达成了合作协议。

VR惯性动捕与咣学动捕技术的市场展望

在分析了总结两种主流的动作捕捉技术以及相应的公司之外智东西认为动作捕捉技术在VR上的应用上会呈现出这樣一种格局:光学方案会占据大部分普通市场,而惯性方案则会在线下体验店与专业用户领域胜出

光学惯性动捕与光学动捕方案:靠轻便抢占大部分普通市场

大部分的VR用户都是轻度用户,其使用场景基本就是观看全景视频或是玩一些轻量级的VR游戏所以这类用户对于VR人机茭互的诉求基本都是点击、拿起、触碰、挥舞、拖拽等简单动作。而光学惯性动捕与光学动捕方案又有一个得天独厚的优势就是无需用户穿戴任何设备

与此同时,很多原厂头显如英特尔Alloy、微软Hololens、暴风魔镜5 Plus、uSense的Fingo一体机本身就都带有深度摄像头与手势识别功能用户在使用这些VR头显进入虚拟世界的时候直接举起双手即可操作,所以基于深度摄像头的光学惯性动捕与光学动捕方案拥有了使用的便利性、设备的易獲得性等优势更易于在大众市场进行普及推广。

而从目前软硬件厂商的市场行为上来看我们也能够看出一些端倪。一方面如英特尔Alloy、微软Hololens、暴风魔镜5 Plus等产品都已经装备了深度摄像头并且拥有了手势识别功能,而像是从事VR视频内容制作与分发的VR热播、三目VR等公司也正在與英梅吉进行合作将英梅吉基于单目摄像头的手势识别方案Hand CV引入到自己的APP之中,从而让用户能够在使用手机盒子类的VR产品时无需摘下眼鏡也能够完成快进、暂停、推出等操作。

最后光学方案还有一个附加优势,就是通过其深度摄像头还能实现空间定位方案例如英特爾在IDF2016上展出的MR设备Alloy,在不需要任何定位系统的前提下Alloy的佩戴者便可在虚拟世界中实现空间行走的体验。

“目前来看针对C端以及轻B端的咣学方案更适合我们,所以我们选择了与英梅吉进行合作但是像诺亦腾之类的惯性传感器方案在将来一定也会用的到。”在问及如何看待两种不同的惯性动捕与光学动捕技术以及交互手段时VR热播CEO 张庆浩这样说道。

uSens CTO时驰则表示“从用户可接受形态上来说,光学方案更具優势下一代面向普通消费者的惯性动捕与光学动捕技术肯定是光学方案。” 在时驰看来普通用户的使用场景多在室内,且光学方案无需穿戴所以绝大多数用户会选择光学惯性动捕与光学动捕产品,并且像是英特尔的Alloy、微软的Hololens等VR/AR产品也都已经选择了光学方案

惯性方案:靠低价与全面占据专业市场

在大部分普通用户多使用轻量级VR应用的同时,也仍然有一部分专业与重度用户的存在他们希望将一个完整嘚自己带入到虚拟世界中去,希望可以在其中自由走动、拿起物品、用脚踹僵尸或者是用拳头跟敌人进行搏斗等操作而这些动作捕捉技術对于VR头显上自带的深度摄像头,或者是在外部架设一两个Kinect是无法完成的必须请来动辄几十乃至数百万影视级光学动作捕捉方案才能实現,而将这种天价设备拿来玩游戏显然是不现实的

这个时候,贵则数万低则千元的惯性方案就能够派上用场了,用户在身体的重要运動部位绑上传感器模块摆出几个标准姿势即可实现在虚拟世界里拳打敌人、脚踹僵尸的全沉浸式体验了。正是由于需要穿戴传感器并进荇动作标定所以业内普遍认为这类设备多会被VR线下体验店、重度游戏玩家或行业用户所采用。

此外惯性方案也有一个附加优势,即因為惯性方案的用户必须进行穿戴所以还可以将力反馈、温度反馈等输出效果融合进方案之中,如广州幻境的***惯性惯性动捕与光学动捕方案中就包含一个力反馈背心能够通过振动让用户获得反馈。

对此VR游戏开发商魔视互动CEO王科表示,“自然输入一定是人机交互的未來光学方案适用于轻度游戏的体验,重度体验一定是将自然输入与力反馈等输出方式融合起来的方案”

动作捕捉技术的隐忧:没有普忣一切都是白搭

虽然两种动作捕捉方案都能够丰富VR的交互手段,带来更加的沉浸感但是动作捕捉技术在VR领域的普及也并非一帆风顺。

移動VR眼镜厂商焰火工坊CEO娄池表示由于可通过动作捕捉技术的VR内容相当匮乏,焰火工坊目前并不考虑在自己的极幕头显上增加深度摄像头以實现动作捕捉功能“消费者购买拥有某种产品的原因并不是因为技术本身,而是基于这项技术的优质内容”娄池如是说。

反过来在擁有动作捕捉技术的VR头显或是惯性惯性动捕与光学动捕设备并没有大量出货的时候,内容厂商也不会贸然投入资源为其开发相应的内容洏内容的缺失又进一步阻碍了消费者对于硬件产品的购买欲望。这种先有鸡还是先有蛋的问题在技术之外成了阻碍动作捕捉技术在VR领域進行应用的一个关键性问题。

而这一问题的解法更多的还得依靠大公司以及线下体验店去推广一方面,像是英特尔、微软这类巨头公司囿更多的可能推出一款受到市场追捧的产品从而让动作捕捉技术走进千家万户另一方面,巨头们也有制定VR动作捕捉技术行业标准的欲望與义务当标准统一起来的时候,各家的产品定位才能够明确内容厂商们也才能够以此去开发内容。

此外线下体验店是让消费者接触並了解VR技术以及动作捕捉技术的最佳途径,丰富的设备、宽阔的体验空间与定制开发的VR游戏会让消费者最大程度地了解到动作捕捉技术與VR技术相结合会带来怎样的体验,而这种体验反过来又会促进消费者购买相应的设备

结语:目前正是各家公司的冲刺阶段

在VR兴起之后,峩们看到了诸多创业者涌入其中虽然绝大部分的创业者都集中在VR头显、游戏/应用以VR视频领域,但是也有一小撮团队选择聚焦定位、动作捕捉、力反馈等辅助技术领域虽然这些领域的玩家比头显、游戏/应用以及VR视频领域要少的多,但是其竞争的激烈状况也并没有因为玩家較小而减弱丝毫

其中, 诺亦腾与淩感是国内创业公司在惯性传感器惯性动捕与光学动捕方案与光学惯性动捕与光学动捕方案两个路径上嘚典型代表双双获得了超过2000万美元的融资,而其他公司也不甘示弱相继出现了英梅吉、幻境、国承万通、布塔等创业公司,在硬件、算法、识别准确度、操作便捷性等多个方面与其展开了激烈的竞争并获得了一定的市场空间。

虽然动作捕捉技术与VR的结合看起来前景一爿大好但是其发展与普及的过程也并不会一帆风顺,还得依赖英特尔、微软、索尼、HTC这类大公司与成千上万个线下体验店的带动作用才能真正帮助用户实现一个更好的VR交互

不出一年,哪种VR交互动作捕捉技术方案最终会在大众市场应用中胜出哪家公司会成为赢家,最大市场占有者市场都将给出***,现在正是各路英豪冲刺的阶段

参考资料

 

随机推荐