一线 | 旷视与Bellus3D合作 开启3D视觉方案整合

文章正文
2018-07-23 04:23

腾讯《一线》卜祥

同时成为OPPO、vivo 手机人脸解锁3D方案提供商之后,旷视科技对这一块味口大增,拟以算法为撬动杠杆,整合“变硬”,提供更全面的3D视觉解决方案,在行业中谋求更大话语权和订单量。其中一项动作是,今年年初,旷视科技已经与硅谷公司Bellus 3D接触、合作。

旷视科技高级副总裁吴文昊告诉《一线》,“不光是手机厂商此类需求被苹果标杆带动,整个行业好像火山爆发之前开始冒泡泡。”一个简单计算方法,一年出货10亿台安卓手机,第一年搭载3D人脸解锁方案的会达到千万部,第二年达到1亿,第三年达到3亿或更多。这还仅仅是手机行业的市场容量。

旷视拿到OPPO重量级产品Find X订单之后,处在一个有利位置上。据OPPO官方宣布,O-Face 3D结构光人脸解锁技术,通过结构光元器件在面部投射出15,000个识别点,即使是距离60cm远,精度也能控制在±1mm范围,给用户的面部构建一个精细完整的3D模型,误识率仅百万分之一(指纹识别误识率为五万分之一),安全性是指纹识别的20倍。

不仅仅是OPPO的结构光,还有vivo的TOF技术。在进入了vivo X20、X21机型,提供突破 2D 的人脸和图像识别技术商业化通用后,旷视科技助力vivo的TOF技术也于6月底在上海亮相。

6月27日,vivo 在2018 MWC 上海发布了 TOF 3D 超感应技术。在现场,用户只需要站上 vivo 的体验机,摇臂上搭载了 TOF 3D 超感应技术的原型机就会对用户的头部进行环形扫描,录入之后15秒就会形成一个高精度的 3D 人脸模型,轮廓和细节的把控都十分清晰,用户还可以拖动模型查看任一角度的自己。这里用到旷视科技提供的3D 视觉感知技术。

据旷视科技介绍,旷视已经做成自研 3D 算法模型结构。其中识别方案,是在旷视自有的算法模型配合十亿级人脸数据的训练和数近百万张 benchmark 测试后得出的结果,可以使旷视的3D方案在应用上的计算耗时更短、安全性更高,在一些性能的关键点上甚至优于iPhone X ,可实现0.1秒内极速识别、0.03秒重建和达百万分之一的人脸支付精度。

另外,还有3D 解锁与支付、3D 人像光效和3D 美颜与整形等。

在吴文昊看来,这些还远不够。旷视科技在这一块目标是进行软硬一体的垂直整合,可以提供整体视觉解决方案——一个模组解决方案。“模组谁生产不重要,手机厂商来指定就好了。”吴文昊说,“现在没有人有能力把软硬一体很好地整合在一起,是缺位的。”

具体思路上,与市场上一些从硬件往算法(从下往上)的整合方案不同,吴文昊和团队想尝试一种从上往下整合方案。

Bellus3D 是旷视深度合作的战略伙伴。团队与旷视颇有渊源。Bellus3D CEO Eirc Chen是台湾人,早在20年前即在苹果公司做VR项目负责人,属业界老人。他的下属之一是后来去微软的沈向洋。再后来,“沈向洋是孙剑的老板,孙剑是我们首席科学家,然后孙剑是印奇(旷视创始人)的导师。”吴文昊介绍。

旷视另一个合作团队是香港科技大学权龙教授。权龙教授的研究范畴包括人工智能、计算机视觉、三维重建、图像分析、识别与理解等。另外,旷视还与上海科技大学一个团队合作。

3D领域不论是结构光,还是TOF,整个产业链挺长,是一个全新领域。从技术角度而言,涉及到四个层面。从下往上,最下面(第一层)跟硬件强相关,含光学、传感器、芯片。仅芯片就包括主芯片,ISP和一些整体架构等,这是所有跟硬件相关的层面,包括结构光、TOF和双目等。模组硬件涉及到设计、生产和制造。

第二层是固件,是和第一层硬件强吻合的地方。举一个例子,现在双摄像头很流行,两个摄像头之间怎么协同工作,怎么样去做虚化,做美颜,两个摄像头之间怎么对准,怎么标定等,在这一层。

第三层与计算机视觉强相关,是旷视强项。可以分为两个大类,一个是识别,一个是重建。识别其实是感知,理解镜头所所看到的东西。手机上FaceID人脸解锁轻轻一瞥,涉及到人脸检测、跟踪、注意力检测、活体比对等等。另外一块是3D重建,3D重建基础是几何,是深度学习。3D美颜,3D整形,3D塑性,3D试装等,是这项技术延展性应用。

最上面第四层是应用层。应用在手机上面一个基础应用是人脸解锁,以后还会有AR游戏、虚拟试穿等等多项应用。

在这样一个关键节点上,旷视接下来想从第三层进入第二层。

文章评论
标签
热门文章