2017年,苹果首次将3D摄像头采用在智能手机中,从而带动整个3D摄像头产业快速发展,不仅仅海外厂商积极布局该市场,在国内A股市场,同样引发了一场资本高潮,这背后折射出的是3D摄像头未来前景的美好。
到了2018年,国产手机厂商OPPO首次将3D摄像头应用在了安卓手机阵营,这也意味着安卓手机阵营证实开启了3D世界的大门。然而,对于整个3D感知市场而言,让消费者真心买账并不只是把2D摄像头替换为3D摄像头那么简单。
3D视觉和感知技术在手机行业的应用需要硬件、算法、应用等各个层面的协作贯通,才能为消费者打造更为完美的体验。从目前行业的大趋势来看,3D与AI技术的结合给了手机厂商们一个好的切入点。
日前,中国人工智能企业旷视科技Face++就发起了一场“3D视觉产业先锋研讨会”,从硬件设计、解决方案、算法创新到应用开发四个层面,阐释了旷视最新、最全面的“AI+3D”发展脉络,同时联手上下游企业打造生态链,以为业界提供“软硬一体”的移动端3D感知全栈解决方案。
但是旷视的野心不止于此,依托业界顶尖的研发实力和软硬一体整合解决方案两大优势,他们还希望通过整合行业上下游资源,将软硬一体的智能3D解决方案应用在更多行业领域,赋能更多消费终端,让3D真正进入到人类世界的各个角落。
移动端3D产业爆发 供应链厂商积极抢进
据透露,其实苹果早在2016年便开始研究3D结构光方案,但因为市场不够成熟而推迟到了2017年。
其实安卓市场的3D觉醒也早有端倪,有消息称,小米、OPPO、vivo原本都计划在去年第四季度发布搭载3D传感器、支持高级面部识别的手机,但受制于3D摄像头供应不足难题,不得不推迟到今年上半年。
但是苹果今年在3D技术的动作上更加激进:据The Inquirer爆料,苹果2018年秋季新品发布会发布的三款iPhone手机将全部支持Face ID解锁,而传说中的iPhone X Plus也将拥有“第二代”3D扫描技术,同时,苹果iOS 12系统将对Face ID升级,支持横向Face ID解锁。
苹果在其移动端普及3D技术对整个3D感知市场起势形成了里程碑式的意义,也激发了安卓阵营技术革命热潮。首先硬件层面,国内一大批摄像头产业企业均在大力布局3D摄像头产业,如AMS、奥比中光、欧菲、瑞声科技、大立光、舜宇及信利等,各家方案各有利弊。
其中AMS晶圆级镜头优势明显,是iPhone X的前置3D感测WLO晶圆级镜头供应商,而瑞声科技重点布局混合镜头,玻璃晶圆级镜片极具优势;大立光优势在塑料镜头端,但也有玻璃产能;舜宇光学TOF、散斑结构光、编码结构光三大主流方案均有量产…
而在去年第三季度,高通就和奇景光电共同宣布,将会结合两者的技术,一起推出3D摄像头系统解决方案(但是由于高通的调试进度并不理想,原本计划一季度量产的进度恐怕有所拖延);除此以外,进入2018年后,汇顶科技与信维通信也宣布进军3D摄像头产业,侧重研发VCSEL和DOE衍射元件。整体看来,随着供应链厂商的高度集中,3D感知市场正在逐渐爆发。
3D与AI结合为必然趋势 核心在于打造生态链
随着消费级终端3D技术的爆发以及在市场的应用进一步推广,我们会发现,3D感知技术与AI技术的结合十分紧密,而这也将成为未来的重要发展趋势。
而作为一家以人工智能技术为核心的行业物联解决方案提供商,旷视科技致力于为全球行业用户提供领先的人工智能算法和解决方案。基于核心的深度学习和智能传感技术,旷视科技希望用AI+IoT赋能摄像头、手机、汽车等城市终端,构建数字化、智能化的物联系统,为行业用户提供真正的商业价值。
据了解,目前旷视科技业务主要分为三方面:其一是消费终端,包括OPPO、vivo、华为、小米等在内的头部的手机厂商几乎都是旷视科技的合作伙伴;其二是城市管理,包含全国各地公关安全体系,城市服务相关的征信体系等都不同程度地引入了旷视的AI产品和解决方案;其三则是商业运营,旷视科技核心是希望通过技术推动供应链及商业的运营和交易效率,覆盖零售、物流、地产等泛商业领域。
旷视科技Face++高级副总裁吴文昊
对于AI+3D的应用创新,旷视科技Face++有自己的理解——旷视科技Face++高级副总裁吴文昊表示:“我们把移动终端的计算机视觉分为三大方向,第一是跟深度学习联系最紧的识别与感知,通过深度学习算法和感知前端让机器能够认出你并感知到你的需求。
第二个大的应用方向是计算摄影,通过软件和算法反向驱动硬件的设计,传感器设计、光学设计,也就是用AI Define Camera。
第三是3D视觉本身的应用,比如三维建模等,计算机视觉本身来讲就是识别+3D,让机器感知到一切并3D化地进行还原。”简单说来,就是通过3D摄像头获取维度更高的图像信息,再通过AI为这些图像进行相关的处理与应用。
加强布局3D领域,是旷视实现AI+IoT赋能手机等智能终端的最新发展方向,也是打造未来数字化、智能化世界的重要一步。
目前旷视已经联合合作伙伴让多种先进的3D应用和解决方案成为现实,并实现大规模商用。
比如国内一线手机厂商OPPO在6月19日发布的OPPO Find X 便搭载了由旷视科技Face++提供的3D结构光人脸识别方案,这款机型是全球首款支持人脸识别支付的安卓手机,同时也标志着3D结构光技术在安卓手机中的应用开始进入量产时代。
随后,vivo也震撼发布TOF 3D超感应技术,该技术也是由旷视科技提供的3D人脸建模算法支持。
在8月8日举办的3D产业先锋研讨会中,吴文昊表示:“手机3D视觉领域虽然已有多种类型的应用案例出来,但该领域包含算法和模组的软硬一体整体解决方案仍是缺位的,旷视科技正在尝试一种从上往下的整合方案。”在旷视发布的软硬一体移动端智能3D产品解决方案中,最上面一层是3D应用层,往下依次至AI算法、解决方案,最后到摄像、传感等硬件设备设计上。可见,旷视“软硬一体”3D感知全栈解决方案的逻辑是,希望Face++能起到整合的角色,把软件、硬件、算法、应用统统整合在一起,只有整合者出现之后,整个3D落地才会大大加速。
如何具体地理解旷视“软硬一体”的3D解决方案?首先从顶层的应用层看,目前在手机3D视觉能力开发方面,旷视研发的3D人脸识别解锁和3D人像光效已经实现了大规模的应用,并且还在业内开发出全面可用的人脸支付、3D美颜、3D整形等应用。
下一步,旷视将投入到AR游戏、虚拟试穿等应用上,持续探寻3D能为手机带来的更多能力。
而在AI+3D的底层算法研发方面,旷视专注于识别和重建两个大类。第一类的识别即机器感知、理解世界的能力,也是旷视的强项所在,基于旷视自研的MegBrain深度学习引擎,旷视在人脸识别、人体识别、活体检测、注意力检测追踪及其他图像识别的算法层面拥有业界顶尖的技术实力。
第二大类所谓的重建即把识别出的物体进行三维重建,则是开发针对人、针对物的3D视觉应用核心所在,旷视目前已在人像3D建模、人体3D建模及物体几何测量算法研发方面走在世界前列,并与Bellus 3D、Altizure等3D视觉企业开展了联合研发合作。
不同的应用场景需要不同的3D视觉解决方案,旷视根据不同应用场景中对深度计算、深度修复、深度优化、标定、畸变校正等能力的需求,设计出基于双摄、三摄、深摄的丰富解决方案,在整合结构光、TOF、双目等不同的摄像、传感系统架构上拥有成熟的应用经验。
最后则是硬件层面,前文已经提及,在3D摄像头硬件供应链端,当前业界的投资十分火热;而移动端3D产业链最下面一层是硬件制造,包含摄像头、传感器、芯片及硬件模组的研发。结构光、TOF和双目方案都需要高清摄像头、IR投射器、IR接收器、激光发光器等设备的搭配组合,旷视目前已经与艾迈斯半导体(AMS)等3D硬件模组厂商展开合作,在业界率先建立起软硬一体的3D视觉技术优势。
3D产业迎来手机、算法和设备厂商的疯狂涌入,面对纷乱复杂的技术和解决方案选择,整合3D产业链上下游资源、打造软硬一体的整体解决方案成为了行业迫在眉睫的诉求,而旷视科技正在朝该方向发展解决此难题,其“软硬一体”的移动端3D感知全栈解决方案,是3D视觉领域内首个完整的从AI+3D算法到硬件再到解决方案的业务规划,正如吴文昊所强调:“手机3D科技的变革不是由旷视开启,但旷视正在用来自中国的原创科技为行业提供最前沿、最全面的3D技术,引领世界3D发展潮流。”