多视角4D人脸扫描系统给AI装一双“慧眼”

发布时间: 2024-05-09 07:05:26 来源：光明网

观看：212

图像识别、智能助手、虚拟人、文生视频……技术的发展和创新让人们进一步向智能时代迈进。然而，目前运用人工智能（AI）技术呈现的图像画面大多是二维效果，在空间、时间和细节方面仍有较大上升空间。

如何为AI装一双“慧眼”，让画面更清、更细、更自然？

近日，《中国科学报》记者从中国科学院深圳先进技术研究院（以下简称深圳先进院）了解到，该院集成技术研究所（以下简称集成所）机器视觉研究中心研究员宋展团队自主研发出多视角4D高精度人脸三维成像系统。相较传统的3D人脸扫描技术，该系统在精度、分辨率和速度上均实现大幅提升，可应用领域包括但不限于人脸识别、医疗诊断、影视特效等。

　　人脸扫描更快、更清、更细

据介绍，研究团队开发的多视角4D人脸扫描系统，由3个不同近红外波段的结构光相机构成，底层算法采用团队提出的高频条纹位移编码三维重建方法，可以实现1080P（1920×1080像素）分辨率下超过100帧每秒的三维扫描速度，基于GPU的高并行三维重建算法可实现高达300赫兹的实时重建速度，且深度成像误差小于0.05毫米。

“每个深度相机都由一个近红外结构光投影光栅和一个工业相机组成。深度相机每重建一次，投影仪都要向被测物体投射一组预设高频条纹图案，并用相机拍下它们在被测物体上产生变形的图案。最终，根据相机拍到的变形图案分析得到深度信息，即3D信息。深度相机实现连续扫描，增加了时间轴信息，由此得到4D信息。”深圳先进院集成所在读硕士生吴迪解释说。

此外，为实现多角度更为完整的三维人脸动态成像，该系统采用3种不同波段的近红外光作为光源，既能避免人脸产生炫目，又能避免3套设备投影仪投射的图案相互干扰，大大改善了成像完整性。

“近红外光对人眼友好，但对皮肤具有一定的穿透性，使得投射的高频光栅图案模糊，降低了三维重建精度。”宋展表示。对此，研究团队采用了创新的图像增强算法，结合高鲁棒性的条纹编解码算法突破，提高了解码投射图案的相位计算精度，从而提高了三维重建精度。与此同时，研究团队还要考虑算法的实时性和并行性，为3D动态模型获取、头部姿态估计和面部表情迁移等基础工作的研究提供高精度数据支持。

　　支撑AI生成更高质量三维数据

宋展介绍，该系统在多个领域应用前景广阔。例如，在新型显示技术领域，有望为全息投影、空气成像等新型显示技术以及AR显示终端，提供三维数据采集设备；在影视领域，可实时捕捉演员的高精度面部表情，结合表情迁移技术，实现从真人的表情到卡通形象的表情迁移；在游戏领域，可捕捉用户面部信息，结合视线追踪技术，实现人机交互；在医疗领域，可帮助提供患者面部表情信息，助力医疗诊断等；在人形机器人领域，可为机器人提供更加精确、敏锐的4D视觉感知方法，让其从只能干粗活变成干更多精细活。

AI技术的发展，很大程度上依赖于数据驱动。

“二维平面上生成的图像或视频往往难以呈现真实世界的三维结构，未来，AI技术生成的视频将逐渐从二维向三维发展。想要生成更高质量的三维视频，离不开三维数据的支撑。”宋展说。

该系统可以为“3D+AI”研究提供真实、精细的高质量三维数据，解决目前该研究领域高精度三维数据不足的问题，为AI模型生成更高质量的视频提供实时、高精度、高分辨率的数据支撑。

据了解，目前，研究团队已将该技术运用于电影特效、特种加工、面部3D诊疗、动态3D视觉引导装配等方面，并取得了良好的效果。

未来，研究团队将进一步加强底层算法研究，提高编码效率成像速度，降低硬件成本，研制模块化高时空分辨率4D成像器件，并将其应用于工业和信息通信等更多领域，为新质生产力发展提供锐利的视觉成像技术支撑。

图像识别、智能助手、虚拟人、文生视频……技术的发展和创新让人们进一步向智能时代迈进。然而，目前运用人工智能（AI）技术呈现的图像画面大多是二维效果，在空间、时间和细节方面仍有较大上升空间。

如何为AI装一双“慧眼”，让画面更清、更细、更自然？

近日，《中国科学报》记者从中国科学院深圳先进技术研究院（以下简称深圳先进院）了解到，该院集成技术研究所（以下简称集成所）机器视觉研究中心研究员宋展团队自主研发出多视角4D高精度人脸三维成像系统。相较传统的3D人脸扫描技术，该系统在精度、分辨率和速度上均实现大幅提升，可应用领域包括但不限于人脸识别、医疗诊断、影视特效等。

　　人脸扫描更快、更清、更细

据介绍，研究团队开发的多视角4D人脸扫描系统，由3个不同近红外波段的结构光相机构成，底层算法采用团队提出的高频条纹位移编码三维重建方法，可以实现1080P（1920×1080像素）分辨率下超过100帧每秒的三维扫描速度，基于GPU的高并行三维重建算法可实现高达300赫兹的实时重建速度，且深度成像误差小于0.05毫米。

“每个深度相机都由一个近红外结构光投影光栅和一个工业相机组成。深度相机每重建一次，投影仪都要向被测物体投射一组预设高频条纹图案，并用相机拍下它们在被测物体上产生变形的图案。最终，根据相机拍到的变形图案分析得到深度信息，即3D信息。深度相机实现连续扫描，增加了时间轴信息，由此得到4D信息。”深圳先进院集成所在读硕士生吴迪解释说。

此外，为实现多角度更为完整的三维人脸动态成像，该系统采用3种不同波段的近红外光作为光源，既能避免人脸产生炫目，又能避免3套设备投影仪投射的图案相互干扰，大大改善了成像完整性。

“近红外光对人眼友好，但对皮肤具有一定的穿透性，使得投射的高频光栅图案模糊，降低了三维重建精度。”宋展表示。对此，研究团队采用了创新的图像增强算法，结合高鲁棒性的条纹编解码算法突破，提高了解码投射图案的相位计算精度，从而提高了三维重建精度。与此同时，研究团队还要考虑算法的实时性和并行性，为3D动态模型获取、头部姿态估计和面部表情迁移等基础工作的研究提供高精度数据支持。

　　支撑AI生成更高质量三维数据

宋展介绍，该系统在多个领域应用前景广阔。例如，在新型显示技术领域，有望为全息投影、空气成像等新型显示技术以及AR显示终端，提供三维数据采集设备；在影视领域，可实时捕捉演员的高精度面部表情，结合表情迁移技术，实现从真人的表情到卡通形象的表情迁移；在游戏领域，可捕捉用户面部信息，结合视线追踪技术，实现人机交互；在医疗领域，可帮助提供患者面部表情信息，助力医疗诊断等；在人形机器人领域，可为机器人提供更加精确、敏锐的4D视觉感知方法，让其从只能干粗活变成干更多精细活。

AI技术的发展，很大程度上依赖于数据驱动。

“二维平面上生成的图像或视频往往难以呈现真实世界的三维结构，未来，AI技术生成的视频将逐渐从二维向三维发展。想要生成更高质量的三维视频，离不开三维数据的支撑。”宋展说。

该系统可以为“3D+AI”研究提供真实、精细的高质量三维数据，解决目前该研究领域高精度三维数据不足的问题，为AI模型生成更高质量的视频提供实时、高精度、高分辨率的数据支撑。

据了解，目前，研究团队已将该技术运用于电影特效、特种加工、面部3D诊疗、动态3D视觉引导装配等方面，并取得了良好的效果。

未来，研究团队将进一步加强底层算法研究，提高编码效率成像速度，降低硬件成本，研制模块化高时空分辨率4D成像器件，并将其应用于工业和信息通信等更多领域，为新质生产力发展提供锐利的视觉成像技术支撑。

日前，盛世盈创氢能科技（陕西）有限公司（以下简称盛世盈创）与协氢（上海）新能源科技有限公司宣布达成战略合作，共同推进风冷氢燃料电池电堆全自动化生产线（以下简称风冷堆）的研发与生产。双方协议，将建设目据英国《泰晤士报》网站3月15日报道，2020年1月，英国帝国理工学院的亚当·汉普希尔与英国广播公司合作，对8万人进行了30分钟的测试，目的是揭示生活方式的改变会影响我们的大脑功能。三个月 3月21日记者从中国科学技术大学获悉，该校物理学院张斗国教授课题组，提出并实现了一种基于矢量光场调控原理的动量空间偏振滤波器件。科研人员将该滤波器件安装于传统无标记光学显微镜的出射端，记者3月21日获悉，商汤科技与遥感数据平台吉林一号网、四维地球、星图地球等展开合作，此举标志着“SenseEarth智能遥感云”平台数据源全面升级，将为行业用户提供更完善、精准的一体化的高分辨率记者从中国航天科技集团获悉，3月21日13时27分，长征二号丁运载火箭/远征三号上面级在酒泉卫星发射中心起飞，随后将云海二号02组卫星送入预定轨道，发射任务取得圆满成功。云海二号02组卫星由中国航有消息称，iPhone在中国寻找本土生成式AI提供方，iPhone讨论了在中国的设备中使用百度的人工智能技术。据《华尔街日报》报道，iPhone与百度进行了谈判，以授权其型号。这可能是为了向中国的iPhone客户提。

本文链接：多视角4D人脸扫描系统给AI装一双“慧眼”http://www.sushuapos.com/show-2-5759-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：科学家首次实现大鼠胎间移植

下一篇：三星取代苹果成出货量最多厂商，分析师解读一季度全球手机市场

多视角4D人脸扫描系统给AI装一双“慧眼”

热门资讯

推荐资讯

科技最热文章

多视角4D人脸扫描系统 给AI装一双“慧眼”

热门资讯

推荐资讯

科技最热文章

多视角4D人脸扫描系统给AI装一双“慧眼”