图像识别、智能助手、虚拟人、文生视频……技术的发展和创新让人们进一步向智能时代迈进。然而,目前运用人工智能(AI)技术呈现的图像画面大多是二维效果,在空间、时间和细节方面仍有较大上升空间。
如何为AI装一双“慧眼”,让画面更清、更细、更自然?
近日,《中国科学报》记者从中国科学院深圳先进技术研究院(以下简称深圳先进院)了解到,该院集成技术研究所(以下简称集成所)机器视觉研究中心研究员宋展团队自主研发出多视角4D高精度人脸三维成像系统。相较传统的3D人脸扫描技术,该系统在精度、分辨率和速度上均实现大幅提升,可应用领域包括但不限于人脸识别、医疗诊断、影视特效等。
人脸扫描更快、更清、更细
据介绍,研究团队开发的多视角4D人脸扫描系统,由3个不同近红外波段的结构光相机构成,底层算法采用团队提出的高频条纹位移编码三维重建方法,可以实现1080P(1920×1080像素)分辨率下超过100帧每秒的三维扫描速度,基于GPU的高并行三维重建算法可实现高达300赫兹的实时重建速度,且深度成像误差小于0.05毫米。
“每个深度相机都由一个近红外结构光投影光栅和一个工业相机组成。深度相机每重建一次,投影仪都要向被测物体投射一组预设高频条纹图案,并用相机拍下它们在被测物体上产生变形的图案。最终,根据相机拍到的变形图案分析得到深度信息,即3D信息。深度相机实现连续扫描,增加了时间轴信息,由此得到4D信息。”深圳先进院集成所在读硕士生吴迪解释说。
此外,为实现多角度更为完整的三维人脸动态成像,该系统采用3种不同波段的近红外光作为光源,既能避免人脸产生炫目,又能避免3套设备投影仪投射的图案相互干扰,大大改善了成像完整性。
“近红外光对人眼友好,但对皮肤具有一定的穿透性,使得投射的高频光栅图案模糊,降低了三维重建精度。”宋展表示。对此,研究团队采用了创新的图像增强算法,结合高鲁棒性的条纹编解码算法突破,提高了解码投射图案的相位计算精度,从而提高了三维重建精度。与此同时,研究团队还要考虑算法的实时性和并行性,为3D动态模型获取、头部姿态估计和面部表情迁移等基础工作的研究提供高精度数据支持。
支撑AI生成更高质量三维数据
宋展介绍,该系统在多个领域应用前景广阔。例如,在新型显示技术领域,有望为全息投影、空气成像等新型显示技术以及AR显示终端,提供三维数据采集设备;在影视领域,可实时捕捉演员的高精度面部表情,结合表情迁移技术,实现从真人的表情到卡通形象的表情迁移;在游戏领域,可捕捉用户面部信息,结合视线追踪技术,实现人机交互;在医疗领域,可帮助提供患者面部表情信息,助力医疗诊断等;在人形机器人领域,可为机器人提供更加精确、敏锐的4D视觉感知方法,让其从只能干粗活变成干更多精细活。
AI技术的发展,很大程度上依赖于数据驱动。
“二维平面上生成的图像或视频往往难以呈现真实世界的三维结构,未来,AI技术生成的视频将逐渐从二维向三维发展。想要生成更高质量的三维视频,离不开三维数据的支撑。”宋展说。
该系统可以为“3D+AI”研究提供真实、精细的高质量三维数据,解决目前该研究领域高精度三维数据不足的问题,为AI模型生成更高质量的视频提供实时、高精度、高分辨率的数据支撑。
据了解,目前,研究团队已将该技术运用于电影特效、特种加工、面部3D诊疗、动态3D视觉引导装配等方面,并取得了良好的效果。
未来,研究团队将进一步加强底层算法研究,提高编码效率成像速度,降低硬件成本,研制模块化高时空分辨率4D成像器件,并将其应用于工业和信息通信等更多领域,为新质生产力发展提供锐利的视觉成像技术支撑。
图像识别、智能助手、虚拟人、文生视频……技术的发展和创新让人们进一步向智能时代迈进。然而,目前运用人工智能(AI)技术呈现的图像画面大多是二维效果,在空间、时间和细节方面仍有较大上升空间。
如何为AI装一双“慧眼”,让画面更清、更细、更自然?
近日,《中国科学报》记者从中国科学院深圳先进技术研究院(以下简称深圳先进院)了解到,该院集成技术研究所(以下简称集成所)机器视觉研究中心研究员宋展团队自主研发出多视角4D高精度人脸三维成像系统。相较传统的3D人脸扫描技术,该系统在精度、分辨率和速度上均实现大幅提升,可应用领域包括但不限于人脸识别、医疗诊断、影视特效等。
人脸扫描更快、更清、更细
据介绍,研究团队开发的多视角4D人脸扫描系统,由3个不同近红外波段的结构光相机构成,底层算法采用团队提出的高频条纹位移编码三维重建方法,可以实现1080P(1920×1080像素)分辨率下超过100帧每秒的三维扫描速度,基于GPU的高并行三维重建算法可实现高达300赫兹的实时重建速度,且深度成像误差小于0.05毫米。
“每个深度相机都由一个近红外结构光投影光栅和一个工业相机组成。深度相机每重建一次,投影仪都要向被测物体投射一组预设高频条纹图案,并用相机拍下它们在被测物体上产生变形的图案。最终,根据相机拍到的变形图案分析得到深度信息,即3D信息。深度相机实现连续扫描,增加了时间轴信息,由此得到4D信息。”深圳先进院集成所在读硕士生吴迪解释说。
此外,为实现多角度更为完整的三维人脸动态成像,该系统采用3种不同波段的近红外光作为光源,既能避免人脸产生炫目,又能避免3套设备投影仪投射的图案相互干扰,大大改善了成像完整性。
“近红外光对人眼友好,但对皮肤具有一定的穿透性,使得投射的高频光栅图案模糊,降低了三维重建精度。”宋展表示。对此,研究团队采用了创新的图像增强算法,结合高鲁棒性的条纹编解码算法突破,提高了解码投射图案的相位计算精度,从而提高了三维重建精度。与此同时,研究团队还要考虑算法的实时性和并行性,为3D动态模型获取、头部姿态估计和面部表情迁移等基础工作的研究提供高精度数据支持。
支撑AI生成更高质量三维数据
宋展介绍,该系统在多个领域应用前景广阔。例如,在新型显示技术领域,有望为全息投影、空气成像等新型显示技术以及AR显示终端,提供三维数据采集设备;在影视领域,可实时捕捉演员的高精度面部表情,结合表情迁移技术,实现从真人的表情到卡通形象的表情迁移;在游戏领域,可捕捉用户面部信息,结合视线追踪技术,实现人机交互;在医疗领域,可帮助提供患者面部表情信息,助力医疗诊断等;在人形机器人领域,可为机器人提供更加精确、敏锐的4D视觉感知方法,让其从只能干粗活变成干更多精细活。
AI技术的发展,很大程度上依赖于数据驱动。
“二维平面上生成的图像或视频往往难以呈现真实世界的三维结构,未来,AI技术生成的视频将逐渐从二维向三维发展。想要生成更高质量的三维视频,离不开三维数据的支撑。”宋展说。
该系统可以为“3D+AI”研究提供真实、精细的高质量三维数据,解决目前该研究领域高精度三维数据不足的问题,为AI模型生成更高质量的视频提供实时、高精度、高分辨率的数据支撑。
据了解,目前,研究团队已将该技术运用于电影特效、特种加工、面部3D诊疗、动态3D视觉引导装配等方面,并取得了良好的效果。
未来,研究团队将进一步加强底层算法研究,提高编码效率成像速度,降低硬件成本,研制模块化高时空分辨率4D成像器件,并将其应用于工业和信息通信等更多领域,为新质生产力发展提供锐利的视觉成像技术支撑。
3月15日,我国一些地区停止居民集中供热。初春时节,乍暖还寒。停暖初期昼夜温差较大,老人、儿童等身体较弱者,可能需要使用电暖气、电热毯等取暖设备,这导致部分家庭近来用电量增加。最近,一款名为 记者3月21日获悉,由中国科学院自动化研究所和中国科学院香港创新研究院联合研发的医疗领域AI多模态大模型——CARES Copilot 1.0日前在香港正式发布,现已面向香港神经外科医生开放使 一个国际团队近日在英国《自然》杂志上发表论文说,他们利用湖水样本培养出一种奇特的光合细菌,它属于绿弯菌门一种此前未知的目,代表了光合作用生物进化过程中的过渡形式。新发现为进一步探索远 21世纪经济报道记者 冯恋阁 王俊 广州、北京报道2013年播出的科幻电视剧《黑镜》第二季中有这样一个故事——女主角玛莎在男友艾什被车祸夺走生命之后,长久无法走出分离的痛苦,最终选 3月24日,据央视财经消息,在今天开幕的中国发展高层论坛2024年年会现场,苹果公司首席执行官蒂姆·库克回应记者提问表示,苹果公司的Apple Vision Pro头显产品将在今年年内于中国市场上市, 记者从中国科学院新疆天文台获悉,近期南山26米射电望远镜在参与欧洲VLBI网组织的联测中,首次成功运用4Gbps宽带、高码率VLBI技术获得干涉条纹。相较于2Gbps观测,该技术理论上可将图像信噪比提升 。本文链接:多视角4D人脸扫描系统 给AI装一双“慧眼”http://www.sushuapos.com/show-2-5759-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 科学家首次实现大鼠胎间移植