当前位置:首页 > 技术分析 > 正文内容

中科院AI新研究:基于手绘草图生成逼真人脸,或能助力警察破案

ruisui883个月前 (02-17)技术分析13

南都讯 记者冯群星 把粗糙的手绘草图输入AI,可以生成逼真的人脸图像?日前,中国科学院计算所和香港城市大学的研究团队发表论文,介绍了相关的研究进展。

随着深度学习技术的发展,计算机视觉领域的“图像到图像翻译(image-to-image translation)”也越来越丰富,比如把黑白照转换成彩色照、白天照转换成黑夜照、低像素图片转换成高像素图片,等等。把手绘草图转换成照片般的逼真图像,也是其中一种。

中科院计算所和香港城市大学研究团队的最新论文题为《深度人脸画像:从草图到面部图像的深度合成(DeepFaceDrawing: Deep Generation of Face Images from Sketches)》。这篇论文已经被计算机视觉顶级学术会议SIGGRAPH接收,将在今年七月的会议期间展出。

研究人员在论文中表示,目前大多数基于深度学习的草图到图像翻译任务仍然靠数据驱动,对输入草图的质量要求较高,即草图的质量要接近于边缘图像。

所谓边缘图像,就是对原始图像进行边缘提取后得到的图像。边缘是图像信息最集中的地方,也是图像中不确定性最大的地方,提取边缘对计算机视觉系统的任务处理至关重要。没有接受过专业绘画训练的人所画的草图,显然很难达到这样的要求。

原始图像与计算机算法提取的边缘图像。图自论文《图像边缘提取方法及展望》。

为了破解这一难题,研究人员开发了一种新的深度学习系统,能够基于粗略的、不完整的草图来生成人脸图像。该网络使用的人脸数据更少,并且能够对图像的形状细节进行更细粒度地控制。

简单地来说,研究人员使用的是“从局部到整体”的思路。整个系统由三大主要模块组成,分别是构件嵌入模块、特征映射模块和图像合成模块。构件嵌入模块负责从面部草图数据中分别学习左眼、右眼、鼻子、嘴巴和其他面部构件的特征。特征映射和图像合成模块可以融合这些特征,再将其映射到分辨率为512×512像素的高质量人脸图像。

深度学习系统生成图像的过程。

在训练过程中,研究人员使用了1.7万对草图和照片数据,并邀请10位志愿者参与测试(其中4位是绘画小白,4位有一定绘画基础,2位是专业人士)。每位志愿者至少要手绘三幅草图。结果显示,虽然志愿者给出的草图质量不一,但系统生成的人脸图像始终较为稳定。与现有的其他算法系统(如pix2pixHD、Lines2FacePhoto 、iSketchNFill等)相比,系统生成的人脸图像也更为自然。

10位志愿者画出的不同草图及系统生成的对应人脸。

不同系统根据草图生成图像的对比。

当然,该系统还存在着局限性。研究人员表示,分开学习人脸构件的特征可能带来构件不兼容的问题。例如,如果草图中左眼和右眼的差距较大,最终生成的人脸图像就会出现左右眼形状和颜色不一致。

系统生成的人脸图像中左右眼不一致。

研究人员认为,基于粗略草图生成人脸图像存在广泛的应用前景,比如刑事调查、绘画设计、教育培训等。

AI前哨站注意到,早在前几年,就有人提出设想:通过AI技术实现模拟画像智能化。

模拟画像是一种刑侦手段,许多大案要案的侦破背后都有画像师的功劳。然而,传统的模拟画像对目击者的描述能力有着很高的依赖性,有画像师在接受媒体采访时表示,直接利用模拟画像手段破案的成功率仅在百分之二十左右。

中国科学院计算所和香港城市大学的新研究,无疑为模拟画像智能化提供了一种可能性。但AI的准确性和可靠性有多高?会不会带来冤假错案及其他伦理问题?在技术进步的过程中,这些问题同样需要予以重视。

扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/2004.html

标签: pix2pixhd
分享给朋友:

“中科院AI新研究:基于手绘草图生成逼真人脸,或能助力警察破案” 的相关文章

2024年,不断突破的一年

迈凯伦F1车队不久前拿下了2024年度总冠军,距离上一次还是二十几年前。在此期间,另一领域内,一个充满革新活力的腕表品牌——RICHARD MILLE理查米尔,正不断发展,与F1运动、帆船、古董车展等领域,共享着对速度与极限的无尽向往。RICHARD MILLE的发展与F1车手们在赛道上的卓越表现交...

再来一波黑科技工具,低调使用

静读天下静读天下是一个特别优秀的电子书阅读器。它上面有多个在线书库,像古登堡计划,很多种优秀的书杂志,都可以下载来阅读。它还能智能识别章节功能,还支持外置的语音阅读功能。它支持多种文本格式,比如说txt,pdf,epub,mobi等等。为了便于阅读它还有10 种配色方式,还有夜间模式。不过免费版有广...

别让“跑焦”毁所有!仅需这一项设置,即可显著改善镜头对焦精度

我常常会收到一些摄影爱好者的私信,也一直在努力的帮助大家解决更多摄影中常见问题。在我收到的所有问题中。有一个问题是最麻烦的,那就是“为什么我的图像看起来模糊?”。这个问题几乎每个人都遇到过,究其原因可以说是多种多样相对复杂。起初我一直认为是对焦问题所导致,也就有了我之前所写的“后按对焦”以及“对焦模...

JS数组过滤元素的方法

引言JavaScript 作为前端开发的核心技术之一,在现代 Web 开发中扮演着举足轻重的角色。随着 Web 应用越来越复杂,高效处理数据集合的需求日益凸显。本文旨在介绍 JavaScript 中数组过滤的基础知识及其在实际项目中的应用技巧。技术概述定义数组过滤是 JavaScript 提供的一种...

thinkphp8+vue3微信小程序商城,发布公众号App+SAAS+多商户

项目介绍三勾小程序商城基于thinkphp8+vue3+element-ui+uniapp打造的面向开发的小程序商城,方便二次开发或直接使用,可发布到多端,包括微信小程序、微信公众号、QQ小程序、支付宝小程序、字节跳动小程序、百度小程序、android端、ios端。支持主题色+自定义头部导航+自定义...

TDesign企业级开源设计系统越发成熟稳定,支持 Vue3 / 小程序

TDesing 发展越来越好了,出了好几套组件库,很成熟稳定了,新项目完全可以考虑使用。早在2021年,腾讯的 TDesing 刚发布不久,我就写了一篇简短的文章来介绍,当时主要关注的是 TDesign 的 Vue 组件库和用来搭建 admin 后台系统的实用性。虽然当时看起来不错,但还处于测试版,...