当前位置:首页 > 技术分析 > 正文内容

中科院AI新研究:基于手绘草图生成逼真人脸,或能助力警察破案

ruisui884个月前 (02-17)技术分析20

南都讯 记者冯群星 把粗糙的手绘草图输入AI,可以生成逼真的人脸图像?日前,中国科学院计算所和香港城市大学的研究团队发表论文,介绍了相关的研究进展。

随着深度学习技术的发展,计算机视觉领域的“图像到图像翻译(image-to-image translation)”也越来越丰富,比如把黑白照转换成彩色照、白天照转换成黑夜照、低像素图片转换成高像素图片,等等。把手绘草图转换成照片般的逼真图像,也是其中一种。

中科院计算所和香港城市大学研究团队的最新论文题为《深度人脸画像:从草图到面部图像的深度合成(DeepFaceDrawing: Deep Generation of Face Images from Sketches)》。这篇论文已经被计算机视觉顶级学术会议SIGGRAPH接收,将在今年七月的会议期间展出。

研究人员在论文中表示,目前大多数基于深度学习的草图到图像翻译任务仍然靠数据驱动,对输入草图的质量要求较高,即草图的质量要接近于边缘图像。

所谓边缘图像,就是对原始图像进行边缘提取后得到的图像。边缘是图像信息最集中的地方,也是图像中不确定性最大的地方,提取边缘对计算机视觉系统的任务处理至关重要。没有接受过专业绘画训练的人所画的草图,显然很难达到这样的要求。

原始图像与计算机算法提取的边缘图像。图自论文《图像边缘提取方法及展望》。

为了破解这一难题,研究人员开发了一种新的深度学习系统,能够基于粗略的、不完整的草图来生成人脸图像。该网络使用的人脸数据更少,并且能够对图像的形状细节进行更细粒度地控制。

简单地来说,研究人员使用的是“从局部到整体”的思路。整个系统由三大主要模块组成,分别是构件嵌入模块、特征映射模块和图像合成模块。构件嵌入模块负责从面部草图数据中分别学习左眼、右眼、鼻子、嘴巴和其他面部构件的特征。特征映射和图像合成模块可以融合这些特征,再将其映射到分辨率为512×512像素的高质量人脸图像。

深度学习系统生成图像的过程。

在训练过程中,研究人员使用了1.7万对草图和照片数据,并邀请10位志愿者参与测试(其中4位是绘画小白,4位有一定绘画基础,2位是专业人士)。每位志愿者至少要手绘三幅草图。结果显示,虽然志愿者给出的草图质量不一,但系统生成的人脸图像始终较为稳定。与现有的其他算法系统(如pix2pixHD、Lines2FacePhoto 、iSketchNFill等)相比,系统生成的人脸图像也更为自然。

10位志愿者画出的不同草图及系统生成的对应人脸。

不同系统根据草图生成图像的对比。

当然,该系统还存在着局限性。研究人员表示,分开学习人脸构件的特征可能带来构件不兼容的问题。例如,如果草图中左眼和右眼的差距较大,最终生成的人脸图像就会出现左右眼形状和颜色不一致。

系统生成的人脸图像中左右眼不一致。

研究人员认为,基于粗略草图生成人脸图像存在广泛的应用前景,比如刑事调查、绘画设计、教育培训等。

AI前哨站注意到,早在前几年,就有人提出设想:通过AI技术实现模拟画像智能化。

模拟画像是一种刑侦手段,许多大案要案的侦破背后都有画像师的功劳。然而,传统的模拟画像对目击者的描述能力有着很高的依赖性,有画像师在接受媒体采访时表示,直接利用模拟画像手段破案的成功率仅在百分之二十左右。

中国科学院计算所和香港城市大学的新研究,无疑为模拟画像智能化提供了一种可能性。但AI的准确性和可靠性有多高?会不会带来冤假错案及其他伦理问题?在技术进步的过程中,这些问题同样需要予以重视。

扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/2004.html

标签: pix2pixhd
分享给朋友:

“中科院AI新研究:基于手绘草图生成逼真人脸,或能助力警察破案” 的相关文章

GitLab 14.6发布,优化Geo高可用,安全更新等

昨天,GitLab官方按照管理发布了有一个月度版本GitLab 14.6的发布,这也是本年度收官版本。14.6中在安全合规性方面,在Geo方面以及MD代码块一键复制等方便做了优化,另外还在UI图标方面发布了一套全新的图标。详细情况请和虫虫一起学习。GitLab 14.6主要改进使用 Geo 实现无缝...

博信股份新战略后再推新品 TOPPERS E2耳机售价199元

中新网6月21日电 20日,博信股份在北京正式推出新品TOPPERS主动降噪耳机E2,这是博信股份继2月战略暨新品发布会后的第二次新品亮相。价格方面,TOPPERS主动降噪耳机E2零售价199元,并于6月20日下午4点在京东商城公开销售。据介绍,TOPPERS主动降噪耳机E2采用AMS(奥地利微电子...

我的VIM配置

写一篇关于VIM配置的文章,记录下自己的VIM配置,力求简洁实用。VIM的配置保存在文件~/.vimrc中(Windows下是C:\Users\yourname \_vimrc)。VIM除了自身可配置项外,还可插件扩展。VIM的插件一般用vundle或vim-plug来管理,但我力求简单,不打算装太...

别让“跑焦”毁所有!仅需这一项设置,即可显著改善镜头对焦精度

我常常会收到一些摄影爱好者的私信,也一直在努力的帮助大家解决更多摄影中常见问题。在我收到的所有问题中。有一个问题是最麻烦的,那就是“为什么我的图像看起来模糊?”。这个问题几乎每个人都遇到过,究其原因可以说是多种多样相对复杂。起初我一直认为是对焦问题所导致,也就有了我之前所写的“后按对焦”以及“对焦模...

vue-router是如何解析query参数呢? #前端

vue-router 中的 query 解析。1. 大家好,我是龙仔。今天来分享 vue-router 是如何解析快乐参数的,因为使用 vue 路由会传 query 参数和快乐参数,所以从 vue 的角度来看如何解析传递的快乐参数。2. 基础知识大家应知道,快乐参数结构如:a、b、c、a、b、c、a...

一篇文章搞懂同步与异步、阻塞与非阻塞

要想掌握好Java NIO需要涉及了解同步与异步、阻塞与非阻塞,本文通过相关例子让你深入理解其本质@mikechen阻塞阻塞与非阻塞是对同一个线程来说的,在某个时刻,线程要么处于阻塞,要么处于非阻塞。阻塞调用是指调用结果返回之前,当前线程会被挂起,调用线程只有在得到结果之后才会返回。举一个例子:当一...