精准的唇部同步技术可以将假新闻视频变成真正的问题

Adam Clark Estes 08/20/2017. 21 comments
Fake News Computer Vision Artificial Intelligence Ai Computer Learning Neural Networks Research

想像一下最坏的情况。 不幸的电影制作人员使用人造智能电脑将原始音频馈送到奥巴马的模拟版本中。 音频实际上是奥巴马的声音,脸上真的是他的脸。 但嘴唇运动? 完全假货 电影制作人在互联网上发布视频,几乎不可能看到这是一个假的,因为技术非常好。 这不是一个假设的情况。

华盛顿大学的研究人员开发了一种方法 ,使用机器学习来研究奥巴马的面部动作,然后为任何音频呈现真实的唇部动作。 这意味着他们可以让奥巴马的视频在任何他们想要的设置上说出他们想要的任何东西。 当他们使用奥巴马的声音随机音频时,效果尤其出色 - 奥巴马作为法律学生的旧录音,并且让奥巴马昨天表示这些看法。

这个新的发展建立在越来越多的研究的基础上,创造出人们讲实话的视频,而不用录像机实际记录下来。 在过去,通过记录几个人一遍一遍地说出相同的句子来捕获使每个声音所需的特定嘴巴移动,实现了类似的口唇同步效果。 华盛顿大学团队精简了这个过程,然而,通过将大量显示一个人(奥巴马)的镜头馈送到神经网络中,然后使用算法来确定口腔运动的差异。 他们选择了奥巴马,因为奥巴马在公共领域上有这么多小时的视频。

研究人员说,嘴唇同步问题是一个特别具有挑战性的问题,因为人类非常擅长发现言语中的微小视觉不准确。 主要作者Supasorn Suwajanakorn一份声明中说:“如果你不能在错误的时间使牙齿正确或下巴移动,人们可以立即发现它会看起来是假的。 “所以你必须让口腔完美地超越不可思议的山谷。”

对于最终的演示,研究人员使用奥巴马的岁数音频在谈话节目中和哈佛的新闻机构,然后在椭圆形办公室中创作奥巴马的新视频。 这不是perfect ,但它很亲近。

新的突破建立在同一个华盛顿大学研究团队以前的工作中, 包括培训计算机来识别某些角色 ,如汤姆·汉克斯。 通过确定哪些特征使特定的脸部及其表情独特,团队开发了一种方法,可以让他们使用照片或短视频剪辑来创建特定脸部的移动,3D渲染。 从那里,他们可以有效地将模拟变成木偶。 他们甚至制作了一个模拟的奥巴马 给布什的一个演讲

当然,还有其他团队在世界各地也遇到类似的问题。 你知道吗 他们都非常善于创造令人难以置信的逼真的假视频,即使是低廉的设备。 例如,去年,一个斯坦福大学的团队创建了一种可以用任何便宜的消费者网络摄像头进行脸部再现的方法。 令人难以置信的令人毛骨悚然

虽然你可以想象这样的技术的阴谋影响,实际应用更加平凡。 例如,研究人员认为,这种技术可以使视频聊天更好,因为如果永远是可怕的视频源切断,计算机可能会产生你所说的形象。 或者,博物馆和主题公园可以使用历史人物的旧录音制作视频或全息图,显示他们发表着名演讲,使用事件的实际音频。

但是,到目前为止,使用易于访问的技术创造假图像和视频的能力也在增长。 就在上个星期,安全研究员格雷格·艾伦(Greg Allen)发表了一个有趣的警告:“ AI会使任何一切都变得容易一些 。”艾伦写道:

结合起来,廉价,高品质的媒体伪造的轨迹令人担忧。 在目前的进展中,可能只有两三年之前,现实的音频伪造足够愚弄未经培训的耳朵,只有五,十年之前,伪造者可以愚弄至少一些类型的法医分析。 当制作假视频的工具的质量高于今天的CGI,同时可以提供给未经培训的业余爱好者,这些伪造可能构成了大部分的信息生态系统。 这项技术的发展将在新闻,政府交流,刑事司法证据以及当然的国家安全领域改变证据和真相的意义。

正如本周的研究显示,这一进步速度正在快速上升。 好消息是,在华盛顿大学开发的技术也可能被用来发现媒体伪造。 不好的消息,艾伦总结出坏消息,他说这种技术将会“改变证据和真相的意义”。如果你认为假冒伪劣的新闻网站是一个问题,那么想像一个完全假冒的警察机构视频可以做

[ 华盛顿大学 ]

HighResolutionMusic.com - Download Hi-Res Songs

21 Comments

Matt
samnada
Admiral Asskicker
psydcarsss
liffie420
The-Guy-They-Warned-You-About
sssiamese
Darmok eats Challah at 12Nagra

Suggested posts

Other Adam Clark Estes's posts

Language