近日,各个WhatsApp朋友圈中,有人接连转发了一个中国国家主席习近平用英语(另一个还兼说韩语)演讲的视频。有人表示惊讶,有人坚持说那是通译员的声音,但平时有读报,懂得“深伪”(deepfake)的人,马上就知道,那只是现代电脑科技的玩意儿。

仔细比对发音和嘴型,你会真的以为习近平在用英语或韩语发言。果真有这样的事,一般主流媒体早就炒翻了,还等社交媒体来爆料吗!诸如此类的视频其实多得很。如美国总统拜登以纯正的北京腔华语发言,美国女歌手泰勒丝(Taylor Swift)讲标准华语等等。

这类造假视频,用的是人工智能和深伪技术,通过现成软件,可以很容易给人“换脸”,以及克隆一个人的声音。所谓深伪,据维基百科的解释,是深度伪造的简称,是英文deep learning和fake的混成词,专指基于人工智能的人体图像合成技术的应用。技术可将已有的图像或影片叠加至目标图像或影片上。伪造面部表情并呈现至目标影片的技术,早在2016年就已出现。