全球首部全人工智能(AI)生成的短片《冰霜》(The Frost),讲述在南极洲冰冷的深处,某研究团队着手调查一个奇怪的信号,不知不觉踏上了一段奇异的旅程。
以往只能用电脑生成影像(CGI)或更先进的视觉特效(VFX)处理的画面,如今只要一个相对简单的文字指令(text prompt),就能制作一部生成式AI影片(Generative AI film)。
《冰霜》上集在2023年的国际AI影展推出时引起不小轰动,下集日前在滨海湾金沙艺术科学博物馆(ArtScience Museum)举行的Creator RenAIssance影展全球首映,吸引不少科技粉和电影人捧场。
《冰霜》上下集时长共约24分钟,耗时八个月完成。影片由位于美国底特律的Waymark影片创作公司制作,先由制片人撰写剧本,之后输入到AI图像生成工具DALL-E 2,制作出一个个镜头,再利用AI软件D-ID赋予这些静止图像动作,如眨眼和张嘴说话等。
《冰霜》的制作人兼故事人Josh Rubin(乔西鲁宾)接受《联合早报》访问,畅聊AI生成影片的优劣、技术上的局限与突破,以及对影视工业的影响,也探讨人们对AI潮来临的焦虑。
AI在一年间飞速进化
鲁宾说,完成《冰霜》下集后,发现AI的学习能力是超乎想象的快速与惊人,才相隔一年,AI便已从《冰霜》上集飞速进化。
他说:“在《冰霜》上集,我们只是用AI生成一帧图像,然后由人工进行动画制作,生成另外23帧图像。可是当我们制作下集时,AI已经可以自动生成所有图像。”
记者发现,《冰霜》的AI景象和人物虽然疑幻拟真,雪山远景也很有立体感,但人物对话时,对白与唇形不怎么搭得上,画面协调上也有种生硬的“怪异感”。
对此,鲁宾回应:“D-ID这个AI工具的原理是,对嘴巴的某个区域进行上下移动来配合影像‘说’对白。《冰霜》里的角色很少是直视镜头说话的,这些稍微偏斜的角度,让唇形与台词有些失焦。虽然它并不完美,但正越来越完善。”
鲁宾的创作灵感来自身边的一切日常事物,可以是一场梦,或自己喜欢的歌曲,拍《冰霜》时则被美国导演John Carpenter(约翰卡朋特)1982年的电影《突变第三型》(The Thing)、日本大导黑泽明的《梦》,以及西班牙导演Alejandro Jodorowsky(亚力山卓尤杜洛斯基)的《圣山》(The Holy Mountain)和《鼹鼠》(El Topo)启发。
AI是创作上的得力伙伴
鲁宾说,现在市面上有很多实验性的AI作品,但观众还是想看有故事的叙事电影,AI技术就必须跨越科技的局限,让影片更流畅。“一旦唇形与对白同步功能得到改善,这项技术就会真正腾飞。我不能说它会变得像照片一样真实,或像好莱坞电影般,但几年后它可能达到非常不错的动画水平。”
在研发AI生成影片的过程中,鲁宾学会如何与这个新形态的“艺术家”共处。在他的认知里,AI并不是会取代人类工作的洪水猛兽,反而是创作上的得力伙伴。
鲁宾说:“作为一个创作者,在使用AI时我们得要学会妥协。从技术上来看,虽然你是输入提示者,但你也得尊重对方(AI)也是一个‘艺术家’。我们花了很长时间才明白这点,也学会不再与AI对抗。”
他认为,在踩进AI影片创作的新世界时,必须敞开心扉接受任何可能性,因为AI可能会带领创作者走向完全不同的方向。“如果它不按你想要的方式进行,你只有两种选择:要么放弃这个想法,要么看看它能带你去哪里……它就像一个活物,一直在变化。”
AI是一把双刃剑
AI生成视频和动画速度之快,大大降低了制作成本,把影片拍摄的门槛拉低,可能开启未来“一个人制作电影”的个人电影新时代。一些相关工业被AI的进化速度搞到焦虑,害怕被这个一日千里的科技取代。
对此,鲁宾说:“就目前而言,AI只是一个非常有趣的工具,可以帮助你快速表达想法,而且速度快通常意味成本更低。但我认为它不会完全取代所有东西,总还是会有人想要用实体摄影机拍戏,也有人想要表演,这些不会消失。我觉得AI目前能做到的是,当你在自家后院给自己拍了一张照后,可以用AI瞬间把自己置身于外太空或山顶上。”
从ChatGPT到ChatGPT 4.0,仅仅两年半,深度伪造技术已经在这短时间内发酵成熟,正如《冰霜》这部用AI来讲AI故事的短片所叙,我们正经历一场人类历史上革命性的超速进化。随着人工通用智能 (Artificial General Intelligence,AGI) 甚至超级人工智能 (Artificial Super Intelligence,ASI)的可能来袭,不少人对这股科技新浪潮充满一定的恐惧,甚至有抵制的心理。
鲁宾认为:“这是不可避免的趋势,我们须要拥抱它。我认为AI有帮助人们实现愿景的巨大潜力,也推进人类这个物种的进化。同时,我们也要意识到它正在迅速发展,也就是说它既能治愈癌症,同时也能制造邪恶。”
