前沿聚焦 | 刘海波 张腾越 | 失真、失控与趋同:关于可灵AI电影短片的三个问题
2024年12月6日,由快手自研视频生成大模型“可灵AI”联合李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等9位导演共同发起的“中国首个AIGC导演共创计划”正式上线。作为视频生成大模型在电影级内容创作层面的首次尝试,这9部电影短片作品被中国电影博物馆永久收藏、放映展示,显示了业界对这一尝试的重视。事实上,作为观察AI电影未来的样本,这9部短片也的确在“失真与逼真、失控与可控、个性与趋同”等向度上给我们提出了问题。

失真与逼真:AI电影的表层印象

AI电影在人物面孔生成上的塑料感和表情失真一直为观众所不满。此次可灵AI生成的九部短片也不例外。虽然可灵 AI 专门推出了人脸定制模型,创作者通过上传10-99段5秒的多角度人物形象视频来训练完成一个固定模型,上传越多效果越好,从结果看,此次九部短片实验,基本保证了视频主体形象的统一,能满足叙事的连贯和镜头的稳定清晰。但是与真实演员的表演相比,塑料感仍然强烈。例如李少红导演的《花满渚》以一个学习导演的女生“成为导演之前先要成为她们”为线索,让女生化身《红粉》中的小萼、《橘子红了》中的秀禾、《觉醒》中的女孩、《大明宫词》中的太平公主、《恋爱中的宝贝》中的宝贝等五个角色,女孩运动中的变装、发型转换、场景穿越等都很丝滑,但女孩漂亮的面孔和表情却因为毫无瑕疵而难以摆脱塑料感。AI算法依赖于大数据训练,这些数据通常来源于现有的视觉文化数据集,这些体现主流审美的数据,往往会合成马诺维奇所谓的“过于完美的照相现实”,即一种拥有完美清晰度、高色彩饱和度、高锐度的超越现实的“完美视觉 ”。尽管有9位成熟导演把关,但此次可灵AI生成的视频也仍然体现为缺少个性的“完美视觉”。

AI短片不仅在人物面孔上有“美的不真实”的问题,更在表情传达上欠缺真实所具有的丰富性。在传统电影中,真人演员对情感和情绪的传达不仅有台词里的语气、语速、语态、停顿、重音等种种表达技巧,也有微妙的肢体语言和微表情,特别是优秀的演员进入了规定情境后,其情感表现的层次和丰富,绝非一般演员所能及。显然,仅仅靠几十段视频训练的模型,依赖预设的算法和数据集,无法穷尽一个真人所具有的真实反应和丰富表现力。此外,演员自身所具有的人生经验、进入表演情景前千差万别的情绪状态、对具体表演环境的感知、与其它演员交流时擦出的即兴的火花,都不是当前数据大模型所能掌握的。例如贾樟柯执导的短片《麦收》虽然给角色配上了方言,但在麦田里收割的老人即便有朴素的衣服、满脸的皱纹、地道的山西方言,其动作和表情仍然显得浮于表面、刻板单一、缺少自然流动性,完全无法与贾樟柯《一代风流》里那些鲜活的真实面孔相比,甚至也无法与《三峡好人》里的素人演员韩三明木讷的表情相提并论。

为了应对AI在人物生成上的失真,许多导演选择了幻想故事,以非现实人物为角色,例如俞白眉《百鬼勿扰》中的钟馗和兔子精、蛤蟆精,叶锦添《快递员》中的外星人,贾樟柯《麦收》中的赛博人等,王子川的《雏菊》干脆让赛博人戴着头盔没有面孔。而王卯卯的《再见兔子》则选择了动画形式,直接回避掉AI真人生成的瑕疵。
当我们苛求AI影像在人物生成上的不真实时,它在动物生成上似乎显得更真实了。俞白眉《百鬼勿扰》中小白兔、李少红《花满渚》里的鸽子、薛晓路《喵心归处》里的小猫都显得格外生动。这既与大模型学习了足够多的数据相关,也是人类对动物熟悉程度不如对人类自己的缘故,一般观众既不懂动物的肢体语言和声音语言,也对动物的微表情缺少观察和了解,所以对其真实性的评价标准也就放低。

让人满意的逼真效果还来自AI生成的时空场景和特殊效果。张吃鱼执导的《最后的防线》讲述了一个地球被外星文明降维打击后,退守重庆的故事,对于城市街道、工业生产和灾难场景的营造就氛围感十足,特别是插入了斑驳的大钟、水洼里的旧报纸、翻腾的火锅等特写,建构了强烈的时空真实感。董润年的《新世界》里女孩不断穿越进去的城市街景、叶锦添的《快递员》中太空快递员经过的浩瀚的太空、死寂的宇宙、布满垃圾的深海等等都营造出了令人信服的“逼真感”。稍加反思我们就能明白,决定这些短片空间真实感的关键在于观众的真实参照系。现实时空场景和特写来自AI训练时所获得的真实影像,AI生成只是遴选和组合;而幻想中的场景和角色,并无“本真”参照,有的只是以往影视作品给我们建构的视觉效果以及我们的想象力,所以,只要接近这些已有效果,我们便会产生“逼真感”。


失控与可控:AI电影的深层思辨

我们有理由怀疑9位成熟导演在制作他们的短片时能发挥的掌控力。因为AI影像的生产机制如同抽盲盒,创作人员可以发布指令,但生产交给了人工智能,出来的效果可能是惊喜,也可能是垃圾。创作人员可以喊NG(NO GOOD),要求再来一条,如同监视器后的导演对镜头前的演员们要求的那样,但是即便导演有最终选择权,人机对话的模式,显然无法与人和人的沟通相提并论。这里有两点不同,一是成熟的演员都经过了经年累月的训练,自身还有丰富的生活经验,他们在接受导演指导和塑造角色时,会积极调动自己的专业性和经验性,会与现场的信息积极互动,塑造出令导演满意的角色;二是导演与演员或其它工作人员的交流是双向的,也是全息的,甚至是积淀的——有些主创团队长期合作,相互之间保持心有灵犀的默契。从理论上说,AI也可以通过与某位导演的长期磨合,熟悉导演风格,成为导演的专属模型,但此次9位导演与可灵AI的合作都是第一次,所以在生产环节,一定程度上是“失控的”,至少部分控制权交给了熟悉人工智能指令的合作工程师。
但另一方面,AI生成又增强了某种可控性,对于动物角色、婴儿角色、儿童角色来说,现实中这些“特殊演员”都难以听懂和执行导演指令,处于失控状态,而在AI影像中,却可以做到所想即所得,变得轻松可控。其它如天气、灾难等等非人力可控因素,AI生成也让曾经复杂的传统电影制作过程简单化,实现了电影制作成本的可控。当然我们还可以乐观地说,从本质上AI依赖于对现实世界的物理规律、社会规则和情感表达的深度学习,因此在源头上AI生成的内容具有在人类经验范围内的可控性。

可灵AI导演共创计划AIGC电影短片在中国电影博物馆展出

个性与趋同:AI电影的审美陷阱

失控与可控之辩背后表达的不仅有未来世界由碳基人还是硅基人主导的焦虑,更有未来新世界究竟在审美上会更有个性还是更加趋同的问题。
一方面,AI降低了个性化艺术表达的知识、技术及资金门槛,解放了许多人的创作潜能。AI的定制化功能允许用户输入独特的审美参数,通过训练专属模型生成与个人情感、经历和想象力密切相关的视频内容,为更多个人创作者和独立电影人提供表达灵感创意的机会,这些个性化作品通过互联网还可以迅速触及小众群体或特定兴趣社群,从而形成多元化的审美生态。
另一方面,每个个体都生活在现实语境中,受主流、次主流、亚文化审美规范的影响,从而在AI模型训练上必然形成文化共识和交集——这也是文化交流的必须前提,在这样背景下训练出来的AI模型是否会越来越走向文化和审美的趋同?就像曾经以反音乐姿态出现的摇滚乐最终无法摆脱消费社会里的大众化宿命。
从此次9部可灵AI短片的生产过程看,人类与智能机器在创造性工作中形成了“主体间性”,带来了一些惊喜,就像与王卯卯导演合作《再见兔子》的AIGC创作者Jason所感慨的,他在提示词里输入了“小男孩心情低落时产生的幻觉”,可灵生成了“四个蓝色小人从小男孩本体中分裂而出”,与主题完美契合,虽然这一镜头未被采用,但给剧组带来了意外之喜。《新世界》中AI根据指令生成了很多“行尸走肉”般的人,其中阴森机械、皮肤煞白的陶瓷人一下击中了导演董润年。

未来人机共创电影作为审美维度的检验,是时时都能带来意外的惊喜,还是看多了不过是停留在对已有视觉的模仿?这恐怕最终取决于人类自身的想象力边界。所以,未来的AI电影,其优势不在巴赞美学所推崇的现实模仿,而在对人类想象力的捕捉与再现。我们期待2024成为AI电影的元年,此次9部可灵AI电影短片作为尝试的起点。

本文作者
上海大学上海电影学院教授
上海电影评论学会会长
张腾越
上海大学上海电影学院研究生
原载于10月28日《上海影评学会画外音》
图片来源于原文
编辑/林紫倩
责编/曹峻冰
点击上方名片,关注我们




