邱章红|预训练语言模型合作创作商业电影剧本中的人物

供稿来源:    作者:   发表时间:2024-07-18

随着技术的不断进步,AI已经渗透到影视制作的各个环节,为行业带来了前所未有的变革。GPT到底能不能取代电影编剧?电影剧作家如何与人工智能创作共存?剧作家如何利用大语言模型打造电影主角的光环?针对以上问题,7月17日下午,北京大学艺术学院邱章红教授为研究生暑期学校的学员们带来了一场主题为“预训练语言模型合作创作商业电影剧本中的人物”的讲座。

邱章红教授在讲座中深入剖析了人工智能在电影剧本创作领域的应用与前景,肯定了GPT在文本生成方面的强大能力;客观分析了GPT/BERT在长篇电影剧本创作中存在的缺陷和优势,进一步探讨了GPT/BERT预训练语言模型的二段式训练模式,提出了创作长篇电影剧本的解决思路;分享了相关创作案例,并详细阐述了如何利用BERT等模型的规则库来设计商业电影中的主角,构建具有吸引力和深度的角色形象。

一、GPT/BERT在长片电影剧本创作方面的主要缺陷

邱章红教授在分析人工智能与电影创作之间的紧密联系时,特别指出了GPT/BERT等预训练语言模型在长片电影剧本创作方面存在的主要缺陷。

语言模型的通用性与电影个性化之间存在难以调解的冲突。电影创作以创意为核心,追求的是个性化与差异化表达,而GPT等模型由于其预测模式的本质,往往倾向于生成大众化、普遍化的内容。GPT的应用不断推高了人们想象力的上限,却不能超越上限;不断拉低了人们反思力的下限,不断接近欲望层,但不能抵达欲望层。

GPT/BERT等预训练语言模型在情绪逻辑推理能力存在不足。电影剧本的逻辑本质上是情绪逻辑,而非简单的因果逻辑或数理逻辑。然而,GPT/BERT等模型虽然能够基于大规模语料进行推理和模仿人类理性逻辑分析,但并不具备真正的情绪逻辑推理能力。这意味着它们无法准确捕捉和表达电影剧本中复杂的情绪变化,也无法生成超出语料范围之外的、富有情感的答案。

GPT/BERT等预训练语言模型无法解决电影文本的“成长性”问题。电影文本充满了叙事缝隙和未明确表述的内容,需要观众通过自身的想象、生活经历、情感经验和道德观去填补和完善。然而,模型基于数理逻辑推演出来的故事情节往往过于完整和闭合,缺乏足够的叙事缝隙和想象空间,从而限制了观众在观影过程中的参与感和共鸣。

GPT/BERT等预训练语言模型存在无法与学习环境交互的局限性。电影剧本的创作和解读都依赖于特定的语境和环境,包括语言、影像、对白、画外音、音乐、肢体运动等多种元素的综合运用。然而,当前大语言模型训练学习的语料主要是文本形式,被抽离了超文本的语境上下文。这使得模型无法真正理解作者创作时的实时环境和观众阅读时的实时环境,也无法与学习环境进行有效的交互和反馈。因此,模型在理解和创作电影剧本方面存在着根本的局限性。

二、GPT/BERT在长片电影剧本创作方面的主要优势

邱章红教授详细阐述了AI技术在电影剧本创作中的三大潜在优势。

AI能够显著减少剧作家的工作量,并提升整体创作效率。在未来,AI有望承担超过70%的剧本创作工作,从而极大地解放剧作家的生产力,使他们能够更专注于创意的深化和打磨。

AI技术极大地拓宽了剧作家的横向想象力空间。GPT的穷尽性优势,即其能够生成大量、多样化的内容,帮助剧作家突破个体思维的局限性。GPT的“例外”优势,即其能够产生出乎意料、新奇的内容,为剧本增添了陌生感和吸引力。然而,如何将这种新奇感转化为电影所需的过程感和连贯性,仍需剧作家的专业介入和精心编排。

AI技术能够确保剧本的创新度。通过强大的检索功能和数据分析功能,AI能够迅速捕捉市场热点和流行趋势,为剧本创作提供灵感和方向。这种基于数据的创新方式,不仅提高了剧本的市场竞争力,也为电影产业带来了更加丰富的创意资源。

三、GPT/BERT预训练语言模型的二段式训练

邱章红教授深入探讨了GPT/BERT等预训练语言模型在自然语言处理领域的二段式训练模式,指出这是实现工业化的必经之路。

大规模文本“预训练”阶段是一个无标签、无监督的过程,旨在构建普适性、通用性的模型。该阶段通过大量无标签样本进行预训练,以获取优质的语言表示,为后续下游特定自然语言处理任务奠定基础。少量文本“微调训练”阶段是一个标注、监督的过程,针对特定领域构建高性能模型(SATA)。在此阶段,通过少量典型性样本的标注与监督,结合强套路的商业电影元素,对模型参数进行初始化训练,以适应特定任务的需求。

邱章红教授在研究中发现电影长片剧本训练存在诸多无效的原因:样本量过小,不超过10万部电影,这限制了模型的泛化能力;样本质量参差不齐,烂片数量远超过好片,影响了模型的学习效果;训练成本高昂,也是不容忽视的问题;训练出的模型在应对下游任务时表现不佳,进一步证明了当前训练方法的局限性。

为论证上述观点,邱章红教授以商业电影剧本中常见的角色——信使为例,通过输入“报信者”等关键词,观察并分析了模型输出的特征。这一实验结果进一步支持了邱教授关于电影长片剧本训练无效原因的分析。

四、长片电影剧本创作:我们的解决思路

邱章红教授针对电影长片剧本训练中存在的无效性问题,提出了一系列专业性的解决思路。他强调基本理念的清晰性,指出在利用AI创作电影故事时,应明确AI是为人服务的工具,评判权掌握在人类手中。因此,人机问答过程应被视为剧作家与人工智能之间相互启发、对抗与促进的学习过程,旨在共同提升创作质量。

邱教授提出了电影剧本创作的核心标准:剧本内容需与上下文紧密相关,遵循核心结构框架;任务类型明确,区分有监督、无监督/自监督等训练方式;以及模型扩展的方向,如任务扩展、领域扩展和模态扩展等。这些标准共同构成了电影剧本创作的基石。

在核心思维方面,邱章红教授主张减少大规模预训练,转而注重微调训练。面向N-shot Learning时,应优先考虑Zero-shot Learning、One-shot Learning和Few-shot Learning等少量、不确定数据的训练方法,以提高训练的针对性和效率。

邱教授强调了“交互提示式”提问方式的重要性。电影剧本创作是一个从种子观点出发,逐步深化、具体化的过程。人机问答过程中,提高提问的正确性和效率至关重要,这有助于增强AI与环境的互动能力,促进创意的涌现和深化。

邱章红教授介绍了商业电影创意的工业标准流程与电影主题的标准表达式。他指出,通过观念提取、故事策划和剧本创作等步骤,可以形成一套行之有效的商业电影剧本创作套路。这些套路不仅有助于提升剧本的质量,还能为电影产业带来更加规范和高效的创作模式。

五、LLMs与剧作家合作创作商业电影剧本中的人物

邱章红教授深入探讨了电影创作者借助人工智能(AI)技术在电影剧本人物创作方面的创新机制。他认为可以利用大型语言模型(LLMs)与剧作家合作,共同创作商业电影中的剧本人物,并分享了相关成功案例,展示了AI在剧本创作中的实际应用。

邱教授详细阐述了如何利用BERT规则库中的三大设计套路(人物类型、人物角色、人物三维模型)来塑造电影主角的光环。人物塑造是剧本自动创作中的一大挑战,因为人性复杂多变,包含个性化、情感化、成长性等多重维度,难以完全准确呈现。为此,邱教授以“导师”这一人物角色为例,展示了如何通过BERT规则库对输入数据进行预处理,赋予角色明确的身份、标签、判断及系统定位,进而通过特征假设与功能假设的相似性判断,从多个选项中选出最佳答案,以精细构建角色形象。

邱章红教授从生理、心理、社会等多个层面构建了人物的三维模型,强调这些模型应源自真实生活,反映人物的境遇与环境,从而展现其人性化特征;通过路径约束和LLMs与学习环境的交互模型,进一步阐明了角色设计的逻辑与过程,帮助学生更好地理解人物设计的复杂性与深度;还介绍了人物社会关系网络和主角成长模型在成功塑造角色中的关键作用,这些模型共同构成了角色发展的完整框架。

讲座最后,邱章红教授分享了基于预训练语言模型的微短剧剧本创作经验,并预告了其团队即将上线的AI创作系统,鼓励大家利用这一平台进行微短剧创作的尝试,探索AI技术在影视创作领域的新可能。

邱章红教授的分享表达了他对电影剧本创作与人工智能技术融合发展的热切期望和深刻思考。科技与艺术的深度融合将为观众带来更多前所未有的视听盛宴。

互动环节

胡智宇同学:邱教授您好,关于大模型塑造人物形象,如果在人机交互的过程中,对人物模型提出关键词第一个为杀手,第二个为仇杀者的关键词,使用同一个大模型的反馈是否会重复?

邱章红教授:的确存在重复,同质化确为大数据模型弊端,但不可通过单一词汇让大模型创造,这个词没有任何信息约束,要给予限制才有差别,这个是交互过程,人工智能和人之间提示过程,不能仅一个词解决。

胡智宇同学:通过大模型的版权归于AI还是创作者?

邱章红教授:对于收费大模型,像ChatGPT运用付费创作出来的为个人所有,而对于免费大模型的也并不代表未来不收费,因此也为操作者所持有。