Skip to content

【视频&逐字稿】机器写作简史,及人类编剧时代的终结(1677—2024.3)

约 13799 字大约 46 分钟

AI写作机器写作编剧Sora

2025-02-03

  • 24年3月,Sora发布,世界上第一部AI长片公映,Figure机器人发布等新闻接踵而来,影视领域无疑将迎来巨变,在这个历史节点,择要梳理了程序写作、机器写作、AI写作的历史,也涉及叙事学与编剧理论的发展,主要以编剧视角聚焦和拣择材料,也包含了对教育的思考

  • 该视频于24年3月19日首发于B站与YouTube,在豆瓣最大的编剧小组收到了第一条回复:“你怕是还没睡醒”

  • 不幸的是,随着时间的推移,这些预测正在被现实印证

  • 在 DeepSeek 再度引发行业爆炸的今天,整理一下文稿重发出来,过两天等网站弄好后会 用 DeepSeek 写个短片 出来,算是给自己的call back

  • 注:正文源自视频字幕,格式由GPT整理,内容没有修改

多媒体

YouTube

Bilibili

播客

时间轴

00:00 导言:
完全由人类编剧的时代已经结束了

一、前计算机时代:
01:09 电子计算机出现之前,已有程序写作
01:24 1677年《人工作诗》(Artificial versifying)出版
02:14 现代编剧为何有必要使用随机机制?
04:34 拉丁诗歌机Eureka
05:09 后果Consequences,客厅游戏
05:46 达利玩什么玩出了超现实主义?
06:48 1953,疯狂的自由 Mad Lib
震惊,汤姆克鲁斯、卷福与肥伦玩的竟然是这个?
07:28 叙事学历史上重要事件,现代编剧模型的祖宗: 弗拉基米尔・普洛普,《故事形态学》
07:54 编剧是一门手艺,并不完全依赖灵感
编剧工作有很多可以程序化的部分
08:36 万恶之源 —— 英雄之旅
为什么超级英雄电影很无聊

二、电子计算机时代

10:56 计算机时代
11:15 克里斯托弗·斯特拉奇 跳棋&情书程序
11:56 1954,机器翻译
12:29 1959,计算机诗歌
13:01 60年代初,故事生成器
13:17 从第一个聊天机器人,到Siri
15:07 谢尔顿开发的Novel writer小说写手
米翰的Tale spin故事旋转
15:42 第一本计算机写出来的书,插图很下饭
16:20 笑话生成器JAPE

三、进入新千年
16:59 新千年
微软亚洲研究院:对联系统
17:49 机器不需要做到比你好
18:34 2007年起,自动新闻业
21:39 AI写作辅助软件Grammarly
21:59 纸牌屋上线,流媒体时代全面爆发,行业逻辑巨变
22:51 Scriptbook、海马轻帆,人工智能剧本分析及票房预测
阿里影业欲抛弃专业编剧,遭众多编剧集体抵制
为什么国内烂片越来越多?
24:45 2015,OpenAI成立
25:04 AI写作辅助软件Frase
25:14 第一个人工智能编剧,第一部人工智能编剧电影
26:38 人类编剧并非高枕无忧
28:17 AI版“《在路上》”,第一部完全由机器写的书
29:50 谷歌大脑推出Transformer模型,大模型进入新时代
30:07 Facebook、剑桥数据分析操纵美国大选,大数据及AI生成内容的风险被曝光
31:01 马斯克退出OpenAI ,OpenAI发布GPT1、GPT2

四、人工智能爆发时代

31:25 OpenAI发布GPT3模型,众人竞相整活
33:07 Anyword推出AI文案平台,进入营销与广告领域
33:30 谷歌工程师宣称自己与AI谈笑风生,大模型已具有自我意识,被谷歌解雇
34:27 ChatGPT
35:04 Deepmind发布Dramatron,具有完整的编剧功能
35:55 GPT4,完全依靠人类编剧的时代的终结
36:53 新工具带来新体裁、新形式
电影形式在未来的十年中会发生颠覆性的变化
我们熟知的电影制作方式、语法,将不复存在
38:00 好莱坞编剧工会大规模罢工,谈判议题涉及人工智能
好莱坞、流媒体巨头意图用AI取代人类,《未来学大会》照进现实
人机协作已势不可挡
40:26 Fable推出The Simulation,生成以用户为主角的剧集,让AI角色拥有自己的生活
(《软体的生命周期》?)
人机工作方式互换
43:09 王炸来了,Sora颠覆业界结构,彻底改变未来编剧工作流
44:59 世界上首部AI长片在好莱坞公映

五、结语

45:33 梳理历史的感想:
(1)影视编剧、交互叙事、机器写作 这几个领域共享了某些基础理论,其发展互相影响,以前我没有意识到过,现代编剧技术的发展,与编程技术的发展相关
(2)这些创新基本上以美国为中心,国内似乎极为滞后,要提升创新创造能力,必须有新的教育
46:25 未来的第十艺术将更接近梦境
47:01 Don‘t Panic,新生态会带来新机会,通过垄断资源、垄断渠道修建的壁垒将被打破
基本能力、认知、审美只会更加重要
48:18 人类已进入全民创造时代,我将做出更多关于创造力话题的内容
48:42 很多话题不好太发散,从编剧角度拣择了一些重点,对相关信息有兴趣的,可以搜索关键词,之后也会在评论区贴文章、资料
49:11 本节目的制作有ChatGPT的参与,它给出的很多信息,经搜索证实有误(看来它暂时还不能取代我)
49:26 感谢收听,有任何观点补充、纠正,或者想探讨的,欢迎留言

逐字稿

一、前计算机时代:

完全由人类编剧的时代已经结束了——这是去年我在家摆弄GPT-4的时候发出的感慨。

2024年2月15日,OpenAI首次发布了由文本转视频模型Sora制作的视频,再次引发行业地震;2024年3月6日,世界上第一部AI生成的电影长片《我们的终结者2:重制版》在好莱坞举办了首映仪式。随着新工具的逐渐普及,不仅以前的剧本格式将不复存在——毕竟以前的剧本是写给人看的——实际上整个影视行业的结构都会发生天翻地覆的变化。我们正处在一个特殊的历史节点上,对于相关领域的从业者,知道我们从哪里来,可能会有助于我们思考向哪里去。作为参考,我梳理了一下程序写作的发展史,并从编剧工作的角度分享一些观点,欢迎交流。

欢迎收听七叶电波,大家好,我是宸鸣。

技术的发展是渐进和累加的,程序写作在电子计算机出现之前已经存在了,这些技术,也是后世的计算机写作的基础。

首先我们来到1677年,《Artificial versifying》出版,这个书名可以翻译成《人工作诗》或者《人工诗韵》。在伦敦大瘟疫期间,一位名叫约翰·彼得的人开发了这个可以生成拉丁诗歌的系统。这本书于1677年出版,他宣称任何认识ABC并且能数到9的人,都可以用它来生成拉丁语诗歌。这本书取得了商业上的成功,在那个时代被多次重印,并且被视为后世的计算机文学的先驱。《人工诗韵》这个系统的机制是,用表格对字母进行排列组合,因为本质上诗歌就是用符合规则的字词进行各种排列组合。现代编剧也有用表格对角色原型和故事结构等元素进行随机的排列组合的方法,这和《人工诗韵》的机制是类似的。

如果一个编剧的创作完全没有随机成分,就是按自己的想法写,那不管你怎么写,都会反映你的喜好、你的思维、你的审美、你的价值观。它始终受到编剧个人的内心叙事的限制。编剧一思考,上帝就发笑,你翻来覆去都是一个套路,观众肯定会审美疲劳,这都是很难避免的。你想想你在生活中认识的人,一两年的时间能发生多大变化?有些人几十年都是一个样子,看多了烦不烦?编剧也不是说换一部作品,它就天翻地覆了。再加上现在几乎所有人用的都是同一个编剧模型……这个编剧模型固化的问题,我们会在后面再谈到。

观众可能不懂编剧理论,但你套路用多了,观众肯定能感觉到;而且现在不管是什么电影,肯定有人在豆瓣上喷编剧三观不正,这个也是很难避免的。你想想,你跟你关系最好的几个朋友,如果掏心窝子说话,价值观也不可能完全一致的。个人的价值观不可能讨好所有人。这就是在创作中引入类似《人工诗韵》这种机制的好处,因为故事发展并不完全受到编剧个人意志的控制。人为设计的感觉不会那么强,不仅对于观众来说,不容易产生审美疲劳,对于编剧自己来说也要更加健康。因为让一个编剧模型完全渗透到脑子里,会毒害到你生活的方方面面,随机成分一方面是始终为观众带来新鲜感,另一方面是可以避免你一再重复同样的内心叙事,到中年的时候变成一个自怨自艾、自我厌弃的Whiny Bitch。

然后是19世纪。首先是尤里卡(Eureka),也被称为拉丁诗歌机,由贵格会的发明家约翰·克拉克于1830年开始制作,并于1845年在伦敦皮卡迪利大街的埃及展厅展出。他的工作是基于刚才我们提到的约翰·皮特的《人工诗韵》,它的发明使这个过程完全自动化。

同样是19世纪,《后果》(Consequences),这是一款古老的客厅游戏,相当于那个年代的桌游。它的玩法是两个人或者多个人按照一定的规则来讲故事,一个人先在纸上写下单词或者短句,然后将纸折起来,隐藏他写的内容,再给下一个人。下一个人重复这个步骤,大家通过这套规则来创建一个完整的故事,最后这个故事会被大声读出来以供娱乐。

在这个话题上,我们可以再延展一下。后来也出现过一些类似的游戏,比如在20世纪初,法国的一些艺术家们经常玩的精致尸体(cadavre exquis)。玩家名单中包括我们熟悉的安德烈·布勒东、胡安·米罗、弗里达·卡罗以及萨尔瓦多·达利。这个游戏一开始是文字版,后来他们还开发出了图像版。我们现在还可以看到他们通过这个游戏共创的一些画作。和文字版类似,图像版也是把大部分的图像遮住,让另一个人接着画。后来超现实主义的出现和这个游戏或多或少是有些关系的。可见对于艺术创作者,即兴自发的创造力的重要性,创造是每个人与生俱来的能力,我们所需要做的只是把后天教育形成的抑制去除掉。如果你没有创造力,可能是你游戏玩的还不够多。

1953年,莱纳德·斯特恩以及罗格·普莱斯发明了《Mad Lib》(疯狂的自由),也是类似的游戏。疯狂的自由对即兴表演领域有很大的影响,加上这两个人本身就在电视喜剧界工作,我们在现在的一些脱口秀游戏中还是经常能看到类似的游戏,这个我们就不细说了。现代的各种讲故事的桌游或多或少是从这些游戏发展出来的。后果这个游戏同样也被视为计算机文学的先驱,包括我们后面会提到的情书生成器。

然后是1928年,学者弗拉基米尔·普洛普发表《故事形态学》。从这个人的名字你应该就可以看出来,这是一个强者。

故事形态学的发表是叙事学历史上的一个重要事件。如果你从事戏剧创作或者与故事写作相关的工作,我强烈建议你读一读这本书。很多人以为编剧作为一种艺术创作,靠的完全是缪斯女神赐予的灵光乍现,这也是很多人认为AI无法从事艺术工作的原因,因为灵感不能被程序化。实际上并非如此,编剧工作有相当多的程序化的部分。其实编剧工作理论化乃至程序化的历史非常悠久,故事结构角色分类方面的理论至少可以追溯到古希腊的《诗学》与古印度的《舞论》。而现代影视工业,比如好莱坞,也有多种多样的成熟的编剧模型,这些模型基本上是从“英雄之旅”发展出来的。这个模型是源自约瑟夫·坎贝尔在1949年发表的作品《千面英雄》。我个人认为,这个模型的出现是人类历史上的一场灾难,因为乔治·卢卡斯宣称《星球大战》的创作受到了千面英雄的影响,这极大地提升了这个模型的知名度。好莱坞编剧们开始竞相使用这个模型,由于好莱坞在商业上的强势,基于英雄之旅发展出来的编剧模型也传遍了全世界。可以说,约瑟夫·坎贝尔的英雄之旅通过影视作品与游戏影响了全世界人的内心叙事。

请注意,这是说这个模型对全人类的心理产生了无法估量的影响。他的书我看过几本,他是很典型的先射箭后画靶,在引证上非常不严谨,经常瞎编或者曲解故事来配合自己的观点,更像是一个心灵鸡汤作者而非学者。我称他为美国武志红。你可以在几乎所有好莱坞电影中看到英雄之旅这个模型,就更不要说超级英雄电影了。大家觉得超级英雄电影越来越无聊,一定程度上就是因为对这些编剧模型的滥用,用一个模型解释世界上所有的故事,本身就是对传统故事的曲解。这个模型的泛滥也极大地束缚了后来的编剧者们的创作。

好莱坞在商业上的成功为约瑟夫·坎贝尔赢得了巨大的声誉,很多编剧都以为是他发明了用于描述故事结构的模型,这其实也很不公正,好莱坞经常抄苏俄的东西再据为己有,由于当时的历史原因,被抄的人无法发声。叙事模型在过去的几百年间一直在持续发展,而普洛普可以说是第一个集大成者。

二、电子计算机时代

接下来我们会提到的电子计算机发明后的一些成果,也是基于普洛普的工作。然后让我们进入电子计算机时代。

电子计算机发明之初,人们就已经在探讨计算机能否思考,以及计算机是否有创造力。图灵在1949年预言,机器将渗透到人类思维的所有领域,甚至可以写出十四行诗。

1951年2月,世界上第一台商用通用电子计算机Ferranti Mark I被交付给曼彻斯特大学。计算机科学家克里斯托弗·斯特拉奇在1952年,将自己在国家物理实验室编写的可以下跳棋的人工智能程序移植到这台计算机上。他可以用正常的速度玩跳棋游戏。1952年,他编写了可以利用这台计算机内值的随机数生成器生成情书的程序。下面是它生成的情书,MUC是曼彻斯特大学计算机的缩写。

1954年,乔治敦大学在IBM的协助下,用IBM 701计算机首次完成了机器翻译实验。1964年,美国科学院成立了委员会调查机器翻译的可行性,并于1966年出具了一份报告,否定了机器翻译的可行性。受到这份报告的打击,机器翻译领域在接下来的一段时间内进展缓慢。除此之外,机器翻译在几十年间一直不断地发展,到今天已经有了巨大的飞跃。

1959年,《Augenblick》杂志以随机文本(Stochastische Texte)为题,出版了我们所知的最早的计算机诗歌。这个程序的作者是斯图加特工业大学的西奥·卢茨(Theo Lutz)。他的一位朋友鲁·贡岑豪瑟(Rul Gunzenhäuser)通过数学建模,支持了他的项目。鲁还建议使用卡夫卡的小说《城堡》中的文字作为素材。我觉得这首诗有一种威廉古堡的感觉,不知道周杰伦有没有用过这个东西。

60年代初,语言学家约瑟夫·格里姆斯开发了一个故事生成器,这个系统是基于我们前面提到的普洛普的工作。关于这个故事生成器,我们所知的细节很少。

1966年,最早的聊天机器人ELIZA被创建,作者是麻省理工学院的约瑟夫·威森鲍姆。ELIZA会模仿心理治疗师来回答使用者的文字描述和问题。

我们顺着聊天机器人这个关键词再延展一下,后来也出现过很多其他的聊天机器人。比较值得一提的有1991年的Dr. Sbaitso,这是最早的语音聊天机器人,由新加坡的Creative Labs创造。大家可以感受一下。然后是1995年,理查德·华莱士构建了聊天机器人爱丽丝,他因此获得了2000年和2001年的人工智能最高荣誉奖——洛伯纳奖。大家很熟悉的,由杰昆·菲尼克斯与斯嘉丽·约翰逊主演的电影《她》其导演斯派克·琼斯说,这部电影的灵感就是来自于爱丽丝。后面也出现过很多其他的聊天机器人,大家最熟悉的可能就是在2010年,Siri被苹果收购并在后来被整合进苹果4S中。聊天机器人从此被大众所熟知。其他大厂后来也纷纷推出自己的聊天机器人,我们就不一一列举了。

类似研究比较多的我们就找一些关键节点来讲。因为当时出于对隐私方面的担忧,这些聊天机器人我用的很少。我印象比较深刻的是,有一次我在朋友家里提到我爸,小爱同学应了一句“我在”。

我们继续回到主线上。1973年,谢尔顿开发了Novel Writer小说作者这个程序,这个谢尔顿不是Sheldon Cooper,而是Sheldon Klein。这个程序使用Fortran语言编写,可以生成2,100个单词的谋杀悬疑故事。

1977年,《故事旋转》(Tale spin),作者米翰,这通常被认为是最早的智能故事生成器。然后是1984年,《The Policeman Spirit is Half Constructed》出版。警察的胡子是……嗯,我不知道这个应该怎么翻译。总而言之,这是第一本由电脑程序编写并出版的书。有些内容可能有点抽象,难以理解,但如果配合图片使用,效果就另当别论。同一时代,也出现过一些其他的故事协作程序,比如Universe宇宙,这些我们就不细讲了。

然后是1994年,第一个笑话生成器JAPE被创建。以下是它生成的笑话,看看大家能不能get到。嗯,我觉得比起乔治·卡林和路易·CK,可能还是有一定的差距。JAPE是计算机幽默领域的早期成果。这个领域第一次专门的会议在1996年举办,这个我们就不细讲了。

这些千禧年前的古老程序,很多都可以在网上找到。如果你想体验一下,搜关键词就可以了。

三、进入新千年

接下来我们来看一下新千年的成果。

2006年
微软亚洲研究所发布了这个对联系统。我不知道在国际上,这个研究是什么分量,但我还是想在这里提一下。我相信很多人都用过这个程序,反正当时我自己是玩得不亦乐乎。你可以在程序中输入一部分文字,它会为你补全其他的文字,给出一些备选答案。你可以利用它的答案拼成对联。这是当时在贴吧里有一些网友的出句和我用这个程序对的对句。这个是备选答案太多了,就变成了两副对联,还有一些边角料就写了后面这个。我没有学过格律,想必这些文字在行家眼里看来是很可笑的。但我想,这一类应用很重要的一个用处就是可以让外行用很低的成本自娱自乐。这也是现在各领域的专业人士普遍感觉受到AI技术的威胁的原因。因为它不需要做得比你好,它只需要做到让一个外行可以做出让其他外行看着像那么回事的东西,就足够了。
这些是当时我用贴吧里的一些网友的ID对的对联,当然也是经过了人工的筛选和调整的。不知道大家觉得怎么样?
然后我们回到主线,看看新闻领域的进展。

2007年
前思科工程师罗比·阿伦创建了统计表Stash sheet,这是一个可以自动更新数据的体育网站。2011年,公司更名为Automatic Insights,缩写是AI。这个公司也逐渐扩展他们的业务到其他体育联盟以及金融房地产等非体育主题。后来美联社采购了他们的服务,成为第一家配备人工智能编辑的新闻编辑室,开创了自动化新闻业。

2010年
初创公司Narrative science(叙事科学)成立。这个公司从一个学生项目StatsMonkey发展而来,该项目专注于自动编写基于比赛数据的故事。后来他们专注于将技术应用于新闻领域。国内在这个领域跟进得比较快,最早的成果是腾讯财经开发的Dreamwriter。2015年9月10日,Dreamwriter第一次发稿,新华社于同年11月开始使用。写稿机器人快笔小新是国内最早使用机器写稿的官方媒体,其他互联网大厂和媒体也有跟进,就不一一列举了。

2018年
福布斯在北美的编辑人员和高级撰稿人开始使用Bertie系统。Bertie可以学习并为不同的作者定制输出,它可以根据作者之前的文章推荐文章主题,还可以建议相关的标题和图片。Bertie使他们获得了巨大的流量增长。在那几年,这些工具一开始在新闻界也是普遍受到质疑的。除了对于抢走人类工作的担心,人们也害怕机器的使用会污染新闻界。但质疑的声音也没有持续太久,很快大家就发现这些工具很擅长撰写基于数据的重复性较高的报道,但在写比较复杂的文章时,比如福布斯的作者们,就觉得这个东西只能用来辅助,不能用来产出。

国内在这方面的跟进还是比较快的,进展也比较迅速。在18、19年的时候,我已经开始怀疑很多营销号的文章都是用机器写出来的。营销号,相信大家都很熟悉,但营销号用机器写作是怎么回事呢?大家有什么想法呢?欢迎在评论区留言与小编一起讨论哦。

刚才是顺着新闻领域稍微延展了一下,现在我们回到主线。

2009年
Grammarly公司成立,这是一家总部位于美国的乌克兰技术公司,该公司提供基于人工智能和自然语言处理的写作辅助工具。它可以自动检测语法与拼写错误,以及检测抄袭并提出替换建议。

2013年2月1日
网飞拍摄的《纸牌屋》上映,这部据说是通过数据分析立项的电视剧,将网飞推向了巅峰,成为大数据神话的开端。在很多方面,这部剧都开创了业界先河,无论是一次性放出一整季的操作,还是他们分析和使用用户数据的方式。虽然《纸牌屋》的编剧否认了仅凭数据能够算出火爆的作品,但无论如何,这部剧的上线标志着流媒体进入了全新的时代。在接下来的若干年里,好莱坞将会受到来自流媒体巨头的巨大冲击,全球的行业逻辑乃至编剧的创作逻辑从这里开始会发生更剧烈的变化。

2015年
Scriptbook成立,他们的产品会对剧本进行详细分析并预测票房。国内最早的类似公司应该是16年11月成立的海马轻帆,根据海马轻帆自己的说法,他们的剧本智能评估服务在国内剧本市场的渗透率达到80%,其案例包括《你好,李焕英》、 《流浪地球》这样的作品。

顺便说一下,2015年年末,有新闻称阿里影业副总裁徐远翔在一次论坛上宣称阿里影业已经总结出了在中国影视行业制胜的科学公式,那就是做电影必须符合有IP、有明星、有逆袭主题三大条件,并且宣称阿里影业不需要专业编剧。他提出了一套由网文作者和同人文作者PK在网上海选剧本,再由专业编剧修改的方式,宣称这是给编剧们指一条生路。此举遭到众多职业编剧的反击。徐远翔则表示自己没有说过这些话,同时网上也传说阿里在开发编剧AI,这是徐远翔有底气抛弃专业编剧的原因之一。这件事也遭到编剧界的抵触,但我搜了很久,一直没有搜到确切的证据可以证明阿里开发编剧AI,这条新闻可能是洋葱新闻半真半假。

无论如何,国内外相继出现了类似的数据分析公司,这也是行业创作逻辑再一次改变的一个关键节点。从这里想下去,或许你就可以理解为什么现在烂片越来越多,而堆IP、堆明星、逆袭主题也确实是现在电影界的怪现状。从这里我们或许可以找到一些原因。

我们再次回到主线。

2015年12月
奥特曼、马斯克和其他投资者宣布联合成立非营利性人工智能实验室OpenAI,毫无疑问,在整个人工智能的历史上,这都是一个值得记录的关键节点。

2016年9月

AI写作辅助软件Frase发布,类似的工具现在也已经有很多,我们就不一一细说了。接下来是人工智能编剧领域的一个关键节点,《Sunspring》这部科幻短片是第一部由人工智能编写剧本的电影。2016年6月9日发布,写出这一剧本的程序被命名为本杰明,导演奥斯卡·夏普与纽约大学人工智能研究员罗斯·古德温合作创建了这一程序。这部电影是参加伦敦科幻电影节48小时电影挑战赛的成果。参赛者会收到一组通知,主要是道具和台词,这些提示必须出现在他们接下来两天制作的电影中。

本杰明是世界上第一位人工智能编剧,它采用长短期记忆网络……(这一块我没有看懂,有专业人士的话可以指点一下)。它被投喂了一些人类写的科幻剧本进行训练,除了剧本,本杰明也创作了这部电影的配乐。我是19年第一次在B站看到这个电影,当时所有人都在嘲讽他是人工智障,这个剧本有些地方确实写得比较抽象,比如……又比如……但我当时作为从业者,只觉得脊背发凉,因为我无法不想到以现在的技术进步的速度,它还要花多久就可以取代人的工作。后来我就一直关注这方面的进展。前面我们也说了,编剧工作有相当多的技术成分,故事结构的模型在普洛普那个时代就已经成熟了。编剧工作的入门一定程度上就是在学习开发自己的编剧模型。所以编剧工作在设计故事前提、大纲和角色的时候,本来就有大量的时间是在处理这些模型、搜集信息、调查、写作等等环节,也有非常多的机械重复的部分。这些工作是可以程序化的。随着AI工具的发展,甚至采访表演测试这些环节也可以部分程序化,这可以节省大量的时间。我还找学编程的人问过,能不能根据这些模型让AI写作,但没有得到结果。当时我从一些科普读物上了解到,人机协作已经是不可避免的一个趋势,从摩尔定律以及实际的技术进步的速度来看,我想很可能在几年之内就可以实现人机协作。但当我发现这一天已经来临的时候,我还是相当震惊。当时我感觉到的并不是失业危机,而是存在危机,因为机器越来越像人,人越来越像机器。

这个,罗斯·古德温在做完这个电影以后,也没闲着。2017年3月,罗斯·古德温从纽约开车前往新奥尔良。他在一辆凯迪拉克上加装了摄像头、GPS、麦克风和时钟,这些装置被连接到一台实时生成手稿的便携式AI写作机器上。在开车的时候,AI会用位置和时间等数据生成小说,并通过汽车后座的收据值打印出来。由此诞生了第一本未经人类编辑的人工智能写的书《One the Road》。

这个模型用的还是长短期记忆神经网络(我也还是不知道这个词是什么意思)。古德温说,他整的这个活是想模仿杰克·凯鲁亚克的旅行文学。我觉得这个思路本身挺有意思的。我自己也尝试过在旅行中写作,写作是对印象的编织,一直闷坐在电脑前并不能产生足够的印象,也不是一种健康的生活方式。旅行对于写作是很有帮助的。所以这个利用传感器给机器提供印象,辅助写作的思路我觉得很有趣。

当然,你可能已经想象到,这个时候的AI写出来的作品还没有达到通顺易懂的程度。2017年,谷歌大脑的一个团队推出了Transformer模型,后来这个模型逐渐取代了长短期记忆的模型,成为了自然语言处理的首选模型。后来OpenAI的GPT也是基于这个模型。

2018年3月 英国卫报曝光了英国公司剑桥数据分析操纵美国大选。该公司通过Facebook窃取了至少5000万用户的个人数据,并根据数据推送广告以及生成内容。Facebook股价因此暴跌,并面临创建以来的最大危机。该公司除了影响美国大选,也影响了英国脱欧。他们自称曾在五大洲活动,包括美国、欧洲、非洲、南美,甚至亚洲多国,也包括了当时处于冲突之中的乌克兰。他们的主要手段是通过一些小游戏、心理测试之类的程序窃取用户信息。怎么样,是不是很熟悉?

这个案例也使大数据和人工智能生成内容的风险问题第一次被抛到大众面前。

2018年2月 马斯克退出OpenAI董事会。同年6月,OpenAI发布GPT-1模型,这是基于前面我们提到的Transformer架构推出的大型语言模型。 2019年2月 OpenAI发布GPT-2,随后马斯克宣布彻底退出OpenAI。

四、人工智能爆发时代

2020年6月 OpenAI发布了GPT-3模型,这个模型有1,750亿参数,能力远超之前的GPT-2。我记得,当时看到很多用这个模型整合的新闻。有很多人用它帮自己写作业、写论文。有一位学生用GPT-3写了一篇心灵鸡汤,发表在Hacker News论坛,这篇博文一度成为该论坛的最热文章,直到作者本人公布了真相,才被揭穿。

当然,这一次也有电影学院的学生用GPT-3写剧本。有人在美国论坛Reddit上,每分钟发一条信息,后来该用户的回帖速度越来越快,几秒钟就能回复一篇文章,才被人识破,暂停了更新。美国哲学家丹尼尔·丹内特用自己的著作训练GPT-3,然后分别向哲学家本人和电子哲学家提出10个问题,让他们作答。这个实验邀请了300位参与者来分辨AI与哲学家的回答,参与者都是对他的著作比较熟悉的人,也包括了该领域的专家。但在这次实验中,专家们的平均正确率只有5.1分,10分是满分,读者的正确率是4.8分,而且没有一个人猜对所有问题。

类似的这种整活儿在今天已经越来越多了,比如前段时间,日本文学的最高荣誉之一,芥川龙之介赏的获得者九段理江透露,她的得奖作品有5%的内容由ChatGPT生成。此事引起网民热议。

然后我们回到主线 2021年 Anyword推出AI文案平台,进入营销与广告领域。它们的第一代模型是在2019年建立的Anyword,利用自然语言处理来生成和优化网站社交媒体、电子邮件和广告的营销文本。

2022年6月12日 华盛顿邮报报道,一位名叫布莱克・雷蒙恩的谷歌工程师宣称自己与人工智能展开了深度对谈。他认为后者产生了自我意识。后来,谷歌证实已将这位工程师解雇,宣称雷蒙恩的言论违反了公司的就业和数据安全政策。这件事我记得在当时引起了一点点波澜。当时我是感觉很震撼的,因为在雷蒙贴出的对谈里面,谷歌的模型LaMDA非常完善地解释了传宗公案里的“破镜重圆”的意思。这是我第一次看到人工智能表现出和人类一样的理解能力。

当时这件事很有争议,有很多人,包括一些业内人士,都认为他疯了,还有很多人在科普,AI模型只是在预测字词,不可能了解人的意思。但就在短短几个月之后,2022年11月30日,OpenAI推出了ChatGPT,这件事立刻就被人抛诸脑后了。因为所有人都通过与GPT实际的互动,对人工智能的进展有了切身的理解。ChatGPT的发布是一个里程碑式的事件。

在2022年,人工智能话题本来就因为图像生成领域的进展而受到了很大的关注,ChatGPT的发布则把这个话题的关注度推向了顶峰。几乎是同一时间,DeepMind发布了AI写作模型Dramatron,这是一个用于编剧的AI模型。Dramatron可以通过一个由用户提供的摘要生成整个剧本,长度可以达到几万字,其内容包括标题角色、包含节拍表的故事情节、地点描述和对话。用户可以在分层生成的任何阶段进行干预和修改。

研究人员邀请了15位专业人士进行测试,大家的评价有好有坏。有些人认为它创作的内容没有达到直接使用的标准,但普遍对于人机协作的可能性给出了肯定。因为它发布的时间和ChatGPT这件事几乎是同时,这件事基本上没有被大众注意到。

2023年3月15日 OpenAI发布了GPT-4。去年7月份有一天,我在家里白嫖一个可以联网的GPT-4,GPT给了我一点小小的震撼。在GPT-3.0的时候,我就觉得GPT可以用于编剧了。我也说过,我找程序员问过这件事,因为当时我以为需要通过代码来描述编剧模型。但这一天,我用GPT-4写文章的时候,它直接在网上搜了一些写作规则,然后按照这些规则来写作。也就是说,它可以理解自然语言设定的编剧模型,而且可以记住非常长的上下文。那个时候,我意识到完全依靠人类来编剧的时代已经终结了。

新的工具会给故事创作带来新的可能性。电影本身就是新工具带来的新题材。在过去100年里,电影也一直受到工具进步的影响,不断变化。不管是过去的从黑白默片到有声彩色,还是现在的MX和120帧,欧洲与美国的电影向不同的方向发展,也有工具的区别的原因。而近年来写作软件的进化,也导致了编剧技术的发展。这几年非线性的编剧佳作越来越多,是软件的进步带来了这种极度复杂、有机的故事结构的可能性。桌游与游戏机制对电影界的影响,也导致了新的故事形式。

新的工具会给故事创作带来新的可能,而现在工具革新的速度非常快。我们可以想象,现在的电影形式,在未来的十年中会发生颠覆性的变化。我们所熟知的这套电影制作方式语法,也将不复存在。

2023年5月2日 美国编剧工会宣布罢工。这次罢工行动还得到了很多其他国家的编剧协会的支持乃至效仿。当时我在B站评论上看到,有人说这次罢工只是为了流媒体分成,与AI没有关系。实际上并非如此,这次罢工发生在ChatGPT发布之后5个月,一些数字媒体公司也已经在用AI生产内容和大规模裁员了。好莱坞的资本们也已经迫不及待地要用AI降本增效了。

就在罢工期间,纽约时报曝光了网飞的新合同条款,网飞打算用AI永久白嫖配音演员的声音。这个操作是不是也很熟悉?7月14日,演员工会也开始罢工,这是1980年以来好莱坞演员第一次因为劳资纠纷而发起抗议。是不是有一种科幻照进现实的感觉?在电影《未来学大会》中,就有这个永久白嫖的小段。编剧和演员们应该也是预见到了未来会有和电影结尾一样的悲惨光景,而奋起抗争。

根据工会的罢工持续了接近5个月,后来双方达成的协议中,除了流媒体分成等问题,也包含了一些关于人工智能的条款。编剧们担心的各种状况中,有一种就是会被要求改编由大语言模型写出来的剧本,但得到的报酬要比原创作品更低。前面我们聊到阿里影业的那一段,当时阿里影业就已经打算抛弃专业编剧了。看来在这方面的创新,国外还是远远落后于国内。这件事也反映出来,为什么全球的电影质量都在下滑,但中国的滑坡程度还是远远超过欧美。权力是自己争取来的,但这些条款没有否定人机协作的可能性。实际上工具的进步与人机协同已经是不可阻挡的了。

现在在Final Draft里,已经可以用不同的声音朗读剧本。我们也可以借助网上已有的各种工具来实现用某个演员的声音读剧本,或者用AI来做造型画故事版等等。毫无疑问,AI还会继续渗透到更多创作环节。就在这场罢工期间,旧金山初创公司Fable推出了一个大型项目The Simulation。该技术可以生成以用户为主角的剧集。公司的首席执行官爱德华在接受采访时说,它不仅能制作对话,还能制作动画配音和剪辑,还可以直接生成电视剧集。他相信未来的电视节目会朝着生成式的方向发展,这会彻底改变未来影视行业的商业模式。他们认为,让AI角色拥有自己的生活是一个重要突破。通过多智能体模拟,剧中的角色能够互相训练,拥有完整的生命。

如果大家看过一些比较传统的编剧教材,你可能会知道以前的编剧对于要花多少时间写完剧本,这个时间的估算是比较保守的。一般大家会说,要写一个120页的完整的电影剧本,需要至少12个月。前面我们也说过,人接受印象的速度是有限的,要让一个剧本中的每个角色都活过来,具有独立的生命,需要很多的时间精力的投入。你至少要一个四季轮回,才能将足够的印象注入其中。但在流媒体时代,影视行业的工作速度在不断加快,编剧们已经不可能有足够的时间去创造有独立生命的角色了。

现在,Fable公司让AI角色拥有自己的生活。在人类的工作方式越来越像机器的时候,机器的工作方式反而越来越像人了。这也算很有趣的一点。这次罢工达成的协议中,还包括了每年至少两次重新商定与AI相关的协议,因为编剧工会认为AI技术的进展太快,如果要等到三年的合约结束,可能会有太大的变动,所以需要随时重新订立。

演员公会参与罢工,部分原因也是因为感受到了数字人的威胁。为什么会有人说这件事与AI没有关系呢?造成失业率越来越高的,并不完全是经济下行。失业率的上升,在疫情前很多年就已经开始了。机器人与AI技术的发展,是造成失业率提升的最大因素。因为技术发展越来越快,人们已经赶不上社会结构的调整了。在今天这个问题只是变得更加明显。

2024年2月 OpenAI发布了Sora。虽然此前已经有很多可以生成视频的模型,但从实际的画面质量来看,Sora完爆了之前的产品。它可以生成长达一分钟的高质量视频。

Sora刚刚发布后,我就在群里看到有人在筹划用它来做电影了。我很难不联想到,当这种工具向大众开放和普及,人人都可以用它来做电影,创作的门槛将会大大降低。传统编剧的格式也将不复存在,因为以前的剧本是写给人看的,以后的剧本则会结合提示词的形式,因为是写给机器看的。

同样是故事创作,影视编剧和小说有很明显的区别。小说是读者对着一本书产生幻想,作者写的是文字,呈现出来的也是文字。而影视是让观众看创作人员的幻想。影视编剧用的是文字,呈现出来的却是视听。中间可能会有很多人员的参与,有多个制作步骤,从最初的火花到最终的呈现,中间隔了好几层,有太多的不可控因素。仅仅是剧本写得好,并不能保证成品有良好的观感。如果在表演或者剪辑等环节砸了,那整个电影也是砸了。

创作时编剧要用视觉与听觉想象,但不可能一步到位地呈现自己的幻想。类似Sora这样的新技术的发展,会改变整个创作流程,也因此会重塑整个行业的结构。

就在我制作这个节目的这几天,又出来了两个新闻。一个是世界上首位AI程序员Devin的诞生,另一个是在节目的最开始我们提到的3月6日,第一部AI长片公映。这部电影由50位艺术家经过三个月的创作,在Sora发布之前就已经完成。

以上就是迄今为止在程序写作这个领域的一个简单历史,未来的历史就等着我们去书写了。

五、结语

梳理历史的过程让我意识到,影视编剧交互叙事与机器写作共享了某些基础理论。它们的发展都基于基础理论的发展,也互相关联互相影响。在此之前,我从来没有意识到编剧技术的发展与编程技术的发展是息息相关的。

另外一个强烈的观感是,这些创新基本上是以美国为中心,国内似乎极为滞后。这个观感可能有误,如果有人可以补充,我将感激不尽。

中国在过去的几十年中,一直在吃复制发达国家创新的红利,现在红利到头了,开始强调创新创造了。但整个体系还有很多糟糕的惯性,我们的教育从来就不关注创新创造。这个巨变中的世界,需要很多人来探索新的教育方向。

技术的变化不是突然发生的,从前面的历史我们已经看到,技术的突破来自于旧有技术的结合与累积。旧有技术的结合产生了第八艺术,前八种艺术的结合又产生了第九艺术。在不久的未来,AI与元宇宙、非侵入脑机等技术的结合,还会带来更强互动性的新的艺术形式。

我们常常说电影是造梦的艺术,而第九艺术后的新艺术无疑在形式上也会更加接近梦境。在这场革命中,很多相关从业者已经感受到了即将到来的雪崩的冲击。人类的产业结构肯定会受到影响,但生态的变化也肯定伴随着新机会的出现。我个人认为,对于专业人士而言,未来也并不完全是悲观的。

工具的发展更多的是带给缺乏资金与资源的人机会,降低了创作门槛,节省了创作时间。通过垄断资源、垄断渠道的竞争方式已经不再行得通了。但并不是说基本的能力认知与审美不重要了。从来就不缺乏掌握了一线资源的团队拍摄大烂片,这难道是工具不够先进吗?实际上,基本功能的开发反而更重要了。哪怕你不再需要通过实体的工具来创作,以学习绘画为例,绘画不仅仅是学习用笔来画画,还是在学习怎样用眼睛观看事物。你不只是在研究画功,你也是在研究视觉信号,从接触眼睛到被认知的整个过程。

对于其他领域的艺术工作者而言也是一样的。你可以不学乐器了,但这也不代表你可以不发展听觉皮层。我相信随着工具的进化,人类确实已经进入了全民创造的时代。

在创造力这个话题上,我也会做出更多关于提升与整合基本能力的练习,以及关于创造力的本质和如何激发创造力与协作能力的观点、方法的分享。感谢大家的关注。

这个节目是围绕程序写作做了一个梳理,相关的领域如果延展的太多,就会涉及叙事逻辑的发展、交互叙事与抄文本的发展以及人工智能和编程技术的发展。限于篇幅,我尽量从编剧角度选了一些关键节点。你可以搜索前面出现的一些相关关键词和参考评论区的一些资料,获得更多信息。

最后说一句,这个节目的制作有ChatGPT的参与,它给出的部分信息经过交叉搜索后,证实有误。再顺便说一下,我问了GPT,它说这不是交叉搜索。

感谢你可以听到这里。关于这个节目,如果你有任何观点补充或者纠正,想要分享,欢迎留言,我们下期再见。

参考资料

这篇的参考资料实在是太多了,当时我还没找到在视频中标注引用的方案,参考源已经无法完全列举,这里列出一些最主要的:

《 An Introduction to AI Story Generation》—— Mark Riedl

《Cybertext》—— Espen J· Aarseth

《Cybertext》 读书笔记 —— 低多边形厌氧菌

Narrative Logic Folktales and Machines —— Michael Robertson

Machine humour —— Kim Binsted

Hypertext —— George Landow

Possible Worlds, Artificial Intelligence, and Narrative Theory —— Marie-Laure Ryan

Hamlet on the Holodeck —— Janet H. Murray

chatGPT(在写作之初,我要求chatGPT列出一些信息作为参考;所以它也是参考源之一;其中部分信息,经搜索证实有误) ……

你可以在这些文章和书籍中发现更多参考文献。

PS:视频发布后十天,在评论区补了一段文字 —— 再看这个节目,我的表达可能有些分裂。因为感觉到某些观点过于负面,为了平衡一下,在结尾刻意拔高、乐观了一下。但如果实话实说,我认为行业内大部分人的未来都十分黯淡。 从19年到现在,我向身边很多人问过这个问题,包括编剧、表演、美术、音乐、舞蹈、书法等行业的人,我听到的总是对AI的否定――机器不能取代人,机器做的东西没有“灵魂”,机器做不了艺术,甚至到今天仍然如此,反倒是外行们普遍持相反观点 他们总是觉得机器不能“取代”我,因为机器不能做到和我一样好 我的观点是,机器不能取代你的存在,就像你不能取代动物或者机器的存在;但它可以取代你的地位,或者改变你的工作方式,冲击你的薪资 最终你不得不接受人机协作,或接受失业的事实 这并不是希望大家陷入悲观情绪中,而是希望大家警醒,更加重视人无法被机器取代的部分,和更加重视具身认知在教育中的重要性

欢迎交流

不管是对这个主题有兴趣的研究者、从业者,还是AI写作模型的开发者 ➨ 欢迎来交流