内容提要:人工智能在新闻和视觉艺术领域参与创作活动的现象虽然在如今已成常态,但如何认定由此生成内容的可版权性及其权利归属,在法律上却并未形成统一意见。作为非自然人和法人的人工智能首次成为内容来源后,如果将该内容认定为受著作权法保护的作品,必将冲击传统著作权的客体认定标准和权利归属原则,引发权利变动和侵权认定规则的全面混乱。作为激励“理性人”创作和传播的制度工具,著作权法无法脱离从移植自有体物财产权的制度体系和主客体不得互换的基本私法原理,因而围绕创作者和投资者构建的制度设计不应也无法因人工智能而被颠覆。作为遵循人工智能软件设计者意志创作的产物,人工智能生成内容的结果不但仍可由独创性判定标准来认定,权利归属也应借鉴早已存在且运作成熟的法人作品制度安排,将人工智能的所有者视为著作权人。
一、问题的提出
机器对于著作权法而言,一直以来仅作为创作和传播的辅助工具存在,在创作行为上仅限于代替书写和丰富作品固定于载体的方式,并未产生任何独立的著作权法律效果;而在传播行为上则不断扩展了作品的使用方式,促使著作权法为此增加相应的法定权利类型及其限制方式,所以机器对著作权法的影响更多发生在传播而非创作领域。随着传播技术对作品使用方式的改变,新的商业模式不断基于新的作品经济利益实现途径而出现,由此需要在法律上加以调整,以重新平衡权利人与使用者的利益。人工智能不同于以往影响著作权法的机器之处,在于其已进入到对作品创作环节的介入。美国人工智能机器人通过学习已经能够生成极具艺术性和美感的美术作品,并在画廊和博物馆展出。美联社与人工智能公司合作开展的人工智能新闻写作平台Wordsmith,如今已经达到每季度三千余篇的产量。特别是在财经和体育等需要大量数据分析的新闻报道领域,人工智能在利用大数据和大规模分析数据等方面的优势,使其成为最先介入创作行为的领域,我国腾讯等互联网公司也自行开发了Dreamwriter软件来批量撰写财经类新闻报道,并已能根据不同受众群体生成差异化的风格和版本,由此引发了人工智能将代替记者的讨论。在音乐和视觉艺术领域,人工智能介入自然人的创作行为也早已出现,在人的指导下,谷歌提供的人工智能设备DeepDream所生成的绘画已拍卖成功;与此同时,计算机游戏软件在人工智能的帮助下,也能自行生成全新游戏界面供玩家使用。
人工智能对人类创作行为的替代,对现行著作权规则提出了新的挑战。自现代著作权法产生至今,其立法目标始终是通过赋予权利人对作品的法定专有权来激励作品创作和传播。对作品及其归属的认定,也围绕作为主体的著作权人展开。作品作为独创性表达,被认为必须源自人的思想和感情。同理,基于作品的权利也只可能归属于由自然人、法人和其他组织构成的著作权人。法人和其他组织在著作权制度中的意义,体现在对作品创作和传播的组织和投资上,乃产业化发展和分工所必须,最终落脚的仍然是激励人的特定行为。不同于以往机器对创作行为的介入方式,如今人工智能生成内容的方式和结果,是能够独立抓取相关素材并以一定创造性的方式加以重新表达,而不再局限于对信息的抓取和整合。如此则会出现以下两个相关联的著作权问题:
第一,人工智能生成的内容是否能够基于独创性标准认定为作品;
第二,人工智能软件的设计者、使用者或著作权人是否可认定为人工智能生成内容的著作权人。随着人工智能生成的内容越来越多,如果不明确界定其内容属性和权利归属,不但将引发大量著作权法律争议,而且会冲击既有著作权制度体系,产生海量且另类的“孤儿作品”。有鉴于此,首先,需要梳理著作权制度在历史上界定非人类生成内容的方式和原因,界定人工智能与既有著作权体系的矛盾根源;其次,将人工智能生成内容的结果加以类型化,以探寻其内容纳入既有作品判定标准的可行性路径;最后,通过对人工智能生成内容独创性来源的分析,考察既有著作权归属模式应如何规制人工智能生成的内容。
二、作者与人工智能的法理冲突
在私权体系中,权利主体与权利客体不仅相对应,而且彼此之间的法律地位不得转换,所以权利主体不能是权利客体,权利客体亦永远无法成为权利主体,只可能是法定支配权的对象。对于著作权法而言,权利主体与客体不但同样不得转换,而且所有权利客体的来源须限于权利主体,所以无论是著作权法中的作品判定要件,还是权利归属安排,其中都具备的要素皆有作为人的权利主体。在作品判定要件中,著作权法要求作品必须是文学、艺术或科学领域内的独创性表达,其中所谓“表达”,是指须以文字、言语、符号、声音、动作、色彩等一定表现形式将无形的思想表现于外部,使他人通过感官能感觉其存在。由此可见,表达的前提乃自然人所独有的智力或思想。在权利归属条款中,著作权法也明确否认自然人以外的对象能够实施创作行为,所以明确规定“创作作品的公民是作者”,特定情况下法人或者其他组织只能“视为”作者,而视为作者的原因,还是因为作品体现出了法人的意志。由此可知,权利主体与客体的严格划分和转换禁止,乃是绝对权支配性带来的必然结果,私法完全否定主体在任何情况下变成客体从而被作为可支配对象的可能,但这一限定同时也排除了客体支配客体或客体归属于客体的可能。所以如果严格依据现行著作权法来解释,人工智能本身作为权利客体,其显然无法具备如自然人一样的意思或意志而转换成为权利主体,其生成的内容亦不可能同时成为作品。
基于上述法理推理,人工智能生成内容的法律效果将出现如下悖论:首先,即使人工智能所生成的内容符合独创性标准的要求,也将因为无法视为表达而不得成为作品;其次,即使人工智能所生成的内容被认定为作品,其著作权也无法归属于人工智能本身。因此,大量由人工智能生成的内容将成为新类型的“孤儿作品”和“无主作品”,既不利于激励新作品的创作和新人工智能的开发,也无益于著作权市场的合规性和稳定性。
事实上,早在20世纪50年代计算机技术兴起初期,美国即出现了对“机器创作”法律属性的讨论。当时即有数学家利用当时的计算机实现每小时创作四千首歌曲的记录,然而美国版权局却拒绝将上述歌曲视为作品加以登记,其理由在于该局从未登记过由机器创作的作品,但随后还是将计算机程序生成内容的现象视为版权局当时面临的重难点问题之一。在1973年第一版的《美国版权局工作手册》中,版权局确定了受著作权法保护的作品必须来源于人的创作。鉴于计算机技术在当时的迅猛发展,版权局在实务操作中否定计算机可视为作品来源的同时,国会还是新成立了考察新技术如何影响著作权的“新技术时代作品使用方式考察委员会”(National Commission on New Technological Uses of Copyright Works),并于1978年发布了最终调研报告,重申了版权局对待计算机程序生成内容的态度,认为现行著作权制度无须对此做出任何调整,计算机程序仅作为被动性协助创作的工具存在,而并未直接参与创作行为。然而,1986年国会技术评估办公室在重新研究计算机程序生成内容的问题时,却并不认同之前将计算机类比为打字机和照相机等协助创作工具的结论,因为随着计算机程序与操作者互动性的日趋增强,不应忽视计算机在某种程度上有被视为合作作者的可能。正如该机构所预测,自20世纪90年代至今,计算机程序的确朝着直接参与创作的方向发展。特别是在视觉艺术领域,计算机已完全能够在脱离人工参与的情况下实现独立生成内容。在事前不告知是由计算机程序生成的情况下,由计算机程序自行生成的绘画已具备了成熟风格,完全满足作品的独创性要件。在程序设计者和使用者完全没有参与创作的情况下,如何认定上述对象的可版权性及其权利归属,从现行著作权法中难以直接获得答案。即使在已经确认计算机生成内容为作品(computer-generated works)的英国,一方面在客体上将其认定为“集体作品”(collective work)的一种,但又认为该作品完全由计算机生成且不存在任何“人”的参与,另一方面权利归属上将该作品归属于使计算机获得独立生成内容之能力的主体,仍然在权利主体问题上回归到自然人,在客体界定和权利归属的法律逻辑上难以统一。
三、人工智能生成内容权利认定的私法基础
客体认定与权利归属上的悖论说明,如今我们面临的新问题,是原本作为著作权客体的计算机软件,正在迅速从协助创作的工具成为独立内容来源,基于传统的判定标准和方式,自然人作为当然的作者和作品来源在其中处于缺席状态。如果将著作权法中独创性之“创”理解为作者独有人格的物化过程,或者必须体现作者的个性,那么任何计算机程序或人工智能所生成的内容是否属于受著作权法保护的作品,首先需要确定该内容中是否存在人“对社会生活的素材加以选择、提炼、加工,运用自己的构思、技巧,塑造出艺术形象或表述科学技术的创造性劳动”。同理,只有在认定存在独创性的前提下,才可能继续考虑作品归属问题,究竟是根据著作权法的权利配置规则,将作品权利归属于创作者或投资者,还是突破性地认定人工智能为自然人、法人和其他组织之外的新作者。
与此同时,随着技术的进步,今天的人工智能已不同于20世纪中后期的计算机生成内容。人工智能所具备的“机器学习”(Machine Learning)功能,使其能够在没有预先算法或规则设定的情况下,通过主动学习来解决问题,人与机器内容生成的关系被进一步疏远。特别是随着大数据时代的到来,基于大数据技术所提供和整合的海量信息,机器学习的效果得以取得质的飞跃,人工智能在独立判断和应对上的失误率已经明显降低。更需要注意的是,人工智能在内容生成上已逐步脱离人的预先设计,可以根据自身所获取的数据来实施创作。近年来取得突破的人工智能“深度学习”,开始模拟人脑神经网络的构造,使得程序算法和独立思考的界限进一步模糊,深度学习是否可视为对人类思维过程的再现,已引起业界的广泛讨论。
相比之下,传统的计算机生成内容,则需要基于既定的算法来解决特定领域和范围内的问题。根据人参与创作的程度,计算机生成内容的类型可以分为以下两种:
第一类为程式化内容生成,即计算机所生成的内容乃基于内部程序或算法的事前设计。在此种计算机生成内容类型中,一切生成的内容皆为程序或算法实现设计的结果。例如近年被广泛讨论的计算机游戏画面的著作权问题,本质上其实就是软件程序设计者与使用者之间的著作权归属。无论游戏软件使用者采取何种方式操作游戏,都是基于软件设计者在软件中已有的情节安排,所以计算机游戏画面或任何计算机程序生成的内容,如果具备独创性要件,著作权显然应归属于软件著作权人所有,与软件的使用者无涉。需要注意的是,另有一类游戏或应用软件采取的是向使用者提供基本素材,然后使用者利用该素材生成新的独创性作品。从法定权利归属的角度看,此类计算机生成内容仍然可以认定原素材的著作权归属于软件著作权人,用户创造的内容按照著作权法演绎作品的安排处理。
第二类为自主性内容生成,即计算机程序基于使用者提供的素材自行生成新的内容,且相同素材每次所生成的内容皆不同。例如一些文字和音乐生成软件,可以根据用户提供的关键词和随机音符生成出连贯且具有一定风格的文字或音乐作品。在此种计算机生成内容的类型中,表面上无论是软件设计者和使用者皆没有直接对新作品的形成做出贡献,但是所生成内容的著作权仍然可视为归属于提供素材的使用者,因为该使用者乃是向计算机提供素材,且对素材进行了筛选并做出特定安排。
基于上述比较,人工智能生成内容与以往计算机生成内容的本质差别,在于人在内容生成中的作用不同。计算机生成内容将生成行为划分为数据输入与成果输出两个阶段,独创性部分体现在数据输入和算法设计上,著作权可明确归属于计算机软件设计者或使用者。而人工智能基于机器学习和深度学习,已经能够自行判断、收集和学习新的数据,最终实现脱离既定的算法预设来解决新问题独立生成新的内容,省去了计算机生成内容时人在数据和算法规则上的参与,这使得将人在算法规则上的事前设定或数据输入上的人为选择作为独创性来源的做法无法继续适用。
因此,既然人工智能因具备了模拟人的感知和判断能力,能够脱离算法预设来能动性地解决新问题,那么在法教义学上解决人工智能生成内容可版权性及其权利归属上的悖论,仍然需要回到“人”在人工智能内容生成中的真实作用这个基本问题。之所以不能脱离人来单独给予机器以著作权主体地位,也不能将独创性标准调整为人工智能独立完成的结果,还是因为权利主体与权利客体不可互换的私法基本原理。将人工智能视为著作权主体的直接后果,就是肯定机器与人一样成为权利主体,那么未来在权利变动的意思表示来源、侵权责任认定的对象等问题上,机器都将与人享有同样的法律地位和资格,如何认定机器的真实意思,如何考量机器在侵权行为中的主观过错,都是现行法律体系所无法完成的任务,也完全是对现行私法原理的颠覆。有鉴于此,人工智能创造内容的可版权性判断及其权利归属选择,必须建立在人作为权利主体的基础之上,换言之,必须坚持将独创性来源视为人的行为,人工智能生成内容的可版权性也只能是人在其中所起的作用。即使未来人工智能发展到了能够完全模拟人类思维的程度,也需要民法在主体制度中首先做出回应,而轮不到知识产权法进行创新。
四、人工智能生成内容权利归属的现实安排
从著作权法的角度看,人工智能基于机器学习所产生的结果究竟是否具有独创性,需要回答两个问题:
第一,人工智能所生成的内容是否达到了最低限度的创造性;
第二,人工智能所生成的内容是单纯的机械计算和程序推演还是属于人工智能设计者的行为。就第一个问题来看,如今大量事实表明,人工智能生成内容与人类创作的作品相比,在没有明确标明来源的情况下已很难区别。既然已无法根据表象分别人与人工智能生成内容的差别,那么将最低限度创造性所需要的选择和风格拘泥于完全由人所独有,显然不具备司法上的可操作性,当我们已无法区分所欣赏的作品为人类创作还是机器生成时,就意味着该内容应被认定为作品,所以人工智能生成内容客观上应视为满足独创性要件中对最低创造性的要求,避免未来在此问题上出现因缺少必要证据而无法认定的情形。有鉴于此,人工智能生成内容的可版权性的认定,就主要落在第二个问题的考量上,即上述最低限度的创造性是否由人独立完成。如上所述,在私权主体与客体不得转换的前提下,人工智能不可能成为权利主体和初始著作权人,因而在独创性之独的判定上,必须考虑以人的行为为基础,才能在既有私法理论和体系下认定作品并确立著作权归属。换言之,根本不存在归属于人工智能的作品或完全由人工智能创作的作品,无论来源如何,被认定为作品的对象只可能归属于人。
沿此思路分析,则需要确立人工智能中的智能与人工智能设计者或使用者的关联,才能满足人工智能生成内容的可版权性认定。从人工智能内容生成的步骤来看,所谓“智能”,所指的是通过机器学习从数据中发掘和整理出有价值的信息,并以此作为未来内容生成或解决其他问题的基础,简言之,即是在进行数据挖掘的同时实现价值判断和推理。从创作行为的角度看,不同于计算机生成内容,人的参与已不会出现在机器学习阶段,但从数据本身的取舍来看,取舍需要具备一定的价值评判标准,才能在之后内容生成时体现出最低限度的创造性,该取舍标准无法为机器所自动具备,而是需要由人类在机器初期的学习过程中向其提供。因此,人工智能得以在内容生成和其他领域适用,之前需要经过大量的训练,以实现数据建模,这一步骤是后来人工智能在生成内容时形成人类可以理解且具有逻辑性表达的基础。在人工智能领域,有学者将这种机器学期称为从“人机回圈”(Human-in-the-Loop)到“众机回圈”(Society-in-the-Loop)的过程,意图期望更多社会公众能够参与到对机器学习的训练中去,使得人工智能具备更受社会接纳的信息取舍标准和决策结果。可以认为,人工智能生成内容的前提,仍然是在之前机器学习过程中作为训练者的人将数据筛选的价值观传达给机器。人工智能超越人类之处,也更多来自于其穷尽一切可能性路径的超强计算能力,而非创造力,创造力的根本还是人在数据建模过程中通过训练赋予人工智能的价值取舍。只有如此,无论是面对复杂问题还是新内容生成,人工智能才能从结果上看似拥有了类似意识和智能的可能,最终将将无意识且无条理的数据信息经过选择和编排形成可供欣赏和理解的各类作品。
基于上述认知,人工智能生成内容在著作权法上可视为是代表设计者或训练者意志的创作行为。事实上,著作权法在拟制投资者和组织者作为著作权人时,早已设计了相关制度。在我国著作权法法人作品条款中,对于“由法人或者其他组织主持,代表法人或者其他组织意志创作,并由法人或者其他组织承担责任的作品,法人或者其他组织视为作者”意味着在没有参与创作的情况下,特定主体仍可成为著作权法中的作者。从现行著作权立法来看,作为著作权主体的作者主要包括创作者与投资者两类,前者往往被认为是狭义上的作者,而后者在法定条件下也被视为作者。正因为如此,《美国版权法》第106条在规定著作财产权时,对权利主体的表述是著作权人(copyright owner)而不是作者(author),以避免在权利归属上出现歧义。对于新出现的人工智能生成内容,在肯定其最低限度创造性的基础上,完全可以将人工智能的所有者视为作者,因为从机器学习的训练角度看,所有者即为向人工智能注入其意志的主体,人工智能则可视为代表所有者的意志创作。在此情况下,人工智能的所有者被视为作者,完全没有任何制度上的障碍。
现行著作权法律及其原理早已承认非自然人作者为著作权人的学理基础,并非是摒弃人作为权利主体的私法基础,而是将组织拟制为具有独立意思的主体,并能够将其独立意思传达给具体从事创作的主体。以此类推,人工智能的独立意思既然可视为来自设计者在训练中的“人机回圈”,则人工智能生成内容乃是代表设计者或所有者意志的行为,因此在面对人工智能生成内容的法律争议问题上,对该内容是否是作品完全可以适用独创性判断标准,并在满足的前提下,以代表所有者意志创作为理由将著作权归属于人工智能所有者享有。