[author]张陈果
[content]
人工智能技术与知识产权保护的合理边界
*张陈果
上海交通大学中国法与社会研究院兼职研究团队成员
上海交通大学法学院副教授
博士生导师
摘 要:当论及人工智能技术与知识产权保护的合理边界时,既有的理论探讨和政策导向分析大多以下几方面内容:人工智能的技术发展现状与这一概念的法律定位;人工智能生成物的著作权保护的可
能性及其边界;按照目前知识产权法的布局——人工智能技术的保护现状及未来保护趋势,以及知识产权法如何前瞻性地促进人工智能的发展。本文也从这三部分依序展开。
一、
人工智能的技术发展现状与法律定位
人工智能的缩写为AI,对其词源进行检索,artificial的词源是拉丁语artificium。该词逐步发展成为古法语的artificiel,后变成如今的artificial。其原意为手工制造,意为非天生,制造产生的。而Intelligence
的拉丁语为intelligere,原意为“懂得”。“因为懂得所以慈悲”的“懂得”;它是有感情、有“心”的意思,不仅仅限于“智能”这一层含义。
发展至今,人工智能技术的种类主要有八大类:包括知识图谱、知识推理、知识表示、模式识别、语音/图像识别,自然语言处理、机器学习算法等等。截止目前,人工智能还没有发展出“感情”和“心”的
这一层能力,但这是研发高阶人工智能的下一个目标——如果我们有幸见证“智能”从“技术”变成“生命”的话。
世界知识产权组织(WIPO)的报告显示,在现有的人工智能技术中,深度学习和神经网络技术方面的发展是最快的。其对我们生活的影响随处可见。
将其戴在手上后,手套可以带动使用者的手指按照乐谱来练习长笛或者钢琴。这是一个具有代表性的人工智能的学习产品,是由上海纽约大学夏立安教授团队研发的。他们通过训练人工智能深度学习,目前
已有很大进展。音乐人工智能不仅可以即兴伴奏,还可以作曲。不过,当我问及人工智能创作是否已经可以替代人类作曲家时,夏教授表示人工智能作曲科研攻关暂时无可替代的一个部分,是古典音乐。古典
音乐凝聚了古往今来人类音乐创作最伟大的智慧,人工智能依靠算法和大数据目前还没有办法去破解。这一点令我深思。
再举一例。如果我向人工智能翻译机器人朗读《红楼梦》,由它翻译成英语,由此生成的英语版红楼梦能否构成翻译作品呢?如果是的话,谁是作者,是翻译机器人还是朗读者?而如果说不构成翻译作品,而
是直接流入公共领域——因为翻译机本身机器学习依赖的数据就是从公共领域来的,产生的“数据”也进入公共领域,“质本洁来还洁去”,这样的制度设计又是否合适?这个政策的尺度如何确定,才能既具有总体
的合理性,又能鼓励技术创新?
二
人工智能生成物的著作权保护的可能性及其边界
学者们经常拿微软小冰“出版”的“诗集”《阳光失了玻璃窗》来距离,讨论小冰是否有著作权这个问题。小冰的创始人李笛是我和陈杭平的同班同学,毕业十五年李迪没有结婚也没有生子,但他创造了微软小冰。
小冰的“成长历程”充满了李迪的个人印记,就像他的孩子一样。但实际上小冰“写”的“诗”,完全比不上李迪本人的诗歌。(李笛在清华就读时,是清华法学院的大才子,创作了很多诗作。)我曾私下咨询李笛,
其认为微软小冰的诗歌是否具有著作权。李笛答道:“如果你们给小冰的诗歌著作权,‘她’下一秒就可以‘创作’出几千首、几万首诗歌。她可以不眠不休的创作。”(因为人工智能不是碳基生物,不需要吃饭睡觉,
可以无时无刻不在创作。)所以对“人工智能作品”是否具有稀缺性这个问题,答案明显是否定的。那么这样的文字是否有著作权保护的价值呢?目前来看也没有。如果给小冰的诗歌著作权,是否能激励小冰创作
呢?答案当然也是否定的——不是“人”的“机器”如何能被“激励”呢?
但是从另一个角度讲,如果赋予相关作品 “诗歌著作权”,是否能激励微软公司的小冰团队继续创新?微软是否会因此更关注人工智能技术本身能带来的价值?如果小冰可以被用户广泛的使用,从而使开发者收到
不菲的使用费(市场价值),实现反哺开发者、激励技术进步更新的效果(技术反馈价值),这也许才是人工智能研发者(和投资者)真正关心的问题。
微软小冰的诗
慕尼黑马克斯普朗克创新与竞争研究所的专门报告指出,著作权权利的划定与权利的保护之间需要成比例。两者相互匹配,才不至于为司法部门和行政执法带来不合理的负担。所以这个权利的门槛如何划定,立
法政策上需要作审慎的考量,过高或过低都会带来一定的后果。试想,如果人工智能生成物大量被赋予著作权,有限的司法资源不会面临难以应付的挑战吗?
我们需要考虑的是人工智能生成物究竟能否满足著作权法上的“独创性”要求,著作权保护的对象是否必须是人类智力活动的成果?根据《伯尔尼公约》的原文,作品的构成要件中其实并没有体现“人类”这一要素。但
我们目前讲作品要有独创性,首先都要求其为“人类智力活动的成果”。目前国内的教科书大都如此介绍。独创性构成中都有“人类”这个词。Intellectual creation翻译成“人类智力活动的成果”介绍到我国著作权法理论来
,不知这是一个翻译的巧合还是历来学界的共识,不知著作权法订立之时是如何处理这个细节的。将“人类”这个词作为作品的前提性要素,可以对此加一点解释的功夫。“人类”这个因素,在作品的构成中究竟占据多
大的份量,是现在框定人工智能著作权保护门槛的一个关键。换个角度讲,赞同要设定人工智能作品著作权或专有权利的学者专家,需要去回答一个问题:“人工智能”不是“人类”(ta们不是胎生、不是哺乳,暂时还没
有情感与心性),但是在适用现行法时我们可不可以用类比的解释方法来扩大解释所谓的独创性?类比解释的前提和方法在法解释学(法教义学)中有很成熟的理论与规范的,可以加以借鉴进一步研究。
三
人工智能技术的保护现状及未来保护趋势
如果说给予人工智能生成物著作权保护对人工智能研发者并没有激励作用的话,那么,政策制定者应该关注的究竟是什么?知识产权保护、知识产权的制度设计应该是旨在激励制度创新,激励人工智能的技术向前
发展,但这个需求目前通过其他途径亦是可以达到的。
人工智能的四大基石是算法、数据、模型、软件。目前,微软小冰有几百个专利,但令他们担心的是,专利一旦申请,技术就会被公布。有一部分内容,微软小冰想要将其作为技术秘密保存,但是技术秘密保护力度
存在问题,进入诉讼程序证明难度较大。另外一部分人工智能研发的核心资源是大数据,大数据的权限政策怎么划定,也是人工智能研发者极为关心的问题。部分开发者把所有的数据放在一个硬盘里,是否可以认定
硬盘附着的所有“东西”(物),其所有权即硬盘所有人?这些数据里可能包含很多个人信息,例如很多的人脸数据。这些数据应该属于每个自然人(个人数据的主体)比较合理,还是整体归属于人工智能技术开发者
(对数据集在收集和编排上下了大功夫)比较合理呢?与之相关的是数据法中热议的一个话题,大数据中的数据集,例如一个平台上搜集到的大量个人信息、非个人信息,其所有人是谁?作为运营的资产,是否需要
设定数据权利?以大家日常使用的微信为例,按照微信的数据使用协议,所有微信用户在上面生成的所有数据,无论是电话号码还是朋友圈照片,所有这些信息在注册使用微信时,按照《用户数据使用协议》一律归
微信平台所有,这样的规定是否合适?
四
结语
最后,重述一下本文尚不成型的几个观点。
首先,给予人工智能生成物著作权保护,目前来看并无必要,亦不太符合著作权法的目的。是否有必要通过类比解释扩大“人类智力活动的成果”的解释范围,或许比设计专门权利的讨论,更有学术研究的价值,也
更符合法律的周延性和体系性。不随意创设新的权利,而是靠法学解释试图将新的社会现象与问题纳入原有的法律体系内,是法学家的功夫所在。
第二,人工智能互联网教育行业采用AI形成的视听影像,是否构成作品,关键在于是否有独创性,目前已经有一些相关判决探讨了这个问题。个人认为,应就具体个案进行分析,不能一概而论。不假思索地给予著
作权保护只会赋予产业竞争一枚轻重不宜的砝码——知识产权诉讼成为攻防武器,被用来框定竞争成本。
第三,人工智能研发的算法、模型、大数据等核心资源和技术,应该是知识产权制度关注的焦点。
最后我想说,我国目前的AI产业的一个软肋是我们的基础技术很差,许多要依赖国外技术。虽然在传播上我们是有优势的,我们擅长进一步的包装,增加附加值,但是人工智能知识产权制度设计应当注重鼓励核心基
础技术强精固本,鼓励研发者在基础技术上稳扎稳打,这可能更符合我们的长远利益,对我们每个人来说也更有意义。