上海校友会法律界同学会&IT同学会共同举办行业月度分享会

2023-07-04|地方校友组织新闻

6月30日下午,复旦法律界同学会、复旦IT同学会在复旦泛海国金黄浦院区港陆广场1112教室共同举办行业月度分享会。分享会由流利说(2018年纽交所上市,被媒体誉为“AI+教育”第一股)联合创始人、上海市学习与认知人工智能重点实验室主任林晖与复旦法律界同学会副会长、现任上海市律师协会竞争与反垄断业务研究委员会副主任黄凯进行分享,分享以“大模型与AIGC时代,企业如何应对技术发展和法律风险”为题展开了深入的讨论

图片

活动首先由林晖博士以“大模型时代的创新机遇与挑战”为题展开。

图片

林晖博士首先向大家阐述当天的讨论将更加专注于LLM,即large language model大语言模型方面,他将带领大家首先从技术的角度探讨大模型是怎样生成的,它对数据的要求又是什么样的;接着在第二个部分分享大模型与AI的发展;最后与现场观众分享大模型时代的变与不变。

首先,大模型究竟是如何“炼”成的。之所以使用火字旁的炼字,是因为在最开始大模型的训练机制如同初期冶炼金属一般困难和不可预估,多数时候研究工作者尝试出一个可以顺利work的大模型,却不知道为何可以跑通,机制的解释不甚清楚,所以大家戏称这是一种“炼丹”,需要不断尝试,有时候会获得良好的效果,有时却未必,具有一定的不确定性和不可控性。

但整体上而言模型训练还是有一个过程,它的训练分为四个步骤,第一步Pretraining,也就是ChatGPT当中的“P”,预训练过程;第二步叫做Supervised finetuning,一般简称SFT,叫做有监督的精调过程;第三步是制作Reward modeling,即奖励函数,最后做强化学习Reinforcement learning。

在这几个步骤中,林博士比较重点讲述了第一步Pretraining,预训练可以从字面上理解,如同培养人才做专业训练之前需要先做一些通识性质的训练,完成之后再给这个模型具体指定任务。预训练需要大量的数据收集工作及大量算力的需求,林博士提出,预训练通过预测下一个词的训练,“学习”到了世界的表征

之后,林博士讲述自己作为AI领域的从业者,在所谓大模型技术出现之后产生的兴趣点。“大模型的出现让我们第一次看到人类有可能去创造智能那智能有什么标志?林博士提出两个要点:触类旁通和举一反三,Zero-shot&Few-shot learning。

如今大模型通过大量 training 之后,当看到一个新的任务,这个系统不需要任何的训练数据,它就会做处理。虽然这个任务是之前没见过,但是只需要给几个例子会举一反三,这是非常让人惊喜的。

大模型时代开启了新的创新浪潮,在以ChatGPT/GPT4为代表的大模型发布后,在交互方面,以自然语言为交互界面的时代终于到来;在生产力方面,大模型的生成能力、初步的逻辑和推理能力将极大提升人类的生产力。而大模型商业价值的天花板很大程度上取决于其可靠性和可控性问题的解决。

在分享的最后,林博士提出即使是在大模型时代也有不会改变的东西,如AI三要素,即算法、算力、数据不会发生改变,如商业逻辑、数据飞轮这些比较基础的东西是不会发生改变的。

图片

林晖博士分享结束后,由黄凯会长以AIGC时代的数据合规法律问题为题进行分享。分享主要围绕AIGC时代:数据相关立法与执法概述、人工智能特点与数据合规风险、AIGC产品侵权与归责、AIGC作品相关版权问题、AIGC涉及的数据交易问题几个方面进行展开讨论。

图片

首先他对AIGC时代的背景与挑战进行叙述,AIGC促进了产业发展,同时也创生了很多新兴职业,但同时也牵扯到伦理风险、责任承担、版权保护、数据交易等风险。黄会长以之前出现过的AI诈骗新闻举例,说明了AICG技术是把“双刃剑”。而国家层面也针对这一特性在数据相关执法框架层面做出了一系列调整,成立国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等。

接着,黄会长针对人工智能特点与数据合规风险进行说明。人工智能具有应用广泛性,在智能驾驶、智慧医疗、智能制造、智慧城市等方面都有运用,数据依赖性(输出结果的质量取决于:输入数据的数量规模、准确性、包容性、全面性等因素),以及算法黑箱性,这是由于人工智能算法的“涌现性”,即由算法底层的简单规则生成复杂行为及人工智能算法的“自主性”,即在无干预状态下能够海量自我学习等特性决定的。他为大家介绍了人工智能技术易触发的保护条款。如涉及到算法黑箱性的第2448条:“个人信息处理者利用个人信息进行自动化决策,应当保证决策的透明度和结果公平、公正,不得对个人在交易价格等交易条件上实行不合理的差别待遇”“个人有权要求个人信息处理者对其个人信息处理规则进行解释说明”等。

提到AIGC产品侵权与归责展望,黄会长首先向大家举例了近期非常火爆的AI“歌手”与AI“画家”所涉侵权问题,目前AIGC有大量的侵权风险,其中有可能涉及到侵犯个人隐私风险、侵犯商业秘密和知识产权风险、虚假信息风险、不当信息风险、不当使用风险、网络攻击风险等等,目前针对合规建议的展望有:收集前具有本人同意等合法性基础;个人信息的处理遵守最小必要原则;在用户授权的范围内使用个人信息;提升保障个人信息主体权利的能力等方式。

AIGC作品涉及到的相关版权问题上,黄会长提出目前的著作权法只保护人类的智力成果这一共识。那么,AIGC作品如何在现有的法律框架下得到保护?可以通过反不当竞争法、适用邻接权保护措施、探究AIGC自动生成作品的相关权利归属来实施相关保护措施。

最后,在AIGC所涉及的数据交易问题上,黄会长也罗列了需要注意的条款及要素:

图片

分享会的间隙,台下听众纷纷提出了具体行业面临的大模型、AIGC相关问题,林博士与黄会长也针对这些问题为大家一一进行解答,分享会在大家兴奋热烈的交流中结束。本次分享会在IT行业与法律行业的交叉语境中探讨目前的大热话题——大模型与AIGC时代企业所面临的技术发展与法律风险,为相关从业者创造了一个良好的交流平台。感谢林晖博士与黄凯会长的分享!

图片

来源:上海复旦大学校友会公众号

最新文章