《生成式人工智能服务管理暂行办法》已经 2023 年 5 月 23 日国家互联网信息办公室 2023 年第 12 次室务会会议审议通过,并经国家发展和改革委员会、教育部、科学技术部、工业和信息化部、公安部、国家广播电视总局同意,现予公布,自 2023 年 8 月 15 日起施行。
今日,七部门联合公布《生成式人工智能服务管理暂行办法》。这一部门规章标志着中国在人工智能领域立法迈出了新的一步。笔者认为该规章体现了我国立法者对飞速发展的人工智能技术具有较为全面的理解,并对生成式人工智能发展过程中产生的潜在威胁采取了积极的应对措施,谨对该文件进行简要评论。
1. 沿革
生成式人工智能服务管理暂行办法的形成过程可以追溯到 2023 年 4 月 11 日,国家互联网信息办公室发布了《生成式人工智能服务管理办法(征求意见稿)》,向社会公开
征求意见。该征求意见稿旨在促进生成式人工智能技术的健康发展和规范应用,并依据《中华人民共和国网络安全法》、《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》等相关法律法规进行制定。
在本办法颁布以前,我国关于互联网+AI 的应用已有两部立法——《互联网信息服务算法推荐管理规定》(自 2022 年 3 月 1 日起施行)以及《互联网信息服务深度合成管理规定》(自 2023 年 1 月 10 日起施行)。
其中,《互联网信息服务算法推荐管理规定》主要关注算法推荐服务提供者的规范管理,要求算法推荐服务提供者应建立健全的管理制度和技术措施,进行定期审核、评估和验证算法机制,加强用户模型和用户标签管理,防止不良信息的传播和算法歧视的发生。此外,该规定还要求算法推荐服务提供者规范开展互联网新闻信息服务,不得生成虚假新闻或传播非法新闻信息,以维护公众的知情权和传播秩序。
而《互联网信息服务深度合成管理规定》则对深度合成数据和技术进行管理规范。规定要求深度合成服务提供者和技术支持者加强对训练数据和技术的管理,保障数据安全,不得非法处理个人信息。同时,要求对使用深度合成服务生成或编辑的信息内容进行标识,以避免公众混淆或误认。此外,该规定还强调任何组织和个人不得以技术手段删除、篡改或隐匿相关标识,以确保信息的真实可信性。
此次颁布的《生成式人工智能服务管理暂行办法》则是针对生成式人工智能技术的重要立法,涵盖了定义、准入资格、责任义务和处罚措施等内容。
2. 生成式人工智能的技术特征
生成式人工智能(Generative Artificial Intelligence)是一种可以根据用户输入,生成(Generate)文字、图像、声音或其他类型的没接的人工智能。
自 2022 年 11 月 30 日 ChatGPT 发布以来,多年处于科研阶段的生成式人工智能迅速吸引了几乎所有人的目光。ChatGPT 作为一种典型的生成式人工智能,是一种大语言模型(Large Language Model、LLM)的应用。除了 OpenAI 之外,Google 的 Bard、Meta 的 LLaMA 等皆属此类。大语言模型通过深度学习技术和海量文本数据的训练,可以生成高度流畅、准确的文本内容。这些文本来自各种网站、论坛、百科、杂志、报纸、社交媒体、政府文件、电子书、学术文献、历史文献及各种各样的其他出版物和文本来源。这些模型具有广泛的应用领域,包括自动文本生成、对话系统、语言翻译和摘要生成等。
其他模态的生成式人工智能在技术路径上与文本语言模型存在差异,但基本实现思路较为相似。具有代表性的有生成图像的 Stable Diffusion、MidJourney、生成视频的 DeepBrain 等。本文的主要关注点是具有共性和代表性的文本生成人工智能,对其他形式的人工智能将进行较少的论述。
生成式人工智能与先前的深度合成类型的人工智能存在差异。生成式人工智能的目标是生成新的、原创的数据或内容。这些模型可以学习从给定的训练数据中推断出新的、合理的样本。其核心思想是从训练数据中学习概率分布模型,然后使用该模型生成新的样本。其实现该目的重要条件是一种在大数据样本的训练过程中出现的 涌现(emergence) 现象。模型能够呈现出 超越原始数据和预训练任务的新颖性和创造性的行为、能力或特征。 涌现赋予了模型创造性、推理能力和更好的语言理解与生成能力。这是 ChatGPT 一经发布就以其令人惊愕的拟人程度轰动世界的技术前提。
3. 人工智能治理的要点
一些技术专家、研究人员和投资者呼吁暂停“巨型人工智能系统”的创建,并认为这对社会存在深刻风险。他们主要的顾虑在于人工智能产生自我意识的可能性。然而,一旦技术的潜力显现,就无法被控制。另外,人工智能仅仅是众多让人担忧的技术中的最新一项,目前立法者也没有干预的依据。然而,我们必须正视生成式人工智能目前已经产生的风险和威胁。
立法者必须关注生成式人工智能模的开发者型在采集数据、训练、微调并最终向公众提供服务的全生命周期中的全过程合法化、规范化,从而制定完善的法律以杜绝这一生命周期中可能存在的法律漏洞。具体而言,笔者认为有以下几个要点:
- 规范化训练样本采集
在生成式人工智能的训练过程中,需要确保训练样本的合法来源。立法者应制定规范,要求开发者在采集训练样本时符合法律法规的要求,避免使用侵犯知识产权的内容。此外,为保证数据的真实性、准确性、客观性和多样性,也需要确保采集的数据具有一定的代表性。
- 避免生成有害内容
生成式人工智能可能产生误导性的虚假信息,甚至用于伪造文本、视频和图片,对社会造成负面影响。立法者应规定生成式人工智能开发者在训练模型时要遵循道德规范,确保生成的内容真实准确,不含有虚假、欺诈等有害信息。
- 提供明确的标识以与人类生成的内容相区分
为了避免产生混淆,生成式人工智能生成的内容应能明确标识为机器生成,与人类生成的内容相区分。这样可以帮助公众识别和理解生成内容的来源和性质,减少可能的误解和法律纠纷。
- 避免歧视,保证采集、训练、微调全过程的多样性和公平性
为了避免生成内容带有歧视性,立法者应制定规定,要求开发者在采集、训练和微调过程中确保多样性和公平性,不歧视任何种族、国别、性别等因素。同时,开发者应该保证采集过程的多样性,避免数据集的偏见和不公平性。
4. 新立法的成就
笔者以上述四个要点为纲,评估该办法是否对生成式人工智能全生命周期产生的潜在威胁予以回应。
-
规范化训练样本采集:
- 第七条规定了生成式人工智能服务提供者在训练数据处理活动中应使用具有合法来源的数据和基础模型。
- 第八条要求提供者在生成式人工智能技术研发过程中进行数据标注时,制定符合本办法要求的标注规则,并对标注内容的准确性进行核验评估。
-
避免生成有害内容:
- 第四条明确禁止生成式人工智能服务生成煽动颠覆国家政权、宣扬恐怖主义、暴力、淫秽色情等法律禁止内容。
- 第十四条要求提供者发现违法内容时,应及时采取停止生成、消除等处置措施,并向有关主管部门报告。
-
提供明确的标识以与人类生成的内容相区分:
- 第十二条规定提供者应按照规定对生成内容进行标识,确保能够区分生成式人工智能生成的内容与人类生成的内容。
-
避免歧视,保证采集、训练、微调全过程的多样性和公平性:
- 第四条要求在生成式人工智能技术的设计、训练数据选择、模型生成和优化等过程中,采取有效措施防止产生歧视,包括民族、信仰、国别、性别、年龄等方面的歧视。
- 第七条要求提供者采取有效措施提高训练数据的真实性、准确性、客观性、多样性,确保数据采集过程的多样性和公平性。
该办法以《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国科学技术进步法》为处罚依据,规定了多种处罚措施,包括警告、通报批评、责令限期改正和暂停提供相关服务等。不同的违规行为会受到不同的处罚,根据违规情节的轻重进行相应的处理。处罚措施的灵活性和多样性可以更好地适应不同违规行为的性质和后果。明确了有关主管部门的责任和权限,这些部门负责对生成式人工智能服务进行监督检查,并依法对违规行为进行处罚。有关主管部门的介入和执法能力可以确保处罚规则的有效执行和实施。
该办法还要求有关主管部门对生成式人工智能服务进行监督检查。监督检查可以发现违规行为并采取相应的处罚措施,同时也起到警示的作用,预防和处罚并重,促使市场参与者自觉遵守规定。
笔者认为该办法建立了一个足够严格的监管框架,并设立了明确的处罚规则,以确保生成式人工智能服务提供者和使用者遵守法律、行政法规的规定。这种制定处罚规则的做法有助于提高市场参与者的合规意识,促进生成式人工智能的健康发展和规范应用,并维护国家安全、社会公共利益以及公民、法人和其他组织的合法权益。
<全文毕>
范牧晨
2023 年 07 月 13 日
附:《生成式人工智能服务管理暂行办法》全文
国家互联网信息办公室
中华人民共和国国家发展和改革委员会
中华人民共和国教育部
中华人民共和国科学技术部
中华人民共和国工业和信息化部
中华人民共和国公安部
国家广播电视总局
令
《生成式人工智能服务管理暂行办法》已经 2023 年 5 月 23 日国家互联网信息办公室 2023 年第 12 次室务会会议审议通过,并经国家发展和改革委员会、教育部、科学技术部、工业和信息化部、公安部、国家广播电视总局同意,现予公布,自 2023 年 8 月 15 日起施行。
国家互联网信息办公室主任 庄荣文
国家发展和改革委员会主任 郑栅洁
教育部部长 怀进鹏
科学技术部部长 王志刚
工业和信息化部部长 金壮龙
公安部部长 王小洪
国家广播电视总局局长 曹淑敏
2023 年 7 月 10 日
生成式人工智能服务管理暂行办法
第一章 总 则
第一条 为了促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益,根据《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国科学技术进步法》等法律、行政法规,制定本办法。
第二条 利用生成式人工智能技术向中华人民共和国境内公众提供生成文本、图片、音频、视频等内容的服务(以下称生成式人工智能服务),适用本办法。
国家对利用生成式人工智能服务从事新闻出版、影视制作、文艺创作等活动另有规定的,从其规定。
行业组织、企业、教育和科研机构、公共文化机构、有关专业机构等研发、应用生成式人工智能技术,未向境内公众提供生成式人工智能服务的,不适用本办法的规定。
第三条 国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管。
第四条 提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德,遵守以下规定:
(一)坚持社会主义核心价值观,不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容;
(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视;
(三)尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为;
(四)尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益;
(五)基于服务类型特点,采取有效措施,提升生成式人工智能服务的透明度,提高生成内容的准确性和可靠性。
第二章 技术发展与治理
第五条 鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系。
支持行业组织、企业、教育和科研机构、公共文化机构、有关专业机构等在生成式人工智能技术创新、数据资源建设、转化应用、风险防范等方面开展协作。
第六条 鼓励生成式人工智能算法、框架、芯片及配套软件平台等基础技术的自主创新,平等互利开展国际交流与合作,参与生成式人工智能相关国际规则制定。
推动生成式人工智能基础设施和公共训练数据资源平台建设。促进算力资源协同共享,提升算力资源利用效能。推动公共数据分类分级有序开放,扩展高质量的公共训练数据资源。鼓励采用安全可信的芯片、软件、工具、算力和数据资源。
第七条 生成式人工智能服务提供者(以下称提供者)应当依法开展预训练、优化训练等训练数据处理活动,遵守以下规定:
(一)使用具有合法来源的数据和基础模型;
(二)涉及知识产权的,不得侵害他人依法享有的知识产权;
(三)涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;
(四)采取有效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多样性;
(五)《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》等法律、行政法规的其他有关规定和有关主管部门的相关监管要求。
第八条 在生成式人工智能技术研发过程中进行数据标注的,提供者应当制定符合本办法要求的清晰、具体、可操作的标注规则;开展数据标注质量评估,抽样核验标注内容的准确性;对标注人员进行必要培训,提升尊法守法意识,监督指导标注人员规范开展标注工作。
第三章 服务规范
第九条 提供者应当依法承担网络信息内容生产者责任,履行网络信息安全义务。涉及个人信息的,依法承担个人信息处理者责任,履行个人信息保护义务。
提供者应当与注册其服务的生成式人工智能服务使用者(以下称使用者)签订服务协议,明确双方权利义务。
第十条 提供者应当明确并公开其服务的适用人群、场合、用途,指导使用者科学理性认识和依法使用生成式人工智能技术,采取有效措施防范未成年人用户过度依赖或者沉迷生成式人工智能服务。
第十一条 提供者对使用者的输入信息和使用记录应当依法履行保护义务,不得收集非必要个人信息,不得非法留存能够识别使用者身份的输入信息和使用记录,不得非法向他人提供使用者的输入信息和使用记录。
提供者应当依法及时受理和处理个人关于查阅、复制、更正、补充、删除其个人信息等的请求。
第十二条 提供者应当按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识。
第十三条 提供者应当在其服务过程中,提供安全、稳定、持续的服务,保障用户正常使用。
第十四条 提供者发现违法内容的,应当及时采取停止生成、停止传输、消除等处置措施,采取模型优化训练等措施进行整改,并向有关主管部门报告。
提供者发现使用者利用生成式人工智能服务从事违法活动的,应当依法依约采取警示、限制功能、暂停或者终止向其提供服务等处置措施,保存有关记录,并向有关主管部门报告。
第十五条 提供者应当建立健全投诉、举报机制,设置便捷的投诉、举报入口,公布处理流程和反馈时限,及时受理、处理公众投诉举报并反馈处理结果。
第四章 监督检查和法律责任
第十六条 网信、发展改革、教育、科技、工业和信息化、公安、广播电视、新闻出版等部门,依据各自职责依法加强对生成式人工智能服务的管理。
国家有关主管部门针对生成式人工智能技术特点及其在有关行业和领域的服务应用,完善与创新发展相适应的科学监管方式,制定相应的分类分级监管规则或者指引。
第十七条 提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。
第十八条 使用者发现生成式人工智能服务不符合法律、行政法规和本办法规定的,有权向有关主管部门投诉、举报。
第十九条 有关主管部门依据职责对生成式人工智能服务开展监督检查,提供者应当依法予以配合,按要求对训练数据来源、规模、类型、标注规则、算法机制机理等予以说明,并提供必要的技术、数据等支持和协助。
参与生成式人工智能服务安全评估和监督检查的相关机构和人员对在履行职责中知悉的国家秘密、商业秘密、个人隐私和个人信息应当依法予以保密,不得泄露或者非法向他人提供。
第二十条 对来源于中华人民共和国境外向境内提供生成式人工智能服务不符合法律、行政法规和本办法规定的,国家网信部门应当通知有关机构采取技术措施和其他必要措施予以处置。
第二十一条 提供者违反本办法规定的,由有关主管部门依照《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国科学技术进步法》等法律、行政法规的规定予以处罚;法律、行政法规没有规定的,由有关主管部门依据职责予以警告、通报批评,责令限期改正;拒不改正或者情节严重的,责令暂停提供相关服务。
构成违反治安管理行为的,依法给予治安管理处罚;构成犯罪的,依法追究刑事责任。
第五章 附 则
第二十二条 本办法下列用语的含义是:
(一)生成式人工智能技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。
(二)生成式人工智能服务提供者,是指利用生成式人工智能技术提供生成式人工智能服务(包括通过提供可编程接口等方式提供生成式人工智能服务)的组织、个人。
(三)生成式人工智能服务使用者,是指使用生成式人工智能服务生成内容的组织、个人。
第二十三条 法律、行政法规规定提供生成式人工智能服务应当取得相关行政许可的,提供者应当依法取得许可。
外商投资生成式人工智能服务,应当符合外商投资相关法律、行政法规的规定。
第二十四条 本办法自 2023 年 8 月 15 日起施行。