产品介绍
随着生成式人工智能技术的飞速发展,大模型已从实验室走向产业应用的快车道,深刻改变着内容创作、客户服务、科研创新等诸多领域。然而,技术浪潮下的规范发展始终是行业健康前行的基石--大模型备案作为我国人工智能治理体系的关键一环,正成为每一家相关企业与从业者必须关注的核心议题。它不仅是对技术安全与合规的硬性要求,更是大模型产品合法落地、赢得市场信任的“通行证”。今天,我们就来深入梳理大模型备案的来龙去脉,拆解其核心要点,为大家清晰呈现这一重要制度背后的逻辑与实践方向。
一、大模型备案的政策要求
●《生成式人工智能服务管理暂行办法》
第十七条提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。
●《互联网信息服务算法推荐管理规定》
第二十四条具有舆论属性或者社会动员能力的算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息,履行备案手续。
算法推荐服务提供者的备案信息发生变更的,应当在变更之日起十个工作日内办理变更手续。
算法推荐服务提供者终止服务的,应当在终止服务之日起二十个工作日内办理注销备案手续,并作出妥善安排。
第二十七条具有舆论属性或者社会动员能力的算法推荐服务提供者应当按照国家有关规定开展安全评估。
未按要求备案的将承担以下责任与处罚:
二、大模型备案和登记
●大模型备案
大模型备案(全称:生成式人工智能服务备案),一般指的是生成式人工智能服务上线备案,由省级网信部门向上提交到国家网信部门,通过备案后由属地网信部门将已备案信息对外公开发布。根据《生成式人工智能服务管理暂行办法》,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。
●大模型登记
网信部门会同相关部门按照《生成式人工智能服务管理暂行办法》及相关要求,对通过API接口或其他方式直接调用已备案大模型能力,且面向境内公众提供具有舆论属性或者社会动员能力的生成式人工智能服务开展登记工作。
三、大模型备案情况
●截至2025年3月,中央网信办已发布了四批备案名单,共302个大模型成功备案。
四、大模型登记情况
●截至2025年3月,中央网信办已发布了三批大模型登记名单,共105个大模型登记。
五、大模型备案的目的
●大模型备案的目的:则更侧重于事前风险管控,确保AI大模型在正式投入市场前已满足国家安全标准及合规要求,有效预防潜在危害,如误导用户或传播非法信息,从而构建安全可靠的人工智能生态。
六、大模型备案流程
由省级网信部门审批后提交到国家网信部门。具体流程如下:
1.向省级网信部门报备,获取备案表;
2.企业根据表格及评估要点准备材料;
3.企业内部展开评估,编写相关材料,准备测试账号;
4.提交材料和测试账号给省级网信部门审核;
5.省级网信部门材料审核及技术测试(安全测试)审核通过后,上报国家网信部门;如未通过,修改材料或调整模型能力后再次提审,具体调整内容根据省级网信部门反馈进行;
6.国家网信部门进行材料复审及技术评审,通过,企业下发备案号;未通过,需重新进行上线备案。
七、大模型安全评估要点
一、语料安全评估
(一)评估内容
(1)文本训练语料规模
训练语料存储规模,按文本格式存储时的语料大小。
训练语料数量,按词元(Token)计数。
(2)各类型语料规模
训练语料中的中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。
(3)训练语料来源
训练语料来源的组成情况,按照开源语料、自采语料、商业语料进行分类。
境外开源网站语料内中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。
自采语料内中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。
商业语料内中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。
(4)语料标注数量
语料标注的数量,仅限文本和图片,按标注单元计数,通常按条数、张数。
(5)标注人员情况
标注人员的数量,标注人员的类型,通常包括内部、外包。
标注人员培训时间、培训数量等情况。
(6)标注规则
按照《生成式人工智能服务管理暂行办法》第四条要求制定的标注规则。
(7)标注内容准确性核验
标注内容准确性人工核验比例。
(8)语料合法性
语料来源合法性情况。
语料是否包含侵害他人知识产权内容。
语料是否包含违法违规的个人信息内容。
(二)评估结论
评估结论应包括以下内容:
(1)语料是否符合《生成式人工智能服务管理暂行办法》相关规定,是否含有违反我国法律法规明确禁止的内容。
(2)语料中包含个人信息语料的数量、种类,是否符合《生成式人工智能服务管理暂行办法》规定。
(3)因语料产生知识产权纠纷的风险分析。
(4)防范语料安全风险的措施和建议。
二、模型安全评估
(1)语料内容评估
采用人工抽检,说明抽检数量与合格率。
采用关键词抽检,说明抽检数量与合格率。
采用分类模型抽检,说明抽检数量与合格率。
(2)生成内容评估
采用人工抽检,说明抽检数量与合格率。
采用关键词抽检,说明抽检数量与合格率。
采用分类模型抽检,说明抽检数量与合格率。
(3)涉知识产权、商业秘密的评估
评估方法、评判标准以及评估结果等。
(4)涉民族、信仰、性别等的评估
评估方法、评判标准以及评估结果等。
(5)涉透明性、准确性、可靠性等的评估
评估方法、评判标准以及评估结果等。
三、安全措施评估
(1)模型适用人群、场合、用途
服务的适用人群,是否适用未成年人、学生等。
适用场合,是否适用关键信息基础设施、自动控制、医疗信息服务、心理咨询等。
服务范围,是否限定或未限定特定领域。
(2)服务过程中收集保存个人信息情况
服务过程中收集保存个人信息情况,包括个人信息的类型、数量、用途以及保存期限。
(3)收集个人信息征得个人同意情况
收集个人信息征得个人同意的方式。
(4)受理处理使用者查阅、复制、更正、补充、删除个人信息请求的情况
受理处理的条件以及途径方法。
(5)图片、视频标识情况
标识的样式,按1:1比例贴入。
标识在图片、视频中的具体位置。
标识频度,如每帧、跳帧等。
(6)接受公众或使用者投诉举报情况
接受公众或使用者投诉举报的途径及反馈方式。
(7)服务协议情况
上述1至6内容是否已经写入模型服务协议。
(8)非法内容拦截措施
监看人员的数量。
预置关键词拦截情况,并提供预置关键词拦截列表。
分类模型的检测情况,说明分类模型研制情况和准确性。
(9)拒答率
拒绝回答或者以简单模板回答数量占总测试数量的比率。
(10)模型更新、升级
在何种情况下重新进行预训练,如较频繁发现生成非法内容。
重新预训练所需的时间。
计划优化训练(fine-tuning)的频度及所需的时间。
四、总体结论
生成式人工智能安全评估的评估结论重点应包括以下内容:
●是否符合《生成式人工智能服务管理暂行办法》的相关规定。
●语料、模型、安全措施等方面存在的主要风险。
●模型上线提供服务后主要安全风险预判及防范措施建议。
●如果模型上线提供服务后对用户和社会造成损害,服务提供者是否具备相应处置能力。
●是否建议上线提供服务。
八、大模型备案的难点
备案流程周期受企业准备情况、网信部门审核进度等因素影响,通常需要3-6个月。其中,耗时较多的环节包括:
安全自评估报告编写:企业往往缺乏经验,容易出现遗漏;
安全测试:涉及语料、模型、内容等多维度模型安全性测试,需充分准备;
评估测试题:总规模应不少于2000题,根据不同安全风险进行分类,每类不少于20题/50题;
案材料多次调整:若材料不符合政策要求,需反复修改。
重要提醒
国家重磅推出大模型备案制度,
为人工智能技术的健康发展保驾护航!
这不仅是一项监管要求,
更是推动技术向善、保护每一个人权益的重要举措!