AI创业者的必修课｜大模型和算法备案

添加书签

AIGC开放社区
2024-08-27

目前国内关于大模型的立法还没有形成。因此，现阶段国内主要是通过备案制度来管理AI的大模型。2023年七月份，网信办等七个部门联合发布了《生成式人工智能服务管理暂行办法》，并于八月份正式实施。该办法提出了人工智能产业相关生态的安全管理和合规要求搭建了框架，包括语料、模型及底层能力的安全规制。因此，在立法之前，国家更多的是从风险合规的角度，对AI厂商和模型进行统一管理。我们特别请到AI安全合规领域的专家Floria和大家分享一些在大模型备案和AI算法备案领域的相关合规问题。

企业为什么必须做合规和备案管理？如果不做，会面临什么样的风险？以及进行备案合规管理的必要性是什么？

对于面向境内公众提供服务的产品，合规备案成为了一项必须履行的义务。监管部门通过定期的专项治理行动，对未备案的产品进行下线处理，并接受行业投诉举报，对发现的非法接口产品进行通知和处罚。虽然这些处罚通常不会公开，但去年年终时，一些因调用非法接口而未备案的创业者和产品收到了整改通知，这在AI圈内引起了广泛关注。

备案不仅是履行合规义务，也是企业自我保护的一种方式。AI技术的不确定性增加了内容生成的风险，因此，除了遵守互联网服务的一般法规外，还需要特别关注人工智能生成系统的备案要求。不履行这些要求可能会导致产品下线和额外的法律风险，包括个人信息保护和客户隐私问题。

备案的价值不仅在于满足监管要求，还在于为企业赢得客户信任。在招投标过程中，一些客户需要看到企业的备案证明，以确保使用的算法是可信的。此外，随着国家对算法空间治理体系的不断完善，备案成为了监管机构了解企业产品的重要途径，有助于企业进行自我检测和风险提示。

但备案不是免责的金牌，而是企业合规经营的起点。它类似于人的出生户口，是监管机构了解企业行为的基础。随着立法和监管的逐步完善，备案成为了企业合规经营和市场信任的基石。对于AI产业的从业者来说，理解并履行这一义务，不仅是对法律的尊重，也是对自身产品和企业未来负责的表现。

大模型备案的涉及范围面有多大？

在人工智能领域，企业如何平衡内部知识库的利用与对外服务的合规性，是一个值得深思的问题。一些企业可能会在内部使用AI模型作为知识库或学习工具，赋能员工，这种情况下通常不需要进行备案。然而，一旦这些模型被用于商业用途，无论是直接还是间接，就需要考虑合规性问题。例如，如果一个企业将其AI模型服务于自己的会员体系，虽然看似只服务于特定群体，不算是向公众提供服务，但如果普通用户能够通过互联网访问并注册使用这些功能，那么这实际上构成了对外公开使用的场景。这种情况下，就需要根据是否构成商业化目的来判断是否需要备案。

备案不仅是企业履行合规义务的基本动作，也是获得客户信任的一种方式。在招投标过程中，一些客户可能需要看到企业的备案证明，以确保使用的算法是可信的。此外，随着国家对算法空间治理体系的不断完善，备案成为了监管机构了解企业产品的重要途径，有助于企业进行自我检测和风险提示。

模型备案过程中的重点关注内容有哪些？

算法备案是一个持续进行的过程，通常每两个月会公示一批新的备案结果，涉及的企业数量可能达到上千家。这些备案公示不仅包括算法本身，也包括模型备案，后者通常更为稀缺，主要针对具备一定算力和推理能力的技术开发者，他们愿意将模型能力公开并供他人调用。

备案过程的复杂性因涉及的层面而异。从技术角度来看，AI服务可以分解为不同的层级，包括底层的大模型、中间件以及上层的应用服务。监管机构关注的是AI应用服务，即用户通过互联网接触的点。然而，备案的对象可能包括服务提供者和技术支持者，区分两者的关键在于服务的提供形式。

服务提供者通常指偏应用层面的企业，它们可能调用了其他企业的模型或算法，形成面向C端用户的小程序、APP或网站。备案的重点是算法的应用，即算法在特定场景下的使用情况。备案材料需要详细说明算法从数据输入到产品应用的整个工作流程和机制。

模型备案则关注模型的能力，包括模型的风险评估、训练数据和风险管理措施。备案过程中，需要阐释从底层到中间层再到应用层的各个环节，即使使用了第三方模型或开源资源，也需要提供相应的许可使用协议，作为备案材料的一部分。如果服务提供者使用的是已经备案的模型，那么在备案过程中，只需提供与模型提供者之间的商业协议或合作关系证明，以及模型的备案号，这可以作为一个合理的解释和证明。

总的来说，备案是一个多层次、多角色的过程，涉及从用户数据输入到产品应用的全链条。无论是服务提供者还是技术支持者，都需要清晰地阐述其在AI服务中的角色和贡献，以及如何确保算法和模型的合规性和安全性。

如何界定生成式人工智能（AIGC）的技术实现范围？

生成式人工智能（AIGC）的备案问题涉及到多种算法和技术。当前的备案体系主要针对利用深度学习技术进行内容生成或修改的算法，这包括单模态和多模态内容，如文本、语音、视频和音频等。这些技术可能涉及transformer架构或stable diffusion等特定算法，但其范围远不止于此。

传统上，人工智能技术如OCR（光学字符识别）早已存在，但生成式AI的重点在于通过深度合成技术自动生成新内容，而不仅仅是对现有信息的识别或检索。因此，即使是OCR这样的技术，如果涉及到通过深度学习模型生成新的视觉或文本内容，也可能需要考虑备案。

备案过程中，需要明确算法的技术细节、输入端、运行机制和应用场景。这包括了从数据输入到产品应用的整个流程，以及与算法相关的数据治理措施。监管机构在审核过程中，会特别关注算法是否能够生成未知的新内容，以及这些内容的不确定性。

在互联网信息服务深度合成管理规定中，对生成式人工智能有明确的定义，即利用深度学习、虚拟现实等技术合成生成文本、图像、音视频、虚拟场景等信息。这表明备案的对象不仅限于新型算法，也包括了能够生成新内容的传统技术。例如人脸识别技术作为人工智能的一个分支，虽然在某些情况下可能不直接生成新内容，但作为生物特征识别的一部分，它在特定情况下也可能涉及到生成式AI的范畴。然而，目前监管的重点更多地集中在通过AI技术生成虚拟现实内容的算法上。

开源模型和“套壳”模型是否需要去备案？

截至2024年3月，已有117个AI大模型完成了备案，去年的预测可能与实际情况有所差异，因为市场上存在许多基于开源模型的“套壳”产品。开源模型的备案需要证明模型的安全性和合规性。监管机构鼓励使用开源、透明的模型，而不是闭源或“黑盒”模型，因为后者可能隐藏风险。即使是开源模型，如果进行了自研或精调，也需要在备案时提供充分的证明，包括算力资源、数据集、训练过程和安全治理措施。

备案过程是全面的，涉及到模型的每一个环节，包括数据集、学习资料、调优参数等。这些都是证明模型合规性的重要方面。如果企业使用的是他人的模型，但对模型的了解不足，可能无法通过安全测试，也无法提供原始模型的测试数据或相应的算力资源，这样的模型在备案时可能会遇到困难。

对于正在开发自己的大模型的企业，建议尽早开始备案准备。首先，需要明确商业计划和市场定位，然后从产品建设期开始，就将合规因素融入产品设计中。无论是面向机构客户还是普通公众用户，都需要考虑不同的备案策略和履行的义务。如果计划推出一个小程序或小应用，应该在产品demo阶段就开始准备算法备案，确保公司具备必要的资质和能力。如果是提供模型能力的服务，则需要在模型建设期间就开始考虑能否承受各类风险测试，确保模型能够满足安全要求标准中提到的31种风险测试。备案是一个需要综合考虑多方面因素的过程，建议企业尽早规划，确保产品能够满足备案要求，从而顺利进入市场。

算法备案和大模型备案的主要区别是什么？

主要在于服务的形式，如果企业主要提供底层API或模型服务，供他人调用，那么应进行模型备案。如果企业提供的是具有用户界面的应用产品，使用了其他模型能力，那么应进行算法备案。有些企业可能同时进行两种备案，以满足不同平台的合规性要求。

备案是否对模型的参数大小有要求？

在大模型备案时，目前并没有关于模型参数大小或算力要求的具体界限。备案的基本要求集中在安全标准上，并没有对参数量提出硬性要求。这一点与欧洲的安全法不同，后者对算法的算力有具体的浮点运算数要求。

中国的备案体系更注重模型的安全性和性能，而不是单纯的参数量或算力大小。这种灵活性可能会导致市场上模型的数量增多，但备案过程本身可以起到正向引导作用，通过审查和测试过滤掉不合格的模型，保护公众免受有害模型的影响。

备案过程中，监管机构会关注模型的安全性和基本能力，包括模型回答问题的准确性、逻辑性和对社会向善的引领作用。这意味着，即使模型安全但性能低下，也难以通过备案。

关于模型备案准备的时间周期和材料提交方式？

备案的时间周期和难度因多种因素而异，但根据历史经验数据，算法备案通常需要大约三到四个月的时间。模型备案可能涉及更多的线下沟通和测试排期，因此时间线可能会更长，有的企业最长需要八个月，而最短则可能在三四个月完成。

备案过程包括材料准备、安全测试和最终审批。监管机构鼓励企业使用开源透明的模型，避免使用闭源或“黑盒”模型。即使是基于开源模型，企业也需要提供充分的证明，包括算力资源、数据集、训练过程和安全治理措施。算法备案是通过一个集中的线上系统进行填报，而模型备案则需要与当地省网信办进行沟通，最终经过央办的终审。备案材料和审查流程都是机密，不对外公开，以保护国家安全和商业机密。

如果企业有多个应用或大模型，每个都需要单独备案。备案分为两个阶段：首先是公司主体的备案，然后是具体的算法或模型备案。即使同一家企业的不同算法或模型也需要分开备案。

对已备案的大模型，如何实现动态监管？

随着AI技术的快速发展，企业需要持续更新其备案资料，以反映技术的最新发展。这包括价值观和意识形态的实时更新，以适应不断变化的社会环境。然而，这也带来了维护成本的问题，因为每次更新可能都需要重新进行安全测试。

备案完成后，监管机构会根据模型的用户量级和影响力进行不同程度的后续管理。对于覆盖广泛的大型平台，可能会有现场调研或座谈，而对于小范围应用，监管可能更侧重于定期的资料更新和审查。

监管机构可能会在关键节点进行重点测试，以确保模型的持续合规性。这种持续的监管和测试要求企业在享受备案带来的市场准入优势的同时，也要承担相应的责任和成本。

在AI大模型领域，市场变化快速，可能会有企业因为各种原因选择退出。尽管目前还没有明确的退出机制，备案过程被视为一种长期的合规化动作，类似于ISO等传统认证，目的是实现可持续的监管和行业向善。

总体来说，备案是一个动态的过程，需要企业在确保模型安全和性能的基础上，不断适应监管要求和技术发展的变化。

大模型监管与AI立法之间的关系是什么？

监管体系在中国是闭环且成体系的，监管机构拥有丰富的经验，能够针对不同的监管对象制定合适的策略。目前，监管的重点是通过备案机制鼓励产业发展，同时确保AI模型能够安全、合规地服务于社会。

全球范围内，包括欧洲和美国在内的多个地区正在制定或已经发布了关于AI的法律法规。中国在AI立法方面持谨慎态度，学术界和专业机构正在为立法做准备。未来的立法可能与现有的备案制度长期并存，互为补充。

备案是实现法制路径的一个关键步骤，有助于实现可知、可管、可控的监管目标。立法将提供更高层次的法律支撑，使行业规范更加合理、可行。备案则是法规落实的具体实施路径，随着立法的细化和行业主管部门的规制出台，备案制度将变得更加具体和强化。

从宏观的立法趋势到具体的行业法规，再到实施的执法路径，它们构成了一个配套的、体系化的内容。就像民法、刑法与户口登记的关系一样，法律提供上位的规范，而备案等执行手段则确保这些规范能够落地实施。

总体来看，备案和立法是相辅相成的，共同推动AI产业的健康发展，并保护社会免受潜在风险的影响。

目前国内各地区对于AI产业支持的优惠政策如何？

中国各地区政府正通过一系列扶持政策积极推动人工智能产业的发展。这些政策通常包括资金补贴、税收减免、租金支持和算力资源提供等形式，旨在降低创业门槛，激励技术创新，并促进AI技术的市场化应用。政策支持覆盖了从技术研发到产业应用的全链条，特别关注于算力基础设施建设和行业应用场景的拓展。此外，政策也倾向于支持那些能够带动行业标准制定、技术突破或产业升级的重点项目和企业。这些扶持措施体现了国家对AI产业战略重要性的认识，以及通过政策引导，促进产业健康、快速发展的决心。

希望收听完整播客节目的朋友，请点击「阅读原文」或图片扫码移步【科技慢半拍】