Cloudflare将推出数据市场,向AI大模型提供有偿服务
添加书签专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!
知名互联网安全平台Cloudflare将推出一个数据市场和专业控制工具,帮助网站所有者对其内容被AI模型抓取的行为进行收费。
这可以为站长们提供新的收入模式,同时规范AI训练数据的使用。
随着ChatGPT等生成式AI产品的大量出现,数据成为提升模型性能的关键之一。但一些AI公司为了搜集数据对网络信息进行大规模抓取,并且通常没有得到内容所有者的许可。
Cloudflare的新市场将为网站运营者提供工具,使他们能够设定规则并直接向那些希望利用其内容来训练AI模型的厂商收取费用。
同时,Cloudflare发布了一个名为“AI Audit”的免费控制工具,供网站所有者使用。AI Audit提供了关于AI机器人活动的详细分析,包括哪些公司正在抓取他们的内容、频率如何,以及哪些网站部分最受AI爬虫欢迎。
AI Audit将AI相关的数据机器人分为三大类:AI数据抓取器、AI搜索引擎爬虫和存档器。这种分类至关重要,因为每种类型的机器人对网站的影响都不同。
例如,AI搜索引擎可能会为网站带来流量,而数据抓取器主要收集信息用于模型训练,而不一定需要标明来源。
Cloudflare还引入了一键选项,允许网站所有者阻止所有AI爬虫,以便他们有时间评估其网站对AI内容使用的策略。对于更精细的控制,管理员现在可以创建自定义规则,允许或阻止特定的AI提供商或机器人类型。
对于已经与AI公司达成协议的发布者,Cloudflare现在提供了审计这些安排的工具。网站所有者可以生成报告,以验证AI提供商是否遵守了关于扫描频率和内容访问的约定条款。
目前,只有大型知识产权或网站能与OpenAI等主要AI公司达成收费协议。Cloudflare的数据市场可能会将这一机会扩展到更小的内容创作者,使得商业数据更加平民化。
本文素材来源Cloudflare,如有侵权请联系删除
END
本篇文章来源于微信公众号: AIGC开放社区