专注AIGC领域的专业社区,关注OpenAI、百度文心一言等大语言模型(LLM)的发展和应用落地,关注LLM的基准评测和市场研究,欢迎关注!
6月20日中午,国家互联网信息办公室发布了《境内深度合成服务算法备案清单》,包括,百度、阿里、腾讯、抖音、科大讯飞等科技巨头的41个算法入选,这也是国内首批公开的算法备案清单。(免费查询地址:https://beian.cac.gov.cn/#/index)
同时,国家互联网信息办公室关于发布深度合成服务算法备案信息的公告中表示,《互联网信息服务深度合成管理规定》第十九条明确规定,具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续。
深度合成服务技术支持者应当参照履行备案和变更、注销备案手续。请尚未履行备案手续的深度合成服务提供者和技术支持者尽快申请备案。
主要用途:应用于在线智能客服场景,根据用户咨询内容,生成文本或语音智能回答。
主要用途:应用于图像生成场景,使用文本条件图像生成模型,生成与输入文本语义一致的图像。
主要用途:应用于对话生成场景,根据用户输入的文本内容,应用对话模型,生成对话文本回复。
主要用途:应用于电话智能客服场景,生成用户问题的语音智能回答。
主要用途:应用于电话智能客服场景,生成用户问题的文本智能回答。
主要用途:应用于短视频制作场景,利用生成模型对用户上传图片、视频进行属性编辑或风格转换,生成图片、视频。
主要用途:应用于图像生成场景,利用图文匹配神经网络模型和扩散生成模型,生成与输入文本语义一致的图像。
主要用途:应用于对话生成场景,基于飞桨深度学习框架和对话语料训练的对话模型,生成开放域的文本回答。
应用产品:西瓜视频(APP)、轻颜(APP)、剪映(APP)、抖音短视频(APP)等
主要用途:应用于图像、视频生成场景,基于人像理解技术和视频剪辑技术实现对用户上传图片或视频的渲染处理与格式转换,生成编辑处理后图像或视频。
主要用途:应用于图像生成场景,服务于图像编辑类的企业端客户,通过API提供人脸图像美颜功能。
主要用途:应用于音频生成场景,服务于音频、视频制作类的企业端客户,通过API提供文本转语音功能。
主要用途:应用于在线智能客服场景,根据用户咨询内容,生成文本或语音智能回答。
应用产品:1688工业品(APP)、阿里巴巴(APP、网站)
主要用途:应用于在线智能客服场景,根据用户咨询内容,结合智能客服知识库,生成文本、图像、音频、视频等形式的回答。
主要用途:应用于在线智能客服场景,识别文字或语音问题,结合智能客服知识库,生成文本、图像、音频、视频等形式的回答。
主要用途:应用于即时通讯场景,识别语音消息,生成识别后的文本信息。
主要用途:应用于即时通讯场景,实现对特定语种的翻译服务,生成翻译后文本信息。
主要用途:应用于即时通讯场景,提取识别图片中文字,生成提取后的文本信息。
主要用途:应用于在线智能客服场景,根据用户咨询内容,结合智能客服知识库,生成文本、图像、音频、视频等形式的回答。
19、主体名称:阿里巴巴达摩院(杭州)科技有限公司
主要用途:应用于对话生成场景,服务于智能对话类的企业端客户,利用对话意图理解、对话内容生成等技术,通过API提供对话生成功能。
20、主体名称:阿里巴巴达摩院(杭州)科技有限公司
主要用途:应用于图像生成场景,服务于图像合成类的企业端客户,通过API提供文字信息转化为图像信息的功能。
21、主体名称:阿里巴巴达摩院(杭州)科技有限公司
主要用途:应用于开放域多模态内容生成场景,服务于问答、咨询类的企业端客户,通过API提供根据用户输入生成多模态信息的功能。
主要用途:应用于智能客服场景,根据用户咨询内容,结合智能客服知识库,生成文本、图像、音频、视频等形式的回答。
主要用途:应用于形象图片制作场景,识别照片中人物表情动作,生成淘宝人生形象图片。
主要用途:应用于智能客服场景,根据用户提问分析用户诉求,生成文本智能回答。
主要用途:应用于文本生成场景,提取语音中声学特征,结合语言模型,识别短音频,生成文本信息。
主要用途:应用于开放域对话生成场景,利用文本、代码、prompt数据及用户反馈数据训练AI大模型,服务于问答、咨询类的企业端客户,通过API提供文本生成服务。
应用产品:美图设计室(APP)、美图秀秀(APP)、美颜相机(APP)等
主要用途:应用于图像生成场景,基于图像内容理解结果,实现对用户上传照片的艺术化重新生成。
主要用途:应用于在线智能客服场景,利用自然语言技术定位用户需求,生成文本、图像、音频、视频等形式的回答。
主要用途:应用于对话生成场景,根据用户输入内容,应用对话模型,生成对话文本回复。
主要用途:应用于音频生成场景,基于用户录音数据,提取用户音色特征,生成与用户音色一致的音频信息。
主要用途:应用于音频生成场景,基于用户歌唱录音数据,提取用户音色特征,制作歌曲。
主要用途:应用于语音转文字场景,识别实时录音数据,生成识别后的文本信息。
主要用途:应用于人脸图像、视频生成场景,将用户上传的照片与特定形象进行面部融合,生成融合后的人脸图像、视频。
主要用途:应用于人脸图像、视频生成场景,服务于图像、视频编辑类的企业端客户,通过API提供用户面部特征融合功能。
主要用途:应用于视频会议场景,利用人像分割得到像素级背景区域,实现对视频背景区域的模糊或替换,生成背景虚化或背景替换后的视频。
主要用途:应用于文本转语音场景,服务于音频、视频合成类企业端客户,使用已授权的声优声纹信息,通过API提供文本转语音功能。
主要用途:应用于文本转语音场景,利用语音合成技术,将文本内容转化为有声读物。
主要用途:应用于视频制作场景,根据用户选择的模板,修改用户上传图片的风格,生成风格化视频。
主要用途:应用于人脸视频生成场景,将用户上传的照片与模板视频进行面部融合,生成与模板视频的人像表情和动作一致的人脸视频。
主要用途:应用于人脸图像、视频生成场景,将用户上传的照片与特定形象进行面部融合,生成融合用户面部特征的人脸图像、视频。
主要用途:应用于人脸图像编辑场景,通过修改用户上传照片中人脸属性信息,改变照片人物的外貌特征。
本文素材来源国家互联网信息办公室,如有侵权请联系删除
END