国产大模型顶流「讯飞星火」:图片生成、代码生成,支持插件等重磅上线

添加书签

8月12日,新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》报告中,讯飞星火以总分1013分,被评为国产卓越大模型之一。(体验地址:https://xinghuo.xfyun.cn/?ch=8tcbd7p)

讯飞星火可基于自然文本、语音的方式提供多场景文本生成、语言理解、知识问答、逻辑推理、数学解答、代码生成和多模态7大能力,快速生成文本、图片、代码等内容。适用于营销、电商、金融、招聘、客服、医疗、文案创作等所有主流业务场景。

单从中文创作来看,讯飞星火生成的文本能够更好的满足国内的需求,从生成速度、连贯性、文字精简、文字表达多个方面,对比ChatGPT等产品也表现出了独特的中文优势,整个体验下来,属于国产大模型中的佼佼者。

在多模态方面,讯飞星火也在此次做了新的更新,支持图片提问功能,目前GPT-4也暂未开放该功能。用户可以向讯飞星火发送一张图片,然后根据图片内容向讯飞星火提问,例如,发送一张西安大雁塔的图片,让其识别图片展示的是哪一处建筑,有哪些相关的历史典故等。

此外,本次更新,讯飞星火还提供可视化“数据微调”特色功能,支持用户一次性上传10个.txt、.PDF的文本,使讯飞星火可以回答特定领域的内容。例如,上传5份法律文件,可提问文件中的内容。

下面「AIGC开放社区」将为大家深度解读讯飞星火的主要特色功能:

1. 图片生成:根据用户的描述,生成符合要求的图像。

2. 图片理解:支持用户图片输入,针对图片内容进行视觉问答。

3. 虚拟人视频生成:根据用户要求,生成符合要求的虚拟人视频。

4. 代码能力:提供了强大的代码生成、解释、纠错功能。

5. 助手功能升级:1)通过角色设定、目标任务、需求说明、风格设定等字段,帮助用户快 速定制自己的专属助手,并提高助手的大模型应用效果。2)个人数据集:用户可以创建数据集,并关联到助手上进行问答。3)独立 Web 应用:单个助手可以作为独立 web 应用分享出去。4)助手 API:每个助手自动生成独立 API,帮助开发者快速将助手集成到自己的应用中。

6. 插件功能:在对话框处可以选择三个强大的插件功能,文档问答、PPT生成和简历生成。

文本生成图片

讯飞星火是一个多模态输出模型,支持文本直接生成图片。虽然该功能没有Midjourney那么细腻,但基本能理解用户的意图生成高质量图片。例如,生成一辆在沙漠中飞奔的越野车。

生成一把削铁如泥的利刃

生成一个拿着大西瓜的胖娃娃,二次元风格

图片理解

图片提问是讯飞星火的主打特色功能之一。早在今年3月OpenAI发布GPT-4时就展示过该功能至今一直没有开放,现在,可以在讯飞星火上体验了。

1)上传了一张万里长城的图片,很快识别出了图片中的建筑并介绍了其历史来历。

2)上传一张动漫图片,同样很快就识别出了图片元素并给出了详细的解读。当提问是哪一部动漫时,讯飞星火居然准确地回答出了《火影忍者》,还是挺令人惊讶的。

3)为了测试讯飞星火的深度识别功能,输入了一张有乱码的电脑图片,依然可以识别并给出了准确答案。

虚拟人视频生成

该功能可根据文本提示,生成符合要求的虚拟人视频。例如,帮我生成一个祝福启蒙导师的李老师教师节快乐的视频。得到文案后,点击生成视频便完成。

 

讯飞星火生成的视频展示

如果用户对形象、背景、声音不满意,可以点击自定义进行替换,选择符合文本需求的元素。

多场景文本生成

讯飞星火为了满足不同用户的需求,提供了一个丰富场景使用的助手中心,可以根据职场、营销、生活、招聘、编程、客服等领域,提供更深度、专业的文本创意功能。

包括生成标题、模拟面试、故事创作、景点推荐等,适用于小红书、抖音、微博、快手等平台,点击即可使用非常便捷。

小红书标题,直接输入产品名称,例如,补水面膜、健身服,可立刻生成三个爆款标题,如果不满意点击重新回答即可。

PPT大纲助手,用户只输入你想做的事情,例如,输入减肥计划,可生成PPT的详细内容,包括封面、引言、目标、饮食计划、习惯调整等所有与减肥计划相关的内容。

求职邮件,用户只需要输入想求职的职位,可生成一份全面的求职信。例如,市场总监。

对于文字工作者来说,稿件校对是事件费事、费力又不容易找出细微错误、差别。讯飞星火提供了专业的稿件校对助手

例如,我昨天去了一个很大的图书馆,有很多书。我看到了一本很有趣的书,我吃了它。可以识别该语句的错别字和语法错误,并给出修改后的答案。

扩写助手对于文案的创作非常有帮助,只需要一段话甚至几个字就能描写出更丰富的场景。例如,天空下了一阵大雨。

讯飞星火提供的助手中心非常丰富,几乎涵盖所有的业务场景,该功能主要面向C端用户,降低了用户使用大模型的门槛,不需要掌握复杂的prompt提示词工程知识,即可向大模型进行专业的提问交互以此获得精准答案。

代码生成、解释、纠错功能

讯飞星火提供了强大的代码生成、解释、纠错功能。例如,用Java,写一个旅游网站的登录页面,很快便给出了一个简单的示例,并且详细解释了代码的运行原理、调用、运行原理等。

输入一段Python代码,让其解释工作原理、用途等。

输入一段错误的Python代码,可以快速识别并提出详细的修改方案,同时生成正确的代码示例。

强大的插件功能

用户在对话框处可以选择三个强大的插件功能,文档问答、PPT生成和简历生成,其中PPT和简历生成支持文档下载,功能相当强大。

文档问答,上传了一份AIGC的深度报告,然后开始根据文档内容进行提问。例如,梳理AIGC的受益厂商,回答的内容与上传的文档基本一致,识别率和回答的准确性很高

源文档内容截图

PPT模版生成,例如,生成一个销售PPT模版,用户可以直接在平台下载生成好的PPT模版。

简历生成,例如,我叫张三丰,五年房地产销售经验,帮我生成一份简历。支持Word格式下载该模版。

创建自定义助手功能

用户可以根据自身的数据,例如,金融、销售、教育、历史等数据打造特定的聊天助手。

该功能相当于可视化“数据微调”功能,同时用户也可以将自己创建的助手发布到平台中,提供给其他人使用。

创建流程非常简单,用户登录到https://xinghuo.xfyun.cn/botcenter然后点击创建助手,输入助手的名称、营销、功能介绍等,点击创建。

再点击数据集,为创建的助手添加专业的数据,支持用户一次上传10个.txt、PDF文件,单个文件不超过20万字。

数据上传完成后,再点击创建的助手并在知识库信源中,关联上我们刚创建的数据集即可完成。现在,就可以根据自定义创建的助手提问,上传数据的文档内容了。

更详细的创建教程,可在https://developer.xfyun.cn/thread/116465查看。

科大讯飞将在今天14:00举办“讯飞星火认知大模型V2.0”升级发布会。本次会议的焦点将集中在此次重大版本升级所带来的代码能力和多模态能力的显著提升,并推出面向老师、学校、企业、开发者等更多元的场景化落地产品。

发布会的主题是“解放生产力、释放想象力”,感兴趣的小伙伴可以去讯飞开放平台官方视频号预约或者星火官网观看~

本文素材来源讯飞星火官网,如有侵权请联系删除