ChatGPT正在测试原生文件分析功能,DALL·E 3能P图啦!
添加书签专注AIGC领域的专业社区,关注微软OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!
10月29日,有部分用户在社交平台上分享,ChatGPT Plus正在测试原生文件上传、分析功能,可以通过文本问答的方式,对上传的PDF等数据文件进行提问、搜索。
例如,上传一份50页的员工手册PDF文件,然后向ChatGPT提问,能帮我总结一下手册的5个核心观点吗?;新入职员工触犯规则后,会遭遇哪些处罚?
其实,文件分析功能并不是最近才推出的,用户借助ChatGPT早期推出的第三方插件功能就能实现。但在性能、效率、海量数据上下文理解方面无法与原生相媲美。
如果加上此前ChatGPT推出的代码解析功能,用户通过问答方式就能根据上传的文件,直接生成可视化图表,这对于金融、市场、营销等业务人员帮助巨大。
无需编写任何一行代码,切换多个工具,在单一平台就能完成所有的数据分析和创建可视化数据图。
分享用户展示了ChatGPT的PDF分析功能:他上传了一份开源大语言模型Mistral 7B的说明文档,然后提问,用两句话总结一下这份PDF文档。
ChatGPT回答:Mistral 7B是一个70亿参数的大语言模型,在各种基准测试上优于现有模型,同时使用分组查询注意力和滑动窗口注意力提升性能。它是在Apache 2.0许可证下发布的,展示了高性能和高效的推理,特别是在推理、数学和代码生成任务中。
同样支持多轮深度提问模式,可以继续发问,Mistral7B在PIQA基准中的测试评分比Code llama高多少?
另外一个重磅测试功能是,用户可以通过上传图片,在ChatGPT 中进行P图。这个使用了ChatGPT最新发布的文生图模型DALL·E 3,并展示了强大的语义理解能力。
例如,上传了一份金毛的图片,然后提问,让这只狗奔跑起来吧。
ChatGPT的P图功能展示
上传一张水豚的图片,然后让其按照皮克斯的风格重新生成一下。
这种细腻的语义理解和图片控制功能比Midjourney还要简单方便。此外,OpenAI还对其他功能进行了优化。
例如,用户不必从GPT-4下拉菜单中选择“使用 Bing 浏览”模式,ChatGPT可以根据上下文猜测他们是否需要联网。
本文素材来源网络,如有侵权请联系删除
END