ChatGPT正在测试原生文件分析功能，DALL·E 3能P图啦！

添加书签

AIGC开放社区
2023-10-30

专注AIGC领域的专业社区，关注微软OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

10月29日，有部分用户在社交平台上分享，ChatGPT Plus正在测试原生文件上传、分析功能，可以通过文本问答的方式，对上传的PDF等数据文件进行提问、搜索。

例如，上传一份50页的员工手册PDF文件，然后向ChatGPT提问，能帮我总结一下手册的5个核心观点吗？；新入职员工触犯规则后，会遭遇哪些处罚？

其实，文件分析功能并不是最近才推出的，用户借助ChatGPT早期推出的第三方插件功能就能实现。但在性能、效率、海量数据上下文理解方面无法与原生相媲美。

如果加上此前ChatGPT推出的代码解析功能，用户通过问答方式就能根据上传的文件，直接生成可视化图表，这对于金融、市场、营销等业务人员帮助巨大。

无需编写任何一行代码，切换多个工具，在单一平台就能完成所有的数据分析和创建可视化数据图。

分享用户展示了ChatGPT的PDF分析功能：他上传了一份开源大语言模型Mistral 7B的说明文档，然后提问，用两句话总结一下这份PDF文档。

ChatGPT回答：Mistral 7B是一个70亿参数的大语言模型，在各种基准测试上优于现有模型，同时使用分组查询注意力和滑动窗口注意力提升性能。它是在Apache 2.0许可证下发布的，展示了高性能和高效的推理，特别是在推理、数学和代码生成任务中。

同样支持多轮深度提问模式，可以继续发问，Mistral7B在PIQA基准中的测试评分比Code llama高多少？

另外一个重磅测试功能是，用户可以通过上传图片，在ChatGPT 中进行P图。这个使用了ChatGPT最新发布的文生图模型DALL·E 3，并展示了强大的语义理解能力。

例如，上传了一份金毛的图片，然后提问，让这只狗奔跑起来吧。

ChatGPT的P图功能展示

上传一张水豚的图片，然后让其按照皮克斯的风格重新生成一下。

这种细腻的语义理解和图片控制功能比Midjourney还要简单方便。此外，OpenAI还对其他功能进行了优化。

例如，用户不必从GPT-4下拉菜单中选择“使用 Bing 浏览”模式，ChatGPT可以根据上下文猜测他们是否需要联网。

本文素材来源网络，如有侵权请联系删除

END

即将举行的活动