重磅！OpenAI将发布DALL·E 3，多模态ChatGPT来了！

添加书签

AIGC开放社区
2023-09-21

专注AIGC领域的专业社区，关注OpenAI、百度文心一言等大语言模型（LLM）的发展和应用落地，关注LLM的基准评测和市场研究，欢迎关注！

9月21日凌晨，OpenAI在官网宣布，在今年10月份将通过API向ChatGPT Plus和企业版用户提供全新文本生成图片产品——DALL·E 3。

这意味着，ChatGPT在DALL·E 3加持下将开启久违的多模态输出模式，用户通过文本就能直接在ChatGPT中生成各种类型图片。

例如，在ChatGPT中输入，生成一只可爱的米老鼠、二次元风格、在火星中奔跑、面带惊恐的表情、背着一个火箭背包。如果对生成的图片不满意，可以让其反复生成直到满意为止。

功能展示

早在2021年，OpenAI基于GPT-3大语言模型和变分自编码器（VAE），开发了文本生成图片产品DALL·E，使用方法和功能与Midjourney、百度文心一格等产品类似。

该名字来源于艺术家Salvador Dali和电影《玩具总动员》中的角色WALL·E，也反映了该产品的主要技术特性，生成具有创新性和想象力的图片。

在2022年4月，OpenAI又发布了DALL·E 2，在功能、资源消耗方面进行了大幅度优化。

今天宣布的DALL·E 3，将比前两代功能更加强大并且可集成在ChatGPT中使用，使其实现多模态输出。

为了增强DALL·E 3的数据安全，OpenAI进行了以下优化。

（申请地址：https://share.hsforms.com/1_OuT5tfFSpic89PqN6r1CQ4sk30）

以下是OpenAI在官网展示的DALL·E 3生成的图片效果。从展示可以看出，DALL·E 3可以生成写实、二次元、平面、创意、朋克、3D等多种类型的图片。

本文素材来源OpenAI官网，如有侵权请联系删除

END

即将举行的活动