ChatGPT可以使用DALL·E 3啦!OpenAI还开放了论文
添加书签专注AIGC领域的专业社区,关注OpenAI、百度文心一言等大语言模型(LLM)的发展和应用落地,关注LLM的基准评测和市场研究,欢迎关注!
10月20日凌晨,OpenAI在官网宣布,现在所有ChatGPT plus和企业版用户,可以使用最新的文生图模型DALL·E 3。
DALL·E 3是OpenAI在今年9月21日发布的最新产品,用户通过文本问答方式就能生成二次元、平面、创意、朋克、3D等多种类型的图片,例如,生成一个在火星奔跑的兔子,荒漠,废土风格,漫天风沙。
值得一提的是,DALL·E 3在语义理解、图片二次修改、大段文本输入等方面,比Midjourney强很多,并且图片质量比DALL·E 2实现了巨大提升。
此外,OpenAI还开放了DALL·E 3的研究论文和系统卡,「AIGC开放社区」后续会详细为大家介绍该内容。
DALL·E 3论文地址:https://cdn.openai.com/papers/dall-e-3.pdf
DALL·E 3系统卡:https://openai.com/research/dall-e-3-system-card
根据OpenAI展示的内容来看,DALL·E 3在文本输入方面更优秀、人性化,可以将一整大段内容输入到ChatGPT中进行生成图片。
细节方面,DALL·E 3在脸部、手臂等方面的处理更加精准,支持横向和纵向宽高比。
DALL·E 3使用演示
例如,我正在为科学课做一份关于卷云的报告,需要一些逼真的图像来展示它们的纤细形态。同时需要与浮肿积雨云的照片进行比较。
很快ChatGPT就能生成符合标准的高质量图片。
我正在与一位网页设计师,合作创建一个销售自行车头盔的新网站。能否推荐一些既现代又简单的网站用户界面,用于分享作为示例?
一张照片中,一位皮肤古铜色的中年波利尼西亚男性冲浪者奋力冲浪,手里拿着50 件物品,包括茶杯、自行车、雨伞、烛台、口琴、地球仪、笔记本、羽毛、秒表、棋盘、弹珠、围巾、灯笼、画笔、凉鞋、指南针、望远镜、扳手、花瓶、溜溜球、鹅毛笔、水壶、书包、贝壳、挂坠盒、铅笔、日晷、卷尺、算盘、袖扣、保龄球、口哨、抹刀、抹刀、沙漏、大礼帽、笛子、显微镜、拼图游戏、放大镜、飞盘、陀螺、手电筒、跳绳、开罐器、风铃、盆景树、擀面杖、热水瓶和打字机等。海浪在他周围拍打,他的表情充满痛苦和轻微的恐慌,并试图平衡物体和他的冲浪板。
巨型机器人的手的特写照片,细节复杂,磨损迹象明显,溅入清澈的河水中。飞溅产生的涟漪扩散开来,反射阳光。手部的金属表面有划痕和凹痕,显示出其年代感。
由珊瑚和水母制成的相机,沉浸在广阔的蓝色海洋深处。相机的外表面饰有珊瑚和闪亮的金色金属装饰。深蓝色的背景上充满了微小的漂浮微生物,采用高质量的光学器件进行描绘,使图像具有胶片颗粒纹理和柔和的色彩。
一个巨大的观察眼睛,虹膜错综复杂,瞳孔与向日葵类似。深邃而黑暗的瞳孔出现在向日葵的中心,周围的金色虹膜图案与花瓣相映。
精致纸张上的剪纸插图,略有磨损,错综复杂的 3D 立体弹出式花园,配有锦鲤池和石灯笼,通过精确的切割和折叠使自然场景栩栩如生,雕塑设计艺术。
负责任安全的DALL·E 3
OpenAI表示,采用了多层级的安全系统,以限制DALL·E 3生成可能有害的图像,包括暴力、成人或仇恨内容。在将结果图像展示给用户之前,会对用户的提示和生成的图像进行了安全检查。
OpenAI还与早期测试用户和专业的安全人员合作,识别和解决了新模型功能带来的安全体系漏洞。例如,他们的反馈帮助识别了生成图形内容的边缘案例,如性感图像,并对模型生成令人信服的误导性图像的能力进行了压力测试。
在DALL·E 3部署的环节中,OpenAI也采取了安全措施,以降低模型生成特定艺术家风格的内容、公众人物的图像,以及改善生成图像中的人口代表性。
本文素材来源OpenAI官网,如有侵权请联系删除
END