Midjourney大更新，细节最强文本生图片模型来啦！

添加书签

AIGC开放社区
2024-08-01

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

著名文生图片平台Midjourney正式发布了V6.1版本，本次对生成内容的细节、连贯性、图片质量、个性化等进行了大量更新，再一次成为行业标杆。

细节则成为本次的重点，对之前经常出现问题的眼睛、睫毛、瞳孔、腿、手臂、手指关节、表情神态等进行了纠正，在生成质量和文本语义还原方面更好。

「AIGC开放社区」将结合V6.1生成的图片，为大家解读一下本次更新的主要内容。

图片连贯性改进：在生成复杂内容，例如，手臂、毛发、腿、手、身体、植物和动物时，V6.1能更准确地捕捉和表现这些细节，使图片看起来更加自然和连贯。

之前经常出现的“六指琴魔”，三条腿、蛤蟆嘴等情况会少很多，增强了图片的真实感。

V6.1生成

图片质量的增强：之前的版本可能在某些区域出现明显的像素化，V6.1通过减少像素痕迹和增强纹理细节，使图片更加平滑和细腻。

例如，生成的人物皮肤将看起来更加光滑，复古风格的8位游戏画面也将拥有更丰富的色彩和细节。

小特征的精准呈现：在细节方面，如眼睛的虹膜纹理、小表情或远处的手部动作，V6.1能够捕捉并清晰展现，之前可能因细节过于微小而被忽略。例如，一张描绘远距离人物的图片，现在可以清楚地看到他们微妙的表情变化。

高级放大功能：当需要放大图像时，V6.1的高级算法能够保持图像的清晰度和纹理质量，避免了放大后可能出现的模糊或失真。这意味着即使在大型广告牌或高清屏幕上展示，图像仍然保持高分辨率。

更快生成效率：V6.1生成图像的效率提升了大约25%，可以帮助用户节省更多的时间。

文本准确性增强：在创建包含文本的艺术作品时，V6.1能够更准确地渲染引号内的文字，避免了字体错误或排版问题。

个性化模型和本地代码管理：V6.1提供了更加个性化的图像生成选项，可以根据用户的偏好创造独一无二的作品，例如，你是一位漫画师，可以使用特定的科幻、抽象风格来生成图片。

此外，如果用户希望保持某种特定的风格或效果，可以保存并重用个人化代码，确保每次生成的图像都具有一致性。

新增“–q 2”模式：这个模式允许用户在图像质量和处理时间之间做出选择，虽然会增加处理时间，但可以获得更丰富的纹理和细节。适合那些对图像质量有极高要求的应用场景。

光影、色彩改进：从色彩平衡到光影效果，V6.1的整体美观性得到了提升，生成的图像将更加吸引人。例如，风景画将展现出更加绚丽的色彩和层次感。

以下是网友用V6.1生成的图片欣赏：

一位时装模特看着相机，在工作室里，黑白照片，口红选择性着色，红色，喜怒无常的灯光，特写角度，高分辨率摄影。

电影镜头，动漫阿基拉真人，阿基拉铁男角色，在新东京街头射击敌人，赛博朋克和都市服装，红色手套，红色夹克，红色裤子，携带未来枪，动态动作，动态运动，互相射击，史诗级。

大学橄榄球场的初秋下午，一名橄榄球运动员，动态照明突出肌肉形态，光影对比，低角度，饱和色彩。

神秘的黑色双足飞龙，鳞片闪烁着虹彩的色调，栖息在摇摇欲坠的城堡塔顶上，戏剧性的灯光，低角度，黑暗幻想风格，怪异的气氛，电影，详细的构图。

电影拍摄角度，一个人在一间破旧的汽车旅馆房间里，从破烂的窗帘后面凝视着外面，外面霓虹灯闪烁，特写，气氛诡异，霓虹灯色彩鲜艳。

值得一提的是，昨天著名视频模型Gen-3 Alpha也推出了图像转视频功能，当我们使用Midjourney V6.1+ Gen-3将能制作专业级视频，拍广告、短剧、制作鬼畜视频统统都没问题啦。

以下是Midjourney V6.1+ Gen-3制作的视频欣赏。相比文本直接生成，这种用特定图片生成的内容更具可控性。

本文素材来源Midjourney，如有侵权请联系删除

END

本篇文章来源于微信公众号: AIGC开放社区

即将举行的活动

联系我们

最新网络研讨会

推荐

AIGC开放社区

加入 AIGC开放社区

AIGCOPEN开放社区是专注于AIGC（生成式人工智能）领域的社区，关注包括微软、OpenAI ChatGPT、百度文心一言、科大讯飞星火、华为盘古等大语言模型（LLM）的发展应用和落地，以及国内LLM的发展和市场&学术研究。社区秉承共享、开放的理念，期待与大家一起共建！