Midjourney大更新,细节最强文本生图片模型来啦!

添加书签

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!

著名文生图片平台Midjourney正式发布了V6.1版本,本次对生成内容的细节、连贯性、图片质量、个性化等进行了大量更新,再一次成为行业标杆。

细节则成为本次的重点,对之前经常出现问题的眼睛、睫毛、瞳孔、腿、手臂、手指关节、表情神态等进行了纠正,在生成质量和文本语义还原方面更好。

「AIGC开放社区」将结合V6.1生成的图片,为大家解读一下本次更新的主要内容。

图片连贯性改进:在生成复杂内容,例如,手臂、毛发、腿、手、身体、植物和动物时,V6.1能更准确地捕捉和表现这些细节,使图片看起来更加自然和连贯。

之前经常出现的“六指琴魔”,三条腿、蛤蟆嘴等情况会少很多,增强了图片的真实感。

V6.1生成

图片质量的增强:之前的版本可能在某些区域出现明显的像素化,V6.1通过减少像素痕迹和增强纹理细节,使图片更加平滑和细腻。

例如,生成的人物皮肤将看起来更加光滑,复古风格的8位游戏画面也将拥有更丰富的色彩和细节。

小特征的精准呈现:在细节方面,如眼睛的虹膜纹理、小表情或远处的手部动作,V6.1能够捕捉并清晰展现,之前可能因细节过于微小而被忽略。例如,一张描绘远距离人物的图片,现在可以清楚地看到他们微妙的表情变化。

高级放大功能:当需要放大图像时,V6.1的高级算法能够保持图像的清晰度和纹理质量,避免了放大后可能出现的模糊或失真。这意味着即使在大型广告牌或高清屏幕上展示,图像仍然保持高分辨率。

更快生成效率:V6.1生成图像的效率提升了大约25%,可以帮助用户节省更多的时间。

文本准确性增强:在创建包含文本的艺术作品时,V6.1能够更准确地渲染引号内的文字,避免了字体错误或排版问题。

个性化模型和本地代码管理:V6.1提供了更加个性化的图像生成选项,可以根据用户的偏好创造独一无二的作品,例如,你是一位漫画师,可以使用特定的科幻、抽象风格来生成图片。

此外,如果用户希望保持某种特定的风格或效果,可以保存并重用个人化代码,确保每次生成的图像都具有一致性。

新增“–q 2”模式:这个模式允许用户在图像质量和处理时间之间做出选择,虽然会增加处理时间,但可以获得更丰富的纹理和细节。适合那些对图像质量有极高要求的应用场景。

光影、色彩改进:从色彩平衡到光影效果,V6.1的整体美观性得到了提升,生成的图像将更加吸引人。例如,风景画将展现出更加绚丽的色彩和层次感。

以下是网友用V6.1生成的图片欣赏:

一位时装模特看着相机,在工作室里,黑白照片,口红选择性着色,红色,喜怒无常的灯光,特写角度,高分辨率摄影。

电影镜头,动漫阿基拉真人,阿基拉铁男角色,在新东京街头射击敌人,赛博朋克和都市服装,红色手套,红色夹克,红色裤子,携带未来枪,动态动作,动态运动,互相射击,史诗级。

大学橄榄球场的初秋下午,一名橄榄球运动员,动态照明突出肌肉形态,光影对比,低角度,饱和色彩。

神秘的黑色双足飞龙,鳞片闪烁着虹彩的色调,栖息在摇摇欲坠的城堡塔顶上,戏剧性的灯光,低角度,黑暗幻想风格,怪异的气氛,电影,详细的构图。

电影拍摄角度,一个人在一间破旧的汽车旅馆房间里,从破烂的窗帘后面凝视着外面,外面霓虹灯闪烁,特写,气氛诡异,霓虹灯色彩鲜艳。

值得一提的是,昨天著名视频模型Gen-3 Alpha也推出了图像转视频功能,当我们使用Midjourney V6.1+ Gen-3将能制作专业级视频,拍广告、短剧、制作鬼畜视频统统都没问题啦。

以下是Midjourney V6.1+ Gen-3制作的视频欣赏。相比文本直接生成,这种用特定图片生成的内容更具可控性。

本文素材来源Midjourney,如有侵权请联系删除

END

本篇文章来源于微信公众号: AIGC开放社区