AI Art Enlightenment 2

Prompt optimization

Sharing tips for optimizing painting prompts

Midjourney

AI painting

Qwen-image

Comfy UI

Flux

Krea

AI Art Enlightenment 1

Text-to-image prompt structure

首先，上一次的提示词是这样的：

长得像日本明星的年轻女孩，活力偶像，皮肤白晳红润，黑色长直发，有一双会说话的大眼睛，穿着时尚的白色裙子，曼妙的身材，表情温柔生动，微笑地看着观众，眼中透出一抹淡淡的忧伤。背景是虚化的现代都市，阳光洒在她的脸上。专业杂志封面人像摄影师的杰作，高清照片。

其实我觉得已经很美了，基本上能切中我的审美，但是总觉得还有点“不食人间烟火”？换句话说就是“AI味”还是存在。

我们能不能再优化或修改一下以便生成更自然的图像呢？

首先让我们分解一下提示词的结构：

提示词的基本结构

上次说到这个基本结构是【人物特征+场景+色彩光线+风格】，分解开就是：

【人物特征】长得像日本明星的年轻女孩，活力偶像，皮肤白晳红润，黑色长直发，有一双会说话的大眼睛，穿着时尚的白色裙子，曼妙的身材，表情温柔生动，微笑地看着观众，眼中透出一抹淡淡的忧伤。
【场景】背景是虚化的现代都市
【色彩光线】阳光洒在她的脸上
【风格】专业杂志封面人像摄影师的杰作，高清照片

我们会发现人物特征说得特别多，其他部分就比较粗略，那么就让我们先在公式中增加更多的“参数”。

丰富场景

场景要有真实感，就要加上互动的内容，比如都市就要有行人和车。另外为了突出主体，我们要在开始就保持背景的模糊。

背景是焦外虚化的现代都市，行人快乐而轻松，公交车和汽车来来往往留下慢速曝光的动感模糊

丰富光线

阳光是很好的光线描述词，但只有阳光就会比较“干巴”，正常来说皮肤这么白嫩的小姐姐不会站在直射的阳光下吧？或许这就是我们觉得不够自然的地方。

阳光洒在她的脸上，投射出淡淡的树影。

定义服装

只说裙子，AI就会搞得很简单，多少要加一点式样。这里只露肩就好了，你可以学习一下服装设计的词汇找到更多款式描述。

她穿着时尚的露肩白色裙子

定义动作

手是人类很重要的“表情”部分，手不动的话，人物就比较死板。虽然现在的AI可以把体态姿势做得比较自然，但是还是要有手的动作描述会更好。

双手交握在胸前。

露齿微笑，微微侧身，双臂交叉在胸前。

缺陷美

所谓“AI味”，不光是指手指数量不对、四肢扭区、细节错误这些老问题。有时候过于完美才是硬伤。

正所谓“有缺陷才是完美的”，连缺陷都没有怎么能称得上完美呢？

所以有时候为了追求我们习惯的“凡间的美”，即真实感、接地气，我们需要人为给描述加一点不完美。

因为之前说过了，“你不说AI怎么会知道呢？”，你不提AI还以为你就是要无缺陷的画面，就像前面提到的阳光和手，不太合常理或不自然就会美得不真实。

你可以在任何地方试着增加“必要的缺陷”，但在这里让我们只是去掉原先提示中的“专业杂志封面人像摄影师的杰作，高清照片。”，改为：

不完美的手机拍摄照片，轻微抖动的模糊边缘, 漏光，过曝。

小技巧：必要时可以在参数中试着降低一点cfg值，让AI“较少遵守提示要求”,以便"更有缺陷"。但这个数值如果过小会降低生成质量，比如结构出错。另外对于Flux系模型官方不建议改cfg(默认1)，只有SD和Qwen效果好些。

最终提示

现在结果是这样的：

长得像日本明星的年轻女孩，活力偶像，皮肤白晳红润，黑色长直发，发梢有深紫色渐变，有一双会说话的明亮大眼睛，穿着时尚的白色露肩裙子,裙边有银色装饰花边，戴着银色珍珠耳环。性感的身材，表情温柔生动，微笑地看着观众。露齿微笑，微微侧身，双臂交叉在胸前。眼中透出一抹淡淡的忧伤。背景是焦外虚化的现代都市，行人快乐而轻松，公交车和汽车来来往往留下慢速曝光的动感模糊。阳光洒在她的脸上，投射出淡淡的树影。不完美的手机拍摄照片，轻微抖动的模糊边缘, 漏光，过曝。

英文版：

A young girl who resembles a Japanese celebrity, a vibrant idol, has fair, rosy skin, long straight black hair with a dark purple tint at the ends, and bright, expressive eyes. She wears a stylish white off-the-shoulder dress with silver trim. She wears small silver pearl earrings and a small silver patent leather shoulder bag. With a voluptuous figure and a gentle, lively expression, she gazes at the viewer with a smile. She grins, leans slightly to the side, and crosses her arms. A hint of melancholy lingers in her eyes. The background is a modern city with a blurred, out-of-focus image. Pedestrians are happy and relaxed, while buses and cars pass by, leaving a slow-motion blur. Sunlight falls on her face, casting a faint shadow of the trees. The imperfect photo, taken with a mobile phone, shows slightly shaky, blurred edges, light leaks, and overexposure.

Flux1 Krea dev生成的结果可能更加自然: