首页 AI教程资讯 stable diffusion_stable diffusion教程_stable diffusion案例

stable diffusion_stable diffusion教程_stable diffusion案例

2024-12-24 来源｜AI图库吧

把文字或者logo融入到自然风景中，这应该是一种很奇妙的体验，同时这也会为我们的设计作品带来不一样的闪光点!

Stable Diffusion文字融入图片，主要方法就是在正常文生图基础上用controlnet增加文字控制，下面我就将制作此类图片的整个过程记录下来，希望你也能轻松学会，并能举一反三，发扬光大。

话不多说，咱们马上开始~

01.文字图片准备

准备好你自己制作的黑白文字底图，图片的宽高比自行定义，效果如下：

02.模型准备

这里需要用到几个模型，模型我会放到网盘，文章末尾会有获取资料的方法。

1、大模型(写实)

realisticVisionV51_v40VAE.safetensors

02、controlNet的qrcode_monster模型control_v1p_sd15_qrcode_monster.safetensors

03、controlNet的brightness模型

control_v1p_sd15_brightness.safetensors

这里需要注意一下：qrcode_monster和brightness模型都有一个.yaml的配置文件。请将网盘中的四个文件全部下载下来放在stable-diffusion-webuiextensionssd-webui-controlnetmodels文件夹中。

03.参数设置

正面提示词：

This is a highly detailed photograph depicting the bustling daytime scenery of Hong Kong"s Victoria Harbor,with various cruise ships shuttling in and out of the sea,high-rise buildings,and blue sky,

当然也可以自己发挥，并不一定要一样。

负面提示词：常用的任意都行

采样方法：DPM++ 2M Karras

采样迭代步数：30

宽度：960.高度：540(尺寸根据你自己的实际需要，尺寸尽量不要太大，否则你的电脑会挂)

CFG：7

参数说明

控制权重：

数值范围从0到2.数字越大，文字融入图片就越强烈，数字越小，文字与图片融入就越和谐，这主要取决于实际作用效果。

引导介入时机：

数值范围从0到1.数字越大，开始介入时间就越晚，文字参与作画过程就越短;数字越小，开始介入时间就越早，文字参与作画过程就越长，同样也取决于实际作用效果。

引导终止时机：

数值范围从0到1.数字越大，终止介入时间就越晚，文字参与作画过程就越长;数字越小，终止介入时间就越早，文字参与作画过程就越短，同样也取决于实际作用效果。

弄清楚基本原理之后，我们就可以点击“生成”开始愉快的跑图了。

挑选到比较满意的图片后，点击图片下方的发送图像和生成参数到图生图选项卡进行放大处理。

将重绘幅度改成0.35.重绘幅度值越小，对画面重构范围就越小，反之越大。

脚本选择Ultimate SD upscale，目标尺寸类型选择Scale from image size，放大算法可以选择4x-UltraSharp，也可以选择R-ESRGAN 4x+，他们最终效果都差不多，但原理有所差别：4x-UltraSharp是把图片分成四个大小一样的区域进行分区渲染，所占用的内存比较小，而R-ESRGAN 4x+是整个图片一起渲染，所占用的内存量巨大，题主8G显存放大4倍时直接崩塌，而选择4x-UltraSharp放大时可以轻松完成。