stable diffusion_stable diffusion教程_stable diffusion案例

2024-12-24 来源|AI图库吧

把文字或者logo融入到自然风景中,这应该是一种很奇妙的体验,同时这也会为我们的设计作品带来不一样的闪光点!

Stable Diffusion文字融入图片,主要方法就是在正常文生图基础上用controlnet增加文字控制,下面我就将制作此类图片的整个过程记录下来,希望你也能轻松学会,并能举一反三,发扬光大。

话不多说,咱们马上开始~

01.文字图片准备

准备好你自己制作的黑白文字底图,图片的宽高比自行定义,效果如下:

02.模型准备

这里需要用到几个模型,模型我会放到网盘,文章末尾会有获取资料的方法。

1、大模型(写实)

realisticVisionV51_v40VAE.safetensors

02、controlNet的qrcode_monster模型control_v1p_sd15_qrcode_monster.safetensors

03、controlNet的brightness模型

control_v1p_sd15_brightness.safetensors

这里需要注意一下:qrcode_monster和brightness模型都有一个.yaml的配置文件。请将网盘中的四个文件全部下载下来放在stable-diffusion-webuiextensionssd-webui-controlnetmodels文件夹中。

03.参数设置

正面提示词:

This is a highly detailed photograph depicting the bustling daytime scenery of Hong Kong"s Victoria Harbor,with various cruise ships shuttling in and out of the sea,high-rise buildings,and blue sky,

当然也可以自己发挥,并不一定要一样。

负面提示词:常用的任意都行

采样方法:DPM++ 2M Karras

采样迭代步数:30

宽度:960.高度:540(尺寸根据你自己的实际需要,尺寸尽量不要太大,否则你的电脑会挂)

CFG:7

参数说明

控制权重:

数值范围从0到2.数字越大,文字融入图片就越强烈,数字越小,文字与图片融入就越和谐,这主要取决于实际作用效果。

引导介入时机:

数值范围从0到1.数字越大,开始介入时间就越晚,文字参与作画过程就越短;数字越小,开始介入时间就越早,文字参与作画过程就越长,同样也取决于实际作用效果。

引导终止时机:

数值范围从0到1.数字越大,终止介入时间就越晚,文字参与作画过程就越长;数字越小,终止介入时间就越早,文字参与作画过程就越短,同样也取决于实际作用效果。

弄清楚基本原理之后,我们就可以点击“生成”开始愉快的跑图了。

挑选到比较满意的图片后,点击图片下方的发送图像和生成参数到图生图选项卡进行放大处理。

将重绘幅度改成0.35.重绘幅度值越小,对画面重构范围就越小,反之越大。

脚本选择Ultimate SD upscale,目标尺寸类型选择Scale from image size,放大算法可以选择4x-UltraSharp,也可以选择R-ESRGAN 4x+,他们最终效果都差不多,但原理有所差别:4x-UltraSharp是把图片分成四个大小一样的区域进行分区渲染,所占用的内存比较小,而R-ESRGAN 4x+是整个图片一起渲染,所占用的内存量巨大,题主8G显存放大4倍时直接崩塌,而选择4x-UltraSharp放大时可以轻松完成。

将放大后的图拿到PS爱国版中稍加修饰,即可出图。这里放几张图供大家参考。


作者的公众号二维码丨扫一扫,关注我

知名一线互联网设计师

在这里我会不定时的分享一些设计经验和3D设计

最新
更多

小度全新AI硬件将于百度世界大会发布丨智谱AI、即梦AI上线新一代视频生成模型丨OpenAI安全系统团队负责人离职

【AI奇点网2024年11月11日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

字节跳动内测豆包通用图像编辑模型SeedEdit丨Grok聊天机器人免费版内测丨月之暗面Kimi创始人被提起仲裁

【AI奇点网2024年11月12日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

李彦宏:文心大模型日调用量超15亿丨百度发布文心「iRAG」文生图技术丨小度AI智能眼镜发布,搭载大模型边走边问

【AI奇点网2024年11月13日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

巧妙利用这两个AI产品,让你的国庆出行没有废片

这两天就有朋友来问我,有没有那种能修图的AI,就是扩图+消除啥的傻瓜好用的。大家大概的需求总结一下其实就两,AI消除+AI扩图。

OpenAI初步谈妥融资70亿美元:最大金主微软追加投资10亿,苹果退出

据华尔街日报报道,苹果公司退出了对 OpenAI 的新一轮融资谈判,而微软则计划向 OpenAI 追加约 10 亿美元的投资。

详解Meta全新大模型Llama 3.2系列:多模态视觉识别能力媲美OpenAI GPT-4o

Meta公司推出了Llama 3 2,也是它首款能够理解图像和文本的旗舰视觉模型。包含中型和小型两个版本,以及更轻量化可用于手机端侧的纯文本模型。

网站地图