把文字或者logo融入到自然风景中,这应该是一种很奇妙的体验,同时这也会为我们的设计作品带来不一样的闪光点!
Stable Diffusion文字融入图片,主要方法就是在正常文生图基础上用controlnet增加文字控制,下面我就将制作此类图片的整个过程记录下来,希望你也能轻松学会,并能举一反三,发扬光大。
话不多说,咱们马上开始~
01.文字图片准备
准备好你自己制作的黑白文字底图,图片的宽高比自行定义,效果如下:
02.模型准备
这里需要用到几个模型,模型我会放到网盘,文章末尾会有获取资料的方法。
1、大模型(写实)
realisticVisionV51_v40VAE.safetensors
02、controlNet的qrcode_monster模型control_v1p_sd15_qrcode_monster.safetensors
03、controlNet的brightness模型
control_v1p_sd15_brightness.safetensors
这里需要注意一下:qrcode_monster和brightness模型都有一个.yaml的配置文件。请将网盘中的四个文件全部下载下来放在stable-diffusion-webuiextensionssd-webui-controlnetmodels文件夹中。
03.参数设置
正面提示词:
This is a highly detailed photograph depicting the bustling daytime scenery of Hong Kong"s Victoria Harbor,with various cruise ships shuttling in and out of the sea,high-rise buildings,and blue sky,
当然也可以自己发挥,并不一定要一样。
负面提示词:常用的任意都行
采样方法:DPM++ 2M Karras
采样迭代步数:30
宽度:960.高度:540(尺寸根据你自己的实际需要,尺寸尽量不要太大,否则你的电脑会挂)
CFG:7
参数说明
控制权重:
数值范围从0到2.数字越大,文字融入图片就越强烈,数字越小,文字与图片融入就越和谐,这主要取决于实际作用效果。
引导介入时机:
数值范围从0到1.数字越大,开始介入时间就越晚,文字参与作画过程就越短;数字越小,开始介入时间就越早,文字参与作画过程就越长,同样也取决于实际作用效果。
引导终止时机:
数值范围从0到1.数字越大,终止介入时间就越晚,文字参与作画过程就越长;数字越小,终止介入时间就越早,文字参与作画过程就越短,同样也取决于实际作用效果。
弄清楚基本原理之后,我们就可以点击“生成”开始愉快的跑图了。
挑选到比较满意的图片后,点击图片下方的发送图像和生成参数到图生图选项卡进行放大处理。
将重绘幅度改成0.35.重绘幅度值越小,对画面重构范围就越小,反之越大。
脚本选择Ultimate SD upscale,目标尺寸类型选择Scale from image size,放大算法可以选择4x-UltraSharp,也可以选择R-ESRGAN 4x+,他们最终效果都差不多,但原理有所差别:4x-UltraSharp是把图片分成四个大小一样的区域进行分区渲染,所占用的内存比较小,而R-ESRGAN 4x+是整个图片一起渲染,所占用的内存量巨大,题主8G显存放大4倍时直接崩塌,而选择4x-UltraSharp放大时可以轻松完成。
将放大后的图拿到PS爱国版中稍加修饰,即可出图。这里放几张图供大家参考。
作者的公众号二维码丨扫一扫,关注我
知名一线互联网设计师
在这里我会不定时的分享一些设计经验和3D设计
上一篇:可能是地表最强的AI消除马赛克神器_免费离线_手把手教学
下一篇:怎么在电脑上部署webui_电脑上怎么下载stable diffusion_stable diffusion去哪里下载
【AI奇点网2024年11月11日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
【AI奇点网2024年11月12日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
【AI奇点网2024年11月13日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
这两天就有朋友来问我,有没有那种能修图的AI,就是扩图+消除啥的傻瓜好用的。大家大概的需求总结一下其实就两,AI消除+AI扩图。
据华尔街日报报道,苹果公司退出了对 OpenAI 的新一轮融资谈判,而微软则计划向 OpenAI 追加约 10 亿美元的投资。
Meta公司推出了Llama 3 2,也是它首款能够理解图像和文本的旗舰视觉模型。包含中型和小型两个版本,以及更轻量化可用于手机端侧的纯文本模型。
飞书智能伙伴
必剪
Hi Echo — 网易有道
堆友
360AI搜索
Wink Studio
通义效率
360AI助手
腾讯文档AI
网站地图
stable diffusion_stable diffusion教程_stable diffusion案例
把文字或者logo融入到自然风景中,这应该是一种很奇妙的体验,同时这也会为我们的设计作品带来不一样的闪光点!
Stable Diffusion文字融入图片,主要方法就是在正常文生图基础上用controlnet增加文字控制,下面我就将制作此类图片的整个过程记录下来,希望你也能轻松学会,并能举一反三,发扬光大。
话不多说,咱们马上开始~
01.文字图片准备
准备好你自己制作的黑白文字底图,图片的宽高比自行定义,效果如下:
02.模型准备
这里需要用到几个模型,模型我会放到网盘,文章末尾会有获取资料的方法。
1、大模型(写实)
realisticVisionV51_v40VAE.safetensors
02、controlNet的qrcode_monster模型control_v1p_sd15_qrcode_monster.safetensors
03、controlNet的brightness模型
control_v1p_sd15_brightness.safetensors
这里需要注意一下:qrcode_monster和brightness模型都有一个.yaml的配置文件。请将网盘中的四个文件全部下载下来放在stable-diffusion-webuiextensionssd-webui-controlnetmodels文件夹中。
03.参数设置
正面提示词:
This is a highly detailed photograph depicting the bustling daytime scenery of Hong Kong"s Victoria Harbor,with various cruise ships shuttling in and out of the sea,high-rise buildings,and blue sky,
当然也可以自己发挥,并不一定要一样。
负面提示词:常用的任意都行
采样方法:DPM++ 2M Karras
采样迭代步数:30
宽度:960.高度:540(尺寸根据你自己的实际需要,尺寸尽量不要太大,否则你的电脑会挂)
CFG:7
参数说明
控制权重:
数值范围从0到2.数字越大,文字融入图片就越强烈,数字越小,文字与图片融入就越和谐,这主要取决于实际作用效果。
引导介入时机:
数值范围从0到1.数字越大,开始介入时间就越晚,文字参与作画过程就越短;数字越小,开始介入时间就越早,文字参与作画过程就越长,同样也取决于实际作用效果。
引导终止时机:
数值范围从0到1.数字越大,终止介入时间就越晚,文字参与作画过程就越长;数字越小,终止介入时间就越早,文字参与作画过程就越短,同样也取决于实际作用效果。
弄清楚基本原理之后,我们就可以点击“生成”开始愉快的跑图了。
挑选到比较满意的图片后,点击图片下方的发送图像和生成参数到图生图选项卡进行放大处理。
将重绘幅度改成0.35.重绘幅度值越小,对画面重构范围就越小,反之越大。
脚本选择Ultimate SD upscale,目标尺寸类型选择Scale from image size,放大算法可以选择4x-UltraSharp,也可以选择R-ESRGAN 4x+,他们最终效果都差不多,但原理有所差别:4x-UltraSharp是把图片分成四个大小一样的区域进行分区渲染,所占用的内存比较小,而R-ESRGAN 4x+是整个图片一起渲染,所占用的内存量巨大,题主8G显存放大4倍时直接崩塌,而选择4x-UltraSharp放大时可以轻松完成。
将放大后的图拿到PS爱国版中稍加修饰,即可出图。这里放几张图供大家参考。
作者的公众号二维码丨扫一扫,关注我
知名一线互联网设计师
在这里我会不定时的分享一些设计经验和3D设计
上一篇:可能是地表最强的AI消除马赛克神器_免费离线_手把手教学
下一篇:怎么在电脑上部署webui_电脑上怎么下载stable diffusion_stable diffusion去哪里下载
小度全新AI硬件将于百度世界大会发布丨智谱AI、即梦AI上线新一代视频生成模型丨OpenAI安全系统团队负责人离职
【AI奇点网2024年11月11日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
字节跳动内测豆包通用图像编辑模型SeedEdit丨Grok聊天机器人免费版内测丨月之暗面Kimi创始人被提起仲裁
【AI奇点网2024年11月12日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
李彦宏:文心大模型日调用量超15亿丨百度发布文心「iRAG」文生图技术丨小度AI智能眼镜发布,搭载大模型边走边问
【AI奇点网2024年11月13日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
巧妙利用这两个AI产品,让你的国庆出行没有废片
这两天就有朋友来问我,有没有那种能修图的AI,就是扩图+消除啥的傻瓜好用的。大家大概的需求总结一下其实就两,AI消除+AI扩图。
OpenAI初步谈妥融资70亿美元:最大金主微软追加投资10亿,苹果退出
据华尔街日报报道,苹果公司退出了对 OpenAI 的新一轮融资谈判,而微软则计划向 OpenAI 追加约 10 亿美元的投资。
详解Meta全新大模型Llama 3.2系列:多模态视觉识别能力媲美OpenAI GPT-4o
Meta公司推出了Llama 3 2,也是它首款能够理解图像和文本的旗舰视觉模型。包含中型和小型两个版本,以及更轻量化可用于手机端侧的纯文本模型。
飞书智能伙伴
必剪
Hi Echo — 网易有道
堆友
360AI搜索
Wink Studio
通义效率
飞书智能伙伴
必剪
Hi Echo — 网易有道
堆友
360AI搜索
Wink Studio
通义效率
360AI助手
腾讯文档AI