AI打破次元壁!原来Ta现实世界长这样?

AI发展迅猛,在之前文章有过对AI的介绍的以及一些AI应用场景,今天我们讲一种非常常见的AI应用场景:真人动漫互转,也就是真人动漫转动漫,或动漫转真人,之所以我把它们归为一类,是因为它们转换的原理想通,再延伸开来,2D转2.5D,真人转赛博朋克,甚至是仅仅用AI对照片进行美化重绘等等。

这其中的重点其实就是AI风格转换的思路

一、转换应用

1. 动漫转真人

很多我们看过的动漫角色,游戏角色,甚至是QQ头像,我们都能转成真人形象,看看他们如果在三次元,长什么样子

王者荣耀系列

我不放原图,大家应该都能看出来是谁吧?

伽罗
露娜
瑶
瑶2
云缨
公孙离
澜

QQ经典头像系列

老QQ用户应该都见过这批头像吧?

QQ头像 真人化
04084df70e10439b30cadd5ba0fbcc78 image-1709977484734
3ca01987b8978c2f3485caa5baf96771 image-1709977682482
b43f992493408e6d0865e76823759da1 image-1709977865761
2d272131fc3dca39837d5f7ba264908f 00025-4269878468

动漫系列

我们看过的动漫,想知道他们在现实世界长什么样吗?
火影小樱
火影小樱真人
妖精的尾巴露西
妖精的尾巴露西真人

2. 真人转动漫

真人转动漫,也可以转换为不同的动漫风格

真人
动漫风
宫崎骏风

3. 赛博朋克化

之前学习过大佬的教程知道了赛博机车这个东西,把真实的机车进行赛博朋克的风格化

赛博机车
赛博机车
赛博汽车
赛博汽车

4. 四维彩超

严格来说,通过四维彩超预测未来宝宝的长相,也属于AI风格化

四维彩超

以上是常见的几种AI风格转换的应用场景,实际应用场景肯定远不止于此,更多的就得我们自己动脑思考了,别人没想到的,你想到了,那就是属于你的变现缺口!

二、实现方式

很多AI工具都能实现这样的风格转换,这里仍然以Stable Diffusion为例

1. 提示词

无论用什么方式进行风格转换,一定需要给提示词,在风格转换的应用中,提示词的作用是让AI更好的理解你提供的原图,以便后续的绘图操作。
这里我无脑推荐Stable Diffusion中的一个反推提示词插件“stable-diffusion-webui-wd14-tagger

通过反推提示词,我们就可以获取到原图的提示词,得到之后可以根据实际情况做微调

在线使用

有开发者贴心的提供了在线使用方式,即只要我们访问页面,提供原图,即可在线反推提示词
https://huggingface.co/spaces/SmilingWolf/wd-tagger

在线使用

WebUI使用

WebUI插件地址:https://github.com/toriato/stable-diffusion-webui-wd14-tagger

1.通过插件商店安装
插件商店安装

2.通过仓库安装
仓库安装

3.使用
使用界面

ComfyUI使用

ComfyUI插件地址:https://github.com/pythongosssss/ComfyUI-WD14-Tagger

1.通过插件商店安装
插件商店安装
插件商店安装

2.通过仓库安装
仓库安装
手动下载插件安装包放到custom_nodes目录下(X:\XXX\ComfyUI_windows_portable\ComfyUI\custom_nodes)

3.使用
使用界面

ComfyUI中的插件即新增一个WD14节点,左边输入加载的原图像,右边输出字符串到“CLIP文本编码器”即可

补充提示词

接下来我们都以火影忍者的小樱为原图,来进行动漫转真人
火影小樱

通过提示词反推,我们得到以下提示词

1girl, haruno sakura, pink hair, solo, green eyes, looking at viewer, outdoors, sky, day, blue sky, sleeveless, short hair, closed mouth, forehead protector, upper body, cloud, blurry background, headband, red shirt, blurry, konohagakure symbol, shirt, bare shoulders

英文不好的朋友可以翻译为中文,来看看提示词是否有问题,是否还需要微调

女孩,春野樱,粉色头发,独奏,绿眼睛,看着观众,户外,天空,白天,蓝天,无袖,短发,闭着嘴,额头保护器,上身,云,模糊的背景,发带,红衬衫,模糊的,河滨符号,衬衫,裸露的肩膀

最后,我们再对正向提示词增加简单的画质提示"best quality,masterpiece,"(追求完美可以继续追加画风画质提示词),在加上通用的基础负向提示词,这样,我们完整的提示词部分就做好了

正向提示词:
best quality,masterpiece,
1girl, haruno sakura, pink hair, solo, green eyes, looking at viewer, outdoors, sky, day, blue sky, sleeveless, short hair, closed mouth, forehead protector, upper body, cloud, blurry background, headband, red shirt, blurry, konohagakure symbol, shirt, bare shoulders
负向提示词:
nsfw,logo,text,badhandv4,EasyNegative,ng_deepnegative_v1_75t,rev2-badprompt,verybadimagenegative_v1.3,negative_hand-neg,mutated hands and fingers,poorly drawn face,extra limb,missing limb,disconnected limbs,malformed hands,ugly,

2.模型选择

模型选择就根据实际情况来了,比如真人转动漫,那么我们大模型的选择上,我们就需要选择动漫大模型,动漫转真人,我们就需要真人大模型。再做细分,如果还需要特定的画风,可能还需要画风的lora微调模型,比如赛博朋克风,我们就需要赛博朋克画风模型等等。

3. 图生图

使用Stable Diffusion的基础图生图模式,其实就已经能实现风格转换了,我们以火影忍者的小樱为原图试一下
图生图

可以看到,在图生图的参数配置中,主要设置采样方法、迭代步数、重绘尺寸、重绘幅度、以及开启ADetailer修脸。

其中最主要的,就是重绘幅度了,重绘幅度越高,AI自由发挥越多,越偏离原图,重绘幅度越低,AI自由发挥越少,越趋向原图。因此在使用图生图来进行风格转换是,不断调整出合适的重绘幅度是关键。

以下就是我使用图生图生成的
图生图

可以看到,实际效果还是不错的

4. ControlNet文生图

图生图方式最大的弊端就是需要调整合适的重绘幅度,并且我们很难控制画面的细节,要么整体更像原图,要么整体更偏离原图。Stable Diffusion的强大之处就在于它的ControlNet控图能力,并且使用ControlNet方式出的图能保留更多画面细节,所以接下我们讲讲使用ControlNet文生图的方式

1.控制类型

使用ControlNet插件的核心就是它的几个常用的控制类型,这里我对常用的几个控制类型都做一个预处理来看效果,看到处理效果就能明白了
1.Canny(硬边缘):计算画面的硬边缘效果,常用于描边
硬边缘
2.Depth(深度):计算画面深度信息,常用于表现前后层次关系
深度
3.OpenPose(姿态):计算人物姿态,姿态可手动调整固定,常用于调整人物姿态
姿态
4.Lineart(线稿):计算线稿信息,线稿的预处理器又包含写实线稿提取、动漫线稿提取和去噪动漫线稿提取,分别得到不同的线稿效果
线稿
5.SoftEdge(软边缘):极端画面的软边缘效果,相对于硬边缘,提供更加模糊的边缘效果
软边缘
6.Tile/Blur(分块/模糊):将画面分成小块并模糊
分块/模糊

以上是针对于风格变换的常用控制类型,所有的文字描述都是生硬的,建议亲自上手试试,每个效果都尝试一遍,才知道什么是最合适的。

在我的使用经验中,最常用分块模糊、线稿、和深度几个控制类型,我会根据原图的实际情况进行调整,并且ControlNet是支持多个同时生效的,我会尽量多做尝试,得到最合适的控制类型。

在这个例子中,我是用Tile/Blur来进行控图出图

2.控制参数

参数

对于其他参数来说,仍然是以实际情况为准,每个图可能情况都不一样,都需要相应的微调,只能说大致上是差不多的。

一般来说,参数中,我只调整以下三个参数:

  1. 控制权重:即该ControlNet在你的画面控制中占多大比例。如果控制效果过强,可以适当调低
  2. 引导介入时机:即该ControlNet在你的画面绘制过程中的哪一步开始生效
  3. 引导终止时机:即该ControlNet在你的画面绘制过程中的哪一步结束生效

其他参数比如开启ADetailer等就根据自身需求来决定了

3.出图效果

出图效果

我的全部参数如下,可以作为参考

best quality,masterpiece,
1girl,haruno sakura,pink hair,solo,green eyes,looking at viewer,outdoors,sky,day,blue sky,sleeveless,short hair,closed mouth,forehead protector,upper body,cloud,blurry background,headband,red shirt,blurry,konohagakure symbol,shirt,bare shoulders,
Negative prompt: nsfw,logo,text,badhandv4,EasyNegative,ng_deepnegative_v1_75t,rev2-badprompt,verybadimagenegative_v1.3,negative_hand-neg,mutated hands and fingers,poorly drawn face,extra limb,missing limb,disconnected limbs,malformed hands,ugly,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 2854918999, Size: 872x648, Model hash: 7c819b6d13, Model: majicMIX realistic_麦橘写实_v7, VAE hash: c6a580b13a, VAE: vae-ft-mse-840000-ema-pruned.ckpt, Denoising strength: 0.3, Clip skip: 2, ADetailer model: face_yolov8n_v2.pt, ADetailer confidence: 0.3, ADetailer dilate erode: 4, ADetailer mask blur: 4, ADetailer denoising strength: 0.4, ADetailer inpaint only masked: True, ADetailer inpaint padding: 32, ADetailer version: 24.3.0, ControlNet 0: "Module: tile_resample, Model: control_v11f1e_sd15_tile [a371b31b], Weight: 0.6, Resize Mode: Crop and Resize, Low Vram: False, Threshold A: 1, Guidance Start: 0, Guidance End: 0.7, Pixel Perfect: True, Control Mode: Balanced, Hr Option: Both, Save Detected Map: True", Hires upscale: 1.5, Hires upscaler: 4x-UltraSharp, TI hashes: "badhandv4: 5e40d722fc3d, EasyNegative: c74b4e810b03, ng_deepnegative_v1_75t: 54e7e4826d53", Version: v1.7.0

4. ComfyUI

以上都是基于WebUI的实现方式,那么ComfyUI其实实现起来思路是大同小异,只是需要基于ComfyUI的节点工作流来实现

在ComfyUI中使用工作流,与直接在WebUI中使用ControlNet大同小异,同样是由预处理器加载器组成,不过在ComfyUI中,需要一个“ControlNet应用”节点来把ControlNet接入到工作流中
ControlNet

以下则是一个简单的使用Tile进行动漫转真人的工作流
ComfyUI工作流

最终,我们得到的效果如下:
ComfyUI成品

也许你发现了,同样的流程,在WebUI中生成的图,和ComfyUI中生成的图,有很大的差距(即便我用相同随机种子,结果也一样),这其实是由于ComfyUI在提示词的采样以及最终的采样器中的采样,算法都略微有区别,如果想做到完全一样,则需要一些和WebUI兼容的节点来完成

文末分享风格转换工作流

三、如何变现

画面风格变换类的AI应用,常见有以下几种变现方式

  1. 做内容涨粉,再通过流量变现
    这种方式适用于大部分的AI变现,我们可以通过观察抖音和小红书,可以看到大量做AI内容的账号,不管通过画AI美女,还是做AI动画,都是积累了很多的粉丝量,那么变现也就非常容易了
  2. 发视频配音乐,推广音乐变现
    通过吸引人的AI内容,来推广音乐,实现变现
  3. 客单定制
    通过发AI画风变换的内容,或直接在头部流量的评论区免费做一个,然后就靠评论或私信引流到私域来付费定制

虽说目前有很多免费的工具,都能做到真人和动漫互转的效果,但是一方面它们的效果不尽如人意,另一方面,免费的体验也不会特别好,因此才会有客单定制做风格转换的需求市场

四、资源分享

我这里也分享一些常用的风格转换的工作流
链接:https://pan.baidu.com/s/1HtTQ3ANSlWg_uxo9RiZ_iA?pwd=7h5a
提取码:7h5a