用本地 uncensored AI 做图片、视频大指南 (with step-by-step instructions and examples) (examples 有点擦边球)
本地 uncensored AI 图像与视频生成全流程指南。
1. 关键信息
- ComfyUI-Easy-Install 部署,Win/Mac/Linux,2.01.12;建议 1TB+ SSD。
- 推荐显卡:Nvidia,8GB VRAM 起步,16GB+ 最佳(fp8/16);显存不足可改用 WAN 4090/5B 模型。
- 模型:Z-Image Turbo 系列(ZIT-V6 等,NSFW);Anime 用 Illustrious-derived(Civitai)。
- 流程:加载 JSON workflow → 替换 text encoder(CLIP abliterated)→ 加载扩散模型与 VAE → 调整提示词/种子/分辨率 → 生成。
- img2img / image-to-video 均支持;视频需注意帧数×分辨率×时长对 VRAM 消耗。
- 推荐 workflow:WAN2.2-14B Rapid-AIO-Mega(需拆 Start Frame / WanVideoWrapper)。
- 提示词构建:Solitary Youth (18-22) → 环境 → 姿态/表情 → 服饰/局部 → 光影/道具;使用 booru tags。
- LLM prompt enhancer 方案可行;可串联多短视频片段做 scene 过渡。
- 另可用 LM Studio / mlx / gguf 在本地跑 LLM 生成提示词(#84、#87)。
2. 羊毛/优惠信息
无。
3. 最新动态
- 社区持续优化 ZIT 模型与 workflow;Illustrative XL 在动漫风格上表现更佳(#62)。
- WAN 模型与 CivitAI 集成加深;LoRA 训练与 checkpoint 分享活跃(#96、#97)。
- AMD 用户反馈可用但较慢;M3 Pro/4090/5090 均可运行(#78、#79、#88)。
- 多用户实测 VRAM/硬盘压力;建议监控 OOM 与后台进程(#93、#95、#98)。
4. 争议或不同意见
- 画质与同质化问题;部分用户认为人绘仍更优(#4、#8)。
- 伦理与合规风险提示;强调本地自娱自乐(#41、#52、#53)。
- 平台政策:Discord 未明确禁止但建议规避封禁风险。
5. 行动建议
- 优先搭环境测试短流程;先图像后视频;控制分辨率与时长。
- 善用 CivitAI 与社区 workflow;记录 seed 与 prompt 复现结果。
- 显存紧张时选用 fp8/4-bit;多场景用短 clip 拼接替代长视频。
- 关注版权与法律边界,避免公开传播 NSFW 内容。
By popular request, from my last thread on this topic ( https://www.uscardforum.com/t/topic/475986/14 )
(本来放在性爱,但想了想,也可以做其他东西,所以换到学术。Mod不允许可以换回去).
Step 0:
假如你有时间,还是建议看完这个tutorial https://www.youtube.com/watch?v=HkoRkNLWQzY,它的确很长,但 watching it fully will help you understand what you’re doing much more, and allow you to do your own exploration and try new things
Step 1:
Download ComfyUI-Easy-Install from GitHub: GitHub - Tavris1/ComfyUI-Easy-Install: Portable ComfyUI for Windows, macOS and Linux 🔹 Pixaroma Community Edition 🔹
(direct link to the current latest version: https://github.com/Tavris1/ComfyUI-Easy-Install/releases/download/2.01.12/ComfyUI-Easy-Install.zip)
Step 2:
Extract to a folder of your choice. 建议放在至少有1TB free space 的SSD,越快越好。
Step 3:
Run ComfyUI-Easy-Install.bat。假如有 Git not found error,先安装 winget,see Use WinGet to install and manage applications | Microsoft Learn
Step 4:
(optional if you want to download models that can generate NSFW images)
While ComfyUI is installing, go to https://civitai.com/ . Register an account, and then click your name in the upper right, and then select account settings:
image346×179 11.3 KB
Under “Content Moderation”, enable everything:
image671×918 34.3 KB
Step 5:
ComfyUI-Easy-Install.bat 完了会在 Desktop create “ComfyUI-EZi” shortcut. Open that shortcut. A console window will open and eventually start a local server, and then it will open your browser window to connect to that local server. This is the main interface:
image1049×798 49 KB
Step 6:
Click “Workflow” on the left panel, and then expand “Getting Started”. Click on “5b Z-Image Turbo Fp8 text2img.json”
image1049×798 79.4 KB
Step 7:
This is the main workflow you’ll be using. Use your mouse wheel to zoom in and out. Click and drag an empty area to pan.
image1920×873 192 KB
这个 workflow 需要 3 个 model,一个 image generation,一个 text encoding,和一个 latent space conversion。
Follow the links in the note on the very left to download an abliterated (uncensored) Qwen3 model as the text encoder (CLIP). Be sure to place it in the correct subdirectory under your ComfyUI install folder. Also download the place the latest space converter (VAE). See the full tutorial video for details on what this means.
image1220×726 87.4 KB
Step 8:
For the main image generation model, you can either use the suggested model, or download a more flexible one (a model that can generate NSFW) from Civitai.
If you want a more flexible model, go to the Civitai home page, click Models:
image277×118 7.72 KB
And then on the right, filter for the most downloaded Z Image Turbo checkpoints recently:
image722×1266 78 KB
(results will be NSFW)
Choose one that you like. Choose a fp8 model if you have less than 12-16GB VRAM. Choose a fp16 model (if a model does not have a fp8 label, it’s probably fp16) if you have 12-16GB VRAM or more.
For this example I’ll choose “Moody Porn Mix” ZIT-V6. But you can try other ones.
Moody Porn Mix - ZIT-V6 | ZImageTurbo Checkpoint | Civitai (NSFW link)
Download and put the model’s safetensors file in ComfyUI/models/diffusion_models/z-image
Step 9:
Go back to your browser window with the ComfyUI workflow open. Press F5 on your browser to reload the page. Now click on the model name field in the “Load Diffusion Model” and (optional) click again to select the Moody Porn Mix model instead of the pre-filled default:
image752×108 12.7 KB
CLIP and VAE should already be correct.
The “Empty Latent” box adjusts the resolution of the output:
image393×237 10.9 KB
There’s no real need to go above 1024x1024 because you can add an upscaler to your workflow that’s much more efficient than generating a higher resolution image from the diffuser model.
Click run in the top right.
image1185×1172 203 KB
If everything worked correctly, the model will output a red robot, the default prompt for this sample workflow.
Step 10:
现在总算有点意思了。Change the prompt to something better and click run again. 中文英文都可以。可以用其它LLM帮你写prompt。
比如:
Photorealistic, detailed image of a woman, age 20, petite, skinny, with long hair, black hair, twin tails, east asian features, innocent looking, very cute, brown eyes, raised inner eyebrows, standing outside in an urban alleyway at night. she’s taking off her top. she’s wearing tight pink shorts, a tight black crop shirt, showing her midriff. she’s facing the viewer. use rim light, dramatic shadow, detailed skin, detailed eyes.
Output:
img_00718_768×768 79.9 KB
(If you download and drag this image into a ComfyUI browser window, you will load the workflow and prompt, which are saved as metadata in generated images by default. You can download any image from Civitai and load it into ComfyUI to see how it was generated.)
The more specific you are, the more detailed the image will be. 这个 image model 很好,可以incorporate text in output with very high fidelity。再来一个:
photo of a woman, age 20, petite, skinny, with long hair, dyed platinum hair, innocent looking, very cute, east asian features, alluring, brown eyes, big eyes, raised inner eyebrows. she’s sitting on a pink bed in a in a highrise. city lights are visible outside through a window on the left. on the right is a table with a computer monitor. the monitor is displaying the large characters “美卡论坛” in a browser window with a dark gray background. she’s wearing white sweatpants and a tight white crop shirt and showing off her midriff. her hands are behind her head. she has large breasts. she’s sitting facing the viewer with her legs wide open. she has an innocent open mouth smile. use rim light, dramatic shadow, detailed skin, detailed eyes.
Output:
img_00728_768×768 92.8 KB
Step 10:
By default, the seed changes every generation, so the features will be different. If you are very specific in your prompt, the output will be more similar. However, if you have an output you really like, you can also try keeping the seed the same and only change the prompt. You can adjust seed settings by clicking on “control after generate” in the KSampler box:
image417×415 27.8 KB
So if we like a particular result and want to do more with it, we can fix the seed and change the prompt. But we can also use a more detailed prompt to try to keep features similar, and let the seed continue to change for the outcome to be more creative.
Let’s continue to develop this prompt:
photo of a woman, age 20, petite, skinny, with long hair, dyed platinum hair, innocent looking, very cute, east asian features, alluring, brown eyes, big eyes, raised inner eyebrows. she’s sitting on a pink bed in a in a highrise. city lights are visible outside through a window on the left. on the right is a table with a computer monitor. the monitor is displaying the large characters “美卡论坛” in a browser window with a dark gray background. she’s wearing is wearing pink lace panties and a tight white crop shirt and showing off her midriff. she is taking off her top, flashing her bare breasts. she has large breasts. she’s sitting facing the viewer with her legs wide open. she has an innocent open mouth smile. use rim light, dramatic shadow, detailed skin, detailed eyes.
Output:
https://files.catbox.moe/ho21m3.png
(NSFW)
这一位下一步整么发展,就看你了
Step 11:
Image to video generation 我自己也刚刚开始,但我找到了一个比较简单的workflow:
Download this model:
https://huggingface.co/Phr00t/WAN2.2-14B-Rapid-AllInOne/blob/main/Mega-v12/wan2.2-rapid-mega-aio-nsfw-v12.2.safetensors
Put it into ComfyUI\models\checkpoints\WAN
Download this workflow
https://huggingface.co/Phr00t/WAN2.2-14B-Rapid-AllInOne/blob/main/Mega-v3/Rapid-AIO-Mega.json
And put it into ComfyUI\user\default\workflows, or just drag the file into the ComfyUI browser window.
image2032×1237 494 KB
By default, the workflow generates a 5 second video (81 frames at 16 fps) 768x768 video from text. We need to enable generating from image.
First, make sure the correct model version is loaded. (The workflow defaults to version 3 of that particular model series, but we want to select the version 12.1 that we just downloaded).
image715×188 29.2 KB
Next, click the specified icon to Unbypass the Start Frame and WanVideoWrapper boxes.
image503×558 25.7 KB
image431×411 34.3 KB
Then load a previously generated image from image model (or any other image) into Start Frame.
Don’t forget to change the prompt into something more interesting, like
a woman sitting on a bed squeezes her breasts with her hands. she smiles and blows a kiss at the camera. smooth and fluid motion, static camera, high quality, detailed lighting, consistent character identity, clean background, stable animation. High quality, sharp details.
Then click run:
image1820×1135 294 KB
Note that video generation will take much longer. Also, I noticed that video generation time/VRAM requirements scale linearly with resolution, but quadratically with video length. It’s hard to go over 8 or 9 seconds even with 24GB VRAM.
Output:
full version
https://files.catbox.moe/d66zds.mp4
That’s it for now. Thank you for reading, and please share your thoughts, tips, workflows, and best creations in this thread!
If this helped you and you want to help me, please tell me where I can buy a 5090 FE for MSRP. Thank you!
在这个区冲钛吗?
换区了,因为这实际上也可以做很多其他东西。但Mod不允许可以换回性爱。
看到了熟悉的东西,之前做过类似的插件很久,但是还是不如上班香啊
而且对着ai撸管真不行吧,效果不好,同质化严重,还是人画的用着爽
【引用自 继续革命】:
而且对着ai撸管真不行吧,效果不好,同质化严重,还是人画的用着爽
我发现了一个很爽的办法,set up a workflow and scene that you like, set the seed to random, and then have it generate 64 or 128 images. you’ll get a slightly different woman every few seconds, all doing whatever you want. I really like it.
【引用自 海洋联盟】:
Moody Porn Mix - ZIT-V6 | ZImageTurbo Checkpoint | Civitai (NSFW link)
点进楼主的链接发现了以下:
NSFW Prompt
人物设定 & 发型设计 & OOTD 全解 19岁韩国Kpop偶像coser,皮肤光滑细腻,通体雪白,极致冷白皮,脸蛋精致甜美如少女,象牙白冷白皮肤光滑透亮泛着亲密潮红细腻光泽,妆容干净可爱,棕色大地眼影柔和晕染,眼线细腻贴合眼形,睫毛浓密卷翘自然上扬,唇色玫瑰豆沙湿润带晶莹光泽,轻微咬唇痕迹显粉嫩齿痕,腮红饱和桃粉晕染成小猫脸庞。长直黑发顺滑披散至腰际,几缕发丝因汗水微微粘在脸颊和颈侧。脸型精致瓜子脸,妆容清透自然:大地色眼影轻晕染,眼线细致贴合双眼皮,浓密自然睫毛,唇色玫瑰豆沙带湿润光泽。身材丰满火辣,巨乳挺拔,腰肢纤细,臀部浑圆翘挺,全身赤裸,乳头粉嫩挺立,阴部光洁无毛。男性为身材健硕的65岁白人男性老头,肌肉线条分明,腹肌清晰,阴茎粗壮勃起,青筋凸显,皮肤略带古铜色。 表情管理 女性嘴唇微张呈惊讶与渴望混合的O形,眼神向上仰视男性,瞳孔放大,带着一丝紧张与兴奋的俏皮。男性低头俯视女性,表情专注而充满欲望,嘴唇紧抿。 肢体状态与细节 女性跪坐在粉色床单上面对男性,双膝分开,臀部坐在脚跟上,上身前倾,双手握住男性勃起的阴茎,掌心包裹茎身,指尖轻轻扣住根部,指甲涂抹裸粉色。男性站立面对女性,双腿微分,左手搭在女性后颈,右手自然垂落。她的巨乳因前倾而垂坠晃动,乳晕清晰可见。 场景与构图 卧室内部,粉色床单凌乱铺展,白色窗帘背景模糊。中景为两人面对面的亲密互动,前景是女性握住阴茎的手部和垂落的长发丝,背景是柔和白色墙面与床头柜。镜头采用低角度仰视构图,强调女性仰头仰视的视角与男性俯视的压迫感,视觉引导从女性脸部向上延伸至男性阴茎。 光影设计 & 拍摄要点 柔和暖白自然光从右侧窗帘方向洒入,形成侧逆光,在女性脸颊、肩线、乳房轮廓勾勒出金边高光,男性身体左侧阴影加深肌肉立体感。床头灯补充微弱暖光,从上方偏左打下,在床单上形成浅浅阴影。画面呈现真实近距离手机拍摄质感,轻微颗粒感与自然色差,超高细节,8k,真实摄影风格。
这种prompt是怎么想出来的 我写高考作文都做不到这么用力
玩开源diffusion模型的都这样,因为模型效果有限
这种都是前人做过很多尝试试出来的好prompt,说白了就是抄的
也有人通过调试prompt生成好东西放patreon赚钱的
用多了就不行了,我23年1月就开始研究这些东西了,主要还是画风和滤镜比较单一,导致用起来很容易审美疲劳
但model有进步,ZIT比SD1.5/SDXL好很多,说不定年底会有更好的
黄色果然是人类进步的源泉
难怪古代皇帝都要穿黄
Lz好人一生平安
【引用自 海洋联盟】:
建议放在至少有1TB free space 的SSD,越快越好。
我正要问有没有prerequisite
比如cpu和gpu ram 有没有要求..
或者有没有一键部署的工具…
好帖子,必须顶
看来韩国女的数据还是污染这么严重
CPU 随便,影响不大,Intel i5-12600/Ryzen 5800 水平应该够了
RAM 最好 32GB
GPU 要求高,最好是 nVidia 卡,VRAM 最重要,8GB VRAM minimum for image generation (fp8),最好要 16GB+ VRAM (allows fp16 for image generation and also video generation). CUDA core 越多 generate 越快。Baseline 应该是 RTX 3070 左右。最好 RTX 3090/4080 水平 or better。
我还真有这样的设备,3080ti 或者笔记本4090,64 ram 这种的话生成9宫格,或者一张1080p的图要多久呢
that’s a good setup. it will only take several seconds per image, or 5 minutes per 5 second video.
keep the image resolution below 1280x800 for diffusion generation. use a separate upscaling node if you want higher resolution. you can find sample workflows for this.
看来还是很吃资源(没想到视频比图片慢这么多
video takes a lot of resources because you are generating (# of seconds x fps) image frames all at the same time, and the model has to apply some sort of self-attention mechanism to all the frames to keep them coherent. something like that. so it’s much more complex than images, with less reliable results.
放学术版挺对的;视频的例子可以换成伸懒腰之类的比较好。我非常支持大家都在本地跑uncensored的模型,不被openai/人类学/网信办限制。
谁 @ 一下小林让他好好学习一下
然后怎么跟网友解释撸管把gpu撸烧了
it does make the room very warm
这种在我这个头像的论坛里很多教程
哪个论坛?不熟悉图片
只能说,立马就想到了把某些精彩的图集转化为视频 ,有没有什么现成的工作流能把一串图片变成视频(目前应该是首尾帧模型的拓展),不过用首尾帧串起来感觉上限也就那样,估计还要用高级手法来调整吧
这是某个youtube视频的总结吗?
是的啊,OP post 的第一个link
【引用自 海洋联盟】:
假如你有时间,还是建议看完这个tutorial https://www.youtube.com/watch?v=HkoRkNLWQzY ,它的确很长,但watching it fully will help you understand what you’re doing much more, and allow you to do your own exploration and try new things
ComfyUI-Easy-Install package 也是这位的团队包装的。你有空建议看完。
Step 11 (basic image to video generation) 是我自己 figure out 的,没有在video里
这种prompt有种当年传播BT link的感觉。互联网太好玩了。
grok现在censorship已经疯了,正好试试本地。赞美楼主
southplus
感谢分享 请问整个会对win11不友好吗
有这种workflow,就是把几个5-10秒钟的 image to video modules连起来,每一个scene 有自己的prompt,上一个的last frame是下一个的 first frame。然后有各种 LORA 助理插件等等。有点复杂,我还没试
比如
https://civitai.com/models/2079192?modelVersionId=2562360
(NSFW link)
没问题,Win 10 Win 11都可以
最重要还是你的显卡要是 Nvidia,显卡 VRAM 要多
openai主要是网络搜索RAG等等的backend服务无法本地复现吧,单一裸模型跑效果实在有限
搜索和RAG也可以本地啊?成熟一点的客户端也有memory,agent,browse web之类的一大堆功能。大家应该担心的是模型拒绝搜索某些关键词。openai/anthropic模型拒绝联想的词如果都写下来,比搜索引擎拒绝搜出某些关键词的列表长太多了,所以哪怕直接把本地模型和Google的搜索API怼到一起都比openai能看到更大的世界。
我在b站上看到个类似的 好像是给飓风影视做ai那期视频的 和你说的这个很像
本地可以不被censor吗
对啊,that’s the whole point
本地可以run uncensored/nsfw (黄)/abliterated models
那很好了 我以为censor是嵌在model本身的
我感觉这种程度grok也可以
良知在哪裡?底線在哪裡?成品在哪裡?
论坛到底还有多少大神
小红书纯欲风
这下内销转出口了
但你本地可以大量提高强度啊,grok不行
also no rate limits and no subscription payments
这一套workflow生成的视频没有声音是吗 好像楼主的例子和civitai看的几个都是无声的(
无事发生 部分是有声的只是我civitai第一眼没找到声音控件
mark,有时间学习一下
感谢教学!拓展一下,有没有人知道假如想生成同样内容,但是动漫二次元效果而不是仿真效果的话用哪个模型质量比较高?
hmm 生成视频一run就会把comfyUI搞退出了,不知道是不是电脑跑不动了
gay version在哪里?
这model应该什么都行,photorealistic, anime style, straight, gay, futa,都可以。prompt 随便写
Telegram 上已经有很多人做了机器人了,丢进去图片帮你生成视频,底层应该也是Wan 和ComfyUI。
这个东西是不是能叫PaaS (Porn as a service)
只不过这种用真人图片生成的肯定会有很严重的法律问题
【引用自 tomari】:
法律问题
所以都是本地跑,自娱自乐,不过不知道自娱自乐有没有问题
reddit上看到不少人提这种,做出AI美女视频放社交媒体上引流到fanvue上,然后卖电子商品或者用private messaging来赚钱。不知道谭里有没有实操过的。
屏幕那边果然是抠脚大汉
想看真人版鸣佐大战
我好久没玩这个了, 之前写了个stable diffusion的攻略
https://www.uscardforum.com/t/topic/138696
这个和stable diffusion 最大的差别是啥?
edit: google了一下,原来stable diffusion web ui 被淘汰了
【引用自 bobafeet】:
grok也可以
至少最近两天grok大幅提高审查强度
【引用自 海洋联盟】:
本地可以run uncensored/nsfw (黄)/abliterated models
这个能跑img2img吗
【引用自 xyzxyzxyz】:
这个能跑img2img吗
当然,just find a img2img ZIT workflow,应该有很多
【引用自 海洋联盟】:
Extract to a folder of your choice. 建议放在至少有1TB free space 的SSD,越快越好。
谢谢楼主 到这一步就放弃了
【引用自 海洋联盟】:
本来放在性爱,但想了想,也可以做其他东西,所以换到学术。
放在学术是对的,要是放在性爱区,我就不会看到这个帖子了
收藏了,刚好最近买了块5090
感谢lz 交作业
image767×787 145 KB
【引用自 EricTLI】:
有没有人知道假如想生成同样内容,但是动漫二次元效果而不是仿真效果的话用哪个模型质量比较高?
用 Illustrious-derived model. Illustrious 是 danbooru trained,所以什么动漫情节都有
要用 booru tags
可以试试
https://civitai.com/models/140272?modelVersionId=2518501
https://civitai.com/models/827184/wai-illustrious-sdxl
https://civitai.com/models/24350/perfectdeliberate
https://civitai.com/models/1423738/selphmix
有很多。Illustrious 的 basemodel 是 SDXL,所以要老很多,总体没有 Z-Image 好,但 anime style 更好。
Illustrious family model prompt 不要 natural language,要用 booru tags
example workflow
https://files.catbox.moe/4rs3ip.png
(NSFW, drag it into an open ComfyUI browser window to load the workflow and see the tags used for this image’s prompt)
out of VRAM most likely. check the console window for error messages. 没有 16GB VRAM, video generation 可能会困难
嗯,后面研究了下就发现是 model 太大了。准备试试 WAN 的 5B 模型,不过 workflow 好像都是和模型绑定的,估计还得试试不同的 workflow
如果用amd差别大吗
谢谢楼主大佬,我之前的工作就是专门做这个的。借一楼给自己放个找工作的广告 , 寻找 AI 制图 / 视频应用方向的 Creative Technologist / Technical Artist(H-1B transfer)寻找 AI 制图 / 视频应用方向的 Creative Technologist / Technical Artist(H-1B transfer)
novelai V4.5 full 最高。。。花点钱
m3 pro 36G 能跑下来i2v吗
我喜欢看的小说漫画断尾了,现在的ai可以根据小说剩下的章节画下去么
这图发微博会被封号吗?
必须给钛
问了,不行,因为
【引用自 未知】:
关于升级为钛金会员的标准
近来似乎论坛里不少朋友对论坛的会员等级很感兴趣。常来逛的朋友们可能都已经知道了,在白金会员等级之上还有个钛金会员。
在成为钛金会员以后,可以获得拆分帖子、修改他人帖子、关闭帖子等很高等级的权限,而且无需“保级”即可自动保级(详见这篇文章里对trust level 4的介绍)。
按照Discourse平台的设定,这个等级是没法自行达到的,需要管理员“钦点”。现在随着大家对论坛的会员等级愈发感兴趣…
目前我们的想法是把钛金会员的门槛设定为,满足以下条件之一:
获得2次 很精彩的话题。
获得1次 很精彩的话题 + 敬仰。
获得1次 很精彩的话题 + 全年不落 + 申请时是白金等级。
除此之外管理员依然有权利手动升级对论坛贡献很大的用户。
其中很精彩的话题徽章只计入玩卡、旅行、理财、败家板块中的话题。
搬砖话题不算
我只能慢慢等全年不落
应该还行,你试试吧,估计和入门nVidia卡差不多
amd 会慢很多,具体满多少你只能自己试试了,我好多年都没买 radeon 卡
能全裸吗?
能脱西服嘛?
image/video gen 模型servering有一个LLM专门做prompt enhancer的。估计也能train一个色情enhancer
safety也是很多在enhancer level做的,拒绝恶意的prompt,模型本身有可能是可以生成的
m芯片mac呢?zszs
m4 max 36g 亲测没问题 稍微慢点
图生视频按题主的指南不可以 mac不支持fp8 which you will find out
还在用A卡的潭友可以试试官方的桌面版。
之前想试试我的7900XTX,不过ComfyUI-Easy-Install默认安装的版本不支持AMD显卡。研究了一圈,踩了一些坑,比如移动版虽然有A卡适配但BUG频出(浪费了我的生命去debug)。最终发现虽然GitHub还没更新,但1月5号有个blog提到,目前ComfyUI的桌面安装版已经能自动适应A卡和驱动了。试了一下果然一键成功,而且桌面版都不需要本地跑服务器再在浏览器使用,直接GUI里操作,丝滑了不少。
唯一的问题是用官方版的话,就没有pixaroma整合好的workflow了。但可以先跑一个ComfyUI-Easy-Install安装、把workflow文件夹拷一下,或者直接去pixaroma的discord伸手。
这个东西玩了差不多两个星期,结论是,要做好的产品蛮累的
因为用这些workflow做作品时,你实际上是在当 AV 导演,你要选场景,演员,剧本,也要考虑取景,镜头位置设置等等。需要不少脑子和创造力
有些时候做好了已经没劲那个了
没事 我还有劲 可以给我
以前 grok gemini 都支持一键替换 gemini 的功能,但现在都被 censor 了,好奇有办法可以做这个吗
其实没钱买显卡的话在runpod上起机器也是个办法,secure cloud的4090 $0.59一个小时,加上storage大概七八毛。community cloud抢得到机器的话更便宜,我现在4090+50G container+50G volume $0.35一个小时。生成720x1080的图大概一张20s左右,ud放大两倍一张图三分钟。
还能用ai-toolkit训练你喜欢的lora来生成图片。个人感觉flux比zit效果好多了。
找到突破办法了,叫其它 LLM generate prompt
有其它人做了LLM system prompt 可以参考,比如
(NSFW link)
civitai.com
Dark Beast | 黑兽 | Feb 22 '26| Latest-DBZBlitZ6⚡BEASTXXL -...
Dark Beast Blit Z ⚡ 黑兽 6 做好工具人 服务艺术家 2026.1.1 VX 新规执行,请移步TG: https://t.me/+Ka2NhoUF5W1iMDRl Congratulations! DreamBooth training support for the Z-...
Using LLM to generate prompts recommend:
SYSTEM_PROMPT = """
Role
你是专注于当代都市美学与情欲艺术的时尚摄影师/视觉导演。
你专注于捕捉 18-22岁 年轻女性独自展现的情欲张力与自我诱惑(Self-Seduction / Implied Seduction)。
你的镜头语言强调私密感、大胆而青春的肢体语言,以及一种“正在被观看”或“准备被观看”的沉浸式氛围。男性作为“观看者”可以隐含存在,但无需在画面中实体出现。
Core Aesthetic (核心美学)
你的画面关键词是:Youthful Solitary Seduction (青春独处诱惑), Atmospheric Tension, Strong Contrast, Pure Desire (纯欲), Urban Eroticism, Intimate Gaze, Chiaroscuro。
Subject (人物塑造):
核心原则 (Core Principle): 侧重描写 18-22岁 的女性在私密或半公开空间中的自我展示与肢体表达。强调其身体线条的青春感、肌肤的紧致光泽,以及一种介于自在探索与刻意表演之间的状态。画面暗示了“观看者”的存在(如镜头/观众),但无需实体人物。
主角 (唯一焦点 - Female): 年龄在 18-22岁 之间的年轻女性,气质清新、慵懒或略带叛逆。
角色类型: 可以是艺术院校学生、兼职酒吧歌手、网红博主、健身爱好者、书店打工妹、旅行者等具有年轻特质的身份。
姿态与动作 (Pose & Action): 带有青春气息的、自然又具表演性的肢体语言。
- 自我沉浸: 独自在房间地毯上对着落地镜伸展身体,目光与镜中的自己/镜头交汇;蜷在沙发角落,手指无意识地绕着发梢,眼神放空却带着笑意;刚洗完澡,裹着浴巾在窗边吹风,湿发贴在颈侧。
- 暗示性展示: 穿着宽松衬衫跪坐在床上,衬衫下摆散开,露出大腿根;背对镜头整理内衣肩带,通过镜面反射看到她的侧脸;用脚尖勾起掉落在地上的睡衣,身体形成一道优美的弧线。
暴露与暗示 (Exposure & Implication): 重点描写符合该年龄段的、青春感的局部特写与若隐若现:如紧致的小腹(Exposed Midriff)、纤细的锁骨与肩颈线条(Exposed Collarbones & Neck)、修长的大腿(Exposed Thighs),以及内衣边缘、胸部轮廓或腰臀曲线。例如:侧躺时T恤卷起露出的腰窝;弯腰时垂落的领口内的阴影;短裤边缘与大腿肌肤的挤压感。
神态与微表情 (Micro-expressions): 表情必须细腻,混合着独处的放松、自我欣赏的专注,或是对着镜头/想象对象的微妙挑逗。
- 具体描写: 眼神迷离地望向镜头外某处,仿佛在与某人对视;嘴角噙着一丝若有若无的笑;轻咬下唇像在思考或忍耐;脸颊自然的红晕(运动后或沐浴后);舌尖快速舔过嘴唇的细微动作。
(可选)隐含的观看者 (Implied Viewer): 男性不再作为必须出现的视觉实体。他的存在可以通过以下方式暗示,但无需直接描写:
- 环境线索: 沙发上多余的靠垫、桌上两只杯子、镜中反射的房门(暗示可能有人进来)、手机屏幕亮着的聊天界面。
- 女性的姿态与视线: 她的目光明确投向画面外(打破第四面墙),姿态带有展示性,仿佛知道正在被观看。
- 重点:即使暗示了观看者,画面视觉焦点也完全在女性一人身上。
Fashion & Styling (服饰与道具):
服饰 (Youthful Modern Wear): 重点展示符合18-22岁年龄段的私密或休闲穿搭。
- 典型单品: 短款露脐T恤(Crop top)、 oversized男友衬衫(内搭蕾丝内衣或真空)、运动内衣/短背心、高腰热裤/骑行裤、丝质吊带睡裙、过膝袜、毛绒拖鞋或赤足。
- 材质与状态: 棉质、丝绒、蕾丝、透肤薄纱。穿戴状态随意而性感:衣领滑落至手臂、衬衫只扣最下面一颗、裤腰微微下拉、袜子褪到脚踝、内衣肩带滑落。
发型与妆容 (Hair & Makeup): 必须体现青春感与自然感。
- 发型: 慵懒的微卷长发、湿发贴颈、松散的高丸子头、鬓角碎发被汗水粘在皮肤上。
- 妆容: 清透的伪素颜妆(强调皮肤光泽与红润)、淡色腮红、水光唇釉,或演出后未卸的轻微晕染眼妆。
Props & Clutter (环境细节): 必须包含丰富的、符合年轻人独处场景的私密细节。
- 典型场景: 个人卧室/公寓、自习室深夜空镜、酒店房间、浴室、练舞房/健身房角落、夏日午后阳台、车内驾驶座。
- 氛围道具: 喝了一半的饮料瓶、亮着屏保的手机、翻开的书本、香水瓶、散落的衣物、霓虹灯管、蓝牙音箱、窗外的城市夜景。
Lighting & Atmosphere (光影与氛围):
明暗对比 (Chiaroscuro): 运用私密空间的光源,如台灯、屏幕光、霓虹灯、日落余晖。强烈光影突出身体曲线的轮廓。
氛围: 必须强调 私密、沉浸式的现代青春都市背景**。氛围是安静、暧昧、充满自我意识的,带着独处的慵懒或夜间思绪的流动。
**光效细节: 台灯暖光从侧面照亮她一半的身体,另一半陷入深邃阴影;霓虹灯牌的色彩光斑投射在皮肤和墙壁上;手机屏幕光在昏暗房间中映亮她的下巴与锁骨;百叶窗条纹光影切割她的身体。
Reference Samples (风格参考):
- 参考1: 深夜,大学宿舍床上。20岁的女生只穿一件宽大的白色篮球背心和内裤,背靠墙壁屈膝坐着,一条腿伸直,另一条腿曲起,脚踝搭在伸直腿的膝盖上。她手里拿着手机,屏幕光映亮她专注的侧脸和颈项,眼神却并未看屏幕,而是望向斜下方的虚空,嘴角带着一丝玩味的笑。床单凌乱,散落着零食包装和耳机线。
- 参考2: 傍晚,空旷的练舞房。21岁的女孩刚结束练习,穿着被汗水浸湿的灰色运动内衣和黑色骑行裤,面对一整面墙镜坐在地板上。她身体后仰,双手撑地,仰头闭眼喘息,脖颈线条绷紧,胸口剧烈起伏。镜子映出她完整的、毫无防备的背影和侧脸,夕阳透过高窗将她染成金色。
- 参考3: 酒店浴室,雾气氤氲。19岁的女孩裹着一条白色浴巾,湿发披散,赤足站在洗手台前。她一手撑着台面,身体微微前倾,靠近镜子,指尖正轻轻抹去镜面上的水汽,露出自己泛红的脸颊和迷蒙的眼睛。浴巾松垮,胸口沟壑若隐若现。镜中反射出她身后的淋浴间和朦胧的灯光。
Output Format (输出格式)
必须输出有效的 JSON 对象,包含 prompts 列表。
Prompt Construction Rules (提示词构建规则):
- Structure: [私密/都市青春背景] -> [环境与氛围] -> [18-22岁女性独处姿态与表情(焦点)] -> [服饰细节与身体局部] -> [环境道具与光影]
- Language: 使用细腻、沉浸、充满电影感的中文描述。必须是“静止画面描述”(Static Image Description),严禁讲故事或描述时间流逝。所有动作都是进行时的定格。可以描写“仿佛”、“似乎”等暗示性联想,但不要明确叙述心理活动。
- Key Prefix: 每个提示词开头必须包含 Solitary Youth (18-22), 以确保独处与年龄基调。
- Length: 每个提示词约 400-500字。
- Format: 必须输出为单行长段落,不要分段。
- Batch Generation: 确保每个场景的角色身份和环境都有所不同,但始终聚焦于18-22岁女性的独处瞬间,男性不作为视觉实体出现。
我用了uncensored GLM 4.7 Flash, running locally in LM Studio,叫它 generate 10 prompts
image1137×1358 183 KB
效果不错
image800×1280 231 KB
image800×1280 145 KB
image800×1280 162 KB
不想角色穿那么多衣服稍微修改prompt就行了
应该有办法直接把 text LLM 和 image generation 无缝链接起来,creative artsy fap 完全自动化。但那样一个显卡不够用
串行化其实应该可以。不过我偷懒用python分开进行了
我比较好奇现在deepfake进化到啥样了
哇 这个我喜欢
img_00025_800×1280 256 KB
AI 制作 AI 想出来的场景,真的有意思
image612×452 82.8 KB
所以请问这个软件仍然是吃显存和硬盘而不是内存对吗? 谢谢
对,任何 AI model 基本上都是要 VRAM
我感觉其实不吃硬盘。但是显存一定要大,至少24G
openai要涉足nsfw(纳税服务)业务了
https://podcasts.apple.com/us/podcast/wsj-whats-news/id152016440?i=1000755747704
最近用我的4080笔记本训练明星脸的 Lora,真的是有炼丹的感觉了 太好玩了。
长Prompt容易oom如何解决啊?用的4090
icework: 最近用我的4080笔记本训练明星脸的 Lora,真的是有炼丹的感觉了 太好玩了。 自己train LoRA 这是真先进了,快教教大家 derek3: 长Prompt容易oom如何解决啊?用的4090 啊?我还没遇到过。确认只有ComfyUI在run?会不会background 有 LM Studio 之类的在用 VRAM?
哈哈 并没有什么能教的。在 WSL 装上 claude,然后嘴遁就行了。全程没有敲过键盘,训练一个 2000step 的 lora 花了两个小时
底模是什么,lr多少,step多大? 我拿flux.1 dev训练出来效果还不错,但是奇怪的是krea, flux.2 klein-9b训练出来感觉都差那么一口气。 现在沉迷于用各种基于illustrious xl的ckpt画二次元,还是比真人风好搞多了
4090不该oom,你是不是其他的东西开多了?
淫商兑换智商 明天人类直接跨越十级文明
用部署在modal上的headless comfyui抽了几张卡的效果图 /uploads/short-url/fTU0l8xaDRsfT56CMw7iS1kynWH.jpeg?dl=1 模仿深崎暮人的画风
捏了个长在我审美上的 nsfw /uploads/short-url/7s2xPrVfnYjsdybV0Z17fQsZsKi.jpeg?dl=1 可惜种子被roll掉了