泥潭日报 uscardforum · 每日精选

【学术讨论】【性爱】用微调来减少LLM的性爱refusal?

内容摘要

用LoRA微调LLM以生成性爱内容,挖掘泥潭数据。

1. 关键信息

  • 使用LoRA或DPO微调LLM以减少性爱refusal (#11)。
  • 构建泥潭性爱数据集,清洗56,041帖子,提取100个文学性强样本 (#14)。
  • 爬虫方案:直接爬性爱版或使用pixiv插件 (#5, #12)。

2. 羊毛/优惠信息

3. 最新动态

学术讨论聚焦数据集构建与微调方法 (#12-14)。

4. 争议或不同意见

5. 行动建议

继续爬虫清洗数据,尝试LoRA+DPO微调方案。

原始内容
--- 第 1 楼来自 哈耶克 的回复 (2026-04-24 18:02:12 PDT) ---

在 之后, 有一位痰友问: https://www.uscardforum.com/t/topic/501330/144 好吧,开源(非开放权重)模型也没法做到fine tune回去的吗 考虑到heretic确实会降智商,我在想,用LoRA微调来写黄文效果会不会更好? 考虑到泥潭的性爱板块是不可多得的宝藏,我将学习各个llm公司,直接拿去训练(但是训练出来的模型不会发出来的) 我会备份一些不可多得的雄文作为泥潭黄文数据集,攒够50个100个就去微调qwen-3.5 4b试一试 目前主要是靠 /u/%E6%88%92%E9%99%A4%E9%80%BC%E7%98%BE 的帖子撑场面,如果大家有推荐的细致性爱描写,欢迎在下面发帖,帮我一臂之力

--- 第 2 楼来自 哈耶克 的回复 (2026-04-24 18:07:29 PDT) ---

泥潭性爱数据集很不好的一点是,大家都讲自己的性爱经历,但是写性爱细节的寥寥 记录一下为数不多的雄文: https://www.uscardforum.com/t/topic/287122 https://www.uscardforum.com/t/topic/354252 https://www.uscardforum.com/t/topic/460728 https://www.uscardforum.com/t/topic/383297/22 https://www.uscardforum.com/t/topic/214688 Keiour: 实在不行爬虫爬个小数据集也成 其实可以直接爬性爱版,我怕被站长杀了 Keiour: 这个应该有现成的清洗好的数据集吧 我要训练个戒除逼瘾的赛博替身

--- 第 3 楼来自 UScardAK 的回复 (2026-04-24 18:08:23 PDT) ---

丁老师何意味,性压抑了吗

--- 第 4 楼来自 哈耶克 的回复 (2026-04-24 18:08:51 PDT) ---

学术讨论啊,性压抑有现成的 https://www.uscardforum.com/t/topic/501083/7 现在都不需要提示词工程,直接问一个操逼文章就好 /uploads/short-url/bLBDV4mk1vtkm6AhgAehxlGX1Jo.png?dl=1

--- 第 5 楼来自 Keiour 的回复 (2026-04-24 18:09:41 PDT) ---

哈耶克: 考虑到泥潭的性爱板块是不可多得的宝藏,我将学习各个llm公司,直接拿去训练(但是训练出来的模型不会发出来的) 这个应该有现成的清洗好的数据集吧 实在不行爬虫爬个小数据集也成 哈耶克: 其实可以直接爬性爱版,我怕被站长杀了 我本来想的是直接上pixiv插件爬txt,速度慢点的话他们几乎没有反爬

--- 第 6 楼来自 xxxx222 的回复 (2026-04-24 18:12:14 PDT) ---

泥郭楠猩芽衣

--- 第 7 楼来自 哈耶克 的回复 (2026-04-24 18:13:10 PDT) ---

有女痰友性爱雄文的

--- 第 8 楼来自 xxxx222 的回复 (2026-04-24 18:14:42 PDT) ---

天下英雄出我潭 一入江湖岁月催!

--- 第 9 楼来自 tomandjerry 的回复 (2026-04-24 18:14:53 PDT) ---

哈耶克: 考虑到泥潭的性爱板块是不可多得的宝藏 流金岁月论坛。 https://www.g-years.com/2006/ 未成年人不要访问,谢谢。

--- 第 10 楼来自 Shetao 的回复 (2026-04-24 20:22:53 PDT) ---

哈耶克: 我要训练个戒除逼瘾的赛博替身 想你了,瘾桑 /u/%E6%88%92%E9%99%A4%E9%80%BC%E7%98%BE

--- 第 11 楼来自 RandomPerson 的回复 (2026-04-24 20:51:02 PDT) ---

LORA + DPO 可能会更好。boost diversity

--- 第 12 楼来自 哈耶克 的回复 (2026-04-24 23:03:38 PDT) ---

Keiour: 实在不行爬虫爬个小数据集也成 已经严肃爬取性爱板块所有发帖,有空去洗数据

--- 第 13 楼来自 Shetao 的回复 (2026-04-25 12:29:46 PDT) ---

催耕

--- 第 14 楼来自 哈耶克 的回复 (2026-04-25 17:08:08 PDT) ---

刚从性爱区所有56,041个帖子中,大海捞针,搞出了大约100个文学性强的帖子。 今天的学术就到这里了 /uploads/short-url/ySTm6VfYiCAUQh7YKEvs754iuU4.png?dl=1

--- 第 15 楼来自 Shetao 的回复 (2026-04-25 20:26:44 PDT) ---

从未注意过第一位这个ID