【学术讨论】【性爱】用微调来减少LLM的性爱refusal?
用LoRA微调LLM以生成性爱内容,挖掘泥潭数据。
1. 关键信息
- 使用LoRA或DPO微调LLM以减少性爱refusal (#11)。
- 构建泥潭性爱数据集,清洗56,041帖子,提取100个文学性强样本 (#14)。
- 爬虫方案:直接爬性爱版或使用pixiv插件 (#5, #12)。
2. 羊毛/优惠信息
无
3. 最新动态
学术讨论聚焦数据集构建与微调方法 (#12-14)。
4. 争议或不同意见
无
5. 行动建议
继续爬虫清洗数据,尝试LoRA+DPO微调方案。
在 之后, 有一位痰友问: https://www.uscardforum.com/t/topic/501330/144 好吧,开源(非开放权重)模型也没法做到fine tune回去的吗 考虑到heretic确实会降智商,我在想,用LoRA微调来写黄文效果会不会更好? 考虑到泥潭的性爱板块是不可多得的宝藏,我将学习各个llm公司,直接拿去训练(但是训练出来的模型不会发出来的) 我会备份一些不可多得的雄文作为泥潭黄文数据集,攒够50个100个就去微调qwen-3.5 4b试一试 目前主要是靠 /u/%E6%88%92%E9%99%A4%E9%80%BC%E7%98%BE 的帖子撑场面,如果大家有推荐的细致性爱描写,欢迎在下面发帖,帮我一臂之力
泥潭性爱数据集很不好的一点是,大家都讲自己的性爱经历,但是写性爱细节的寥寥 记录一下为数不多的雄文: https://www.uscardforum.com/t/topic/287122 https://www.uscardforum.com/t/topic/354252 https://www.uscardforum.com/t/topic/460728 https://www.uscardforum.com/t/topic/383297/22 https://www.uscardforum.com/t/topic/214688 Keiour: 实在不行爬虫爬个小数据集也成 其实可以直接爬性爱版,我怕被站长杀了 Keiour: 这个应该有现成的清洗好的数据集吧 我要训练个戒除逼瘾的赛博替身
丁老师何意味,性压抑了吗
学术讨论啊,性压抑有现成的 https://www.uscardforum.com/t/topic/501083/7 现在都不需要提示词工程,直接问一个操逼文章就好 /uploads/short-url/bLBDV4mk1vtkm6AhgAehxlGX1Jo.png?dl=1
哈耶克: 考虑到泥潭的性爱板块是不可多得的宝藏,我将学习各个llm公司,直接拿去训练(但是训练出来的模型不会发出来的) 这个应该有现成的清洗好的数据集吧 实在不行爬虫爬个小数据集也成 哈耶克: 其实可以直接爬性爱版,我怕被站长杀了 我本来想的是直接上pixiv插件爬txt,速度慢点的话他们几乎没有反爬
泥郭楠猩芽衣
有女痰友性爱雄文的
天下英雄出我潭 一入江湖岁月催!
哈耶克: 考虑到泥潭的性爱板块是不可多得的宝藏 流金岁月论坛。 https://www.g-years.com/2006/ 未成年人不要访问,谢谢。
哈耶克: 我要训练个戒除逼瘾的赛博替身 想你了,瘾桑 /u/%E6%88%92%E9%99%A4%E9%80%BC%E7%98%BE
LORA + DPO 可能会更好。boost diversity
Keiour: 实在不行爬虫爬个小数据集也成 已经严肃爬取性爱板块所有发帖,有空去洗数据
催耕
刚从性爱区所有56,041个帖子中,大海捞针,搞出了大约100个文学性强的帖子。 今天的学术就到这里了 /uploads/short-url/ySTm6VfYiCAUQh7YKEvs754iuU4.png?dl=1
从未注意过第一位这个ID