【学术讨论】【性爱】用微调来减少LLM的性爱refusal?
用 LoRA 微调 LLM 减拒,数据量存疑,Llama 授权争议及 FB 政策不满。
1. 关键信息
- 使用 LoRA 或 DPO 微调 LLM 以减少性爱 refusal (#11)。
- 构建泥潭性爱数据集:原计划清洗 56,041 帖子,提取 100 个文学性强样本 (#14)。但#24 指出该数字可能按每层回复而非每栋楼计算,#26 估算泥潭性爱区 topic id 占比仅 0.4%-0.66%,实际仅几千帖,远不到五万。
- 爬虫方案:直接爬性爱版或使用 pixiv 插件 (#5, #12)。
- 用户@Keiour 指出不允许放模型权重可能是 Llama 系列的 license 问题,并提到现在没人用 Llama (#19)。@Wi-Fi 提议换个名字上传(如 NotFromMark3.3-8b-Heretic)以规避商标侵权(#20)。@哈耶克补充 Llama 在 LM Arena 排名前 200,但落后于 168 个其他模型(#21)。
- 数据集清洗方式:@哈耶克表示让 LLM 读帖子来筛选(#23)。
- 用户@Wi-Fi 在#36 中评论大公司本质,指出 Llama 此前反而是 anomaly。
2. 羊毛/优惠信息
无
3. 最新动态
- 用户@Wi-Fi 提出用换名方式绕过模型权重 license 限制 (#20)。
- 用户@哈耶克回应了 Llama 模型的实际排名 (#21),并澄清数据集筛选由 LLM 完成 (#23)。
- 用户@Lit1 质疑原始 56,041 帖子是否按楼层计算(#24);用户@Wi-Fi 通过 topic id gap 估算实际帖数约几千(#26)。
- 用户@Shetao 调侃性爱区活跃度,提及@Lit1、@psilocybin 等人(#25、#27-34),无实质性进展。
- 用户@Keiour 在#35 中批评 Facebook(FB)公司用极端手段推 age verification 立法,影响开源操作系统和应用商店,并表示不再使用 FB 产品。
- 用户@Wi-Fi 在#36 中回应@Keiour 关于 FB 的批评,认为这是资本主义大公司本质,没什么值得惊讶,并指出 Llama 此前反而是 anomaly。
4. 争议或不同意见
- 模型权重 license 争议:@Keiour 认为当前主流不是 Llama(#19);@Wi-Fi 建议换名发布(#20)。
- 数据集规模争议:原称 56,041 帖子可能严重高估,#26 估算实际仅几千帖,#24 猜测可能是按回复数而非主题数统计。
- 新争议:@Keiour 在#35 中表达对 FB 公司极端手段的反感,但未直接涉及微调方案本身。
- 观点补充:@Wi-Fi 认为大公司行为符合资本主义本质,Llama 此前作为 anomaly 并不罕见(#36)。
5. 行动建议
- 重新核实泥潭性爱区帖子数量:按 topic id gap 重新爬取统计,避免数据集规模误差。
- 优先使用非 Llama 的开放权重模型(如 Mistral、Qwen 等)或换名发布以规避 license 限制。
- 继续尝试 LoRA+DPO 微调方案,集中精力清洗那 100 个文学性强样本的数据集。
- 尽快向#16、#18、#19 等用户回应当前进度:数据集实际规模、模型选择、换名上传计划。
在 之后, 有一位痰友问: https://www.uscardforum.com/t/topic/501330/144 好吧,开源(非开放权重)模型也没法做到fine tune回去的吗 考虑到heretic确实会降智商,我在想,用LoRA微调来写黄文效果会不会更好? 考虑到泥潭的性爱板块是不可多得的宝藏,我将学习各个llm公司,直接拿去训练(但是训练出来的模型不会发出来的) 我会备份一些不可多得的雄文作为泥潭黄文数据集,攒够50个100个就去微调qwen-3.5 4b试一试 目前主要是靠 /u/%E6%88%92%E9%99%A4%E9%80%BC%E7%98%BE 的帖子撑场面,如果大家有推荐的细致性爱描写,欢迎在下面发帖,帮我一臂之力
泥潭性爱数据集很不好的一点是,大家都讲自己的性爱经历,但是写性爱细节的寥寥 记录一下为数不多的雄文: https://www.uscardforum.com/t/topic/287122 https://www.uscardforum.com/t/topic/354252 https://www.uscardforum.com/t/topic/460728 https://www.uscardforum.com/t/topic/383297/22 https://www.uscardforum.com/t/topic/214688 Keiour: 实在不行爬虫爬个小数据集也成 其实可以直接爬性爱版,我怕被站长杀了 Keiour: 这个应该有现成的清洗好的数据集吧 我要训练个戒除逼瘾的赛博替身
丁老师何意味,性压抑了吗
学术讨论啊,性压抑有现成的 https://www.uscardforum.com/t/topic/501083/7 现在都不需要提示词工程,直接问一个操逼文章就好 /uploads/short-url/bLBDV4mk1vtkm6AhgAehxlGX1Jo.png?dl=1
哈耶克: 考虑到泥潭的性爱板块是不可多得的宝藏,我将学习各个llm公司,直接拿去训练(但是训练出来的模型不会发出来的) 这个应该有现成的清洗好的数据集吧 实在不行爬虫爬个小数据集也成 哈耶克: 其实可以直接爬性爱版,我怕被站长杀了 我本来想的是直接上pixiv插件爬txt,速度慢点的话他们几乎没有反爬
泥郭楠猩芽衣
有女痰友性爱雄文的
天下英雄出我潭 一入江湖岁月催!
哈耶克: 考虑到泥潭的性爱板块是不可多得的宝藏 流金岁月论坛。 https://www.g-years.com/2006/ 未成年人不要访问,谢谢。
哈耶克: 我要训练个戒除逼瘾的赛博替身 想你了,瘾桑 /u/%E6%88%92%E9%99%A4%E9%80%BC%E7%98%BE
LORA + DPO 可能会更好。boost diversity
Keiour: 实在不行爬虫爬个小数据集也成 已经严肃爬取性爱板块所有发帖,有空去洗数据
催耕
刚从性爱区所有56,041个帖子中,大海捞针,搞出了大约100个文学性强的帖子。 今天的学术就到这里了 /uploads/short-url/ySTm6VfYiCAUQh7YKEvs754iuU4.png?dl=1
从未注意过第一位这个ID
any update?
还在认真研读性爱版大作
要加快进度呀
啥情况?不允许heretic放模型权重是因为LLama系列的license问题? 不过现在也没人用llama就是了
用商标侵权搞开源项目,让我想起某些翻墙软件圈子里的小学生行为。 无所谓啊,换个名字上传呗,比如就叫NotFromMark3.3-8b-Heretic
The Llama model family ranks among the 200 best language models available today, trailing only 168 other models from 23 competitors on the LM Arena leaderboard
哈耶克: 大海捞针,搞出了大约100个文学性强的帖子。 哈耶克老师是一篇一篇读来捞吗 五万个帖子得读多久啊
肯定是让LLM读啊
直觉这个帖子数量可能是每层回复算一个,而不是每栋楼算一个 也可能是我低估了总帖的数量
姐姐,怎么榜上没你
泥潭现在的topic id一共50万出头,如果这个区占总topic的10%也太可怕了。那个分区topic id的gap平均在150-250左右,也就是占0.4%-0.66%,估算结果也就几千帖到不了五万。
为什么会有我
你也常逛性爱区,为什么没有高质量创作
为什么不challenge李姐的对头
是哪位,桑at一下
是 /u/psilocybin 老在摸鱼楼challenge我
其实我说的是内谁
我知道了 是他 /u/%E9%9C%B2%E5%BA%94%E5%88%AB%E6%B3%AA
他们都不在性爱区活跃
FB这公司就这样,喜欢拿极端手段去达成一个很小的,甚至没什么意义的目标,而且往往不管受到影响的其他人的死活。今年他们花了天量的lobbying cost去推美国各州的age verification立法,顺便就把开源操作系统 / 应用商店给恶心了。 反正现在是一点都不用FB这公司的产品,实在觉得这公司恶心。
还是资本主义大公司本质,也没什么值得惊讶的,哪个大公司都这样。之前llama反而是anomaly。