Heretic has FINALLY defeated GPT-OSS with a new experimental decensoring method called ARA
产品/方法概述
- 一句话介绍: 一个名为 Arbitrary-Rank Ablation (ARA) 的实验性 LLM 去审查/去拒答技术。
- 核心问题: 解决了开源模型(特别是高度受限的模型)在处理敏感或边缘话题时频繁拒答、行为受限(被戏称为“脑叶切除”)的问题。
- 实现方式: 通过任意秩消融(ARA)技术,定位并移除模型参数中负责拒答逻辑的特定矩阵秩,实现模型权重的后处理脱敏。