Qwen3.5-9B-Claude-4.6-Opus-Uncensored-Distilled-GGUF
产品/方法概述
- 一句话介绍: 一个基于 Qwen 3.5 架构,通过张量提取技术整合 Claude 蒸馏逻辑且完全去审查的本地化 9B 轻量级大语言模型。
- 核心问题: 解决了开源模型在角色扮演(RP)和创意写作中因安全过滤导致的频繁拒绝、长思考逻辑造成的复读循环,以及对消费级显卡(如 RTX 3060)显存占用过大的问题。
- 实现方式: 通过 Vibe-coding 提取 Qwen 3.5 不同微调版本的增量权重,合并高质量的 Claude 蒸馏逻辑,并在 GGUF 模版中禁用显式思考过程以节省 Token 消耗。