🔥实时更新 频道/群组搜索 登录
TGSO.PRO
黑洞资源笔记 03-31 16:29:44

On the Biology of a Large Language Model:深入剖析大型语言模型的内部机制,为理解其决策过程提供前所未有的视角。 通过电路追踪技术揭示模型内部的多步推理过程;发现模型在创作诗歌时的“规划”行为,提前布局押韵词汇;展示模型在多语言任务中使用语言无关的通用电路,提升跨语言泛化能力

附件:[图片]