On the Biology of a Large Language Model:深入剖析大型语言模型的内部机制,为理解其决策过程提供前所未有的视角。 通过电路追踪技术揭示模型内部的多步推理过程;发现模型在创作诗歌时的“规划”行为,提前布局押韵词汇;展示模型在多语言任务中使用语言无关的通用电路,提升跨语言泛化能力