Fin-R1:一款专为金融领域设计的推理大模型,助力金融机构高效解决复杂金融推理问题。 仅7B参数量,部署成本低;在金融推理任务中表现卓越,如FinQA得分76.0,ConvFinQA得分85.0;采用SFT和RL两阶段训练,提升模型准确性和泛化能力