新京報貝殼財經訊(記者羅亦丹)為了考察大模型在實際金融場景中部署的能力,7月28日,在世界人工智能大會論壇上,螞蟻數科聯合中國工商銀行、寧波銀行、北京前沿金融監(jiān)管科技研究院、上海人工智能行業(yè)協(xié)會等機構推出Finova大模型金融應用評測基準,深度考察智能體能力、復雜推理以及安全合規(guī)能力。目前,Finova已經全面開源,推動行業(yè)共同提升大模型在金融領域的應用水平。
螞蟻數科還在會上正式發(fā)布金融推理大模型Agentar-Fin-R1,為金融AI應用打造“可靠、可控、可優(yōu)化”的智能中樞。Agentar-Fin-R1基于Qwen3研發(fā),在FinEval1.0、FinanceIQ等權威金融大模型評測基準上超越Deepseek-R1等同尺寸開源通用大模型以及金融大模型。
Agentar-Fin-R1包括32B和8B參數兩個版本。螞蟻數科還推出基于百靈大模型的MOE架構模型,獲得更優(yōu)推理速度。此外,還有非推理版本的14B和72B參數大模型,以滿足金融機構在多樣化場景下的部署需求。
螞蟻數科CEO趙聞飆表示,“通用大模型距離產業(yè)實際應用存在‘知識鴻溝’。構建專業(yè)的金融大模型是推進金融與AI深度融合的必然路徑,未來,金融大模型的應用深度將成為金融機構競爭力的關鍵要素?!?/p>
編輯 陳莉 校對 劉軍