一場圍繞“信貸多模態AI如何建立統一標準”的直播討論近日引發關注,奇富科技聯合復旦大學、華南理工大學研究人員共同推出的首個面向信貸場景的多模態評測基準FCMBench-V1.0成為核心議題。該基準以真實信貸業務為根基,覆蓋多模態感知、推理與決策等關鍵環節,同步開源數據集與評測工具,旨在為金融AI領域構建一套可量化、可對比的評估體系。
奇富科技多模態負責人楊葉輝博士在直播中以“鋤頭與土地”作比,指出AI作為工具需與高門檻行業深度適配。他強調,金融業務對隱私、安全與合規的嚴苛要求,決定了模型能力必須通過客觀標準驗證,而非依賴單一機構的自我宣稱。“當前金融機構常面臨‘不同模型得分相近卻難以抉擇’的困境,FCMBench的價值在于將所有模型置于同一競技場,在真實業務條件下檢驗其推理能力。”楊葉輝透露,該基準在設計時模擬了光線干擾、角度偏差等十余種真實場景,例如通過職業信息與資金流水的矛盾識別,檢驗模型是否具備金融風控的核心推理能力。
華南理工大學許言午教授從跨行業視角提出,AI在金融領域的滲透遠超公眾認知。他指出,保險定價、資產評估和量化交易等領域早已廣泛應用AI技術,只是這些價值隱藏在B端業務流程中。對比醫療AI長達十余年的研發周期,許言午認為金融行業更短的迭代周期為模型評測提供了天然土壤。他將數據集發展劃分為三個階段:夯實數據質量、通過學術競賽擴大影響力、最終獲得行業官方認可。在他看來,FCMBench正站在從第二階段向第三階段跨越的關鍵節點。
復旦大學陳濤教授從AI發展史切入,以ImageNet推動計算機視覺領域變革為例,強調統一評測基準對技術突破的關鍵作用。他指出,FCMBench在數據規模、任務覆蓋度和系統性設計上已達到國際領先水平,其核心價值在于定義了金融AI的“問題邊界”。“好的數據集應直接指向行業痛點,金融AI不能止步于通用模型的微調,而需構建內生的金融思維鏈,使模型天然理解利率、規則與風險。”陳濤特別提到,學界與產業界的協同至關重要,FCMBench的開源特性為這種合作提供了基礎框架。
直播主持人、36氪高級內容總監楊軒在總結時表示,奇富科技的探索為行業樹立了標桿,但金融AI的規范化發展需要更多機構參與數據集測試與賽事共建。她呼吁產業界、學術界共同完善這一“金融領域的ImageNet”,通過持續迭代形成行業共識,推動技術從實驗室走向規模化應用。





















