上海建科咨詢集團近日宣布,正式推出國內首個工程監理行業大模型測評基準——Norma-MESBench 1.0。這一創新成果填補了監理領域在AI大模型測評方面的空白,為行業提供了科學、量化的評估工具,幫助企業精準判斷AI技術在監理各專業領域的應用能力。
Norma-MESBench 1.0的構建基于“全維度測評框架”,涵蓋專業技術、通用綜合和特色場景三大板塊,并細分為多個層級。項目團隊采用“人工+大模型輔助”的混合模式,生成了超過一萬條測評數據,并通過格式標準化、去重算法和多輪人工復核等流程確保題目質量。這一框架不僅為行業提供了統一的測評標準,還通過“多層級加權評分”和“裁判模型評審組”等算法,實現了測評流程的自動化和標準化。
目前,該測評集已完成對17款主流通用大模型在監理工作場景中的能力評估,為企業和從業人員提供了專業、精準的參考依據。這一成果有助于企業科學選擇適合自身需求的AI大模型,推動AI技術在工程監理領域的落地應用。
為促進行業AI生態的開放與可持續發展,上海建科咨詢集團決定將Norma-MESBench 1.0開源發布。此舉旨在鼓勵更多企業和科研機構參與進來,共同推動監理行業人工智能技術的創新與發展。
作為工程監理行業AI測評體系的重要突破,Norma-MESBench 1.0的發布標志著“人工智能+”戰略在工程建設領域邁出了關鍵一步。隨著AI技術的深入應用,工程監理行業有望迎來更高質量、更可靠的智能化轉型。





















