智通財經APP獲悉,9月22日,美團(03690)發布高效推理模型LongCat-Flash-Thinking。美團表示,基於AIME25實測數據,LongCat-Flash-Thinking在該框架下展現出更高效的智能體工具調用能力,在確保90%準確率的前提下,相較於不使用工具調用節省了64.5%的Tokens。目前,該模型已在HuggingFace、Github全面開源。
官方介紹,該模型不僅增強了智能體自主調用工具的能力,還擴展了形式化定理證明能力,成為國內首個同時具備「深度思考+工具調用」與「非形式化+形式化」推理能力相結合的大語言模型。尤其在超高複雜度的任務(如數學、代碼、智能體任務)處理上,LongCat-Flash-Thinking具備更顯著的優勢。
綜合評估顯示,LongCat-Flash-Thinking在邏輯、數學、代碼、智能體等多個領域的推理任務中,達到了全球開源模型的最先進水平(SOTA)。