上海AI企業(yè)發(fā)布全球首個混合架構(gòu)開源模型

2025-06-20 16:43:32 來源: 科技日報點擊數(shù)：

科技日報記者李均

低成本推理與超長文本理解的創(chuàng)新之門，近日被我國一家AI企業(yè)敲開。連日來，這一科技創(chuàng)新事件在全球AI領(lǐng)域引發(fā)震動。

6月17日凌晨，總部位于上海的AI獨角獸企業(yè)MiniMax（上海稀宇科技有限公司），發(fā)布了自主研發(fā)的“全球首個開源的大規(guī)?；旌霞軜?gòu)推理模型”MiniMax-M1（以下簡稱M1）。M1支持100萬token上下文窗口，訓(xùn)練成本僅為53.74萬美元，約合380萬元人民幣，其長文本處理、寫代碼等核心性能填補了開源領(lǐng)域長上下文技術(shù)的空白，展現(xiàn)比肩甚至超越業(yè)界頂尖模型的實力。

開源“新王”：較低成本訓(xùn)練出頂尖模型

當前，AI發(fā)展迎來關(guān)鍵轉(zhuǎn)折點，如同一場比賽進入下半場。大模型的競爭已經(jīng)轉(zhuǎn)變?yōu)樗懔?、?shù)據(jù)、應(yīng)用場景等整個生態(tài)的競爭，而高效、低成本、強推理能力成為定義下一代AI創(chuàng)新的關(guān)鍵變量。“M1如同用經(jīng)濟型轎車的成本造出了豪華超跑?！薄癕1是我們眼中的性價比‘新王’?！被ヂ?lián)網(wǎng)上，一些AI行業(yè)觀察者給出這樣的評價。

作為國內(nèi)“AI六小虎”之一的MiniMax，此次發(fā)布的M1大模型擁有巨大的成本優(yōu)勢，主要源于兩大技術(shù)創(chuàng)新。一是采用閃電注意力機制為主的混合架構(gòu)，使得模型在計算長的上下文輸入以及深度推理時更加高效；二是運用CISPO強化學習算法，優(yōu)化重要性采樣權(quán)重，訓(xùn)練效率超越其他大模型。得益于CISPO的高效，M1模型的整個強化學習階段僅使用了512塊英偉達H800 GPU，耗時3周，成本僅為53.74萬美元。MiniMax方面表示，這一成本“比最初的預(yù)期少了一個數(shù)量級”。

相關(guān)技術(shù)報告也指出，在進行8萬Token的深度推理時，M1所需的算力僅為國內(nèi)另一款大模型的約30%；生成10萬token時，推理算力只需要另一款大模型的25%，實現(xiàn)了“性能躍升、成本腰斬”的雙重突破，為市場提供了一個高性能、低門檻的新選擇。對此，資深人工智能專家、高級工程師丁成剛認為，MiniMax宣布在其自有的App和Web端，M1模型將保持不限量免費使用。當較低成本訓(xùn)練出頂尖模型，用戶不用擔心百萬token上下文成為高昂服務(wù)，可以預(yù)見，M1或?qū)蔀橹悄荏w時代的首選開源基座模型。

技術(shù)“大考”：推動架構(gòu)創(chuàng)新，實現(xiàn)性能超越

行業(yè)觀察人士認為，面對多個核心生產(chǎn)力場景，M1于同類模型中率先實現(xiàn)了技術(shù)突破與架構(gòu)創(chuàng)新，它的核心競爭力在于，將線性注意力（Linear Attention）與標準Softmax注意力有機融合，形成獨特的“閃電注意力”機制。這一設(shè)計讓M1在保持長序列處理效率的同時，解決了純線性注意力在信息檢索上的固有缺陷。

相關(guān)技術(shù)報告顯示，在性能方面，MiniMax在業(yè)內(nèi)公認的17個主流評測集上對M1進行了“檢閱”。結(jié)果顯示，M1表現(xiàn)亮眼，全面碾壓開源界。尤其是在軟件工程、長上下文理解以及工具使用等復(fù)雜且對生產(chǎn)力要求較高的場景中，M1展現(xiàn)出絕對實力。在SWE-bench基準測試里，M1-40k和M1-80k分別取得55.6%和56.0%的高分。憑借其百萬級的上下文窗口，M1在長上下文理解任務(wù)中具有壓倒性優(yōu)勢，不僅超越所有開源模型，還在部分指標上接近OpenAI o3和Claude4Opus，在全球范圍內(nèi)位居第二。

在代理工具使用場景（TAU-bench）的評測中，M1不僅在所有開源模型中脫穎而出，還戰(zhàn)勝了Gemini-2.5Pro。此外，M1-80k在多數(shù)基準測試中的表現(xiàn)都優(yōu)于M1-40k，表明增加計算資源對于提升模型性能有顯著作用。在處理400頁技術(shù)文檔或10萬行代碼庫時，傳統(tǒng)模型需反復(fù)切分上下文，而M1可以做到整體消化、連貫推理，為智能體發(fā)展提供了開創(chuàng)性范例。

“M1打破了‘算力+資本’的競爭模式，將對全球AI大模型市場產(chǎn)生深遠影響。不過，對于更多AI領(lǐng)域企業(yè)來說，要從技術(shù)流派轉(zhuǎn)向市場應(yīng)用，以解決問題、實現(xiàn)任務(wù)為出發(fā)點，開拓醫(yī)療、健康、旅游、傳媒等領(lǐng)域垂直類應(yīng)用場景，才能在AI的規(guī)?；瘧?yīng)用方面擁有更多想象空間和發(fā)展機遇?！辟Y深創(chuàng)投專家、江蘇投資人中心秘書長吳峰認為。

責任編輯：王倩

国产999免费视频|亚洲欧美激情综合首页|动漫人妻h无码中文字幕|国产精品欧美日韩视频一区|美女精品人妻视频一区二区|中文亲近交尾bd在线播放|色五月丁香亚洲高清无码国产|久久一区国产男人操女人的视频

上海AI企業(yè)發(fā)布全球首個混合架構(gòu)開源模型

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級，繼續(xù)瀏覽

国产999免费视频|亚洲欧美激情综合首页|动漫人妻h无码中文字幕|国产精品欧美日韩视频一区|美女精品人妻视频一区二区|中文亲近交尾bd在线播放|色五月丁香亚洲高清无码国产|久久一区国产男人操女人的视频

上海AI企業(yè)發(fā)布全球首個混合架構(gòu)開源模型

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級，繼續(xù)瀏覽

3.暫不升級，繼續(xù)瀏覽