AI 洞察

阿里巴巴發表 Qwen 3.7-Max(2026 年 5 月):100 萬 token 脈絡、代理級推理,但這次「不開源」——台灣中小企業要不要用?

ACTGSYS
2026/5/29
16 分鐘閱讀
阿里巴巴發表 Qwen 3.7-Max(2026 年 5 月):100 萬 token 脈絡、代理級推理,但這次「不開源」——台灣中小企業要不要用?

阿里巴巴於 2026 年 5 月 20 日在 Alibaba Cloud Summit 正式發表旗艦模型 Qwen 3.7-Max,把脈絡視窗從前代的 256K 一口氣倍增到 100 萬 token,並具備原生延伸思考(extended thinking)與代理級能力——但與 Qwen 過去的開源傳統不同,這次首度採閉源、只提供 API。 對台灣中小企業,這款模型最值得注意的不是 benchmark,而是「100 萬 token 脈絡」這件事——它讓「一次餵進整份合約、整本手冊、整季報表」的應用變得實際可行。

Qwen 3.7-Max 發生了什麼事?

阿里巴巴於 2026 年 5 月 20 日在 Alibaba Cloud Summit 正式發表 Qwen 3.7-Max,並早一天(5 月 19 日)就在 Alibaba Cloud Model Studio 上線商用 API。根據 Qwen 官方部落格(2026)與第三方整理,新版最大的躍進是脈絡視窗——從前代 Qwen3.6 Max 的 256K 直接倍增到 100 萬 token,並內建原生延伸思考模式(MarkTechPost, 2026)。

最值得台灣讀者留意的一點:Qwen 3.7-Max 首度採閉源、僅提供 API。 阿里巴巴過去以「開源 Qwen 系列」聞名(許多模型權重公開於 HuggingFace),但這款旗艦版截至 2026 年 5 月並未釋出權重,只能透過 Alibaba Cloud 的 DashScope / Model Studio 使用。這對重視「自行部署、資料不出境」的企業,是一個必須先想清楚的限制。

Qwen 3.7-Max 有哪些重點突破?

Qwen 3.7-Max 定位為「推理 + 代理」模型,重點集中在三方面:

  • 100 萬 token 脈絡視窗——較前代 256K 倍增,可一次處理整份長合約、整本產品手冊、整季財報,無需切碎多次餵入。
  • 整體智能明顯提升——在 Artificial Analysis Intelligence Index 拿到 56.6 分、整體排名第五,較前代 Qwen3.6 Max(51.8)提升 4.8 分;其中 CritPt 提升 9.7 個百分點、Humanity's Last Exam 提升 9.2 個百分點(MarkTechPost, 2026)。
  • 代理與程式能力強——Terminal-Bench 2.0 達 69.7、SWE-Bench Pro 60.6、MCP-Atlas 76.4,在中文模型中屬第一梯隊;Arena 文字 Elo 達 1,475,排名第 13。

Qwen 3.7-Max 跟 DeepSeek、前代差在哪?(脈絡與能力對照)

時事文最常被搜尋的就是「Qwen vs DeepSeek」。下表把重點攤開對照:

面向 Qwen 3.6 Max(前代) Qwen 3.7-Max DeepSeek V4-Pro
脈絡視窗 256K 100 萬 token 較短
是否開源 部分開源 否(閉源、僅 API) 是(權重公開)
代理 / 程式 較弱 SWE-Bench Pro 60.6、Terminal-Bench 2.0 69.7 SWE-bench Verified 80.6%
取得方式 API / 部分自部署 僅 Alibaba Cloud API API 或自部署

(資料來源:Qwen 官方部落格、MarkTechPost、Artificial Analysis,2026。各模型 benchmark 採各家公布之測項,非完全同一基準,僅供方向性對照。)

這張表的解讀關鍵:Qwen 3.7-Max 的最大差異化是『超長脈絡』,而非『最強程式能力』。 純比 coding,DeepSeek V4-Pro 的 SWE-bench 仍領先;但若你的痛點是「文件太長、一次塞不進去」,100 萬 token 的脈絡是 Qwen 3.7-Max 的關鍵賣點。另一個重大差別是開源——DeepSeek 可自部署把資料留在自家,Qwen 3.7-Max 目前只能走 Alibaba Cloud API。

定價說明:截至發表時,官方尚未公布 Qwen 3.7-Max 的正式 API 價格(前代 Qwen3.6 Max 約為每百萬 token 輸入 1.30 / 輸出 7.80 美元,部分第三方追蹤站報導新版約落在 2.50 / 7.50 美元區間)。實際費用請以 Alibaba Cloud Model Studio 官方公告為準。

開發者與產業怎麼看?

社群評價集中在「長脈絡很實用」與「閉源讓人意外」兩端。

正面評價集中在『長脈絡 + 性價比』——開發者實測後普遍認可,100 萬 token 脈絡讓長文件問答、整庫程式碼理解、長對話記憶等場景變得實際可行,而中文表現一向是 Qwen 系列的強項,對處理中文資料的企業特別友善。

保留意見集中在『閉源轉向』與『資料治理』——Qwen 一向以開源著稱,這次旗艦版首度閉源讓不少開發者意外,也削弱了「自行部署、資料留在自家」這個過去的核心優勢。部分企業使用者對「資料送往中國背景雲端」有合規疑慮,特別是涉及客戶個資、財務資料的應用。

從更大的產業框架看,這呼應 Gartner 對 2026 年的觀察:超長脈絡視窗正成為企業 AI 的關鍵競爭維度之一,因為它直接決定了「能不能一次處理完整的企業文件與知識庫」(Gartner, 2025)。但 Gartner 也提醒,模型選型必須把資料主權與合規一併納入評估。

這對台灣中小企業代表什麼?

對台灣中小企業,Qwen 3.7-Max 是「長文件 / 長脈絡應用」的有力新選項,但閉源與資料落地是必須先想清楚的前提。

機會面:

  • 長文件處理變得實際可行——100 萬 token 脈絡讓「一次餵進整份合約、整本 SOP、整季報表做問答與摘要」不再需要複雜的切片工程,適合文件密集的產業。
  • 中文表現友善——Qwen 系列在中文理解與生成上一向表現好,對處理中文客戶資料、合約、客服紀錄的台灣企業特別合適。
  • 作為 RAG 的有力補充——超長脈絡可減少對複雜檢索(retrieval)架構的依賴,某些場景能直接「全文塞進去問」,簡化系統設計。

但要小心三件事:

  1. 閉源 = 無法自部署——目前只能走 Alibaba Cloud API,無法把模型搬到自家或中立雲端。涉及客戶個資、財務、營業機密的應用,要先確認資料流向與合規要求。
  2. 資料主權優先評估——若主力應用涉及敏感資料且有資料不出境要求,Qwen 3.7-Max 的 API-only 限制可能直接出局,這時開源的 DeepSeek 自部署反而更合適。
  3. 定價尚未明朗——正式 API 價格官方尚未完全公布,導入前務必以 Alibaba Cloud 官方報價試算實際成本,別只看第三方數字。

把超長脈絡能力接進 TanJee 做整份文件的問答與摘要、或接進 Dinkoko ERP 做長報表分析時,建議在架構上保留模型路由層——讓「長文件任務走 Qwen 3.7-Max、敏感資料走可自部署的開源模型、程式任務走 DeepSeek」,依任務類型與合規需求最佳化。

ACTGSYS 建議:現在該做什麼?

Qwen 3.7-Max 值得評估,尤其對文件密集、處理大量中文長文本的中小企業,但要在「長脈絡優勢」與「閉源 / 資料落地限制」之間權衡。

現在就做:

  1. 盤點『長文件 / 長脈絡』痛點——列出目前因「文件太長、AI 一次讀不完」而卡關的應用(合約審閱、長報表摘要、知識庫問答),這些最受惠於 100 萬 token 脈絡。
  2. 做資料治理分級——把應用分成「可上雲 API」與「須資料不出境」兩類;後者優先評估可自部署的開源模型,前者再評估 Qwen 3.7-Max。
  3. 針對長文件場景做 A/B 實測——用你最常見的長文件任務,比較 Qwen 3.7-Max 與現有方案的品質與成本(以 Alibaba Cloud 官方報價試算)。

先觀望:

  1. 敏感資料應用先別搬——涉及大量客戶個資且有合規要求的應用,在 API-only 限制下先維持現有方案。
  2. 等正式定價明朗再做大額承諾——在官方完整公布價格前,避免簽下大量用量承諾。

常見問題

Qwen 3.7-Max 在台灣可以用嗎?

可以,但僅能透過 Alibaba Cloud 的 DashScope / Model Studio API 使用,目前不提供模型權重自行部署。對涉及客戶個資、財務資料且有資料不出境要求的應用,須先確認資料流向與合規;這類場景可能更適合可自部署的開源模型。

Qwen 3.7-Max 開源嗎?跟以前的 Qwen 有什麼不同?

不開源。阿里巴巴過去以開源 Qwen 系列聞名(多款模型權重公開於 HuggingFace),但 Qwen 3.7-Max 是首度採閉源的旗艦版,截至 2026 年 5 月未釋出權重、僅提供 API。這也意味著它失去了「自行部署、資料留在自家」這個過去 Qwen 的核心優勢。

Qwen 3.7-Max 和 DeepSeek V4-Pro 怎麼選?

看痛點。若你的需求是「處理超長文件、一次塞進整份合約或手冊」,Qwen 3.7-Max 的 100 萬 token 脈絡是關鍵優勢;若你要的是最強的程式 / 軟體工程能力且需要自部署把資料留在自家,DeepSeek V4-Pro(SWE-bench 80.6%、開源)更合適。最務實的做法是依任務類型分流使用。

Qwen 3.7-Max 的 100 萬 token 脈絡能取代 RAG 嗎?

部分場景可以簡化,但不一定完全取代。超長脈絡讓「全文直接塞進去問」變得可行,能減少複雜檢索架構的負擔;但對超大型、持續更新的知識庫,RAG 在成本與即時性上仍有優勢。建議依資料量與更新頻率,評估「純長脈絡」「純 RAG」或「兩者混合」哪種最划算。

結語

Qwen 3.7-Max 的真正亮點是「100 萬 token 的超長脈絡」,讓長文件處理變得實際可行,中文表現也是台灣企業的加分項。但首度閉源、僅提供 Alibaba Cloud API 的轉向,讓「資料落地與合規」成為導入前必須先解決的前提。對台灣中小企業,正確的回應是「先盤點長文件痛點、做資料治理分級、用真實任務實測,並在架構上保留依任務分流不同模型的彈性」。

想為公司規劃一套「長文件用長脈絡模型、敏感資料走可自部署方案、依任務最佳化成本與合規」的 AI 架構?歡迎與 ACTGSYS 聯繫,我們協助台灣中小企業在快速更新的模型市場中,挑對工具、守住資料治理底線。

本文事件日期:2026 年 5 月 20 日(阿里巴巴發表 Qwen 3.7-Max)。最後更新:2026 年 5 月 31 日。

Qwen 3.7-Max阿里巴巴長脈絡模型技術時事

相關文章

想了解更多 AI 解決方案?

我們的專業團隊隨時準備為您提供客製化的 AI 轉型建議