阿里巴巴發表 Qwen 3.7-Max(2026 年 5 月):100 萬 token 脈絡、代理級推理,但這次「不開源」——台灣中小企業要不要用?
阿里巴巴於 2026 年 5 月 20 日在 Alibaba Cloud Summit 正式發表旗艦模型 Qwen 3.7-Max,把脈絡視窗從前代的 256K 一口氣倍增到 100 萬 token,並具備原生延伸思考(extended thinking)與代理級能力——但與 Qwen 過去的開源傳統不同,這次首度採閉源、只提供 API。 對台灣中小企業,這款模型最值得注意的不是 benchmark,而是「100 萬 token 脈絡」這件事——它讓「一次餵進整份合約、整本手冊、整季報表」的應用變得實際可行。
Qwen 3.7-Max 發生了什麼事?
阿里巴巴於 2026 年 5 月 20 日在 Alibaba Cloud Summit 正式發表 Qwen 3.7-Max,並早一天(5 月 19 日)就在 Alibaba Cloud Model Studio 上線商用 API。根據 Qwen 官方部落格(2026)與第三方整理,新版最大的躍進是脈絡視窗——從前代 Qwen3.6 Max 的 256K 直接倍增到 100 萬 token,並內建原生延伸思考模式(MarkTechPost, 2026)。
最值得台灣讀者留意的一點:Qwen 3.7-Max 首度採閉源、僅提供 API。 阿里巴巴過去以「開源 Qwen 系列」聞名(許多模型權重公開於 HuggingFace),但這款旗艦版截至 2026 年 5 月並未釋出權重,只能透過 Alibaba Cloud 的 DashScope / Model Studio 使用。這對重視「自行部署、資料不出境」的企業,是一個必須先想清楚的限制。
Qwen 3.7-Max 有哪些重點突破?
Qwen 3.7-Max 定位為「推理 + 代理」模型,重點集中在三方面:
- 100 萬 token 脈絡視窗——較前代 256K 倍增,可一次處理整份長合約、整本產品手冊、整季財報,無需切碎多次餵入。
- 整體智能明顯提升——在 Artificial Analysis Intelligence Index 拿到 56.6 分、整體排名第五,較前代 Qwen3.6 Max(51.8)提升 4.8 分;其中 CritPt 提升 9.7 個百分點、Humanity's Last Exam 提升 9.2 個百分點(MarkTechPost, 2026)。
- 代理與程式能力強——Terminal-Bench 2.0 達 69.7、SWE-Bench Pro 60.6、MCP-Atlas 76.4,在中文模型中屬第一梯隊;Arena 文字 Elo 達 1,475,排名第 13。
Qwen 3.7-Max 跟 DeepSeek、前代差在哪?(脈絡與能力對照)
時事文最常被搜尋的就是「Qwen vs DeepSeek」。下表把重點攤開對照:
| 面向 | Qwen 3.6 Max(前代) | Qwen 3.7-Max | DeepSeek V4-Pro |
|---|---|---|---|
| 脈絡視窗 | 256K | 100 萬 token | 較短 |
| 是否開源 | 部分開源 | 否(閉源、僅 API) | 是(權重公開) |
| 代理 / 程式 | 較弱 | SWE-Bench Pro 60.6、Terminal-Bench 2.0 69.7 | SWE-bench Verified 80.6% |
| 取得方式 | API / 部分自部署 | 僅 Alibaba Cloud API | API 或自部署 |
(資料來源:Qwen 官方部落格、MarkTechPost、Artificial Analysis,2026。各模型 benchmark 採各家公布之測項,非完全同一基準,僅供方向性對照。)
這張表的解讀關鍵:Qwen 3.7-Max 的最大差異化是『超長脈絡』,而非『最強程式能力』。 純比 coding,DeepSeek V4-Pro 的 SWE-bench 仍領先;但若你的痛點是「文件太長、一次塞不進去」,100 萬 token 的脈絡是 Qwen 3.7-Max 的關鍵賣點。另一個重大差別是開源——DeepSeek 可自部署把資料留在自家,Qwen 3.7-Max 目前只能走 Alibaba Cloud API。
定價說明:截至發表時,官方尚未公布 Qwen 3.7-Max 的正式 API 價格(前代 Qwen3.6 Max 約為每百萬 token 輸入 1.30 / 輸出 7.80 美元,部分第三方追蹤站報導新版約落在 2.50 / 7.50 美元區間)。實際費用請以 Alibaba Cloud Model Studio 官方公告為準。
開發者與產業怎麼看?
社群評價集中在「長脈絡很實用」與「閉源讓人意外」兩端。
正面評價集中在『長脈絡 + 性價比』——開發者實測後普遍認可,100 萬 token 脈絡讓長文件問答、整庫程式碼理解、長對話記憶等場景變得實際可行,而中文表現一向是 Qwen 系列的強項,對處理中文資料的企業特別友善。
保留意見集中在『閉源轉向』與『資料治理』——Qwen 一向以開源著稱,這次旗艦版首度閉源讓不少開發者意外,也削弱了「自行部署、資料留在自家」這個過去的核心優勢。部分企業使用者對「資料送往中國背景雲端」有合規疑慮,特別是涉及客戶個資、財務資料的應用。
從更大的產業框架看,這呼應 Gartner 對 2026 年的觀察:超長脈絡視窗正成為企業 AI 的關鍵競爭維度之一,因為它直接決定了「能不能一次處理完整的企業文件與知識庫」(Gartner, 2025)。但 Gartner 也提醒,模型選型必須把資料主權與合規一併納入評估。
這對台灣中小企業代表什麼?
對台灣中小企業,Qwen 3.7-Max 是「長文件 / 長脈絡應用」的有力新選項,但閉源與資料落地是必須先想清楚的前提。
機會面:
- 長文件處理變得實際可行——100 萬 token 脈絡讓「一次餵進整份合約、整本 SOP、整季報表做問答與摘要」不再需要複雜的切片工程,適合文件密集的產業。
- 中文表現友善——Qwen 系列在中文理解與生成上一向表現好,對處理中文客戶資料、合約、客服紀錄的台灣企業特別合適。
- 作為 RAG 的有力補充——超長脈絡可減少對複雜檢索(retrieval)架構的依賴,某些場景能直接「全文塞進去問」,簡化系統設計。
但要小心三件事:
- 閉源 = 無法自部署——目前只能走 Alibaba Cloud API,無法把模型搬到自家或中立雲端。涉及客戶個資、財務、營業機密的應用,要先確認資料流向與合規要求。
- 資料主權優先評估——若主力應用涉及敏感資料且有資料不出境要求,Qwen 3.7-Max 的 API-only 限制可能直接出局,這時開源的 DeepSeek 自部署反而更合適。
- 定價尚未明朗——正式 API 價格官方尚未完全公布,導入前務必以 Alibaba Cloud 官方報價試算實際成本,別只看第三方數字。
把超長脈絡能力接進 TanJee 做整份文件的問答與摘要、或接進 Dinkoko ERP 做長報表分析時,建議在架構上保留模型路由層——讓「長文件任務走 Qwen 3.7-Max、敏感資料走可自部署的開源模型、程式任務走 DeepSeek」,依任務類型與合規需求最佳化。
ACTGSYS 建議:現在該做什麼?
Qwen 3.7-Max 值得評估,尤其對文件密集、處理大量中文長文本的中小企業,但要在「長脈絡優勢」與「閉源 / 資料落地限制」之間權衡。
現在就做:
- 盤點『長文件 / 長脈絡』痛點——列出目前因「文件太長、AI 一次讀不完」而卡關的應用(合約審閱、長報表摘要、知識庫問答),這些最受惠於 100 萬 token 脈絡。
- 做資料治理分級——把應用分成「可上雲 API」與「須資料不出境」兩類;後者優先評估可自部署的開源模型,前者再評估 Qwen 3.7-Max。
- 針對長文件場景做 A/B 實測——用你最常見的長文件任務,比較 Qwen 3.7-Max 與現有方案的品質與成本(以 Alibaba Cloud 官方報價試算)。
先觀望:
- 敏感資料應用先別搬——涉及大量客戶個資且有合規要求的應用,在 API-only 限制下先維持現有方案。
- 等正式定價明朗再做大額承諾——在官方完整公布價格前,避免簽下大量用量承諾。
常見問題
Qwen 3.7-Max 在台灣可以用嗎?
可以,但僅能透過 Alibaba Cloud 的 DashScope / Model Studio API 使用,目前不提供模型權重自行部署。對涉及客戶個資、財務資料且有資料不出境要求的應用,須先確認資料流向與合規;這類場景可能更適合可自部署的開源模型。
Qwen 3.7-Max 開源嗎?跟以前的 Qwen 有什麼不同?
不開源。阿里巴巴過去以開源 Qwen 系列聞名(多款模型權重公開於 HuggingFace),但 Qwen 3.7-Max 是首度採閉源的旗艦版,截至 2026 年 5 月未釋出權重、僅提供 API。這也意味著它失去了「自行部署、資料留在自家」這個過去 Qwen 的核心優勢。
Qwen 3.7-Max 和 DeepSeek V4-Pro 怎麼選?
看痛點。若你的需求是「處理超長文件、一次塞進整份合約或手冊」,Qwen 3.7-Max 的 100 萬 token 脈絡是關鍵優勢;若你要的是最強的程式 / 軟體工程能力且需要自部署把資料留在自家,DeepSeek V4-Pro(SWE-bench 80.6%、開源)更合適。最務實的做法是依任務類型分流使用。
Qwen 3.7-Max 的 100 萬 token 脈絡能取代 RAG 嗎?
部分場景可以簡化,但不一定完全取代。超長脈絡讓「全文直接塞進去問」變得可行,能減少複雜檢索架構的負擔;但對超大型、持續更新的知識庫,RAG 在成本與即時性上仍有優勢。建議依資料量與更新頻率,評估「純長脈絡」「純 RAG」或「兩者混合」哪種最划算。
結語
Qwen 3.7-Max 的真正亮點是「100 萬 token 的超長脈絡」,讓長文件處理變得實際可行,中文表現也是台灣企業的加分項。但首度閉源、僅提供 Alibaba Cloud API 的轉向,讓「資料落地與合規」成為導入前必須先解決的前提。對台灣中小企業,正確的回應是「先盤點長文件痛點、做資料治理分級、用真實任務實測,並在架構上保留依任務分流不同模型的彈性」。
想為公司規劃一套「長文件用長脈絡模型、敏感資料走可自部署方案、依任務最佳化成本與合規」的 AI 架構?歡迎與 ACTGSYS 聯繫,我們協助台灣中小企業在快速更新的模型市場中,挑對工具、守住資料治理底線。
本文事件日期:2026 年 5 月 20 日(阿里巴巴發表 Qwen 3.7-Max)。最後更新:2026 年 5 月 31 日。
相關文章
Anthropic 發表 Claude Opus 4.8(2026 年 5 月):同價更強、還會「自己開一隊」併行做事,台灣中小企業該注意什麼?
Anthropic 於 2026 年 5 月 28 日發表 Claude Opus 4.8,維持與前代相同的每百萬 token 5 / 25 美元定價,agentic coding 從 64.3% 升到 69.2%,並推出可同時調度數百個子代理的「Dynamic Workflows」研究預覽。本文解析這次升級對台灣中小企業 AI 自動化的實際影響。
Google Gemini 3.5 Flash 發表(2026 年 5 月):Flash 打贏自家 Pro,但價格漲了 3 倍——台灣中小企業要不要換?
Google 於 2026 年 5 月 19 日在 I/O 2026 推出 Gemini 3.5 Flash,coding 與 agentic benchmark 全面超越 Gemini 3.1 Pro,但 API 價格較前代 Flash 漲 3 倍。本文解析新模型實力、價格策略意圖,以及台灣中小企業的因應重點。
Claude Managed Agents 新增「會做夢」與多代理協作(2026 年 5 月):自我學習的 AI 代理對中小企業意味著什麼?
Anthropic 於 2026 年 5 月 7 日在 Code with Claude 2026 為 Claude Managed Agents 推出 Dreaming(會做夢)、Outcomes、多代理協作與 Webhooks 四大新功能。本文解析這些技術變化如何改變 AI 代理的可用性,以及台灣中小企業現在該關注的重點。