Midjourney V8.1 Alpha 完整解析:從底層重寫到社群爭議,AI 繪圖進入新架構時代

Midjourney 在 2026 年 3 月 17 日發布 V8 Alpha,接著在 4 月中旬推出 V8.1,完成了自創立以來最大規模的架構重寫。 這次不是調參數、不是換訓練資料,是把整個程式碼基底從 TPU 搬到 GPU 原生架構(PyTorch),生成速度提升約 5 倍,原生支援 2K 解析度,文字渲染準確率也大幅改善。但社群反應兩極——Reddit 的 r/midjourney(68 萬成員)和 X 上的創作者對 V8 Alpha 的評價從「終於能打字了」到「把 V7 的靈魂搞丟了」都有。V8.1 的推出就是為了回應這些批評,但問題是:一個 60 人的研究實驗室,能同時解決速度、品質和創意自由度的三角矛盾嗎?


架構重寫:這次改的是地基,不是裝潢

先講技術面。Midjourney 從 V1 到 V7 都是在同一套架構上疊加新功能,像老房子加蓋——能住,但水電管線越來越混亂。V8 把房子拆了重蓋。

核心變更:

項目 V7 及之前 V8 Alpha / V8.1
運算架構 TPU GPU 原生(PyTorch)
標準生成速度 基準 約 5 倍(V8 Alpha);V8.1 標準 1K 比 V7 Draft 還快
原生解析度 1024×1024(需另行放大) 2K 原生(--hd 參數)
文字渲染 經常出錯 短文字明顯改善(引號包裹時)
風格參考(sref) --sv 1 到 --sv 6 V8 Alpha 僅 --sv 6 和 --sv 7;V8.1 改進 moodboard
Prompt 解讀 偏向藝術詮釋 偏向字面執行
預設美學 有 Midjourney 標誌性「畫意感」 V8 Alpha 偏中性、過度打磨;V8.1 修正回來

這裡的關鍵字是「GPU 原生」。之前的 TPU 架構有效能天花板,新功能要繞過舊限制才能跑。改成 PyTorch 之後,開發團隊能直接在 GPU 上做最佳化,HD 模式、Style Creator、更快的個人化演算法都是因為架構換了才做得到。

David Holz(Midjourney 創辦人,前 Leap Motion 共同創辦人)在 2025 年 11 月的 Office Hours 就預告 V8 會是「全面重寫」,2026 年 2 月的場次裡他語氣很興奮地說目標是 2 月底發布。實際上延到 3 月 17 日,先在 alpha.midjourney.com 開放測試。


V8 Alpha 的強項:速度、解析度、文字

V8 Alpha 做到三件 V7 做不到的事。

速度。 標準生成大約快 5 倍。以前 30-60 秒的圖,現在 10 秒內出來。Web 介面同步升級了,設定搬到側邊欄、新增 Grid Mode 可以一次看大量圖片、對話模式讓 prompt 寫起來更像聊天。對需要快速迭代的商業用途來說,這是真正有感的提升。

原生 2K。 --hd 參數讓圖片直接以 2048px 生成,不用先出 1024 再放大。差別在哪?直接生成的 2K 圖在紋理、邊緣、細節密度上都比放大版乾淨。對要做大圖輸出的設計師和攝影師很重要。

文字渲染。 把要顯示的文字用引號包起來(例如 a poster reading "Hello World"),V8 的準確率比 V7 高很多。短文字(品牌名、路牌、標籤)基本能用了,這在之前幾乎不可能。但長段文字還是會出錯——整個產業都還沒解決這個問題,IdeogramRecraft V4 在長文字上還是比較穩。


V8 Alpha 的痛點:社群為什麼吵起來

V8 Alpha 的問題不在技術規格,在「感覺」。

失去了 V7 的創意意外。 V7 是詮釋型模型。你給一個模糊的 prompt——「森林裡的女人」——它會自己加光影、構圖、氛圍,出來的東西常常超出預期。V8 Alpha 改成字面執行,同樣的 prompt 出來可能技術上正確但視覺上平淡。r/midjourney 上有用戶形容是「相機很準,但攝影師不見了」。

預設美學過度打磨。 V8 Alpha 的預設輸出有一層明顯的「AI 光澤」——太乾淨、太完美。Midjourney 團隊自己也承認這個問題,建議用戶先切 --raw 模式去掉預設風格濾鏡。但這等於把調整負擔轉嫁給用戶。

舊 sref 碼不能用了。 V8 Alpha 只支援 --sv 6 和 --sv 7,之前的 --sv 1 到 --sv 5 全部失效。對已經建立了大量風格碼庫的進階用戶來說,這很痛。一位 Substack 測試者寫道:「我還有一堆 --sv 4 的碼能產出很漂亮的結果。不太懂為什麼團隊要拿掉向下相容。」

HD 模式太貴。 --hd--q 4 各耗 4 倍 GPU 時間和費用。兩個一起用就是 16 倍。V8 Alpha 初期甚至沒有 Relax Mode(3 月 20 日才補上),對重度用戶來說,快速時數很快就會燒完。

圖片 Prompt 消失了。 V8 Alpha 上線時沒有 image prompting 和 in-painting 功能,對很多商業用戶來說,這是核心工作流程的一部分。


V8.1:針對社群批評的回應

Midjourney 在 4 月 1 日的 Office Hours 確認 V8.1 即將發布,隨後在 X 上宣布上線。V8.1 的官方推文說得很直接:「我們標誌性的美學回來了。」

V8.1 的具體改進:

項目 V8 Alpha V8.1
預設美學 過度打磨、偏中性 恢復 Midjourney 標誌性風格
HD 模式成本 4 倍 GPU 時間 目標 1.5-2.5 倍(大幅降低)
HD 速度 基準 比 V8 Alpha 快 3 倍
圖片 Prompt 不支援 恢復支援
Describe 功能 不支援 新上線
Moodboard / sref --sv 7 有些問題 改進版
創意與連貫性 偏字面、缺乏驚喜 改善中

一個關鍵訊號:V8.0 Alpha 會在 V8.1 上線約兩週後被淘汰。這在 Midjourney 歷史上很罕見——V5.2、V6、V7 到現在都還能用。這表示團隊把 V8 Alpha 定位為過渡版本,不是正式產品。

Midjourney 內部測試的結論是:團隊在接近 100% 的場景下偏好 V8.1 勝過 V8.0。


Reddit 和 X 社群的真實反應

r/midjourney(68 萬成員)的主要論點:

贊成派認為速度提升是真的、人體解剖學(手、臉、身體比例)進步很大、文字渲染終於能用了、Style Creator 工具對品牌一致性有實際價值。

批評派則說 V8 Alpha 的輸出「視覺上平坦」、缺乏 V7 的藝術深度、HD 模式太貴用不起、沒有 Draft Mode 讓迭代變慢、個人化功能不如 V7 成熟。

價格討論是 Reddit 上的常態話題。r/midjourney 的共識是 Standard 方案(USD 30/月,約 NTD 960)是性價比最高的選擇,因為用完 15 小時 Fast GPU 後還有無限 Relax Mode。Basic 方案(USD 10/月,約 NTD 320)被社群直接評為「付費試用版」——3.3 小時 Fast GPU 大概只夠 200 張圖,一週就用完了。

X 上的創作者反饋:

Midjourney 官方帳號(41 萬追蹤者)在 3 月 20 日宣布 V8 Relax Mode 上線和新版 sref/Moodboard 時,回覆裡有用戶測試後表示「可控性明顯提升,但圖片本身沒有突然變好很多」。設計師社群的反應偏務實:V8 適合產品攝影、建築渲染、商業影像這些需要精確的場景,但概念藝術和氛圍探索還是 V7 比較好。

有一篇在 Substack 流傳很廣的設計師測試報告直接說:「V8 現在是地基,不是成品。工程能力明顯更強了。但創意體驗——我打開 Midjourney 而不是別的工具的原因——還沒追上架構。」


競爭格局:Midjourney 不再是唯一選擇

V8 Alpha 發布時,AI 繪圖市場已經和 2024 年很不一樣了。

工具 架構 強項 弱項
Midjourney V8.1 純擴散模型(GPU/PyTorch) 美學品質、氛圍、速度 無公開 API、長文字不穩、封閉生態系
Recraft V4 混合架構 設計導向、文字渲染、向量輸出 藝術風格選擇較少
Google Imagen 3 混合架構(自回歸+擴散) Prompt 精準度、場景正確性 創意彈性不如 Midjourney
GPT Image(OpenAI) 自回歸 整合 ChatGPT 生態、Prompt 理解力 美學風格較通用
FLUX 開源基底 可自架、高客製化 需要技術門檻
Stable Diffusion 開源 免費、完全控制 需要硬體和技術知識

The Decoder 的測試指出,Midjourney 作為純擴散模型,在「馬騎太空人」這類需要邏輯理解的複雜 prompt 上仍然不如 Imagen 3 和 GPT Image 等混合架構模型。V8 縮小了差距但沒有完全消除。

對 Midjourney 來說,最大的策略風險可能不是圖片品質,而是封閉生態系。到 2026 年 4 月為止,Midjourney 仍然沒有公開 API。開發者和團隊無法把它整合進自動化工作流程或產品管線。Recraft、FLUX 和 Stable Diffusion 都提供 API 或開源方案。


Midjourney V8 的定價結構

方案 月費 年繳月費 Fast GPU 時數 Relax Mode Stealth Mode
Basic USD 10(約 NTD 320) USD 8(約 NTD 256) 3.3 小時
Standard USD 30(約 NTD 960) USD 24(約 NTD 768) 15 小時 ✅ 無限
Pro USD 60(約 NTD 1,920) USD 48(約 NTD 1,536) 30 小時 ✅ 無限
Mega USD 120(約 NTD 3,840) USD 96(約 NTD 3,072) 60 小時 ✅ 無限

V8 的 --hd--q 4 在 V8 Alpha 時各耗 4 倍 GPU 時間。V8.1 把 HD 成本降到約 1.5-2.5 倍。所有方案都包含商業使用權,但年營收超過 USD 100 萬的企業需要 Pro 或 Mega 方案。


實務建議:現在該怎麼用

如果你已經有 Midjourney 訂閱: 測試 V8.1,特別是搭配 --raw 模式。你的 V7 個人化設定檔會轉移過來。但先不要刪掉 V7 的工作流程——概念探索和氛圍型創作,V7 可能還是比較順手。

如果你是新用戶: 先用 Standard 方案(USD 30/月)試一個月。V8.1 對知道自己要什麼的用戶特別友善——prompt 越具體,結果越好。把 --stylize 推到 400-1000 的範圍會有明顯效果。

如果你需要 API 整合: Midjourney 目前沒有公開 API。需要程式化存取的話,考慮 Recraft、FLUX 或透過第三方服務(如 WaveSpeedAI)間接使用 Midjourney 模型。

如果你做品牌設計: Style Creator 和 Moodboard 是 V8 系列的殺手功能。建好一組風格碼,分享給團隊,所有人用同一個 --sref 碼就能維持視覺一致性。


V8.1 之後的路線圖

根據 Office Hours 透露的資訊,Midjourney 接下來的計畫包括:

  • 編輯模型(editing model)
  • V2 影片模型(video model)
  • 3D 功能(含攝影機移動)
  • 統一的編輯器介面
  • OREF/CREF 的替代方案(不在 V8.1 範圍內)

Midjourney 目前是一個 60 人的團隊、自負盈虧(David Holz 在 2022 年就說過公司已經獲利)。在 OpenAI、Google、Adobe 都在投入圖像生成的局面下,Midjourney 的策略很清楚:不靠規模打,靠美學品味和社群黏著度。V8.1 就是在告訴社群:「我們聽到了,而且我們修得很快。」

這策略能撐多久,要看 V8.1 的實際表現能不能讓那些已經切回 V7 的用戶願意回來。


常見問題

Midjourney V8.1 跟 V8 Alpha 差在哪?

V8.1 恢復了 Midjourney 的標誌性美學風格(V8 Alpha 被批評過度打磨),HD 模式速度提升 3 倍、成本從 4 倍 GPU 降到約 1.5-2.5 倍,圖片 Prompt 功能回來了,新增 Describe 功能,moodboard 和 sref 也做了改進。V8 Alpha 會在 V8.1 上線約兩週後被淘汰。

Midjourney V8 的 --hd 模式是什麼?

--hd 讓圖片直接以 2K(2048px)解析度生成,不需要先出 1024px 再放大。原生 2K 的紋理、邊緣和細節密度都比放大版乾淨。在 V8 Alpha 時耗 4 倍 GPU 時間,V8.1 降到約 1.5-2.5 倍。團隊正在評估是否讓 HD 成為預設模式。

為什麼有些創作者說 V8 不如 V7?

主要原因是 V8 從「詮釋型」變成「字面型」模型。V7 會自動為模糊 prompt 加上藝術詮釋(光影、構圖、氛圍),V8 則嚴格按照 prompt 執行。對依賴「創意意外」做概念探索的設計師來說,V8 Alpha 感覺少了靈魂。V8.1 在創意和連貫性上做了改進,但根本的詮釋邏輯差異仍在。

Midjourney 有公開 API 嗎?

截至 2026 年 4 月,Midjourney 沒有公開 API。所有生成都透過 Web 介面(alpha.midjourney.com 或主站)和 Discord 進行。需要程式化存取的開發者可以考慮 Recraft、FLUX 的 API,或 WaveSpeedAI 等第三方整合服務。

現在值得訂閱 Midjourney 嗎?

如果你做視覺創作且預算允許,Standard 方案(USD 30/月,約 NTD 960)是最實用的選擇。V8.1 的速度和美學改進讓它在風格化影像和氛圍創作上還是業界領先。但如果你需要精確的文字渲染(長段文字)、API 整合或完全免費的方案,Recraft V4、FLUX 或 Stable Diffusion 可能更適合你的需求。


引用來源


Author Insight

我們團隊在 AI 影像生成工具的實際導入經驗裡觀察到一個模式:每次有工具做大改版,企業端的反應不是「要不要換」,而是「哪個版本適合哪個流程」。Midjourney V8 的架構重寫放在產業脈絡裡看,其實跟我們協助客戶從 Cursor 遷移到 Claude Code 的經驗很像——底層換了,上層工作流程需要重新校準,但長期效益是真的。目前比較務實的做法是 V7 和 V8.1 並行:品牌一致性和產品影像用 V8.1 的 Style Creator + --raw,概念發想和氛圍板用 V7。等 V8.1 的個人化演算法更成熟後再全面切換。

如果你正在評估 AI 影像工具在企業的導入策略,或想了解怎麼把 Midjourney、Nano Banana Pro 和其他 AI 繪圖工具整合進內容產製流程,歡迎跟 Tenten 團隊預約諮詢

Erik (EKC), Digital Strategy Director at Tenten.co

Share this post
Nora UX

The ultimate organizer who keeps projects on schedule, within budget, and moving smoothly from start to finish.

Loading...