Midjourney V8.1 Alpha 完整解析:從底層重寫到社群爭議,AI 繪圖進入新架構時代
Midjourney 在 2026 年 3 月 17 日發布 V8 Alpha,接著在 4 月中旬推出 V8.1,完成了自創立以來最大規模的架構重寫。 這次不是調參數、不是換訓練資料,是把整個程式碼基底從 TPU 搬到 GPU 原生架構(PyTorch),生成速度提升約 5 倍,原生支援 2K 解析度,文字渲染準確率也大幅改善。但社群反應兩極——Reddit 的 r/midjourney(68 萬成員)和 X 上的創作者對 V8 Alpha 的評價從「終於能打字了」到「把 V7 的靈魂搞丟了」都有。V8.1 的推出就是為了回應這些批評,但問題是:一個 60 人的研究實驗室,能同時解決速度、品質和創意自由度的三角矛盾嗎?
架構重寫:這次改的是地基,不是裝潢
先講技術面。Midjourney 從 V1 到 V7 都是在同一套架構上疊加新功能,像老房子加蓋——能住,但水電管線越來越混亂。V8 把房子拆了重蓋。
核心變更:
| 項目 | V7 及之前 | V8 Alpha / V8.1 |
|---|---|---|
| 運算架構 | TPU | GPU 原生(PyTorch) |
| 標準生成速度 | 基準 | 約 5 倍(V8 Alpha);V8.1 標準 1K 比 V7 Draft 還快 |
| 原生解析度 | 1024×1024(需另行放大) | 2K 原生(--hd 參數) |
| 文字渲染 | 經常出錯 | 短文字明顯改善(引號包裹時) |
| 風格參考(sref) | --sv 1 到 --sv 6 | V8 Alpha 僅 --sv 6 和 --sv 7;V8.1 改進 moodboard |
| Prompt 解讀 | 偏向藝術詮釋 | 偏向字面執行 |
| 預設美學 | 有 Midjourney 標誌性「畫意感」 | V8 Alpha 偏中性、過度打磨;V8.1 修正回來 |
這裡的關鍵字是「GPU 原生」。之前的 TPU 架構有效能天花板,新功能要繞過舊限制才能跑。改成 PyTorch 之後,開發團隊能直接在 GPU 上做最佳化,HD 模式、Style Creator、更快的個人化演算法都是因為架構換了才做得到。
David Holz(Midjourney 創辦人,前 Leap Motion 共同創辦人)在 2025 年 11 月的 Office Hours 就預告 V8 會是「全面重寫」,2026 年 2 月的場次裡他語氣很興奮地說目標是 2 月底發布。實際上延到 3 月 17 日,先在 alpha.midjourney.com 開放測試。
V8 Alpha 的強項:速度、解析度、文字
V8 Alpha 做到三件 V7 做不到的事。
速度。 標準生成大約快 5 倍。以前 30-60 秒的圖,現在 10 秒內出來。Web 介面同步升級了,設定搬到側邊欄、新增 Grid Mode 可以一次看大量圖片、對話模式讓 prompt 寫起來更像聊天。對需要快速迭代的商業用途來說,這是真正有感的提升。
原生 2K。 --hd 參數讓圖片直接以 2048px 生成,不用先出 1024 再放大。差別在哪?直接生成的 2K 圖在紋理、邊緣、細節密度上都比放大版乾淨。對要做大圖輸出的設計師和攝影師很重要。
文字渲染。 把要顯示的文字用引號包起來(例如 a poster reading "Hello World"),V8 的準確率比 V7 高很多。短文字(品牌名、路牌、標籤)基本能用了,這在之前幾乎不可能。但長段文字還是會出錯——整個產業都還沒解決這個問題,Ideogram 和 Recraft V4 在長文字上還是比較穩。
V8 Alpha 的痛點:社群為什麼吵起來
V8 Alpha 的問題不在技術規格,在「感覺」。
失去了 V7 的創意意外。 V7 是詮釋型模型。你給一個模糊的 prompt——「森林裡的女人」——它會自己加光影、構圖、氛圍,出來的東西常常超出預期。V8 Alpha 改成字面執行,同樣的 prompt 出來可能技術上正確但視覺上平淡。r/midjourney 上有用戶形容是「相機很準,但攝影師不見了」。
預設美學過度打磨。 V8 Alpha 的預設輸出有一層明顯的「AI 光澤」——太乾淨、太完美。Midjourney 團隊自己也承認這個問題,建議用戶先切 --raw 模式去掉預設風格濾鏡。但這等於把調整負擔轉嫁給用戶。
舊 sref 碼不能用了。 V8 Alpha 只支援 --sv 6 和 --sv 7,之前的 --sv 1 到 --sv 5 全部失效。對已經建立了大量風格碼庫的進階用戶來說,這很痛。一位 Substack 測試者寫道:「我還有一堆 --sv 4 的碼能產出很漂亮的結果。不太懂為什麼團隊要拿掉向下相容。」
HD 模式太貴。 --hd 和 --q 4 各耗 4 倍 GPU 時間和費用。兩個一起用就是 16 倍。V8 Alpha 初期甚至沒有 Relax Mode(3 月 20 日才補上),對重度用戶來說,快速時數很快就會燒完。
圖片 Prompt 消失了。 V8 Alpha 上線時沒有 image prompting 和 in-painting 功能,對很多商業用戶來說,這是核心工作流程的一部分。
V8.1:針對社群批評的回應
Midjourney 在 4 月 1 日的 Office Hours 確認 V8.1 即將發布,隨後在 X 上宣布上線。V8.1 的官方推文說得很直接:「我們標誌性的美學回來了。」
V8.1 的具體改進:
| 項目 | V8 Alpha | V8.1 |
|---|---|---|
| 預設美學 | 過度打磨、偏中性 | 恢復 Midjourney 標誌性風格 |
| HD 模式成本 | 4 倍 GPU 時間 | 目標 1.5-2.5 倍(大幅降低) |
| HD 速度 | 基準 | 比 V8 Alpha 快 3 倍 |
| 圖片 Prompt | 不支援 | 恢復支援 |
| Describe 功能 | 不支援 | 新上線 |
| Moodboard / sref | --sv 7 有些問題 | 改進版 |
| 創意與連貫性 | 偏字面、缺乏驚喜 | 改善中 |
一個關鍵訊號:V8.0 Alpha 會在 V8.1 上線約兩週後被淘汰。這在 Midjourney 歷史上很罕見——V5.2、V6、V7 到現在都還能用。這表示團隊把 V8 Alpha 定位為過渡版本,不是正式產品。
Midjourney 內部測試的結論是:團隊在接近 100% 的場景下偏好 V8.1 勝過 V8.0。
Reddit 和 X 社群的真實反應
r/midjourney(68 萬成員)的主要論點:
贊成派認為速度提升是真的、人體解剖學(手、臉、身體比例)進步很大、文字渲染終於能用了、Style Creator 工具對品牌一致性有實際價值。
批評派則說 V8 Alpha 的輸出「視覺上平坦」、缺乏 V7 的藝術深度、HD 模式太貴用不起、沒有 Draft Mode 讓迭代變慢、個人化功能不如 V7 成熟。
價格討論是 Reddit 上的常態話題。r/midjourney 的共識是 Standard 方案(USD 30/月,約 NTD 960)是性價比最高的選擇,因為用完 15 小時 Fast GPU 後還有無限 Relax Mode。Basic 方案(USD 10/月,約 NTD 320)被社群直接評為「付費試用版」——3.3 小時 Fast GPU 大概只夠 200 張圖,一週就用完了。
X 上的創作者反饋:
Midjourney 官方帳號(41 萬追蹤者)在 3 月 20 日宣布 V8 Relax Mode 上線和新版 sref/Moodboard 時,回覆裡有用戶測試後表示「可控性明顯提升,但圖片本身沒有突然變好很多」。設計師社群的反應偏務實:V8 適合產品攝影、建築渲染、商業影像這些需要精確的場景,但概念藝術和氛圍探索還是 V7 比較好。
有一篇在 Substack 流傳很廣的設計師測試報告直接說:「V8 現在是地基,不是成品。工程能力明顯更強了。但創意體驗——我打開 Midjourney 而不是別的工具的原因——還沒追上架構。」
競爭格局:Midjourney 不再是唯一選擇
V8 Alpha 發布時,AI 繪圖市場已經和 2024 年很不一樣了。
| 工具 | 架構 | 強項 | 弱項 |
|---|---|---|---|
| Midjourney V8.1 | 純擴散模型(GPU/PyTorch) | 美學品質、氛圍、速度 | 無公開 API、長文字不穩、封閉生態系 |
| Recraft V4 | 混合架構 | 設計導向、文字渲染、向量輸出 | 藝術風格選擇較少 |
| Google Imagen 3 | 混合架構(自回歸+擴散) | Prompt 精準度、場景正確性 | 創意彈性不如 Midjourney |
| GPT Image(OpenAI) | 自回歸 | 整合 ChatGPT 生態、Prompt 理解力 | 美學風格較通用 |
| FLUX | 開源基底 | 可自架、高客製化 | 需要技術門檻 |
| Stable Diffusion | 開源 | 免費、完全控制 | 需要硬體和技術知識 |
The Decoder 的測試指出,Midjourney 作為純擴散模型,在「馬騎太空人」這類需要邏輯理解的複雜 prompt 上仍然不如 Imagen 3 和 GPT Image 等混合架構模型。V8 縮小了差距但沒有完全消除。
對 Midjourney 來說,最大的策略風險可能不是圖片品質,而是封閉生態系。到 2026 年 4 月為止,Midjourney 仍然沒有公開 API。開發者和團隊無法把它整合進自動化工作流程或產品管線。Recraft、FLUX 和 Stable Diffusion 都提供 API 或開源方案。
Midjourney V8 的定價結構
| 方案 | 月費 | 年繳月費 | Fast GPU 時數 | Relax Mode | Stealth Mode |
|---|---|---|---|---|---|
| Basic | USD 10(約 NTD 320) | USD 8(約 NTD 256) | 3.3 小時 | ❌ | ❌ |
| Standard | USD 30(約 NTD 960) | USD 24(約 NTD 768) | 15 小時 | ✅ 無限 | ❌ |
| Pro | USD 60(約 NTD 1,920) | USD 48(約 NTD 1,536) | 30 小時 | ✅ 無限 | ✅ |
| Mega | USD 120(約 NTD 3,840) | USD 96(約 NTD 3,072) | 60 小時 | ✅ 無限 | ✅ |
V8 的 --hd 和 --q 4 在 V8 Alpha 時各耗 4 倍 GPU 時間。V8.1 把 HD 成本降到約 1.5-2.5 倍。所有方案都包含商業使用權,但年營收超過 USD 100 萬的企業需要 Pro 或 Mega 方案。
實務建議:現在該怎麼用
如果你已經有 Midjourney 訂閱: 測試 V8.1,特別是搭配 --raw 模式。你的 V7 個人化設定檔會轉移過來。但先不要刪掉 V7 的工作流程——概念探索和氛圍型創作,V7 可能還是比較順手。
如果你是新用戶: 先用 Standard 方案(USD 30/月)試一個月。V8.1 對知道自己要什麼的用戶特別友善——prompt 越具體,結果越好。把 --stylize 推到 400-1000 的範圍會有明顯效果。
如果你需要 API 整合: Midjourney 目前沒有公開 API。需要程式化存取的話,考慮 Recraft、FLUX 或透過第三方服務(如 WaveSpeedAI)間接使用 Midjourney 模型。
如果你做品牌設計: Style Creator 和 Moodboard 是 V8 系列的殺手功能。建好一組風格碼,分享給團隊,所有人用同一個 --sref 碼就能維持視覺一致性。
V8.1 之後的路線圖
根據 Office Hours 透露的資訊,Midjourney 接下來的計畫包括:
- 編輯模型(editing model)
- V2 影片模型(video model)
- 3D 功能(含攝影機移動)
- 統一的編輯器介面
- OREF/CREF 的替代方案(不在 V8.1 範圍內)
Midjourney 目前是一個 60 人的團隊、自負盈虧(David Holz 在 2022 年就說過公司已經獲利)。在 OpenAI、Google、Adobe 都在投入圖像生成的局面下,Midjourney 的策略很清楚:不靠規模打,靠美學品味和社群黏著度。V8.1 就是在告訴社群:「我們聽到了,而且我們修得很快。」
這策略能撐多久,要看 V8.1 的實際表現能不能讓那些已經切回 V7 的用戶願意回來。
常見問題
Midjourney V8.1 跟 V8 Alpha 差在哪?
V8.1 恢復了 Midjourney 的標誌性美學風格(V8 Alpha 被批評過度打磨),HD 模式速度提升 3 倍、成本從 4 倍 GPU 降到約 1.5-2.5 倍,圖片 Prompt 功能回來了,新增 Describe 功能,moodboard 和 sref 也做了改進。V8 Alpha 會在 V8.1 上線約兩週後被淘汰。
Midjourney V8 的 --hd 模式是什麼?
--hd 讓圖片直接以 2K(2048px)解析度生成,不需要先出 1024px 再放大。原生 2K 的紋理、邊緣和細節密度都比放大版乾淨。在 V8 Alpha 時耗 4 倍 GPU 時間,V8.1 降到約 1.5-2.5 倍。團隊正在評估是否讓 HD 成為預設模式。
為什麼有些創作者說 V8 不如 V7?
主要原因是 V8 從「詮釋型」變成「字面型」模型。V7 會自動為模糊 prompt 加上藝術詮釋(光影、構圖、氛圍),V8 則嚴格按照 prompt 執行。對依賴「創意意外」做概念探索的設計師來說,V8 Alpha 感覺少了靈魂。V8.1 在創意和連貫性上做了改進,但根本的詮釋邏輯差異仍在。
Midjourney 有公開 API 嗎?
截至 2026 年 4 月,Midjourney 沒有公開 API。所有生成都透過 Web 介面(alpha.midjourney.com 或主站)和 Discord 進行。需要程式化存取的開發者可以考慮 Recraft、FLUX 的 API,或 WaveSpeedAI 等第三方整合服務。
現在值得訂閱 Midjourney 嗎?
如果你做視覺創作且預算允許,Standard 方案(USD 30/月,約 NTD 960)是最實用的選擇。V8.1 的速度和美學改進讓它在風格化影像和氛圍創作上還是業界領先。但如果你需要精確的文字渲染(長段文字)、API 整合或完全免費的方案,Recraft V4、FLUX 或 Stable Diffusion 可能更適合你的需求。
引用來源
- Midjourney 官方 V8 Alpha 發布公告
- Midjourney 官方文件 — Version
- The Decoder — Midjourney V8 rolls out with 5x faster generation
- House of GAI — MidJourney V8 for Designers: What's Real, What's Hype
- Midjourney X 官方帳號 — V8.1 上線公告
Author Insight
我們團隊在 AI 影像生成工具的實際導入經驗裡觀察到一個模式:每次有工具做大改版,企業端的反應不是「要不要換」,而是「哪個版本適合哪個流程」。Midjourney V8 的架構重寫放在產業脈絡裡看,其實跟我們協助客戶從 Cursor 遷移到 Claude Code 的經驗很像——底層換了,上層工作流程需要重新校準,但長期效益是真的。目前比較務實的做法是 V7 和 V8.1 並行:品牌一致性和產品影像用 V8.1 的 Style Creator + --raw,概念發想和氛圍板用 V7。等 V8.1 的個人化演算法更成熟後再全面切換。
如果你正在評估 AI 影像工具在企業的導入策略,或想了解怎麼把 Midjourney、Nano Banana Pro 和其他 AI 繪圖工具整合進內容產製流程,歡迎跟 Tenten 團隊預約諮詢。
Erik (EKC), Digital Strategy Director at Tenten.co
