
轉自 https://vocus.cc/article/692d9c73fd89780001c37c8c--Z-Image Turbo 是近期(2025 年 11 月底至 12 月初)由 通義實驗室(Tongyi Lab,阿里巴巴旗下) 推出的全新開源 AI 繪圖模型。
它採用了與 Stable Diffusion 3 類似的先進架構,但在生成速度、中文理解能力以及文字渲染(在圖片中寫字)方面有顯著的突破,被許多 AI 繪圖愛好者視為能與 Flux 或 SD3 競爭的強大工具。
可至線上測試 Z-Image-Turbo
為什麼會看到廣告
以下是 Z-Image Turbo 的核心特色懶人包:
1. 核心技術與架構
架構: 採用 Scalable Single-Stream DiT (S3-DiT) 架構。這意味著它將文字(Prompt)和圖像的數據流合併處理,讓模型更能精準理解複雜的提示詞。速度極快 (Turbo): 經過「蒸餾(Distillation)」技術優化,只需要極少的步數(約 8 步)就能生成高品質圖片,比傳統模型快上許多。
2. 最大亮點:強大的文字渲染能力
這是 Z-Image Turbo 最受推崇的功能之一。
中英文雙語支援: 大多數國外模型(如 Midjourney, Flux)不太會寫中文字,生成的中文常是亂碼。但 Z-Image Turbo 可以精準地在圖片中生成正確的中文字(例如海報標題、招牌文字)。
排版能力: 能夠處理複雜的文字排版,適合用來製作海報、UI 介面草圖或電商圖。
18+: 瑟瑟圖 Prompt 指令完全不擋。
3. 硬體需求與便利性
顯存需求: 相較於某些巨型模型,它對硬體相對友善,據測試 16GB VRAM 的顯卡即可順暢運行(適合消費級顯卡,如 RTX 5060ti 等)。
開源與部署: 模型權重開放(Apache 2.0 協議),支援本地部署(例如透過 ComfyUI 或 WebUI),使用者可以在自己的電腦上免費使用,不用依賴付費訂閱服務。
4. 畫風與編輯
多風格支援: 擅長寫實人像、動漫風格以及 3D 渲染風格。可編輯性: 同系列還有 Z-Image-Edit 模型,支援透過自然語言指令來修圖(例如:「把原本的紅衣服改成藍色」),而不需要複雜的遮罩操作。
為什麼它現在很紅?
Z-Image Turbo 之所以受到關注,是因為它解決了 AI 繪圖長久以來的痛點——「看不懂中文指令」與「不會寫中文字」,同時還保持了極快的生成速度和開源免費的特性。對於華語圈的創作者來說,這是一個非常實用且強大的新選擇。
要在本地端使用 ComfyUI 運行 Z-Image Turbo,最推薦的方法是使用 ComfyUI 官方重製版(Comfy-Org repackage) 的模型權重,因為官方通常會優化模型格式(如將大檔案拆分為 Text Encoder 和 Diffusion Model),讓載入更順暢且節省顯存。
以下是保母級安裝與使用教學:
1. 至github 下載https://github.com/comfyanonymous/ComfyUI 可攜包
https://github.com/comfyanonymous/ComfyUI/releases/latest/download/ComfyUI_windows_portable_nvidia.7z
解壓縮檔案後,執行: D:\ComfyUI_windows_portable\run_nvidia_gpu.bat
如之前已安裝較舊版本的Comfyui,在 ComfyUI 的 update 文件夾中執行 update_comfyui.bat (Windows) 或透過 ComfyUI Manager 點擊 "Update ComfyUI"。
2. 下載模型檔案執行ComfyUI 上的模板Z-Image Turbo
3. 觸發下載主模型
您需要下載 三個主要檔案 並放入對應的資料夾。
放入對應位置:
4. 下 Prompt (可中英文),然後 "執行"
例如 Prompt: 18歲女學生成群結隊去買鹹酥雞,攤位名稱"老張鹹酥雞",內容字體必須是繁體中文。
例如 Prompt: 一張時尚雜誌風格,類似VOGUE,模特兒為20歲的韓國女子,穿著時尚洋裝,姿體優美,封面寫著: "最新秋冬服飾"封面字體必須是繁體中文。
https://vocus.cc/article/692d9c73fd89780001c37c8c