n8n + Claude / Gemini 多模型切換:不被單一 AI 綁死
別只用 OpenAI!這篇教你在 n8n 中串接 Claude、Gemini、Groq 等多個 AI 模型,並設計自動切換機制,省錢又穩定。
很多人串好 n8n + OpenAI 之後就停在那裡了。但只用一個 AI 模型有三個問題:被綁死、花太多、掛了就完蛋。
這篇教你怎麼在 n8n 裡串接 Claude、Gemini 等多個 AI 模型,然後用 IF 節點做智慧路由——簡單任務用便宜模型,複雜任務用強模型,某家 API 掛了自動切到備援。
為什麼不該只用一個 AI 模型?
1. 成本問題
不是每個任務都需要用到頂級模型。摘要一封信用 GPT-4o?太浪費了。用 Gemini Flash-Lite 一樣好,費用差 25 倍。
2. 穩定性問題
2025 年 OpenAI 有過好幾次 API 大當機。如果你的工作流只接 OpenAI,它掛了你就掛了。有備援模型,一家掛了自動切到另一家。
3. 任務適配問題
不同模型擅長不同的事:
- Claude:長文分析、程式碼、細膩的推理
- GPT-4o:通用任務、工具呼叫
- Gemini:多模態(圖片+文字)、長上下文
- Groq / Ollama:速度快、跑開源模型
選對模型做對事,結果更好、錢花更少。
n8n 支援哪些 AI 模型?
n8n 透過 LangChain 整合,原生支援的 Chat Model 節點包括(來源:n8n 官方文件):
| 模型 | n8n 節點名稱 | 特點 |
|---|---|---|
| OpenAI GPT-4o | OpenAI Chat Model | 通用、tool calling 強 |
| Anthropic Claude | Anthropic Chat Model | 推理深度、長文 |
| Google Gemini | Google Gemini Chat Model | 多模態、長上下文 |
| Groq | Groq Chat Model | 超快推理速度 |
| Ollama(本地) | Ollama Chat Model | 免費、資料不出機器 |
| Azure OpenAI | Azure OpenAI Chat Model | 企業合規 |
每個都是獨立的子節點,可以掛到 AI Agent 或 Chain 節點上。
Claude 串接教學
Step 1 — 取得 API Key
- 到 Anthropic Console 註冊
- 點 API Keys → Create Key
- 複製 Key
Step 2 — 在 n8n 設定憑證
- n8n → Credentials → Add Credential
- 搜尋
Anthropic - 貼上 API Key → Save
Step 3 — 使用 Anthropic Chat Model 節點
在 AI Agent 或 Chain 節點中:
- 拉一條線到 Anthropic Chat Model 子節點
- Model 選
claude-sonnet-4-20250514(性價比好)或claude-opus-4-20250514(推理強) - 搞定
Claude 的 API 定價(2026 年 3 月,來源:Anthropic 定價頁):
| 模型 | Input/M tokens | Output/M tokens |
|---|---|---|
| Opus 4.6 | $5.00 | $25.00 |
| Sonnet 4 | $3.00 | $15.00 |
| Haiku 3.5 | $0.25 | $1.25 |
Gemini 串接教學
Step 1 — 取得 API Key
- 到 Google AI Studio 登入
- 點 Get API Key → Create API Key
- 選擇或建立一個 Google Cloud 專案
- 複製 Key
Step 2 — 在 n8n 設定憑證
- n8n → Credentials → Add Credential
- 搜尋
Google Gemini - 貼上 API Key → Save
Step 3 — 使用 Google Gemini Chat Model 節點
跟 Claude 一樣,在 AI Agent 節點拉一條線過去就好。
Gemini 的 API 定價(2026 年 3 月,來源:Google AI 定價頁):
| 模型 | Input/M tokens | Output/M tokens |
|---|---|---|
| Gemini 2.5 Pro | $1.25 | $10.00 |
| Gemini 2.5 Flash | $0.30 | $2.50 |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 |
Flash-Lite 是目前主流 AI 模型中最便宜的——$0.10/M input tokens,比 GPT-4o 便宜 25 倍。
用 IF 節點做智慧路由
重頭戲來了。怎麼讓工作流自動選模型?
策略一:根據任務類型選模型
Trigger
↓
Switch 節點(判斷任務類型)
├── 「摘要」→ Gemini Flash-Lite(便宜)
├── 「分析」→ Claude Sonnet(推理強)
├── 「翻譯」→ GPT-4o(通用好)
└── 「預設」→ GPT-4o-mini(便宜通用)
在 Switch 節點設定條件,判斷輸入內容的類型,然後走不同的路徑——每條路徑接不同的 AI 模型。
策略二:Fallback 機制(主模型掛了自動切換)
Trigger
↓
OpenAI GPT-4o(主要模型)
↓
IF 節點(檢查是否有錯誤)
├── 成功 → 繼續流程
└── 錯誤 → Claude Sonnet(備援模型)
n8n 的 Error Trigger 節點可以抓到 API 錯誤。搭配 IF 節點,就能做到「OpenAI 掛了自動用 Claude」。
詳細的錯誤處理做法,可以參考 n8n 錯誤處理與重試機制。
策略三:成本控制(超過預算自動降級)
Trigger
↓
Code 節點(計算今日已用 token 數)
↓
IF 節點(今日用量 > 閾值?)
├── 沒超過 → GPT-4o(正常用)
└── 超過了 → Gemini Flash-Lite(省錢模式)
用 Code 節點從 OpenAI 的 usage API 讀取當日用量,超過預算就自動切換到便宜模型。
成本比較表
一次看清楚,選什麼模型花多少錢:
| 模型 | Input/M | Output/M | 特色 | 適合 |
|---|---|---|---|---|
| GPT-4o | $2.50 | $10.00 | 通用強 | 主力模型 |
| GPT-4o-mini | $0.15 | $0.60 | 便宜夠用 | 簡單任務 |
| Claude Sonnet | $3.00 | $15.00 | 推理深 | 分析、程式 |
| Claude Haiku | $0.25 | $1.25 | 快又便宜 | 分類、摘要 |
| Gemini 2.5 Pro | $1.25 | $10.00 | 長上下文 | 長文件分析 |
| Gemini Flash | $0.30 | $2.50 | 平衡 | 大部分任務 |
| Gemini Flash-Lite | $0.10 | $0.40 | 超便宜 | 大量簡單任務 |
| Groq(Llama) | ~$0.05 | ~$0.10 | 超快 | 即時回應 |
實測建議:主力用 GPT-4o 或 Claude Sonnet,簡單任務用 GPT-4o-mini 或 Gemini Flash-Lite,備援互相切。這樣費用大概能省 60-70%。
多模型策略的注意事項
1. Prompt 可能要微調
不同模型對 prompt 的理解方式不太一樣。Claude 比較「聽話」,GPT 比較「有創意」。如果切換模型後效果變差,先檢查 prompt。
2. 輸出格式可能不同
同一個 prompt,不同模型的輸出格式可能有差異。建議在 prompt 中明確規定輸出格式(例如「請用 JSON 格式回覆」),或在 AI 後面加一個格式化節點。
3. Tool Calling 支援度不同
GPT-4o 和 Claude 的 tool calling 很成熟,Gemini 也支援但偶爾會有格式問題。如果你的 Agent 大量依賴工具,先測試目標模型的 tool calling 穩定度。
4. 記住 Memory 不共享
如果工作流中途切了模型,Memory(對話記憶)還是共用的。這通常不是問題,但要注意不同模型的 token 格式可能有差異。
下一步
學會多模型切換,你的 AI 工作流就更穩定、更省錢了。接下來可以:
- 還沒串過 AI?先看 n8n + OpenAI 串接入門
- 想讓 AI 用更多外部工具?看 n8n + MCP 整合實戰
- 想了解 AI Agent 架構?看 n8n AI Agent 工作流設計模式
- 回到完整學習路徑:n8n + AI Agent 實戰指南
本週限量包有多模型切換工作流模板,含 Fallback 機制和成本控制版 >> n8nstart.cc/weekly
常見問題 FAQ
用多個模型會不會很複雜?
不會。n8n 的好處就是每個模型都是一個子節點,拉線過去就接好了。多模型切換就是多幾個 IF 節點和路徑而已。
本地模型(Ollama)值得用嗎?
看需求。如果你的資料很敏感不能傳到外部、或者你有 GPU 伺服器想省 API 費用,Ollama 跑 Llama 系列模型是很好的選擇。但效果通常比 GPT-4o / Claude 差一截。
不同模型的回答品質差很多嗎?
看任務。簡單任務(摘要、分類、翻譯)各家差異不大,用便宜的就好。複雜任務(推理、分析、程式碼)差異比較明顯,建議用 GPT-4o 或 Claude Sonnet。