n8n Claude Gemini 多模型 AI 成本優化

n8n + Claude / Gemini 多模型切換:不被單一 AI 綁死

別只用 OpenAI!這篇教你在 n8n 中串接 Claude、Gemini、Groq 等多個 AI 模型,並設計自動切換機制,省錢又穩定。

N8NMarket 2026年4月7日 10 分鐘閱讀

很多人串好 n8n + OpenAI 之後就停在那裡了。但只用一個 AI 模型有三個問題:被綁死、花太多、掛了就完蛋。

這篇教你怎麼在 n8n 裡串接 Claude、Gemini 等多個 AI 模型,然後用 IF 節點做智慧路由——簡單任務用便宜模型,複雜任務用強模型,某家 API 掛了自動切到備援。

為什麼不該只用一個 AI 模型?

1. 成本問題

不是每個任務都需要用到頂級模型。摘要一封信用 GPT-4o?太浪費了。用 Gemini Flash-Lite 一樣好,費用差 25 倍。

2. 穩定性問題

2025 年 OpenAI 有過好幾次 API 大當機。如果你的工作流只接 OpenAI,它掛了你就掛了。有備援模型,一家掛了自動切到另一家。

3. 任務適配問題

不同模型擅長不同的事:

  • Claude:長文分析、程式碼、細膩的推理
  • GPT-4o:通用任務、工具呼叫
  • Gemini:多模態(圖片+文字)、長上下文
  • Groq / Ollama:速度快、跑開源模型

選對模型做對事,結果更好、錢花更少。

n8n 支援哪些 AI 模型?

n8n 透過 LangChain 整合,原生支援的 Chat Model 節點包括(來源:n8n 官方文件):

模型n8n 節點名稱特點
OpenAI GPT-4oOpenAI Chat Model通用、tool calling 強
Anthropic ClaudeAnthropic Chat Model推理深度、長文
Google GeminiGoogle Gemini Chat Model多模態、長上下文
GroqGroq Chat Model超快推理速度
Ollama(本地)Ollama Chat Model免費、資料不出機器
Azure OpenAIAzure OpenAI Chat Model企業合規

每個都是獨立的子節點,可以掛到 AI Agent 或 Chain 節點上。

Claude 串接教學

Step 1 — 取得 API Key

  1. Anthropic Console 註冊
  2. API KeysCreate Key
  3. 複製 Key

Step 2 — 在 n8n 設定憑證

  1. n8n → Credentials → Add Credential
  2. 搜尋 Anthropic
  3. 貼上 API Key → Save

Step 3 — 使用 Anthropic Chat Model 節點

在 AI Agent 或 Chain 節點中:

  1. 拉一條線到 Anthropic Chat Model 子節點
  2. Model 選 claude-sonnet-4-20250514(性價比好)或 claude-opus-4-20250514(推理強)
  3. 搞定

Claude 的 API 定價(2026 年 3 月,來源:Anthropic 定價頁):

模型Input/M tokensOutput/M tokens
Opus 4.6$5.00$25.00
Sonnet 4$3.00$15.00
Haiku 3.5$0.25$1.25

Gemini 串接教學

Step 1 — 取得 API Key

  1. Google AI Studio 登入
  2. Get API KeyCreate API Key
  3. 選擇或建立一個 Google Cloud 專案
  4. 複製 Key

Step 2 — 在 n8n 設定憑證

  1. n8n → Credentials → Add Credential
  2. 搜尋 Google Gemini
  3. 貼上 API Key → Save

Step 3 — 使用 Google Gemini Chat Model 節點

跟 Claude 一樣,在 AI Agent 節點拉一條線過去就好。

Gemini 的 API 定價(2026 年 3 月,來源:Google AI 定價頁):

模型Input/M tokensOutput/M tokens
Gemini 2.5 Pro$1.25$10.00
Gemini 2.5 Flash$0.30$2.50
Gemini 2.5 Flash-Lite$0.10$0.40

Flash-Lite 是目前主流 AI 模型中最便宜的——$0.10/M input tokens,比 GPT-4o 便宜 25 倍。

用 IF 節點做智慧路由

重頭戲來了。怎麼讓工作流自動選模型?

策略一:根據任務類型選模型

Trigger

Switch 節點(判斷任務類型)
    ├── 「摘要」→ Gemini Flash-Lite(便宜)
    ├── 「分析」→ Claude Sonnet(推理強)
    ├── 「翻譯」→ GPT-4o(通用好)
    └── 「預設」→ GPT-4o-mini(便宜通用)

在 Switch 節點設定條件,判斷輸入內容的類型,然後走不同的路徑——每條路徑接不同的 AI 模型。

策略二:Fallback 機制(主模型掛了自動切換)

Trigger

OpenAI GPT-4o(主要模型)

IF 節點(檢查是否有錯誤)
    ├── 成功 → 繼續流程
    └── 錯誤 → Claude Sonnet(備援模型)

n8n 的 Error Trigger 節點可以抓到 API 錯誤。搭配 IF 節點,就能做到「OpenAI 掛了自動用 Claude」。

詳細的錯誤處理做法,可以參考 n8n 錯誤處理與重試機制

策略三:成本控制(超過預算自動降級)

Trigger

Code 節點(計算今日已用 token 數)

IF 節點(今日用量 > 閾值?)
    ├── 沒超過 → GPT-4o(正常用)
    └── 超過了 → Gemini Flash-Lite(省錢模式)

用 Code 節點從 OpenAI 的 usage API 讀取當日用量,超過預算就自動切換到便宜模型。

成本比較表

一次看清楚,選什麼模型花多少錢:

模型Input/MOutput/M特色適合
GPT-4o$2.50$10.00通用強主力模型
GPT-4o-mini$0.15$0.60便宜夠用簡單任務
Claude Sonnet$3.00$15.00推理深分析、程式
Claude Haiku$0.25$1.25快又便宜分類、摘要
Gemini 2.5 Pro$1.25$10.00長上下文長文件分析
Gemini Flash$0.30$2.50平衡大部分任務
Gemini Flash-Lite$0.10$0.40超便宜大量簡單任務
Groq(Llama)~$0.05~$0.10超快即時回應

實測建議:主力用 GPT-4o 或 Claude Sonnet,簡單任務用 GPT-4o-mini 或 Gemini Flash-Lite,備援互相切。這樣費用大概能省 60-70%。

多模型策略的注意事項

1. Prompt 可能要微調

不同模型對 prompt 的理解方式不太一樣。Claude 比較「聽話」,GPT 比較「有創意」。如果切換模型後效果變差,先檢查 prompt。

2. 輸出格式可能不同

同一個 prompt,不同模型的輸出格式可能有差異。建議在 prompt 中明確規定輸出格式(例如「請用 JSON 格式回覆」),或在 AI 後面加一個格式化節點。

3. Tool Calling 支援度不同

GPT-4o 和 Claude 的 tool calling 很成熟,Gemini 也支援但偶爾會有格式問題。如果你的 Agent 大量依賴工具,先測試目標模型的 tool calling 穩定度。

4. 記住 Memory 不共享

如果工作流中途切了模型,Memory(對話記憶)還是共用的。這通常不是問題,但要注意不同模型的 token 格式可能有差異。

下一步

學會多模型切換,你的 AI 工作流就更穩定、更省錢了。接下來可以:

本週限量包有多模型切換工作流模板,含 Fallback 機制和成本控制版 >> n8nstart.cc/weekly


常見問題 FAQ

用多個模型會不會很複雜?

不會。n8n 的好處就是每個模型都是一個子節點,拉線過去就接好了。多模型切換就是多幾個 IF 節點和路徑而已。

本地模型(Ollama)值得用嗎?

看需求。如果你的資料很敏感不能傳到外部、或者你有 GPU 伺服器想省 API 費用,Ollama 跑 Llama 系列模型是很好的選擇。但效果通常比 GPT-4o / Claude 差一截。

不同模型的回答品質差很多嗎?

看任務。簡單任務(摘要、分類、翻譯)各家差異不大,用便宜的就好。複雜任務(推理、分析、程式碼)差異比較明顯,建議用 GPT-4o 或 Claude Sonnet。