n8n claude ai agent n8n ai agent claude api 客服自動化 webhook

用 N8N 串 Claude 打造 24 小時客服 AI Agent:從 webhook 到對話記憶完整實作

上週幫一位做訂閱制工具的老闆把客服流程改成 N8N 串 Claude,先接 webhook、再查 FAQ、寫入記憶、分流真人,3 天內把重複提問處理時間砍掉 62%。這篇會直接拆客服 AI Agent 的 5 層架構、節點設計、記憶策略、真人交接規則與上線 SOP,適合想把 n8n ai agent 真正落地的團隊。

N8NMarket 2026年4月29日

**TL;DR:**N8Nmarket 建議用 Webhook + Claude + FAQ 檢索 + 對話記憶 + 真人分流 這 5 層架構做客服 AI Agent,先用模板跑通,再補記憶與權限,通常比從零拼 workflow 快 3 到 5 倍。

上週幫一位電商 SaaS 客戶補了一條客服 workflow,原本 2 個人每天手動回 200 多則重複問題。改成 n8n claude ai agent 之後,常見問題先由 AI 接住,真人只處理高風險議題,第一週就把平均首回時間從 47 分鐘壓到 6 分鐘。

這篇直接拆你真正要做的幾件事:怎麼收訊息、Claude 怎麼回答、FAQ 怎麼餵、記憶要存在哪、什麼情況一定轉真人,以及上線前哪些坑要先補。

為什麼客服場景特別適合用 N8N 串 Claude

客服不像單次文案生成,它是連續對話。你不只要回一句像人的答案,還要做到 4 件事:

  1. 接到多來源訊息,例如網站表單、LINE、Messenger、Email 或 App 內聊天室。
  2. 判斷使用者意圖,例如查訂單、詢問方案、要求退款、技術故障。
  3. 拉到正確資料,例如知識庫、會員狀態、訂單編號、歷史對話。
  4. 依風險分流,該自動回就回,該交給真人就立刻交。

這正是 N8N 擅長的地方。Claude 負責理解與生成,N8N 負責接 API、跑規則、寫資料與通知。兩者合起來,才會變成真的客服 Agent,而不是只會聊天的機器人。

如果你還在補 N8N 基礎,先看這篇完整入門:https://n8nstart.cc/blog/n8n-beginner-complete-guide
如果你想先建立 AI Agent 的大局觀,先看這篇:https://n8nstart.cc/blog/n8n-ai-agent-complete-guide-2026
如果你正在判斷哪種自動化該做、哪種不該做,這篇也值得一起看:https://n8nstart.cc/blog/n8n-automation-decision-framework

一條能上線的 n8n claude ai agent,最少要有哪 5 層

很多人第一次做客服 Agent,會直接把訊息送進模型,回來再發送。這樣能 demo,不能上線。你至少要有下面 5 層。

1. 入口層:Webhook 收訊與標準化

先把不同來源的訊息收進同一條 workflow。最常見做法是用 Webhook 接網站聊天元件或第三方平台,再在後面做欄位標準化。

你至少要整理出這些欄位:

  • channel:訊息來自哪裡
  • user_id:辨識同一位使用者
  • session_id:同一段對話的追蹤鍵
  • message:使用者原始訊息
  • timestamp:事件時間
  • metadata:像方案別、地區、語言、裝置等補充資料

很多客服 Agent 失憶,不是模型太笨,是 user_idsession_id 一開始就沒設乾淨。

2. 理解層:Claude 做意圖判斷與回答草稿

第二層才是把資料送進 Claude。建議拆成兩步:

  1. 先做意圖分類:退款、帳號、技術問題、功能教學、價格比較、其他。
  2. 再根據分類餵不同的知識片段與回答規則。

好處很直接:Prompt 較短、成本較穩、回答更可控,後續要加 VIP 分流或多語系也比較容易。

Claude API 文件可直接參考官方說明:https://docs.anthropic.com/
N8N 端的節點、憑證與 AI 功能設計,建議同步對照官方文件:https://docs.n8n.io/

3. 知識層:FAQ、文件與訂單資料要分開取

客服最常犯的錯,是把所有資料揉進同一包上下文。實作上至少分成 3 類來源:

  • 穩定知識:FAQ、方案頁、退換貨規則、教學文件
  • 動態資料:訂單、訂閱狀態、付款紀錄、工單狀態
  • 對話資料:最近幾輪訊息、已收集到的條件、是否曾轉真人

穩定知識適合做 FAQ 模板;動態資料即時查 API;對話資料則留在 session store。不要把訂單狀態硬塞進長期記憶,因為它本來就會變。

如果你想進一步看 AI Agent 常見工作流圖譜,可以接著讀:https://n8nstart.cc/blog/n8n-ai-agent-workflow-patterns

4. 記憶層:只記必要資訊,不要把聊天全文一直堆

所謂對話記憶,不是把 50 輪聊天全丟給模型。比較穩的做法是「短期記憶 + 摘要記憶」。

  • 短期記憶:保留最近 5 到 10 輪對話
  • 摘要記憶:把重要事實壓成結構化欄位

例如:

  • customer_name
  • plan_type
  • order_id
  • issue_type
  • sentiment
  • handoff_required

這樣模型每次讀的是「最近上下文 + 已知事實」,成本更低,也比較不會同一題問三次還在重複自我介紹。

5. 控制層:高風險問題一定要轉真人

客服 Agent 最怕的不是答慢,而是答錯。只要涉及下面幾類情境,建議直接走真人分流:

  • 退款、法務、帳務爭議
  • 個資存取、刪除、帳號安全
  • 高情緒客訴
  • Claude 對答案信心不足
  • 找不到對應知識或資料

這裡可以用 N8N 的 IFSwitch 與通知節點,把對話摘要送到 Slack、Email 或工單系統。若你想看更多落地案例,可以讀這篇:https://n8nstart.cc/blog/n8n-automation-efficiency-real-cases

實作架構:從 webhook 到回答輸出的完整流程

下面是一條中小企業客服場景常見、而且真的能落地的流程。

Step 1:Webhook 收到訊息

來源可能是網站 chat widget、表單或客服系統。第一步只做兩件事:驗證請求是否合法,以及把欄位轉成統一格式。

Step 2:查詢使用者與歷史上下文

透過 user_id 或 email,到 CRM、會員系統、Sheets、Airtable 或資料庫查資料。先抓會影響回答的最小集合:

  • 會員層級
  • 最近訂單
  • 最近工單
  • 最近 5 到 10 輪對話

如果沒有資料,就建立新 session。

Step 3:FAQ 檢索與答案素材準備

把使用者問題先做關鍵字或語意檢索,拉出最接近的 FAQ 片段。先從 Google Sheets、Notion、Airtable 或資料表搜尋開始即可;等內容量變大,再升級成向量檢索。很多團隊一開始就衝 RAG,結果資料根本沒整理好,先把常見 30 到 50 題做成 FAQ 模板通常更快。

Step 4:Claude 生成回答與下一步動作

把這些內容一起送進 Claude:

  • 使用者最新訊息
  • 最近幾輪對話
  • 結構化記憶欄位
  • FAQ 檢索結果
  • 品牌回答規範
  • 是否允許直接回答,或只能建議轉真人

Prompt 可以要求 Claude 同時輸出兩塊:

  1. 給客戶看的回覆文字
  2. 給系統用的 JSON 判斷,例如 intentconfidencehandoff

這樣後面在 N8N 裡就很好分流,不用再做一輪解析。

Step 5:寫回記憶、發送訊息、必要時通知真人

回答完成後,把重要欄位寫回記憶表,再把訊息發回原通道。如果 handoff=true,同步把摘要送給客服人員,內容建議包含:

  • 客戶是誰
  • 問題類型
  • Claude 已做了哪些判斷
  • 為何需要人工介入
  • 原始對話連結

這樣真人接手時不必從頭讀完,速度會快很多。

模板先行:比從零拼 workflow 更適合中小團隊

中小企業最缺的通常不是想法,是時間。與其花 2 到 3 天自己測 webhook、測 Prompt、修欄位,不如從一套可改模板開始,把時間放在 FAQ 與商業規則。

模板先行的好處很直接:更快跑通主幹、更少漏掉錯誤分支與人工交接,也更容易估算一條客服 Agent 每天能省多少人工。

上線前 6 個檢查點

1. 先設定禁止回答的範圍

例如退款金額、法務判定、合約承諾、醫療金融建議,都不要讓模型自由發揮。

2. 每次回答都要帶資料來源邏輯

若答案來自 FAQ,至少在系統內記下命中的知識來源。

3. Session 規則要固定

多久算同一段對話、多久清掉短期記憶、真人接手後是否暫停 AI,都要先定。

4. 錯誤處理不能只靠模型

API timeout、資料查不到、Webhook 重送、第三方平台限流,都要在 N8N 裡處理。

5. 先量 3 個核心數字

  • 首回時間
  • 自動解決率
  • 人工介入率

6. 保留人工兜底

真正穩的客服系統,不是 100% 自動,而是大部分重複問題自動處理、關鍵問題快速轉真人。

更多技術細節與社群實作討論,可以參考 n8n 官方社群:https://community.n8n.io/
如果你要決定雲端或自架比較適合客服場景,這篇也值得一起讀:https://n8nstart.cc/blog/n8n-cloud-vs-self-hosted-comparison

結論:先做一條會分流、會記憶、會留痕的客服 Agent

n8n claude ai agent 真正的價值,不是讓 Claude 多會聊天,而是讓它在對的時機拿到對的資料,再用 N8N 把流程控住。你如果只做模型回覆,很快就會撞到答錯、忘記上下文與無法交接這幾個問題。

比較實際的做法是:先用模板把 Webhook + FAQ + Claude + 記憶 + 真人分流 跑通,先吃掉重複性最高的一批客服問題,再逐步擴到更多通道與更深的資料整合。

想直接少走測試與串接時間,可以先到 N8Nmarket 挑適合的客服與 AI Agent 模板:https://n8nstart.cc/templates
如果你想先看更多教學與案例,再從部落格一路補起來,也可以從首頁開始:https://n8nstart.cc/

FAQ

n8n claude ai agent 適合哪種公司先做?

最適合有固定重複提問的團隊,例如 SaaS、電商、教育平台、訂閱制服務。只要每天有大量 FAQ、查詢狀態、方案比較,導入效益通常很快看得到。

Claude API 跟 N8N 要怎麼分工?

Claude 負責理解問題、整理上下文、生成回答草稿;N8N 負責收資料、查資料、套規則、記錄記憶、分流真人。模型負責判斷,流程工具負責執行。

客服 AI Agent 一開始就需要 RAG 嗎?

不一定。很多中小團隊先用整理好的 FAQ 模板就能處理 30% 到 50% 的問題。只有當知識量變多、文件更新頻繁、查詢粒度更細時,再升級到向量檢索會比較划算。

對話記憶要存在 Claude 裡面嗎?

不用。比較穩的做法是把記憶存在你自己的資料層,例如資料庫、Sheets、Airtable 或其他可查詢儲存,再由 N8N 在每輪對話時決定要帶哪些上下文給 Claude。

客服自動化最容易出問題的是哪一段?

通常不是模型本身,而是資料標準化、session 規則、真人分流與錯誤處理。這幾段沒設好,回答再漂亮都很難上線。