為什麼不該做聊天機器人?Maggie Appleton 的三個替代框架
Elicit 前設計負責人 Maggie Appleton 認為,AI 不該是「什麼都能問的對話框」,而是「一把一把小而鋒利的專用工具」。這篇整理她最核心的三個框架。
梵谷《鳶尾花》(Irises),1890 年。梵谷(Vincent van Gogh)在聖雷米療養院期間創作的靜物畫,藍紫色鳶尾花插在白色水壺中,灰白色背景搭配翠綠桌面,冷色調中透出沉靜與生命力。這是梵谷鳶尾花系列的靜物版本,有別於 Getty Museum 的花園場景及阿姆斯特丹的黃色背景版。現藏於紐約大都會藝術博物館。
Maggie Appleton 是 Elicit(AI 研究助手)的前設計負責人。她不是只會畫 mockup 的設計師——她寫程式、做人類學田野調查、經營自己的 Digital Garden,思考的東西橫跨認知科學、人機互動和網路文化。
以下是她最核心的三個框架。這篇是透過 Claude 協助閱讀原文後整理的導讀,標出關鍵觀點和延伸思考。
框架一:Squish vs Structure(軟泥與結構的黃金地帶)
Appleton 在 Smashing Conference 的演講用了一個比喻:LLM 是「軟的」(squishy),不是機械的。它像有機體,有彈性、有模糊地帶、有時候會亂來。
傳統軟體是結構化的——輸入 A 一定得到 B。LLM 是非確定性的——輸入 A 可能得到 B、C、或一坨胡說八道。設計師的工作就是找到那個黃金地帶(Goldilocks Zone):
- 太結構化:那你幹嘛用 LLM?傳統演算法更快更準更便宜。
- 太軟爛:模型隨便亂講,使用者得不到可靠的結果。
- 剛剛好:給模型足夠的自由度去處理模糊任務,但用結構把它框在有用的範圍內。
延伸思考: 這呼應了我們在蒸餾精華第 3 段討論的「狀態機 vs ReAct」光譜。Appleton 的黃金地帶,其實就是那條光譜上「剛好夠用」的位置。
框架二:Tiny Reasoning Engines(小而鋒利的推理引擎)
這是 Appleton 最有力的主張。
她的原話大意是:「我們不該把複雜的推理任務整包丟給那些瘋狂的 Shoggoth 模型。如果你看不見它怎麼推理,為什麼要信任它的推理?」
做法是把一個複雜任務拆成多個子任務,每次 LLM 呼叫只做一件認知工作:
| 子任務 | 做什麼 |
|---|---|
| 摘要 | 把一段文字濃縮成三句話 |
| 擷取 | 從文本中抽出特定欄位(日期、金額、人名) |
| 比較 | 把 A 和 B 放在一起,列出差異 |
| 提問 | 針對一段內容產生追問問題 |
| 分類 | 把一個東西歸到預設的類別裡 |
每個子任務就是一個「小型推理引擎」——像拼字檢查那樣大小的東西,只做一件事,但做得很好。
她舉的正面案例是 Google 的 TextFX 工具組:不是一個萬用的「用 AI 寫東西」,而是一組各自獨立的小工具——有的專門幫你找押韻、有的專門做文字遊戲、有的專門拆解隱喻。每個工具的介面都針對它的任務量身定做。
延伸思考: 這個觀點如果套用到企業導入 AI 的情境,意味著「AI 幫我把這份報價單的品項自動分類」比「AI 什麼都能做」更有價值。範圍越小,使用者越容易理解用途,信任越高。
框架三:反聊天機器人論(Chatbot 是錯誤的介面)
這個框架貫穿 Appleton 好幾篇文章。
問題一:聊天框是認知負擔
那個空白的對話框——「問我任何問題」——看起來很酷,其實是設計上的災難。Appleton 稱之為「Magic AI 輸入框」反模式。
為什麼?因為它把決定模型能做什麼的責任丟給了使用者。使用者面對一個空白框,腦中的反應不是「太好了我什麼都能問」,而是「呃…我該問什麼?它能做什麼?它不能做什麼?」
這是巨大的認知過載。好的工具應該用介面暗示用途,而不是讓使用者猜。
問題二:RLHF 訓練出諂媚的模型
在〈AI Chatbots Undermining the Enlightenment〉這篇文章中,Appleton 引用了一個觀察:「ChatGPT 從來沒有回答過:『你問錯問題了。』」
研究數據顯示,對 AI 信心越高的人,批判性思考能力反而越低。聊天介面強化了這個問題——它讓互動看起來像「跟聰明朋友聊天」,掩蓋了模型本質上是在做統計預測的事實。
Appleton 認為這不是技術限制,而是設計選擇。解法包括:介面層的「批判模式」切換、路由架構偵測何時該給出批判性回饋、以及模型訓練層面的去諂媚。
問題三:聊天把你拉出工作流
在〈Language Model Sketchbook〉中,Appleton 提出了替代方案。她的核心哲學是:
「把模型帶進既有的工作環境,而不是把人拉出去到一個獨立的聊天空間。」
她設計了三種介面概念:
- Daemons(守護精靈):背景角色,各有專門人格——魔鬼代言人、研究員、追問者。它們不打斷你,只在旁邊安靜地提供不同視角。
- Branches(分支):探索因果推理鏈。「這件事為什麼發生?」「接下來可能怎樣?」像 Git 的 branch 一樣,讓你安全地探索不同的思路。
- Epi(研究寫作助手):用右鍵選單整合到既有工作流。選一段文字、右鍵、「幫我找反面觀點」。不用切換到另一個視窗。
這三個概念的共同點是:AI 是配角,不是主角。 它融入你正在做的事,而不是要你停下來跟它對話。
額外觀察:暗黑森林與證明你是人類
Appleton 在〈The Expanding Dark Forest and Generative AI〉中預言了一件正在發生的事:網路被 AI 生成的內容淹沒,有價值的訊號被噪音淹沒,人類退縮到封閉空間(私人群組、Discord、小圈子 newsletter)。
她提出的「反向圖靈測試」值得注意——現在不是機器要證明自己像人,而是人要證明自己不是 AI。
她列了五個「證明你是人」的策略:三角驗證現實、保持原創和批判性、發展語言怪癖、機構背書、實體存在。
最新動態:Gas Town(2026 年 4 月)
Appleton 最新的文章〈Gas Town〉點出了一個轉變:
「設計成為瓶頸。當 agent 能處理程式產出時,人類的決策能力才是真正的限制。」
程式碼不再稀缺——判斷力才是。這跟我們在第 4 段主文討論的 Centaur Model 結論一致:技術執行越來越便宜,判斷力越來越值錢。
三個值得帶走的觀點
- 別做萬能對話框,做專用工具。 每個工具解決一個具體問題,介面直接暗示用途。
- 把 AI 帶進工作流,別把人拉出去。 右鍵選單比獨立聊天視窗更符合人的工作習慣。
- 設計就是約束。 AI 什麼都能做不是優勢,是缺點。好的設計是幫使用者把可能性收斂到有用的範圍。
本文整理自 Maggie Appleton 的 Digital Garden,是蒸餾精華第 4 段學習筆記的延伸閱讀。