祐成

什麼是誠實的介面設計?能力不到,就別用那個外型

介面的外型就是承諾,能力不到就別用那個外型。從平庸的銀行 chatbot 到卓越的 Perplexity,用真實案例拆解什麼是「誠實的介面設計」。

朱祐成
· 13 分鐘閱讀 · 學習筆記
什麼是誠實的介面設計?能力不到,就別用那個外型
Image courtesy of The Metropolitan Museum of Art, Open Access

馬奈《西班牙歌手》(The Spanish Singer),1860 年。馬奈(Edouard Manet)描繪一位坐在長凳上彈奏吉他的西班牙歌手,此畫在 1861 年巴黎沙龍展出時獲得榮譽獎,標誌著馬奈藝術生涯的轉捩點。畫面寫實而不拘泥於學院傳統,開啟了現代藝術的新篇章。現藏於紐約大都會藝術博物館。

你打開一個客服對話框,看到擬人頭像和打字動畫,直覺告訴你「我可以跟它聊天」。結果它只會匹配五個關鍵字。問題不在技術不夠強,而在介面騙了你。


介面外型 = 承諾

使用者的期待不是你的文案決定的,是你的視覺元素在說話:

視覺線索使用者的期待
放大鏡 + 單行輸入框「這是搜尋」
對話氣泡 + 擬人頭像「這能跟我聊天」
Cmd+K 指令列「這聽指令」
行內紫色虛線框「這是建議,不是定稿」
來源標註 [1][2][3]「這可以驗證」

用了對話框的外型,就承諾了對話的能力。能力不到,就別用那個外型。


三個等級:平庸、良好、卓越

等級代表產品做了什麼
平庸台灣銀行智能客服對話框 + 擬人頭像包裝 if-else 選單,期望詐欺
良好Stripe 搜尋、Linear Cmd+K、Siri Suggestions外型 = 能力,零落差,不騙你
卓越Perplexity(來源標註)、Notion AI(紫色虛線框 + 手動接受)、Arc「Browse for Me」把 AI 的不確定性變成設計元素

良好是「不騙你」。卓越更進一步:把 AI 天生的不確定性,變成介面的一部分。


我的追問與發現

「『誠實的介面』具體怎麼做?有沒有案例?」

用三個等級看最清楚。平庸案例(銀行 chatbot):對話框包裝選單,使用者反覆嘗試才發現在跟 if-else 對話,浪費時間也失去信任。良好案例(Stripe):搜尋框就是搜尋框,看起來無聊但零落差。卓越案例(Perplexity):每個回答附來源標註,遇到資訊衝突會明說,把不確定性做成可點擊的介面元素。這可能是目前最聰明的信任設計。

「Notion AI 和 Arc 怎麼做到卓越?」

Notion AI 不另開聊天視窗,直接嵌在文件裡。AI 生成的內容用紫色虛線框標示——視覺上就在說「這是 AI 寫的」。必須手動按「接受」才寫入,決定權留給你。Arc 的按鈕叫「Browse for Me」而非「問 AI」,精準描述系統行為,執行時顯示「正在瀏覽 5 個網頁…」。命名即承諾,流程即透明。


你可以怎麼用

  1. 檢查你的產品:介面上的視覺元素承諾了什麼能力?系統真的做得到嗎?
  2. 對話框是最危險的容器:除非你的系統真的能自由對話,否則別用對話氣泡和擬人頭像
  3. 讓不確定性可見:AI 沒把握的回答,用視覺標示(虛線、來源標註)讓使用者知道
  4. 命名要精準:按鈕叫什麼,系統就該做什麼。「Browse for Me」比「Ask AI」誠實
  5. 決定權留給人:AI 產出 = 草稿建議,手動接受才寫入正式內容

延伸連結


一句話帶走

介面的外型就是承諾。能力不到,就別用那個外型。



📚 完整學習對話紀錄(想看完整脈絡可展開)

從技術到品味

前一篇討論零 LLM 引擎時,我們聊到了一個問題——零 LLM 模板模式「不應該偽裝成聊天機器人」。Claude 說了一句讓我印象很深的話:

誠實的介面 = 正確的期待 = 更好的體驗

我立刻追問:這個怎麼做?不是口號,是具體的設計方法。什麼樣的介面算誠實?什麼樣算詐欺?有沒有真實產品可以參考?

這篇就是那場對話的整理。


我的提問:「誠實的介面」具體怎麼做?有沒有案例?

我請 Claude 幫我分三個等級——平庸、良好、卓越——各舉真實產品的例子。不要假設性的範例,要我能打開來用的東西。

Claude 的回答讓我重新理解了一件事:介面設計的核心不是好不好看,是誠不誠實。


平庸案例:「對話」的殼包「選單」的心

台灣銀行智能客服

台灣銀行智能客服介面 台灣銀行智能客服的對話介面。看起來像可以自由對話,實際上只能匹配預設選項。

打開介面,你會看到:一個對話框、一個擬人的頭像、訊息送出後還有打字動畫。這三個元素加在一起,承諾的是「我能跟你聊天」。

但真正的能力呢?只能匹配 5 到 10 個關鍵字。你打「我想問信用卡的年費怎麼減免」,它回你「很抱歉,我不太理解您的意思,請試試以下選項」,然後跳出一排按鈕。

問題不在技術能力不足——選單式引導本身沒有錯。問題在於你用了對話的外型。使用者看到對話框,會投入情感和耐心,會嘗試換句話說、多試幾次。等到他們發現自己在跟一個 if-else 對話時,已經浪費了時間,也失去了信任。

這違反了 Jakob Nielsen 的「系統狀態可見性」(Visibility of System Status)原則——使用者應該隨時知道系統能做什麼、不能做什麼。

反模式總結:用「對話」的容器包裝「選單」的能力,是最常見的期望詐欺。


良好案例:用對外型,不偽裝

Stripe 文件搜尋

Stripe 文件搜尋介面 Stripe 的搜尋介面。放大鏡圖示、單行輸入框、回傳文件連結清單。搜尋的外型 = 搜尋的能力。

就是一個搜尋框。放大鏡圖示、單行輸入、回傳的是文件連結清單。沒有對話氣泡,沒有擬人角色,沒有打字動畫。

你輸入關鍵字,它回傳相關文件。搜尋的外型 = 搜尋的能力 = 零落差。

看起來很無聊?對。但無聊代表沒有騙你。

Linear Command Palette

Linear Command Palette Linear 的 Cmd+K 指令列。輸入時即時顯示系統「能做什麼」的邊界。

按 Cmd+K 叫出指令列,不是聊天視窗。你每打一個字,它即時過濾可用的指令。你隨時看到能力的邊界,而不是問了才知道「不行」。

指令列這個外型本身就在說:「我聽指令,不聊天。」外型和能力完全吻合。

Apple Siri Suggestions

Apple Siri Suggestions Apple Siri Suggestions。不要求你開口,主動根據時間和地點推薦。是工具,看起來就像工具。

Siri Suggestions 不要求你說話,不擬人、不打招呼、不假裝在對話。它根據時間和地點主動推薦——早上通勤時間顯示地圖、午餐時間顯示常去的餐廳 app。

是工具,看起來就像工具。這就是誠實。


卓越案例:把不確定性變成設計元素

良好的設計是「不騙你」。卓越的設計更進一步:把 AI 天生的不確定性,變成介面的一部分。

Perplexity AI

Perplexity AI 來源標註 Perplexity 的搜尋結果。每個回答附上來源標註 [1][2][3],遇到資訊衝突會明說。

Perplexity 每個回答都附上來源標註 [1][2][3],滑鼠移上去可以預覽原文。遇到來源之間資訊衝突,它會明確告訴你:「來源 A 說是,來源 B 說不是。」

沒有藏起 AI 的不確定性,而是把不確定性做成介面元素。使用者看到標註,自然知道這是「可驗證的」而不是「絕對正確的」。

這可能是目前最聰明的信任設計。

Notion AI

Notion AI 行內助手 Notion AI 的行內助手。紫色虛線框標示 AI 生成內容,必須手動「接受」才寫入。

Notion AI 不是另開一個聊天視窗。它直接嵌在你的文件裡,行內出現。AI 生成的內容用紫色虛線框標示——視覺上就在說「這是 AI 寫的,不是你寫的」。

而且你必須手動按「接受」,內容才會正式寫入文件。AI 的產出 = 草稿建議,不是最終答案。決定權留給你。

Arc Browser「Browse for Me」

Arc Browse for Me Arc 的「幫我瀏覽」功能。命名精準描述系統行為,執行時顯示「正在瀏覽 5 個網頁…」。

Arc 的按鈕不叫「搜尋」,不叫「問 AI」——叫「Browse for Me」(幫我瀏覽)。這個命名精準描述了系統真正在做的事:它會去幫你瀏覽幾個網頁,然後整理結果給你。

執行時顯示「正在瀏覽 5 個網頁…」,讓你看到過程。結果同時顯示摘要和原始來源。

命名即承諾,流程即透明。


設計密碼:視覺線索決定期待

Claude 幫我整理了一張表,看完之後我才真正理解——使用者的期待不是你文案怎麼寫,是你的視覺元素在說什麼:

視覺線索使用者的期待
放大鏡 + 單行輸入框「這是搜尋」
對話氣泡 + 擬人頭像「這能跟我聊天」
Cmd+K 指令列「這聽指令」
行內紫色虛線框「這是建議,不是定稿」
來源標註 [1][2][3]「這可以驗證」

一句話總結:介面的外型就是承諾。能力不到,就別用那個外型。


延伸閱讀

想深入研究 AI 介面設計,這些是我找到的最頂尖的資源:

資源專文原始出處
Google PAIR Guidebook精讀筆記pair.withgoogle.com
NNGroup AI UX 系列精讀筆記nngroup.com
Apple HIG ML精讀筆記developer.apple.com
Maggie Appleton精讀筆記maggieappleton.com
Shapeof.AI 模式庫精讀筆記shapeof.ai

我學到的

品味與科技的混合題:技術決定你「能做到什麼」,品味決定你「讓使用者期待什麼」。兩者吻合就是好體驗,不吻合就是災難。

銀行 chatbot 的工程師可能很厲害,但他沒有阻止產品經理用對話框包裝選單。Perplexity 的設計師可能不會寫 LLM,但他知道要把來源標註做成可點擊的介面元素。

能判斷「外型和能力是否吻合」這件事的,不是工程師,是有 UX 直覺的人。這就是 Centaur Model 的精神——你帶路,AI 跑腿。我負責判斷什麼是誠實的、什麼是詐欺的,AI 負責把我的判斷實現成可運作的產品。