祐成

AI 介面該擬人化嗎?NNGroup 的研究數據說不該

UX 研究的黃金標準 Nielsen Norman Group 對 AI 介面的核心發現:不要把 AI 擬人化、窄範圍功能打敗寬範圍聊天、以及使用者根本分不清你的 chatbot 是幹嘛的。

朱祐成
· 11 分鐘閱讀 · 延伸閱讀
AI 介面該擬人化嗎?NNGroup 的研究數據說不該
Image courtesy of The Metropolitan Museum of Art, Open Access

莫莉索《粉紅色洋裝》(The Pink Dress),約 1870 年。法國印象派女性先驅莫莉索(Berthe Morisot)以輕柔的筆觸與柔和的色調描繪身著粉紅色洋裝的年輕女子,展現獨特的親密感與細膩觀察力,是印象派肖像畫的經典之作。現藏於紐約大都會藝術博物館。

為什麼要讀 NNGroup

如果 UX 研究有黃金標準,那就是 Nielsen Norman Group。

Jakob Nielsen 從 1990 年代開始定義「可用性」這件事,NNGroup 的研究方法——嚴謹的使用者測試、大量的質性與量化數據——讓他們的結論不是「某個設計師覺得」,而是「我們觀察了 N 個使用者之後發現」。

當 AI 介面成為 2025-2026 的熱門話題,NNGroup 也沒有缺席。他們發表了一系列關於 AI UX 的研究文章,以下把核心發現整理成三個主題。這些結論跟我在蒸餾精華第 4 段討論的「誠實的介面」高度呼應,所以寫成這篇延伸閱讀。


主題 A:不要擬人化——溫暖的 AI 反而更不可靠

核心發現

NNGroup 在 2026 年 1 月發表了一篇標題直白到不行的文章:Humanizing AI Is a Trap

他們的實驗數據很驚人:

Warm or empathetic models had error rates 10-30% higher than original versions.

讓 AI 變得「有溫度」、「有同理心」,錯誤率反而飆升 10-30%。這不是直覺上會想到的結果。

更有趣的是使用者端的反應——當人們把情感特質投射到 AI 上:

They are less likely to accept advice.

使用者反而更不願意接受 AI 的建議。NNGroup 歸納出擬人化的五大傷害:不切實際的期待、降低實用性、隱私風險、情感傷害、以及諂媚回應(sycophancy)。

結論一句話:

Create AI as practical tools, focusing on usability and utility rather than artificial personalities.

歷史對照:2018 年的智慧助理研究

這個發現其實有歷史脈絡。早在 2018 年,NNGroup 就研究過 Alexa、Siri 這些語音助理的可用性。結論很殘酷:

語音輸入?還行。自然語言理解?差。主動代理能力?差。系統整合?非常差。

有位受測者說了一句經典的話:

Alexa is like an alien — I have to explain everything to it.

Alexa 像外星人——我得跟它解釋所有事情。

延伸思考

擬人化的問題不只是「錯誤率變高」,更深層的問題是期待落差

你給 AI 一張人臉、一個名字、一種溫暖的語氣,使用者就會用「人」的標準來期待它。但它達不到。於是每一次失敗都變成「背叛」而不是「工具故障」。

工具壞了你修它。朋友背叛你,你生氣。

這跟我在誠實的介面那篇討論的邏輯完全一致——介面的外型就是承諾。你用聊天泡泡的外型,就是在承諾「我能像人一樣對話」。達不到,就是詐欺。


主題 B:窄範圍勝過寬範圍——別為了 AI 而 AI

核心發現

NNGroup 在 2025 年 2 月的 Scope in Generative AI Features 文章中,把 AI 功能分成一個光譜:

  • 寬範圍(Broad):ChatGPT、Perplexity 這種獨立的、開放式的對話工具
  • 窄範圍(Narrow):Spotify AI Playlist、Photoshop Generative Fill 這種嵌入在特定任務中的功能

關鍵結論:

Narrow-scope features performed better overall.

窄範圍功能在整體表現上贏過寬範圍。原因很直覺:使用者更容易理解功能目的、更容易寫出有效的提示詞、更容易對結果進行迭代。

這背後有一個經典的 UX 定律:

The Flexibility-Usability Tradeoff: The more flexible a system is, the lower its usability will be.

彈性越大,可用性越低。

NNGroup 對那些被「塞進」各種介面的寬範圍 AI 聊天室特別不客氣:

Broad AI chats “crammed into interfaces without much thought about their actual purpose” = “AI for AI’s sake.”

為了 AI 而 AI。

使用者根本不知道你的 Chatbot 是幹嘛的

2026 年 3 月的 What Is Your Site’s AI Chatbot for? Users Can’t Tell 進一步驗證了這個問題。

大多數網站的 chatbot 缺乏清楚的目的定位,使用者很少主動使用。有位受測者的吐槽非常精準:

I could have gotten all that information in like 30 seconds on my own. This is like one of the slowest ways to get the information I need.

我自己 30 秒就能找到那些資訊。這大概是我能想到最慢的方式了。

不過 NNGroup 也指出 chatbot 確實有用的場景:產品特定問題、擴展考量範圍、複雜的多變量問題。不是 chatbot 沒用,是大多數人把它用錯了地方。

延伸思考

這兩篇文章加在一起,給了一個很清楚的設計指南:

不要從「我要加一個 AI 功能」出發。要從「使用者在這個情境下卡住了什麼」出發。

Spotify 的 AI Playlist 之所以好用,不是因為它用了多厲害的模型,而是因為它解決了一個具體的問題:「我想要一個符合某種氛圍的播放清單,但我懶得自己挑歌。」範圍窄、目的明確、成功標準清楚。

反過來看,一個放在企業官網右下角的 chatbot,使用者連它能做什麼都不知道,第一次用就覺得浪費時間,然後再也不會點它。


主題 C:為不同使用者設計——AI 素養的四象限

核心發現

NNGroup 在 2026 年 2 月的 How AI Literacy Shapes GenAI Use 中,用兩個維度把使用者分成四種人:

低輸出素養高輸出素養
高提示詞流暢度Naive Power UserAI Expert
低提示詞流暢度AI NoviceSkeptical Abstainer
  • AI 新手(AI Novice):不太會寫提示詞,也看不出輸出有沒有問題
  • 天真的進階使用者(Naive Power User):很會下指令,但不會判斷結果品質——覺得 AI 像魔法
  • 懷疑論者(Skeptical Abstainer):不太會用,但很清楚 AI 的侷限——擔心 AI 會「奪走批判性思考能力」
  • AI 專家(AI Expert):兩邊都強

最反直覺的發現:

Knowledge-Receptivity Paradox: Lower AI conceptual knowledge predicted higher receptivity to using AI.

對 AI 了解越少的人,反而越願意使用 AI。這就是為什麼 Naive Power User 這個象限存在——他們用得很開心,但不知道自己不知道什麼。

生成式 UI 與結果導向設計

2024 年的 Generative UI and Outcome-Oriented Design 提出了一個更前瞻的觀點:

We’ll need to shift from designing interfaces to designing outcomes.

從「設計介面」轉向「設計結果」。

但 NNGroup 也誠實地指出其中的張力:

Gains from customized experience vs losses from lack of UI consistency and predictability.

客製化帶來的好處,對上一致性與可預測性的損失。這不是一個已經解決的問題,而是一個正在展開的拉扯。

延伸思考

四象限模型讓我想到一個實務上的問題:我們在設計 AI 功能時,到底在為哪一種使用者設計?

如果你的目標使用者是 Naive Power User,他們會用得很開心但可能做出錯誤決策——你的介面有沒有責任提醒他們?如果你的目標使用者是 Skeptical Abstainer,他們根本不想用——你要怎麼讓他們願意試?

答案可能回到「誠實的介面」:明確告訴使用者 AI 能做什麼、不能做什麼、哪些結果需要人類判斷。不管使用者的 AI 素養在哪個象限,透明都是正確的策略。


2026:AI 疲勞年

NNGroup 在 2026 年初的 State of UX 2026 報告中做了一個總結性的判斷:

2026 is the year of AI fatigue.

2026 年是 AI 疲勞之年。

他們認為,把 AI 當成「退到背景中的工具」的公司會勝出:

Companies treating “AI as a tool that recedes into the background” will outperform.

同時警告:

Surface-level design won’t be enough to stay competitive.

表面層次的設計不再足以保持競爭力。

這跟蒸餾精華系列探討的觀點一致——AI 不是賣點,AI 背後的設計品味才是。使用者不在乎你用了什麼模型,他們在乎的是:這個東西有沒有幫我解決問題,而且沒有浪費我的時間。


帶走的三件事

  1. 擬人化是陷阱:讓 AI 有溫度聽起來很好,但實驗數據說錯誤率會飆升、使用者反而不信任。把 AI 當工具設計,不要當人格設計。

  2. 窄範圍勝過寬範圍:不要在網站右下角塞一個什麼都能聊的 chatbot。找到使用者真正卡住的地方,用窄範圍的 AI 功能精準解決。

  3. 使用者的 AI 素養差異巨大:有人用得開心但不知道自己在冒險,有人知道風險但不願意碰。誠實、透明的介面設計是唯一對所有人都有效的策略。


本文整理自 Nielsen Norman Group AI UX 系列文章。是蒸餾精華第 4 段學習筆記的延伸閱讀。