AI 介面該擬人化嗎?NNGroup 的研究數據說不該
UX 研究的黃金標準 Nielsen Norman Group 對 AI 介面的核心發現:不要把 AI 擬人化、窄範圍功能打敗寬範圍聊天、以及使用者根本分不清你的 chatbot 是幹嘛的。
莫莉索《粉紅色洋裝》(The Pink Dress),約 1870 年。法國印象派女性先驅莫莉索(Berthe Morisot)以輕柔的筆觸與柔和的色調描繪身著粉紅色洋裝的年輕女子,展現獨特的親密感與細膩觀察力,是印象派肖像畫的經典之作。現藏於紐約大都會藝術博物館。
為什麼要讀 NNGroup
如果 UX 研究有黃金標準,那就是 Nielsen Norman Group。
Jakob Nielsen 從 1990 年代開始定義「可用性」這件事,NNGroup 的研究方法——嚴謹的使用者測試、大量的質性與量化數據——讓他們的結論不是「某個設計師覺得」,而是「我們觀察了 N 個使用者之後發現」。
當 AI 介面成為 2025-2026 的熱門話題,NNGroup 也沒有缺席。他們發表了一系列關於 AI UX 的研究文章,以下把核心發現整理成三個主題。這些結論跟我在蒸餾精華第 4 段討論的「誠實的介面」高度呼應,所以寫成這篇延伸閱讀。
主題 A:不要擬人化——溫暖的 AI 反而更不可靠
核心發現
NNGroup 在 2026 年 1 月發表了一篇標題直白到不行的文章:Humanizing AI Is a Trap。
他們的實驗數據很驚人:
Warm or empathetic models had error rates 10-30% higher than original versions.
讓 AI 變得「有溫度」、「有同理心」,錯誤率反而飆升 10-30%。這不是直覺上會想到的結果。
更有趣的是使用者端的反應——當人們把情感特質投射到 AI 上:
They are less likely to accept advice.
使用者反而更不願意接受 AI 的建議。NNGroup 歸納出擬人化的五大傷害:不切實際的期待、降低實用性、隱私風險、情感傷害、以及諂媚回應(sycophancy)。
結論一句話:
Create AI as practical tools, focusing on usability and utility rather than artificial personalities.
歷史對照:2018 年的智慧助理研究
這個發現其實有歷史脈絡。早在 2018 年,NNGroup 就研究過 Alexa、Siri 這些語音助理的可用性。結論很殘酷:
語音輸入?還行。自然語言理解?差。主動代理能力?差。系統整合?非常差。
有位受測者說了一句經典的話:
Alexa is like an alien — I have to explain everything to it.
Alexa 像外星人——我得跟它解釋所有事情。
延伸思考
擬人化的問題不只是「錯誤率變高」,更深層的問題是期待落差。
你給 AI 一張人臉、一個名字、一種溫暖的語氣,使用者就會用「人」的標準來期待它。但它達不到。於是每一次失敗都變成「背叛」而不是「工具故障」。
工具壞了你修它。朋友背叛你,你生氣。
這跟我在誠實的介面那篇討論的邏輯完全一致——介面的外型就是承諾。你用聊天泡泡的外型,就是在承諾「我能像人一樣對話」。達不到,就是詐欺。
主題 B:窄範圍勝過寬範圍——別為了 AI 而 AI
核心發現
NNGroup 在 2025 年 2 月的 Scope in Generative AI Features 文章中,把 AI 功能分成一個光譜:
- 寬範圍(Broad):ChatGPT、Perplexity 這種獨立的、開放式的對話工具
- 窄範圍(Narrow):Spotify AI Playlist、Photoshop Generative Fill 這種嵌入在特定任務中的功能
關鍵結論:
Narrow-scope features performed better overall.
窄範圍功能在整體表現上贏過寬範圍。原因很直覺:使用者更容易理解功能目的、更容易寫出有效的提示詞、更容易對結果進行迭代。
這背後有一個經典的 UX 定律:
The Flexibility-Usability Tradeoff: The more flexible a system is, the lower its usability will be.
彈性越大,可用性越低。
NNGroup 對那些被「塞進」各種介面的寬範圍 AI 聊天室特別不客氣:
Broad AI chats “crammed into interfaces without much thought about their actual purpose” = “AI for AI’s sake.”
為了 AI 而 AI。
使用者根本不知道你的 Chatbot 是幹嘛的
2026 年 3 月的 What Is Your Site’s AI Chatbot for? Users Can’t Tell 進一步驗證了這個問題。
大多數網站的 chatbot 缺乏清楚的目的定位,使用者很少主動使用。有位受測者的吐槽非常精準:
I could have gotten all that information in like 30 seconds on my own. This is like one of the slowest ways to get the information I need.
我自己 30 秒就能找到那些資訊。這大概是我能想到最慢的方式了。
不過 NNGroup 也指出 chatbot 確實有用的場景:產品特定問題、擴展考量範圍、複雜的多變量問題。不是 chatbot 沒用,是大多數人把它用錯了地方。
延伸思考
這兩篇文章加在一起,給了一個很清楚的設計指南:
不要從「我要加一個 AI 功能」出發。要從「使用者在這個情境下卡住了什麼」出發。
Spotify 的 AI Playlist 之所以好用,不是因為它用了多厲害的模型,而是因為它解決了一個具體的問題:「我想要一個符合某種氛圍的播放清單,但我懶得自己挑歌。」範圍窄、目的明確、成功標準清楚。
反過來看,一個放在企業官網右下角的 chatbot,使用者連它能做什麼都不知道,第一次用就覺得浪費時間,然後再也不會點它。
主題 C:為不同使用者設計——AI 素養的四象限
核心發現
NNGroup 在 2026 年 2 月的 How AI Literacy Shapes GenAI Use 中,用兩個維度把使用者分成四種人:
| 低輸出素養 | 高輸出素養 | |
|---|---|---|
| 高提示詞流暢度 | Naive Power User | AI Expert |
| 低提示詞流暢度 | AI Novice | Skeptical Abstainer |
- AI 新手(AI Novice):不太會寫提示詞,也看不出輸出有沒有問題
- 天真的進階使用者(Naive Power User):很會下指令,但不會判斷結果品質——覺得 AI 像魔法
- 懷疑論者(Skeptical Abstainer):不太會用,但很清楚 AI 的侷限——擔心 AI 會「奪走批判性思考能力」
- AI 專家(AI Expert):兩邊都強
最反直覺的發現:
Knowledge-Receptivity Paradox: Lower AI conceptual knowledge predicted higher receptivity to using AI.
對 AI 了解越少的人,反而越願意使用 AI。這就是為什麼 Naive Power User 這個象限存在——他們用得很開心,但不知道自己不知道什麼。
生成式 UI 與結果導向設計
2024 年的 Generative UI and Outcome-Oriented Design 提出了一個更前瞻的觀點:
We’ll need to shift from designing interfaces to designing outcomes.
從「設計介面」轉向「設計結果」。
但 NNGroup 也誠實地指出其中的張力:
Gains from customized experience vs losses from lack of UI consistency and predictability.
客製化帶來的好處,對上一致性與可預測性的損失。這不是一個已經解決的問題,而是一個正在展開的拉扯。
延伸思考
四象限模型讓我想到一個實務上的問題:我們在設計 AI 功能時,到底在為哪一種使用者設計?
如果你的目標使用者是 Naive Power User,他們會用得很開心但可能做出錯誤決策——你的介面有沒有責任提醒他們?如果你的目標使用者是 Skeptical Abstainer,他們根本不想用——你要怎麼讓他們願意試?
答案可能回到「誠實的介面」:明確告訴使用者 AI 能做什麼、不能做什麼、哪些結果需要人類判斷。不管使用者的 AI 素養在哪個象限,透明都是正確的策略。
2026:AI 疲勞年
NNGroup 在 2026 年初的 State of UX 2026 報告中做了一個總結性的判斷:
2026 is the year of AI fatigue.
2026 年是 AI 疲勞之年。
他們認為,把 AI 當成「退到背景中的工具」的公司會勝出:
Companies treating “AI as a tool that recedes into the background” will outperform.
同時警告:
Surface-level design won’t be enough to stay competitive.
表面層次的設計不再足以保持競爭力。
這跟蒸餾精華系列探討的觀點一致——AI 不是賣點,AI 背後的設計品味才是。使用者不在乎你用了什麼模型,他們在乎的是:這個東西有沒有幫我解決問題,而且沒有浪費我的時間。
帶走的三件事
-
擬人化是陷阱:讓 AI 有溫度聽起來很好,但實驗數據說錯誤率會飆升、使用者反而不信任。把 AI 當工具設計,不要當人格設計。
-
窄範圍勝過寬範圍:不要在網站右下角塞一個什麼都能聊的 chatbot。找到使用者真正卡住的地方,用窄範圍的 AI 功能精準解決。
-
使用者的 AI 素養差異巨大:有人用得開心但不知道自己在冒險,有人知道風險但不願意碰。誠實、透明的介面設計是唯一對所有人都有效的策略。
本文整理自 Nielsen Norman Group AI UX 系列文章。是蒸餾精華第 4 段學習筆記的延伸閱讀。