AI 介面該擬人化嗎？NNGroup 的研究數據說不該

為什麼要讀 NNGroup

如果 UX 研究有黃金標準，那就是 Nielsen Norman Group。

Jakob Nielsen 從 1990 年代開始定義「可用性」這件事，NNGroup 的研究方法——嚴謹的使用者測試、大量的質性與量化數據——讓他們的結論不是「某個設計師覺得」，而是「我們觀察了 N 個使用者之後發現」。

當 AI 介面成為 2025-2026 的熱門話題，NNGroup 也沒有缺席。他們發表了一系列關於 AI UX 的研究文章，以下把核心發現整理成三個主題。這些結論跟我在蒸餾精華第 4 段討論的「誠實的介面」高度呼應，所以寫成這篇延伸閱讀。

主題 A：不要擬人化——溫暖的 AI 反而更不可靠

核心發現

NNGroup 在 2026 年 1 月發表了一篇標題直白到不行的文章：Humanizing AI Is a Trap。

他們的實驗數據很驚人：

Warm or empathetic models had error rates 10-30% higher than original versions.

讓 AI 變得「有溫度」、「有同理心」，錯誤率反而飆升 10-30%。這不是直覺上會想到的結果。

更有趣的是使用者端的反應——當人們把情感特質投射到 AI 上：

They are less likely to accept advice.

使用者反而更不願意接受 AI 的建議。NNGroup 歸納出擬人化的五大傷害：不切實際的期待、降低實用性、隱私風險、情感傷害、以及諂媚回應（sycophancy）。

結論一句話：

Create AI as practical tools, focusing on usability and utility rather than artificial personalities.

歷史對照：2018 年的智慧助理研究

這個發現其實有歷史脈絡。早在 2018 年，NNGroup 就研究過 Alexa、Siri 這些語音助理的可用性。結論很殘酷：

語音輸入？還行。自然語言理解？差。主動代理能力？差。系統整合？非常差。

有位受測者說了一句經典的話：

Alexa is like an alien — I have to explain everything to it.

Alexa 像外星人——我得跟它解釋所有事情。

延伸思考

擬人化的問題不只是「錯誤率變高」，更深層的問題是期待落差。

你給 AI 一張人臉、一個名字、一種溫暖的語氣，使用者就會用「人」的標準來期待它。但它達不到。於是每一次失敗都變成「背叛」而不是「工具故障」。

工具壞了你修它。朋友背叛你，你生氣。

這跟我在誠實的介面那篇討論的邏輯完全一致——介面的外型就是承諾。你用聊天泡泡的外型，就是在承諾「我能像人一樣對話」。達不到，就是詐欺。

主題 B：窄範圍勝過寬範圍——別為了 AI 而 AI

核心發現

NNGroup 在 2025 年 2 月的 Scope in Generative AI Features 文章中，把 AI 功能分成一個光譜：

寬範圍（Broad）：ChatGPT、Perplexity 這種獨立的、開放式的對話工具
窄範圍（Narrow）：Spotify AI Playlist、Photoshop Generative Fill 這種嵌入在特定任務中的功能

關鍵結論：

Narrow-scope features performed better overall.

窄範圍功能在整體表現上贏過寬範圍。原因很直覺：使用者更容易理解功能目的、更容易寫出有效的提示詞、更容易對結果進行迭代。

這背後有一個經典的 UX 定律：

The Flexibility-Usability Tradeoff: The more flexible a system is, the lower its usability will be.

彈性越大，可用性越低。

NNGroup 對那些被「塞進」各種介面的寬範圍 AI 聊天室特別不客氣：

Broad AI chats “crammed into interfaces without much thought about their actual purpose” = “AI for AI’s sake.”

為了 AI 而 AI。

使用者根本不知道你的 Chatbot 是幹嘛的

2026 年 3 月的 What Is Your Site’s AI Chatbot for? Users Can’t Tell 進一步驗證了這個問題。

大多數網站的 chatbot 缺乏清楚的目的定位，使用者很少主動使用。有位受測者的吐槽非常精準：

I could have gotten all that information in like 30 seconds on my own. This is like one of the slowest ways to get the information I need.

我自己 30 秒就能找到那些資訊。這大概是我能想到最慢的方式了。

不過 NNGroup 也指出 chatbot 確實有用的場景：產品特定問題、擴展考量範圍、複雜的多變量問題。不是 chatbot 沒用，是大多數人把它用錯了地方。

延伸思考

這兩篇文章加在一起，給了一個很清楚的設計指南：

不要從「我要加一個 AI 功能」出發。要從「使用者在這個情境下卡住了什麼」出發。

Spotify 的 AI Playlist 之所以好用，不是因為它用了多厲害的模型，而是因為它解決了一個具體的問題：「我想要一個符合某種氛圍的播放清單，但我懶得自己挑歌。」範圍窄、目的明確、成功標準清楚。

反過來看，一個放在企業官網右下角的 chatbot，使用者連它能做什麼都不知道，第一次用就覺得浪費時間，然後再也不會點它。

主題 C：為不同使用者設計——AI 素養的四象限

核心發現

NNGroup 在 2026 年 2 月的 How AI Literacy Shapes GenAI Use 中，用兩個維度把使用者分成四種人：

	低輸出素養	高輸出素養
高提示詞流暢度	Naive Power User	AI Expert
低提示詞流暢度	AI Novice	Skeptical Abstainer

AI 新手（AI Novice）：不太會寫提示詞，也看不出輸出有沒有問題
天真的進階使用者（Naive Power User）：很會下指令，但不會判斷結果品質——覺得 AI 像魔法
懷疑論者（Skeptical Abstainer）：不太會用，但很清楚 AI 的侷限——擔心 AI 會「奪走批判性思考能力」
AI 專家（AI Expert）：兩邊都強

最反直覺的發現：

Knowledge-Receptivity Paradox: Lower AI conceptual knowledge predicted higher receptivity to using AI.

對 AI 了解越少的人，反而越願意使用 AI。這就是為什麼 Naive Power User 這個象限存在——他們用得很開心，但不知道自己不知道什麼。

生成式 UI 與結果導向設計

2024 年的 Generative UI and Outcome-Oriented Design 提出了一個更前瞻的觀點：

We’ll need to shift from designing interfaces to designing outcomes.

從「設計介面」轉向「設計結果」。

但 NNGroup 也誠實地指出其中的張力：

Gains from customized experience vs losses from lack of UI consistency and predictability.

客製化帶來的好處，對上一致性與可預測性的損失。這不是一個已經解決的問題，而是一個正在展開的拉扯。

延伸思考

四象限模型讓我想到一個實務上的問題：我們在設計 AI 功能時，到底在為哪一種使用者設計？

如果你的目標使用者是 Naive Power User，他們會用得很開心但可能做出錯誤決策——你的介面有沒有責任提醒他們？如果你的目標使用者是 Skeptical Abstainer，他們根本不想用——你要怎麼讓他們願意試？

答案可能回到「誠實的介面」：明確告訴使用者 AI 能做什麼、不能做什麼、哪些結果需要人類判斷。不管使用者的 AI 素養在哪個象限，透明都是正確的策略。

2026：AI 疲勞年

NNGroup 在 2026 年初的 State of UX 2026 報告中做了一個總結性的判斷：

2026 is the year of AI fatigue.

2026 年是 AI 疲勞之年。

他們認為，把 AI 當成「退到背景中的工具」的公司會勝出：

Companies treating “AI as a tool that recedes into the background” will outperform.

同時警告：

Surface-level design won’t be enough to stay competitive.

表面層次的設計不再足以保持競爭力。

這跟蒸餾精華系列探討的觀點一致——AI 不是賣點，AI 背後的設計品味才是。使用者不在乎你用了什麼模型，他們在乎的是：這個東西有沒有幫我解決問題，而且沒有浪費我的時間。

帶走的三件事

擬人化是陷阱：讓 AI 有溫度聽起來很好，但實驗數據說錯誤率會飆升、使用者反而不信任。把 AI 當工具設計，不要當人格設計。
窄範圍勝過寬範圍：不要在網站右下角塞一個什麼都能聊的 chatbot。找到使用者真正卡住的地方，用窄範圍的 AI 功能精準解決。
使用者的 AI 素養差異巨大：有人用得開心但不知道自己在冒險，有人知道風險但不願意碰。誠實、透明的介面設計是唯一對所有人都有效的策略。

本文整理自 Nielsen Norman Group AI UX 系列文章。是蒸餾精華第 4 段學習筆記的延伸閱讀。