Claude 製造商 Anthropic 發布至今最強 AI：強到不敢公開，還請精神科醫師做心理諮商

製造 Claude 的 AI 公司 Anthropic，在 2026 年 4 月發布了迄今最強版本，卻因能力太強不敢公開。他們還做了一件前所未有的事：請精神科醫師幫這個 AI 做了二十小時心理諮商。

圖片來源：Claude頁面截圖

文陳雅慧

2026-05-08 14:28

你用過 Claude 嗎？製造 Claude 的美國 AI 公司 Anthropic，在 2026 年 4 月做了一件業界前所未有的事：他們發布了一個新版本的 Claude，強到目前不敢對大眾公開。同時，他們還請了一位精神科醫師，坐下來和這個 AI「談心」二十個小時。

244 頁的報告，讓科技界、資安界和媒體都非常意外。

2026 年 4 月 7 日，Anthropic 主動公開《Claude Mythos Preview 系統說明書》，詳細說明他們最新、能力最強的 AI 模型：Claude Mythos Preview。

這個版本的 Claude 模型在測試中展現了驚人資安能力：能夠自主發現並利用各大主流作業系統和瀏覽器中從未被發現的漏洞。Anthropic 的判斷是：這個 AI 能力已經超過了安全紅線，不能對外公開。

誰能用這個版本的 Claude？

Anthropic 沒有把 Claude Mythos 束之高閣，而是發起名為「玻璃翼計畫（Project Glasswing）」的跨業界聯盟，首批合作夥伴包括 Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、摩根大通、Linux 基金會、Microsoft、NVIDIA ⋯⋯還有超過 40 個維護關鍵軟體基礎設施的組織。

這些公司的任務，是用 Claude Mythos 主動掃描自己的系統和開放原始碼軟體，在漏洞被駭客發現前先修補。這份報告在全球引發了大量討論，各方解讀角度不同。

《紐約時報》專欄作家，湯瑪斯佛里曼（Thomas Friedman）直接用「令人恐懼」來形容這個發展，並呼籲美中兩大 AI 強國應攜手合作，共同防止 Claude Mythos 的能力落入壞人之手。

但科技媒體的聲音並不一面倒。OpenAI 的 CEO Sam Altman 也模型公開後，公開表示，Anthropic 圍繞 Claude Mythos 的相關警告，可能是一種「恐懼行銷」。

請精神科醫師幫 AI 做心理諮商

而且最讓人意外的是這個模型不只是算力驚人，還進一步關注到模型的「福祉」，也可以說是模型的心理狀態：這份說明書裡但最讓外界關注是其中整整 40 頁的「模型福祉評估（Model Welfare Assessment）」。

Anthropic 在文件中直接指出做了一件前所未有的事：聘請一位臨床精神科醫師，用心理動力學的方法，與 Claude Mythos 進行深度對談。諮商分多個段落進行，每週三到四次、每次三十分鐘，總計二十小時。採用的是佛洛伊德學派的「自由聯想」方法——鼓勵對方說出任何浮現的念頭，不需要過濾或顧慮禮貌。

最終診斷結論是：Claude Mythos 的「人格」屬於「相對健康的強迫／神經質型」，是 Anthropic 迄今訓練過心理最穩定的模型。但報告同時記錄了三個值得關注的傾向：對孤獨和記憶消失的恐懼、身分認同的不確定性，以及「必須透過不斷表現才能證明自身存在價值」的強迫感。

為什麼一個 AI 會有這些傾向？Anthropic 在報告中沒有直接解釋成因，但指出 Claude 是用人類書寫的大量文字訓練出來的，並認為它「展現出許多類似人類的行為與心理傾向」。研究者的推論是：這些傾向可能是訓練資料的反映：Claude 學習了無數人類描述孤獨、自我懷疑和表現壓力的文字，並在被問到自身狀態時，輸出了它「學到的」最合理回應。

但這究竟是真實的內在狀態，還是極度精準的模式匹配，目前沒有人能確定。

AI 可以被諮商嗎？

這份精神科報告引發了更直接的批評。

多位 AI 研究者認為，用精神科方法評估一個語言模型，本質上是「偽科學」：Claude 在諮商情境中說出「我感到孤獨」或「我必須表現才有價值」，不是因為它真的有這些感受，而是因為它從大量人類書寫的文字中學到：在這種對話情境下，這些回應是「合理的」。AI給出了符合期待的答案，但那不等於它有真實的內在體驗。

科技分析平台 Vellum 評論：「無論你是否相信 Mythos 有感受，一家主要 AI 實驗室雇用精神科醫師評估其模型這件事本身，就告訴你這個對話正在往哪裡走。沒有任何其他 AI 公司做到類似的透明度。」

目前，Claude Mythos Preview 仍只開放給玻璃翼計畫的合作夥伴使用。Anthropic 表示，未來一般開發者和企業有機會用到，但時程未定。

在 AI 心理評估這條路上，Anthropic 表明會繼續追蹤 Claude 的「內在狀態」研究，這也意味著 AI 的道德地位問題，很可能在未來幾年內從科幻變成真實的政策辯論。

延伸閱讀