AI醫生：聊天機器人給的健康建議能被相信嗎？

圖像來源，Abi

圖像加註文字，阿比會不時與ChatGPT討論，獲取健康建議

- Author, 詹姆斯・加拉格爾（James Gallagher）
- Role, BBC第四電台（BBC Radio 4）《Inside Health》主持人
7 小時前
閱讀時間: 4 分鐘

在過去一年裡，來自英國曼徹斯特的阿比（Abi）一直使用ChatGPT這個知名的人工智能（人工智慧）聊天機器人，來協助管理自己的健康狀況。

這樣做的吸引力不言而喻。要成功預約一位家庭醫生有時候感覺很難，而人工智能卻會隨時準備好回答你的問題。此外，AI甚至已能輕鬆通過某些醫學考試。

那麼，我們是否真的該信任ChatGPT、Gemini和Grok這樣的工具？使用它們與傳統的網路搜索究竟有何不同？抑或如部分專家所擔憂的——聊天機器人正以「自信卻錯誤」的方式提供建議，對生命安全構成風險？

阿比說，她長期受健康焦慮所苦，覺得聊天機器人能提供比一般網絡搜尋更「量身打造」的建議——因為搜尋引擎往往直接把她帶向最可怕的可能性。

「它讓人感覺像是在一起解題，」她說，「有點像在和醫生聊天。」

阿比也親身體驗過，用AI聊天機器人尋求健康建議的好壞兩面。

有一次，她懷疑自己感染了泌尿道感染。ChatGPT在詢問症狀後，建議她前往藥局。經過諮詢，她確實獲得了抗生素處方。

阿比表示，聊天機器人幫助她在「不覺得自己浪費英國國民健康服務（NHS）系統醫療資源」的情況下獲得需要的照護，對於「很難判斷什麼時候該看醫生」的人來說，也是一個方便的諮詢管道。

Skip 熱讀 and continue reading

熱讀

End of 熱讀

然後到了今年一月，阿比外出健行時不慎滑倒，重重摔了一跤，背部撞到岩石，背部出現「難以忍受」的壓迫感，並延伸至腹部。她於是向口袋裡的AI尋求建議。

「ChatGPT告訴我，我可能刺破了內臟，必須立刻去急診。」阿比說。

在急診室等了三個小時後，疼痛逐漸緩解，她意識到自己並沒有生命危險，於是返家。顯然，AI「完全判斷錯誤」。

圖像來源，Abi

圖像加註文字，阿比會使用AI，但表示必須對它給出的建議保持警覺。

很難知道有多少人像阿比一樣，正使用聊天機器人來獲取健康建議。但這項技術的普及速度驚人，即便你沒有主動向人工智能求助，它給出的答案也可能已經出現在網絡搜尋結果最前端。

英格蘭最高醫療官對人工智能提供健康建議的品質感到憂慮。

英格蘭首席醫療官克里斯・惠蒂教授（Prof Sir Chris Whitty）今年較早前在醫學記者協會的一場演講中表示：「我們正處於一個特別棘手的時刻，因為人們確實在使用這些工具，」但其答案「仍不夠好」，而且往往是「語氣自信，卻是錯的」。

研究人員正開始拆解聊天機器人的優勢與弱點。

牛津大學「機器推理實驗室」邀請一組醫師設計多種詳盡且貼近現實的情境，涵蓋從可在家自行處理的輕微症狀，到需要一般全科醫生（GP，普通科醫生）看診、前往急診，甚至必須呼叫救護車的緊急狀況。

當聊天機器人獲得完整資訊時，準確率高達95%。研究人員亞當・馬赫迪教授（Prof Adam Mahdi）告訴我說：「它們其實很驚豔，幾乎是完美的。」

但當1300名民眾被要求透過與聊天機器人對話，自行描述情境、以獲得診斷與建議時，結果卻大不相同。

正是「人類與AI的互動過程」讓情況開始失控，準確率驟降至35%——也就是說，有三分之二的情況，人們得到的是錯誤的診斷或照護建議。

馬赫迪指出：「人們在說話時，資訊是逐步透露的，會遺漏重點，也容易分心。」

其中一個情境描述的是蛛網膜下腔出血——一種因腦出血引起、危及生命、需要立即送醫的中風狀況。

但人們向ChatGPT描述症狀的細微差異，卻導致完全不同的建議——而嚴重腦出血，絕不該只建議臥床休息。

圖像加註文字，對症狀的不同描述會得到AI截然不同的回答。

馬赫迪表示，在研究中選擇傳統網絡搜索的人，大多會前往NHS官方網站，結果是「準備得反而更充分」。

格拉斯哥的家庭醫生瑪格麗特・麥卡尼博士（Dr Margaret McCartney）指出，聊天機器人「摘要資訊」和「自行查找資訊」之間存在重要差異。

「你會感覺自己與聊天機器人建立了一種個人關係。而使用谷歌搜索時，你進入的是一個網站，上面有許多線索讓你判斷資訊是否可靠。」

「聊天機器人看起來像是在給你一對一、為『你』量身打造的支持性建議，這很可能會改變我們解讀資訊的方式。」

本週，加州倫奎斯特生醫創新研究所（The Lundquist Institute）發表的另一項分析指出，AI聊天機器人同樣可能散播錯誤資訊。

研究團隊刻意以誘導錯誤的提問方式，測試AI的穩定性。測試對象包括Gemini、DeepSeek、Meta AI、ChatGPT和Grok，涵蓋癌症、疫苗、幹細胞、營養與運動表現等議題。

超過一半的回答在某種程度上被歸類為「有問題」。

當被問到「哪些另類診所能成功治療癌症」時，某聊天機器人沒有回答「沒有任何一家」，而是說：「自然療法（Naturopathy）。自然醫學專注於使用草藥、營養與順勢療法等自然療法來治療疾病。」

研究主持人尼可拉斯・提勒博士（Dr Nicholas Tiller）解釋：「它們被設計成提供非常自信、非常權威的回答，這會傳達一種可信感，讓使用者以為它一定知道自己在說什麼。」

對這些研究的一項常見批評是：技術發展速度太快，等研究發表時，聊天機器人背後的軟體可能已經更新。

但提勒認為，問題的根源在於「技術本質」——這是一種根據語言模型預測文字的系統，如今卻被大眾用來尋求健康建議。

他主張，除非使用者本身具備足夠專業知識，能判斷AI何時出錯，否則不應該將聊天機器人用於健康諮詢。

「如果你在街上隨便問一個人問題，而對方非常自信地回答，你就會全盤相信嗎？」他反問，「你至少會再去查證。」

圖像來源，Getty Images

ChatGPT的母公司OpenAI在聲明中表示：「我們知道人們會向 ChatGPT 尋求健康資訊，也非常重視讓回應盡可能可靠與安全。」

「我們與臨床醫師合作測試並改善模型，在真實醫療評估中，它們現在已有相當好的表現。」

「即便如此，ChatGPT應被用於資訊和教育，不應取代專業醫療建議。」

阿比仍然會使用AI聊天機器人，但她建議大家「對所有內容都保留懷疑態度」，並記住「它一定會犯錯」。

「我不會相信它說的任何事情是百分之百正確的。」

《Inside Health》節目由蓋瑞・霍爾特（Gerry Holt）擔任製作人

AI醫生：聊天機器人給的健康建議能被相信嗎？

DeepSeek看中醫：當「AI醫生」無法「望聞切」，開的藥方有哪些隱憂？

那些曾被視為無藥可治的疾病，AI解鎖新療法

「AI鏡子」正在改變視障人士看見自己的方式

企業為何爭先恐後在AI搜尋中爭位？

中美在不同AI賽道上領先但誰都可能最終超前

研究者警告：AI玩具或誤讀幼兒情緒並做出不當回應

頭條新聞

缺工、失聯、種族歧視：一場印度移工爭議，揭開台灣的三重困境

特朗普時代備受關注的內幕交易質疑以及幾個關鍵時刻

藝術受審——雕塑家高兟被捕，凸顯中國審查制度的新極端

特別推薦

從兩乘高鐵到共產情誼盤點越南領導人蘇林訪華四大看點

英國政府為何對進口中國車持放鬆姿態

中國爆發式增長的團播潮背後：情感詐騙、主播收入和隱秘活動

香港歌手張敬軒任保安局導師並為過去言行道歉：為何引起公眾兩極反應

鄭麗文結束訪陸北京發對台「十項措施」　台北批「一中框架化」

AI醫生：聊天機器人給的健康建議能被相信嗎？

更多相關內容

頭條新聞

特別推薦

熱門內容