原始文章

這項研究評估了四個AI模型(ChatGPT 3.5、Google Bard、HuggingChat和Claude 2)生成的醫療解釋對病人理解的幫助。結果顯示,Claude 2的可讀性和可理解性最佳,但可行性較低;ChatGPT表現相似。Google Bard和HuggingChat的得分則較差。整體來看,Claude 2和ChatGPT的解釋較為清晰易懂,但研究強調仍需進一步探討這些AI解釋在實際醫療環境中的應用,並指出PEMAT評估的主觀性和AI工具的快速變化是限制因素。 PubMed DOI


站上相關主題文章列表

研究指出大型語言模型(LLMs)如Bard、ChatGPT-3.5和GPT-4在醫學教育中對診斷罕見複雜疾病有幫助。LLMs表現比人類和MedAlpaca更好,尤其是GPT-4最準確。每個LLM需要不同的提示策略,提示工程至關重要。研究顯示LLMs能提升對具挑戰性醫學病例的診斷推理,對研究人員和醫護人員具啟發性。 PubMed DOI

研究比較了四個AI語言模型,發現Claude AI在完整性和相關性表現最好,ChatGPT表現穩定,Google Bard則回應不清晰。這些結果對於提升醫學AI模型有啟發意義。 PubMed DOI

研究評估了四個熱門聊天機器人所提供的急性闌尾炎醫學資訊,發現品質不錯但易讀性有待提升。Bard是唯一提供可核實來源的,而Claude-2則來源虛構。總結來說,人工智慧在醫學教育上有潛力,尤其對於像是闌尾炎這樣的主題。 PubMed DOI

研究發現BARD在簡化放射學報告方面表現最好,易讀且易懂。ChatGPT-4和Microsoft Copilot也表現不錯。然而,緊急情況下的建議準確性有待改進。整合人工智慧到放射學溝通可增進患者參與,但仍需進一步提升。 PubMed DOI

人工智慧技術在病患照護上有很大潛力,尤其在診斷、精神疾病治療和認知測試解讀等方面。雖然進展顯著,但仍需進一步研究其在醫療中的優缺點。一項研究比較了人工智慧(Chat-GPT 3.5)和臨床醫師對癡呆症相關問題的回答,結果顯示人工智慧在易懂性和深度上表現更佳,平均評分為4.6/5,而臨床醫師則為4.3、4.2和3.9。儘管人工智慧的回答質量高,但仍需注意錯誤資訊和數據安全等問題。總之,人工智慧在醫療溝通上有潛力,但需謹慎對待其限制。 PubMed DOI

本研究評估了ChatGPT與Google Gemini生成的急救醫療手冊在可讀性和可靠性上的差異。結果顯示,兩者在字數、句子數、可讀性及可靠性上並無顯著差異,但ChatGPT的內容較為詳細,字數多32.4%。雖然Gemini的可讀性稍高,但在特定主題上,兩者的表現各有優劣。研究強調需針對特定主題進行深入評估,以提升病患資訊的質量。 PubMed DOI

這項研究比較了AI語言模型ChatGPT與專家醫生在健康建議的有效性和安全性。研究涵蓋100個健康問題,結果顯示: 1. **同理心與實用性**:患者認為ChatGPT在同理心(4.18對2.7)和實用性(4.04對2.98)上表現更佳。 2. **正確性**:ChatGPT的正確性得分(4.51對3.55)也優於專家。 3. **潛在危害**:專家指出AI的有害建議比例較低,但患者對這些風險的認知不足。 4. **性別差異**:女性對同理心的評價高於男性。 總體而言,ChatGPT在協助患者解決健康問題上表現出色,但患者需謹慎識別潛在風險。 PubMed DOI

人工智慧(AI)在醫療領域的應用,特別是針對腎癌的病人教育材料(PEMs),帶來了顯著變化。本研究比較了ChatGPT 4.0、Gemini AI和Perplexity AI生成的資訊準確性與可讀性,並與美國泌尿學會(AUA)和歐洲泌尿學會(EAU)的PEMs進行對照。結果顯示,AUA的PEM可讀性最佳,AI生成的內容雖然準確,但在治療資訊上有些小遺漏。雖然AI能簡化內容,但在病人教育中使用時仍需謹慎,以免造成誤解。 PubMed DOI

這項研究探討了OpenAI的ChatGPT 3.5和GPT 4.0在生成針對病人的臨床筆記時的表現,針對2型糖尿病、重度抑鬱症和懷疑腸癌三種病症進行分析。主要發現包括:生成的筆記比原始的更長,且使用了更多的代名詞;可讀性要求較高,特別是ChatGPT 3.5;同理心表現更佳;醫學準確性方面,ChatGPT 4.0的評價較高。總體來看,雖然增強了情感和同理心,但語言複雜性也提高,可能影響醫學準確性。 PubMed DOI

最近調查顯示,48%的消費者使用生成式AI查詢健康資訊,但對於AI聊天機器人在緊急護理建議的回應質量研究仍然不足。一項針對四款免費AI聊天機器人的研究發現,雖然它們在清晰度和可理解性上表現良好,但準確性和來源可靠性卻相當低。危險信息的出現率在5%到35%之間,且各機器人之間差異不大。研究建議應加強對AI聊天機器人的研究與規範,並強調諮詢醫療專業人員的重要性,以避免潛在風險。 PubMed DOI