原始文章

自體免疫性肝病(AILDs)較為罕見,醫療提供者需仔細評估。研究探討了四款聊天機器人(ChatGPT 3.5、Claude、Microsoft Copilot 和 Google Bard)在臨床決策支持中的潛力。十位肝臟專家針對56個問題進行評估,結果顯示Claude得分最高(7.37),ChatGPT次之(7.17)。研究發現這些機器人常提供一般性資訊、劑量資訊不足,且對孕婦的建議不準確。雖然聊天機器人有潛力,但仍需改善資訊的具體性與準確性,以提升其在自體免疫性肝病管理中的有效性。 PubMed DOI


站上相關主題文章列表

研究發現ChatGPT對於肝硬化和HCC患者提供準確資訊和情緒支持,但在治療時間和地區指引等特定領域上有不足。建議ChatGPT可作為輔助工具,提供實用建議,協助改善疾病結果。 PubMed DOI

非酒精性脂肪肝病(NAFLD)是全球嚴重健康問題,目前沒有特效藥物,調整生活方式很重要。為了應對NAFLD,需要創新方法來支持長期改變。現在稱為代謝功能障礙相關性脂肪肝。AI聊天機器人如ChatGPT可以提供個人化支持和教育,有助於增進醫療資源。研究評估ChatGPT對NAFLD問題回答的正確性和完整性,以了解對患者疾病和生活方式問題的回應。 PubMed DOI

研究比較了四個AI語言模型,發現Claude AI在完整性和相關性表現最好,ChatGPT表現穩定,Google Bard則回應不清晰。這些結果對於提升醫學AI模型有啟發意義。 PubMed DOI

AI聊天機器人如ChatGPT和Bard在提供癌症免疫治療引起的免疫相關不良事件(irAEs)資訊方面表現良好,尤其ChatGPT稍微優於Bard。專家們使用Likert量表評估後發現,這些聊天機器人提供的資訊準確且完整。雖然AI聊天機器人可作為有用資源,但仍需依賴確實指引以取得準確的irAEs相關資訊。 PubMed DOI

ChatGPT3.5是一款擁有為肝病患者提供諮詢潛力的人工智慧聊天機器人。研究發現,在回答意大利MASLD相關問題時,其準確性表現良好,但完整性和易懂性較低。專家評估顯示身體活動問題得分最高,專科轉診問題得分最低。語言對結果影響不大。ChatGPT在意大利語中為MASLD患者提供諮詢有潛力,但在某些方面仍需改進。 PubMed DOI

美國IBD患病率最高,遺傳、環境和飲食都影響急性發作。研究發現ChatGPT比BingChat和YouChat更適合回答IBD飲食問題,但有時回答不可靠。CB-AI建議諮詢專家,有助於改善IBD患者飲食教育。 PubMed DOI

這項研究評估了OpenAI的ChatGPT-4和Google的Bard在回答前列腺癌新療法<sup>177</sup>Lu-PSMA-617的準確性、可讀性和簡潔性。結果顯示,ChatGPT-4的回答準確性較高(得分2.95對2.73),但Bard的可讀性更佳(得分2.79對2.94)。兩者在簡潔性上相似。ChatGPT-4的錯誤資訊較少(16.6%),而Bard則有較多誤導性資訊。總體來看,這兩個AI仍需改進,才能成為病人尋求相關資訊的可靠來源。 PubMed DOI

慢性乙型肝炎(CHB)在全球造成重大挑戰,尤其在中國等高盛行率地區。本研究探討AI助手ChatGPT-3.5在CHB管理中的潛力,特別是其提供個性化醫療諮詢的能力。研究發現,ChatGPT-4.0在資訊量和一致性上表現優於3.5,準確率達93.3%。然而,兩者在情感管理上表現不佳,需改進。研究建議針對情感管理進行專門訓練,並進一步探討免責聲明對病人經驗的影響。 PubMed DOI

這項研究評估了七個大型語言模型(LLMs)在模擬英國醫學考試問題上的表現,使用了423道考題。測試的模型包括ChatGPT-3.5、ChatGPT-4、Bard等。結果顯示,ChatGPT-4表現最佳,準確率達78.2%,其次是Bing和Claude。研究指出,LLMs在醫學教育中有潛力,但在依賴它們進行訓練前,仍需解決一些限制,並建議進一步研究專科特定的LLMs及其在醫學課程中的應用。 PubMed DOI

這項研究評估了五款AI聊天機器人(GPT-4、Claude、Mistral、Google PaLM和Grok)對腎結石相關問題的回答質量。研究透過Google Trends找出熱門搜尋詞,並針對每個機器人提供25個查詢。分析工具包括DISCERN、PEMAT-P等。結果顯示,無一機器人的回答達到理想的可理解性標準。Grok在易懂性上表現最佳,而GPT-4則最難理解。整體來看,這些聊天機器人有潛力改善醫療溝通與病人理解。 PubMed DOI