原始文章

這項研究評估了 ChatGPT 4.0 在提供腹主動脈瘤(AAA)資訊的準確性,針對患者和醫生的問題進行了測試。結果顯示,對患者問題的平均準確度為 4.4,與血管外科學會(SVS)的指導方針一致性也不錯,平均評分為 4.2。不過,對於 AAA 破裂風險的問題,表現僅為中等,平均評分 3.4。整體來看,ChatGPT 4.0 在 AAA 資訊上表現良好,對患者教育和醫生知識提升有潛在幫助。 PubMed DOI


站上相關主題文章列表

這個研究旨在評估ChatGPT對於處理腹壁疝氣相關問題的回應的準確性和適用性,因為有必要驗證AI模型在醫學主題上提供的資訊可靠性。 PubMed DOI

研究比較了ChatGPT-3.5和Google Bard在回答血管手術相關問題時的表現,發現ChatGPT的回答更準確完整,易讀且適合大專程度;Bard則適合高中程度但品質較低。ChatGPT提供較長回答,顯示在血管手術病人教育上有潛力,但仍需進一步研究改進。 PubMed DOI

這項研究評估了ChatGPT(4.0版)在生成與常見視網膜疾病相關回應的表現,依據美國眼科醫學會的指導方針進行。研究包含130個問題,涵蓋12個領域,專家評估回應的相關性和準確性。結果顯示,ChatGPT的平均得分為4.9分,與指導方針高度一致,但外科管理得分最低。回應可讀性較低,需大學以上理解能力,且在診斷和治療選擇上有錯誤。整體而言,雖然顯示潛力,但仍需臨床醫師監督及改進。 PubMed DOI

這項研究評估了ChatGPT-4在抗凝治療管理方面的準確性,特別針對接受胃腸道手術的患者,並與ChatGPT-3.5及增強檢索生成模型(ChatGPT4-RAG)比較。結果顯示,ChatGPT-4的完全準確率為30.5%,而ChatGPT4-RAG則達到75%。儘管如此,研究指出75%的準確率仍不足以獨立做臨床決策,AI應視為醫生的輔助工具,並需持續評估以保障病人隱私及醫病關係。 PubMed DOI

像ChatGPT這樣的AI模型在醫學上雖然帶來不少好處,但也引發了對資訊質量和可靠性的擔憂。一項研究評估了ChatGPT對假設性先天性二尖瓣主動脈瓣病人的回答,發現其提供的資訊雖然詳細,但缺乏針對個別病人的具體建議,且沒有引用來源來驗證真實性。此外,AI也無法替代醫生與病人之間的細緻溝通。隨著AI在醫療中的應用增加,解決這些問題和倫理考量變得相當重要,以確保AI是輔助而非取代醫療提供者的角色。 PubMed DOI

急性主動脈剝離(AD)是一種危及生命的疾病,常因症狀與其他病症相似而被誤診。本研究探討了OpenAI的AI模型ChatGPT 4.0在診斷急性AD的有效性。透過系統性搜尋PubMed,找到163篇案例報告,隨機分析十篇。患者年齡介於29至82歲,性別分佈均衡,高血壓為常見合併症。結果顯示,ChatGPT 4.0能成功將急性AD列為前三名的鑑別診斷之一,並在五個案例中確定為主要診斷。研究指出,ChatGPT 4.0可作為輔助工具,幫助醫生進行早期篩檢。 PubMed DOI

這項研究評估了ChatGPT(3.5和4版本)在提供肩膀和肘部手術資訊的準確性,分析了114個問題。結果顯示,ChatGPT 3.5的正確率為52.3%,而ChatGPT 4則達到73.3%。雖然3.5在不穩定性類別表現較佳,但4在大多數其他類別中表現更優。兩者的表現都超過50%的熟練度,但仍無法取代臨床決策。研究建議進一步改善ChatGPT的訓練,以提升其作為醫療資訊資源的效用。 PubMed DOI

這項研究評估了ChatGPT提供的腹主動脈瘤(AAA)資訊質量,並與澳洲健康指導(HDA)進行比較。研究發現,ChatGPT的回應臨床上適當,但可讀性較高,達到大學水平,而HDA則在10到12年級。雖然ChatGPT的回應通常更易理解,但可行性得分較低,且行動建議不夠明確。總體來看,ChatGPT可作為病人教育的工具,但需改進以提升其幫助病人做出知情決策的能力。 PubMed DOI

這項研究評估了兩個AI聊天機器人,ChatGPT和ChatSonic,針對腹腔鏡修補腹股溝疝氣的問題所提供的回答質量。研究者提出十個問題,並由兩位外科醫生使用全球質量評分(GQS)和修改版的DISCERN評分來評估。結果顯示,ChatGPT的回答質量較高,獲得了良好的評分,而ChatSonic的表現稍遜。雖然兩者都有潛力,但在可靠性和質量上的不一致性,顯示在臨床使用前仍需進一步驗證。 PubMed DOI

這項研究評估了ChatGPT-4在回答全踝關節置換術(TAA)相關問題的表現。研究人員提出十二個常見問題,並請四位專科外科醫生評分其回答的準確性和清晰度。平均得分為1.8(滿分4分),顯示在事實性問題上表現尚可,但對於術後方案等細緻問題評分較低。外科醫生的評分差異顯著,顯示出不同的解讀和期望。這強調了針對特定臨床情境設計AI工具的必要性,以提升病人教育和資訊的準確性。 PubMed DOI