LLM 相關三個月內文章 / 第 1 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究探討了Google和ChatGPT在提供青光眼常見問題解答的準確性與易讀性。結果顯示,ChatGPT的準確性高達97%,遠超過Google的77%。不過,ChatGPT的初始閱讀水平較高(14.3級),而Google為9.4級。當要求ChatGPT修訂青光眼教育材料時,它成功將閱讀水平降至9.4級,且準確性未受影響。這顯示ChatGPT能提供更清晰易懂的資訊,增進病人教育,改善理解與治療遵從性,顯示其在青光眼資訊及教育資源開發上的潛力。 相關文章 PubMed DOI

近年來,中國的日間手術發展迅速,但麻醉醫師短缺使術前麻醉管理面臨挑戰。本研究探討了ChatGPT在術前評估及解決病人疑慮的潛力。研究人員創建150個模擬病人檔案,讓ChatGPT與專業麻醉醫師進行ASA-PS分類及日間手術建議評估。結果顯示,ChatGPT在評估表現上與專家相當,且在回答常見問題時準確率達94%。總體而言,ChatGPT能有效協助麻醉醫師,提供術前風險評估及解答病人疑問,對臨床環境有價值的支持。 相關文章 PubMed DOI

這項研究評估了六個生成式人工智慧大型語言模型(LLMs)在回答醫學多選題和生成解剖學臨床情境的準確性。測試的模型包括ChatGPT-4、ChatGPT-3.5-turbo、ChatGPT-3.5、Copilot、Google PaLM 2、Bard和Gemini。結果顯示,ChatGPT-4的準確率最高,達60.5%,其次是Copilot(42.0%)和ChatGPT-3.5(41.0%)。雖然這些模型尚未能完全取代解剖學教育者,但它們在醫學教育中仍具備實用價值。 相關文章 PubMed DOI

這項研究探討了使用具視覺能力的GPT-4V進行醫學影像分類,特別是癌症組織病理學。傳統方法需大量標註數據和計算資源,而上下文學習則能從提示中學習,無需更新參數,這在醫學影像領域尚未普遍應用。研究評估了GPT-4V在結直腸癌組織亞型分類、結腸息肉亞型分類及淋巴結切片乳腺腫瘤檢測的表現,結果顯示其表現可與專門神經網絡媲美,甚至在樣本數量有限時更佳。這顯示通用AI模型在醫療影像分析中的潛力,特別對於缺乏技術專業知識的醫療人員。 相關文章 PubMed DOI

近年來,生成式人工智慧(AI)特別是大型語言模型(LLMs)和多模態模型(MM-LLMs)受到廣泛關注。LLMs如ChatGPT和LLaMA,能理解和生成語言,而MM-LLMs則結合文本和圖像,模擬人類認知。這些技術在醫療領域有潛力改善病人護理,透過分析數據和提供診斷建議等方式。放射科醫生需了解LLMs的基本概念,以掌握其在影像領域的應用與挑戰。 相關文章 PubMed DOI

這項研究評估了AI語言模型ChatGPT在放射腫瘤學臨床情境中的表現。研究涵蓋12種不同疾病的案例,問題涉及流行病學、分期、臨床管理等領域。經過專業醫師審查後,ChatGPT的總得分為2317分(滿分2730分,得分率84%),在完整性、簡潔性和正確性方面表現良好。特別是在流行病學和癌症生物學上得分高達93%。不過,在治療計畫和臨床管理方面則表現較差,顯示其在處理複雜案例時仍有局限性。 相關文章 PubMed DOI

2024年在盧布爾雅那舉行的AUTO14雙年國際自體免疫大會,為醫學界提供了探討最新進展的平台。會議中,人工智慧(AI)成為焦點,特別是ChatGPT與專家們的辯論,討論了多個臨床案例,包括血管炎。ChatGPT在臨床決策上與專家一致,並強調長期使用類固醇的患者需注意骨質疏鬆預防。大會還涵蓋了自體免疫疾病的多個主題,如感染影響及COVID-19疫苗的討論,並將報告內容整理成不同部分,方便查閱。 相關文章 PubMed DOI

人工智慧對生活的影響深遠,尤其在醫學領域。這篇文章探討了醫學倫理的兩大重點:大數據與聊天機器人如ChatGPT的應用。這兩者涉及數據收集、演算法開發和決策三個階段。在數據收集時,醫生需尊重病人的自主權與隱私。雖然科技能協助診斷與治療,但最終決策仍需醫生與病人共同討論。此外,使用人工智慧進行研究時,對結果要保持批判性思考,以免被誤導。 相關文章 PubMed DOI

這項研究評估了ChatGPT在提供放射性藥物外滲資訊的有效性。研究者向ChatGPT提出十五個問題,並進行三次詢問,兩位核醫學醫師和一位物理學家評估其回應的適當性和幫助性。結果顯示,ChatGPT的回應在93%的情況下非常有幫助,且評估者之間的一致性良好。雖然有87%的回應顯示輕微不一致,但大多數回應使用了經過驗證的來源,未發現AI幻覺。然而,回應與官方SNMMI立場存在顯著差異,顯示出對一致性需求的迫切性。 相關文章 PubMed DOI

最近的研究顯示大型語言模型(LLMs)在自然語言處理,特別是遠程醫療中有很大潛力。研究比較了GPT-3.5、GPT-4和LLaMA 2在醫療諮詢摘要的表現。結果顯示,LLaMA2-7B在n-gram精確度上表現最佳,而GPT-4在語義準確性和可讀性上優於其他模型。所有模型在總結能力上相似,但GPT-4在內容理解和結構上稍有優勢,顯示其生成病人友好摘要的潛力。研究也探討了使用LLMs的潛在風險與限制。 相關文章 PubMed DOI