LLM 相關三個月內文章 / 第 92 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了ChatGPT-4在創傷外科中提供的ABCDE方法參考資料的準確性。兩位獨立評審對30個參考資料進行打分,結果顯示平均準確性為66.7%,只有43.3%是正確的。其餘56.7%則不準確或不存在。不同創傷協議的準確性沒有顯著差異。研究對ChatGPT-4在醫療決策中的可靠性提出疑慮,建議雖然它可作為教育工具,但使用時需謹慎,並進行徹底的驗證與交叉參考。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4在抗凝治療管理方面的準確性,特別針對接受胃腸道手術的患者,並與ChatGPT-3.5及增強檢索生成模型(ChatGPT4-RAG)比較。結果顯示,ChatGPT-4的完全準確率為30.5%,而ChatGPT4-RAG則達到75%。儘管如此,研究指出75%的準確率仍不足以獨立做臨床決策,AI應視為醫生的輔助工具,並需持續評估以保障病人隱私及醫病關係。 相關文章 PubMed DOI

這項研究全面回顧了ChatGPT在臨床醫學、泌尿科及學術醫學的應用,並探討了相關的倫理挑戰與風險。研究團隊從2022年1月到2024年1月,針對泌尿科與人工智慧進行了廣泛搜尋。結果顯示,ChatGPT能協助生成準確的臨床文件及提供醫療資訊,但對資訊準確性仍有疑慮,需醫師監督以保障病人安全。在學術領域,ChatGPT可協助撰寫與整理數據,但需有指導方針以防學術不端。總之,雖然ChatGPT對泌尿科醫師及學術界有幫助,但人類監督仍是維護安全與透明的關鍵。 相關文章 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在冠狀動脈疾病(CAD)診斷中的表現,特別是根據CAD-RADS 2.0指引進行比較。結果顯示,ChatGPT 4o的準確率最高,達到100%,接著是ChatGPT 4和Claude 3 Opus,準確率為96.6%。其他模型的準確率也不錯,介於90%到93.3%之間。這些結果顯示LLMs在改善CAD的放射報告和病人照護方面的潛力,並強調進一步研究其視覺診斷能力的重要性。 相關文章 PubMed DOI

在人工智慧時代,許多病人會在線上尋找健康資訊。本研究評估了三個人工智慧聊天機器人(ChatGPT、Gemini、Copilot)提供的泌尿生殖系統癌症治療資訊的可靠性。評審結果顯示,ChatGPT和Gemini的資訊質量中等,分別得41分和42分,而Copilot得分較低(35分)。整體可理解性偏低,只有Gemini的可行性得分達60%。這顯示病人需謹慎使用這些工具,因為它們提供的資訊質量和可靠性普遍不高,且難以理解。 相關文章 PubMed DOI

這篇論文探討了ChatGPT在神經外科領域作為學習工具的潛力,特別是GPT-3.5和GPT-4的進步引發了對臨床應用的興趣。文中提到ChatGPT能協助醫學執照考試及神經外科書面考試,並在創建個性化案例報告和學習材料上展現潛力。此外,它也能提升研究流程和文獻回顧的效率。不過,論文提醒使用時需謹慎,因為AI幻覺和過度依賴技術可能帶來風險。最後,強調了ChatGPT在神經外科教育中的重要角色。 相關文章 PubMed DOI

生成式 AI 模型如 ChatGPT 正逐漸融入醫學教育,許多學生利用它來學習和準備考試,包括美國醫學執照考試(USMLE)。根據2023年5月的調查,96% 的醫學生知道 ChatGPT,52% 曾使用過它來完成課業。學生常用它解釋醫學概念、協助診斷及文法檢查。不過,對於不準確性、病人隱私和抄襲的擔憂也浮現,顯示出制定規範以確保道德使用的必要性。了解學生的看法對於建立負責任的使用指導方針至關重要。 相關文章 PubMed DOI

這篇文章強調在醫療和研究領域中,如何安全有效地使用大型語言模型(LLMs),特別是對於經驗較少的專業人士。文中列出六個實用案例,包括自訂翻譯、精煉文本、生成概述、編纂想法、創建個性化教育材料,以及促進智識討論。此外,還提供了一些使用AI工具的注意事項和策略。儘管面臨挑戰,將LLMs整合進醫療和研究工作中,能有效提升生產力和效率。 相關文章 PubMed DOI

自1950年代以來,人工智慧(AI)在腸胃病學上取得了顯著進展,特別是大型語言模型(LLMs)如ChatGPT的出現。這些模型能生成類似人類的文本,並有潛力改善診斷、治療和病患溝通等方面。 優勢包括加速診斷、個性化護理、增強教育和決策支持。然而,挑戰也不少,如AI理解能力有限、數據偏見和隱私問題等。未來,LLMs的發展需依賴於數據分析能力,並需醫療專業人員與AI開發者的合作,以提升病患護理品質。 相關文章 PubMed DOI

您的研究顯示開源大型語言模型(LLMs)在醫療領域的潛力,特別是在德文臨床文本中提取心血管功能指標。透過分析497份心臟MRI報告,您成功提取14個指標,並達到95.4%的正確標註率和99.8%的命名實體識別準確率,顯示這些模型能有效處理醫療語言的複雜性。這項研究強調了開源LLMs在臨床環境中的應用潛力,並為未來在其他語言的醫療研究鋪路。 相關文章 PubMed DOI