LLM 相關三個月內文章 / 第 14 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究用88份真實MRI肝臟病灶報告,測試多款大型語言模型的分類能力。結果發現,Claude 3.5 Sonnet準確率最高,勝過GPT-4o等其他模型。雖然LLM有潛力協助醫療診斷,但臨床應用前還需更多驗證,嚴謹測試也很重要。 相關文章 PubMed DOI 推理

這項研究發現,目前免費的AI工具(如ChatGPT、Bard、SmallSEO)在偵測科學論文抄襲上效果有限,尤其對AI重寫過的內容幾乎無法辨識。也就是說,AI不僅難以抓出抄襲,還能幫助抄襲內容規避偵測,現階段並不可靠。 相關文章 PubMed DOI 推理

這項研究發現,孤獨感會明顯提高長者入住安養院的風險和速度,影響力跟性別或獨居差不多,但孤獨感是可以改善的。如果減少社交參與服務,可能會讓更多人提早進安養院。政策上應重視減少孤獨感的服務,幫助長者延後或避免入住安養院。 相關文章 PubMed DOI 推理

LabQAR 是全新人工整理的實驗室檢驗參考值資料集,收錄 550 筆、共 363 種檢驗項目,並附詳細註解和多選題,協助自動化解讀檢驗結果。研究發現 GPT-4o 在這項任務表現最佳,顯示大型語言模型有助於臨床決策與複雜數據處理。 相關文章 PubMed DOI 推理

這項研究用大型語言模型(LLMs)自動從電子病歷的臨床紀錄辨識失眠,準確度高於傳統BERT模型(F1分數93.0和85.7)。這個方法不只偵測失眠效果好,也有潛力應用在其他容易被忽略的疾病診斷上。 相關文章 PubMed DOI 推理

這項研究發現,用大型語言模型自動產生心臟衰竭住院摘要,能幫助部分醫師更快回答問題,且準確率沒變。大多數醫師認為這樣能省時間,也願意使用,但摘要格式要配合個人需求。整體來說,LLM有助提升醫師效率,但摘要內容還需客製化。 相關文章 PubMed DOI 推理

這項研究找來70位醫師,測試專為醫師協作設計的GPT AI診斷系統。無論是AI先診斷還是醫師先診斷,協作後的正確率都比傳統工具高(85%和82%對75%),和單純AI診斷(90%)差不多。結果顯示,協作型AI能有效提升診斷準確率,也促進醫師與AI的合作。 相關文章 PubMed DOI 推理

這項研究提出用大型語言模型(LLM)來測試去識別化工具的隱私保護效果。結果發現,即使是先進工具,仍有9%病患紀錄被重新識別,顯示現有方法有漏洞。這方法有助於找出弱點,讓未來生醫資料分享更安全。 相關文章 PubMed 推理

**重點摘要:** 這項研究顯示,使用 prompt-tuning 搭配大型臨床語言模型(GatorTronGPT)可以有效地摘要醫師與病患之間的對話,不僅表現優於以往經過 fine-tune 的模型,而且更有效率,因為不需要更新模型的參數。 相關文章 PubMed 推理

這項研究發現,像 Med-BERT 這種專為醫療設計的大型語言模型,比通用型模型更能處理不同醫院間的資料差異,提升知識轉移效果。通用模型如 OpenAI 需額外微調。未來建議持續研究如何在任務難度、資料量和微調之間取得最佳平衡。 相關文章 PubMed 推理