LLM 相關三個月內文章 / 第 142 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

**重點摘要:** 大型語言模型(LLMs)可以大幅提升化學研究的效率,像是在規劃、優化和資料分析等任務上提供協助,特別是當它們與各種工具和資料整合時效果更佳。不過,要讓LLMs成為有效且合乎倫理的科學夥伴,還必須解決像是效能評估、可重現性、資料隱私和偏誤等挑戰。 相關文章 PubMed DOI 推理

這項研究比較四種生成式AI(Gemini、Bing、GPT-4、Wrtn)用韓文回答大腸癌問題的準確度,結果平均只有5.5分(滿分10分),Wrtn表現最佳。AI雖然能解釋基本概念,但遇到複雜醫療細節就不太行。目前這些AI還不適合用來教育韓國病患及家屬,還需要再加強。 相關文章 PubMed DOI 推理

這項研究發現,用 ChatGPT-4 產生的耳鼻喉科住院醫師學習指南,內容正確、相關又清楚,獲得專科醫師高度肯定。審查者認為格式完整,但建議可再補充細節和圖像。AI 工具有助減輕教師負擔、協助個人化學習,但未來還需優化模型並加入多媒體內容。 相關文章 PubMed DOI 推理

本研究提出一套結合NLP與隱私技術的兩階段k-匿名化框架,能自動偵測並匿名化電子健康紀錄中的敏感資訊。方法利用微調BERT和LLM擷取敏感實體,並產生符合法規的匿名資料。此框架準確率高(F1 > 90%),可依需求調整,且透過LoRA技術降低硬體需求,適合大規模或資源有限的醫療場域應用。 相關文章 PubMed DOI 推理

這項研究發現,經過微調的LLaMA 3等語言模型,能準確從約2萬份肺癌病理報告中擷取臨床重點,特徵擷取F1-score達92%,存活預測F1-score有70%,且在不同醫院資料上表現穩定。顯示PLMs有助自動化報告分析,提升晚期肺癌照護決策效率與品質。 相關文章 PubMed DOI 推理

這項研究發現,針對從非結構化病理和放射科報告擷取臨床實體,生醫領域預訓練的編碼器型NER模型表現最好,F1分數最高達0.88。雖然大型語言模型(LLMs)精確度高,但召回率低,容易漏掉資訊,且運算成本較高,因此目前還不適合用於這類任務。 相關文章 PubMed DOI 推理

這項研究發現,大型語言模型(LLMs)在有結構化提示下,評估隨機對照試驗偏倚風險的準確率可達74%,速度也比人類快很多。雖然還不能完全取代人工判斷,但已展現成為研究助理的潛力,未來若優化提示,實用性有望再提升。 相關文章 PubMed DOI 推理

這項研究比較三款大型語言模型在中英文門診協助 CNS 腫瘤診斷與治療決策的表現。ChatGPT-4o 和 DeepSeek-R1 診斷準確度接近醫師,Doubao 較差,但三者在治療建議上都不如醫師。中英文表現差異不大。總結來說,這些模型在初步診斷有潛力,但治療建議還不夠可靠。 相關文章 PubMed DOI 推理

這項研究發現,四款生成式AI(ChatGPT 4o、Perplexity、Copilot、Gemini)在回答帕金森氏症深腦刺激治療指引時,表現都不理想,最高符合率只有42.9%,而且答案常常不完整或太有自信,內容也太艱澀,病患難以理解。結論是,目前AI還不適合單獨用在臨床決策上。 相關文章 PubMed DOI 推理

當然可以!這裡有一個重點摘要: 這則訊息指出在整形外科領域使用大型語言模型時,可能會有一些倫理上的疑慮。 相關文章 PubMed DOI 推理